• ベストアンサー

統計学 中央値

質問があります。 派遣業務で消費者ユーザーの特性を調べているのですが、なぜか会社では、平均値を使わず、中央値でユーザー特性を調べています。 、動向を知るには平均の方がいいと思うのですが統計学的に見て中央値を使うメリットデメリットを教えてください。また、統計学に興味を持ち始めたのですが、(実は大学時代勉強したはずなのですがもうすっかり忘れてしまっているので・・・)これからは実際の業務として役立つようにしたいのでお勧めのサイト書物がありましたら教えてください。標準偏差とか誤差を勉強したいです。派遣とはいえ統計を扱う以上しっかりしておきたいのでお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.6

 統計学は、「分かりやすい・・・」というようなタイトルでも、分かりやすいとは、思いません。学生時代にサッパリ分からなかった経験から、不得意な数学的な根拠を無視して、統計学を利用することだけを目的にして、書きます。 >消費者ユーザーの特性 統計学は、その特徴を知りたい対象とするグループの特性を数値で表すものです。数値で表すと、分かりやすいからです。成績の平均点が高いと、『賢いなグループ』ということになります。  グループを集団といいます。この場合、消費者ユーザー全員を母集団といいます。母集団のデータは、その数が多い場合は、中央付近の人が多い形(ベル)のようにになり、これを正規分布といいます。 母集団の特徴を現す数値を代表値といいます。代表値には、お馴染みの平均値、それ以外に中央値、さらに最頻値、などを用います。  通常、平均値が用いられます。これは、二つ以上の集団の比較に、検定という作業をするのに便利だということもあります。ただ、平均値を用いる場合は、その集団が正規分布をしていることが、絶対的な前提条件になります。日本の貯蓄額の平均値は、700万円とか。しかし、多くのの家庭は、「そんなにナイゾ」と叫びます。これは、一握りの金持ちが、握り締めているからです。アメリカでは、この差はもっと広がります。すなわち、データの分布が、正規分布していないから、こういうことになります。  そこで、考えられたのが中央値です。正規分布していなくても、データを順番に並べると、真ん中付近の者が多いことから、中央値をその集団の代表値にすると、納得する者が多いので、代表値としてふさわしいのです。    ちなみに、集団が正規分布をしている場合は、平均値と中央値は、一致します。  まとめますと、平均値は、計算しやすい、聞いてる人が慣れていますが、正規分布が前提になります。データの数が多いと、正規分布になるハズデスが、貯蓄額のように数千万人が対象でもナラナイ場合もあります。  中央値は、正規分布していなくてもOKだが、算出がやや面倒、多くの人は慣れていないので説明が必要かもしれません。  消費者の動向などでは、平均値も中央値も使えない場合があります。その場合、最頻値が有効で、これは案外無意識に使っています。  私の過去の回答に、検定や回帰分析などの初心者向けの回答をしています。統計学的な数学は苦手なので、いまだに初心者ですが、使い方は間違っていない、と思っています。  統計学は、慣れです。  釈迦に説法の点は、ご容赦を。

その他の回答 (5)

noname#21649
noname#21649
回答No.5

>消費者ユーザーの特性を よりおそらく計数(1人.2人....と数える)でしょう。すると.ガウス分布になりませんので.平均値が存在しません。平均値での議論は数学的に無意味。

  • solla
  • ベストアンサー率59% (45/76)
回答No.4

> 動向を知るには平均の方がいいと思うのですが なぜそのように思うのでしょう? 一般に集団の代表値としては平均値が用いられることが多いのは事実ですが、他の方の回答にもあるようにそれは平均値が数学的性質が良いこと、計算がしやすいことが主な理由です。しかし平均値が何を表しているかを考えると結構難しいのではないでしょうか。私が知る限り「分布の重心に相当する」ということ以上の明確な意味は無いように思います。一方で中央値はその値よりも大きい特性値を持つ人が全体の半分、小さい特性値を持つ人が半分という直感的に明確な意味を持っています。

  • tonybin
  • ベストアンサー率20% (22/105)
回答No.3

中央値はデータを小さい順から並べていったときに真ん中に来る値です。平均値は文字通り平均の値です。中央値を使う事については、例えば「大根一本の値段」を無作為に100件の店から導き出そうとするときに、バラツキ(分散)に左右されないということです。100件中5件が一本2万円で売っていたとしたら、その他95件が100円前後で売っていたとしても「大根一本の値段」が平均で1100円近くしてしまいます。だから、バラツキに左右されない中央値の方を使っているんだと思います。学生なんでこの位しか分かりません。解りづらかったらスミマセンです。

  • neKo_deux
  • ベストアンサー率44% (5541/12319)
回答No.2

> 消費者ユーザーの特性 こちらがどういうものか?次第ですね。 例えば、5人の消費者が特定の商品に1年間に使う金額を、 1) 300円 280円 360円 290円 320円 ですと、平均値=310円、中央値=300円で、どちらを使ってもさほど問題ありません。 2) 20円 0円 0円 10円 158,000円 ですと、平均値=31,606円、中央値=10円と、大きく違います。 算出した動向をどのように使うか?によって、どちらがいいかってのは変わって来ます。 「一人のユーザーが使う金額はだいたいどれくらい?」だと中央値が良いかも知れません。 「他の製品と比較する時の収益性は?」だと平均値の方が良いかも。 一般的に平均値を良く使うのは、計算が楽だって面もあります。 並べ替えはちょっと面倒です。

回答No.1

研究で統計を扱っているものです。 統計が専門ではありませんのでご了承ください。 まず、中央値と平均値の件ですが、 サンプルが正規分布している場合には、 ほとんどの場合平均値を用いることが多いと思います。 平均値と標準偏差で、サンプルの分布を表すことが可能です。 しかし、正規性がないサンプルの場合、 平均値と標準偏差ではサンプルの分布を表すことが難しくなります。 そのため、中央値を用いるわけです。 また、中央値だけでは分布を表せないので、 25パーセンタイル値、75パーセンタイル値を合わせて用いることが多いと思います。 もう一度扱っているデータの分布をグラフにしてみるなどするといいかもしれませんね。 あと、統計に関しては、 ↓のサイトが詳しくてお勧めです。 ご参考まで。

参考URL:
http://aoki2.si.gunma-u.ac.jp/index.html
gnabila
質問者

お礼

中央値がばらつきに左右されないというこがわかりましたが、どうしてそうなるのかとういうことがいまいちよくかみしめられていません。 でも、上記のことがわかったことだけでも嬉しいです。 勉強してみたいと思います。

関連するQ&A

専門家に質問してみよう