• ベストアンサー

統計の分散のイメージ

統計で「分散」という概念がありますが、これは個々のデータの散らばり具合の大きさを表すと理解しています。ですが、何を基準に分散の値が大きいとか小さいといえるのでしょうか?たとえば分散が15と出た場合、散らばり具合が大きいか小さいかはどうやって判断すればよいのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

単独の分布で「分散が15と出た」というだけでは, 一般的には大きいとも小さいとも判断のしようがありません. 「個々のデータ」が何かの計測値であって「他の方法ではかって得られたデータ」があるのなら, そちらの分散と比較して「散らばり具合が大きい」とか「小さい」とか判断することができます. あるいは, 何か想定しているデータがあってその分散が既知であるならそれと比較することができます.

i-tad
質問者

お礼

回答ありがとうございます。 参考になりました。

その他の回答 (1)

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.2

 分散というのは当該統計量の平均値からどの程度散らばっているかを示す尺度です。平均値との差はプラスとマイナスがあり、平均値からの差の合計は常にゼロになってしまいますから、差の合計は統計量として使用することはできません。そこで二乗和を統計量として用いることにしたのです。そして平均値との差を合計したものを総数で割ったものを分散と名付け、これを使うことにしたのです。ただし、統計量が一つしかなかったらその分散はその統計量の二乗になってしまいます。しかし一つのデータの分散なんて意味がないですよね。そこで意味がないなら計算できないようにしておこうということで、割る数を統計量の総数から1を引いた値で割ることにしたのです。ですから分散というのは平均値からの差の二乗の総和をN-1で割ったものということになっているのです。  分散が大きいか小さいかの尺度はその平方根である標準偏差値で評価します。この場合、σは次元を持ちますから単位を変えると値が変わってしまいます。これではまずいので、統計量としてすべてのサンプルを平均値で割って無次元化したものを用いることが多いのです。これの分散、標準偏差を取ると値が無次元化されているので単位の取り方の影響を受けずに散らばり方を評価することができるようになるのです。  その上で散らばり具合が大きいか小さいかは採取したデータによってさまざまですから、それぞれのデータについて基準になる値を決め、これによって判定を下すのです。たとえば水晶の振動数を測定するとこれは極めて分散が小さい量ですから、基準量は極めて小さいものを設定しなければなりません。ところが一日降雨量の年間データとなると極めてばらつきが大きいですから、これを評価するときの基準値はかなり大きなものを設定するということになり、これは統計学とは別次元の判断基準によって定められるということになります。

i-tad
質問者

お礼

回答ありがとうございます。 参考になりました。

関連するQ&A

専門家に質問してみよう