分散と標準偏差についての疑問

このQ&Aのポイント
  • 分散は値のばらつきを示し、大きいほど分布が広いことを意味します。
  • 具体的な例として、テストの平均点や血液型の分布が考えられます。
  • 標準偏差はバラツキの目安で、中央値からのバラツキを示します。
回答を見る
  • ベストアンサー

勉強してるのですが、結局、分散の意味がわかりません。

勉強してるのですが、結局、分散の意味がわかりません。 分散は平均値からのばらつきを示しますので、値が大きければ、分布が大きく、小さければ分布が平均値付近に集中していることを示します。 とあるのですが、値が大きいというのはどの程度を示しますか? いい例が思いつかなかったのですが、 (2 3 5 5 5 7 8 9 10 100) では、分散は801.04ですが、これは大きいほうでしょうか? また、これ以外にもわかりやすい例があれば教えてほしいです。 特に、クラスのテストの平均点・血液型の分布 などを知りたいです。 経済学部一回生のものですが、いまいちわからなかったので質問しました。 また、標準偏差はバラツキをあらわす目安で たとえば製品の長さを測定した結果、40、50、60、70、80cmだったとします。 この場合の標準偏差は14.1で 14.1cmのバラツキがあるということだと思いますが、 このバラツキというのはどこを基準としたバラツキなんでしょうか? 長さはそれぞれ10cmずつしか違いませんし・・・ 中央値からのバラツキなんでしょうか? これももっとわかりやすい例とかあればお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • flex1101
  • ベストアンサー率37% (45/119)
回答No.2

大きい、小さいというのは、絶対的なものでなく、相対的なもので使うと思います。 2グループのそれぞれの分散を検討した時、Aの分散は80.5でBの分散は10.1だった。 Aと比べてBの方が平均値近辺にデータが集まっている、というように。 バラツキは「中央値」でなく「平均値」からのバラツキです。 平均値 = 各人のデータを足し合わせたもの / 人数 中央値 = 各人のデータのうち、並び替えをして、中央に来るデータ値 1, 4, 6, 10, 12の中央値は6で、平均値は33/5 = 6.6になります。微妙に違いがあります。 40, 50, 60, 70, 80cmはそれぞれ10cmずつしか違いませんが、平均値(60cm)とそれぞれの データとの差(絶対値)は20cm, 10cm, 0cm, 10cm, 20cmとなり、0cmの差が一つ、 10cmの差が二つ、20cmの差が二つとなりますね。 50, 50, 60, 70, 70cmの場合と比べて、分散が大きいことは分かりますでしょうか。

その他の回答 (1)

noname#114565
noname#114565
回答No.1

高校数学からやり直してください 教科書にわかりやすく書いてあるはずです http://www.cap.or.jp/~toukei/kandokoro/html/14/14_2migi.htm

関連するQ&A

  • 正規分布における平均値175、分散100の問題

    はじめまして。初心者で統計の勉強をしているのですが、わからない問題があって困っています。どなたかご教授おねがします。 測定値が、平均値175、分散100の正規分布にしたがっていたとして、 (1)測定値が185のとき、基準化した後の値はどうやって求めればいいでしょうか?基準化=(測定値-平均値)÷標準偏差 の数式がありますが、分散100の意味がわかりません。 また以下ははどうやって求めればいいでしょうか? (2)測定値が185以上となる確率 (3)測定値が、171≦ 測定値 ≦ 191 の条件を満たす確率 (4)Aさんが、測定値X以下となる確率を求めたら67%だったときのXの値

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。

  • 統計

    次の問題が分かりません。教えて下さい。 1000人の平均身長が168cm、分散が25、標準偏差5のとき正規分布表を用いて次の値を求めよ。 (1)身長165cmは何%タイル値か? (2)85%タイル値に当たる身長は何cmか? できれば途中式などもお願いします。

  • 統計学?

    初めて投稿します。まともに勉強もしないで生きてきて全然わからない問題あります。 Aの測定値は、平均値μ1、標準偏差のα1の分布 Bの測定値は、平均値μ2、標準偏差のα2の分布 Aの測定値の分布とBの測定値の分布から1つずつの値を抜き取ったとして Aの測定値-Bの測定値という値を計算すると、その分布は正規分布する。 正規分布の平均値と標準偏差は下記のとおりである。 平均値μ=μ1-μ2である。なぜこうなるのかを記述せよ。 さらに標準偏差を導きなさい。 言葉の意味も含めて教えていただけるとうれしいです。よろしくお願いいたします。

  • 標準得点はなぜ平均0,分散1になるのか

    標準得点がなぜX~N(0,1)の分布になるのかが理解できません。 なんとなくですが、計算式 "(X-平均)/標準偏差"から、標準得点とは 「"平均から値Xの差"が標準偏差のどれくらいの割合か」 という意味だろうなぁと理解してます。 しかし、なぜこの計算式の結果が、平均が0、標準偏差が1の分布になるのでしょうか?

  • 標本分散と不偏分散の使い分けについて。

    標本分散と不偏分散の使い分けについて。 私はメーカーに勤めており、電子部品のばらつきなどでよく標準偏差σを目にします。 自分で少し調べてみると標準偏差にも標本分散を使うときと不偏分散を使うときがあることを知ったのですが、説明が難しくどのように使い分けていいのか分かりません。 標本分散と不偏分散はどのように使い分ければいいのでしょうか。 例えば電子部品の性能や実験データのばらつきにはどちらが使われているのでしょうか? ご存知の方、教えてください。 よろしくお願いします。

  • 共分散

    証券 (1)(2)(3)(4)(5)(6)(7)(8)(9) 平均 0.066 0.062 0.146 0.173 0.198 0.055 0.128 0.190 0.116 標準偏差 0.231 0.121 0.292 0.309 0.357 0.230 0.169 0.383 0.281 のときの共分散を求めたいのですが 共分散={(-0.305-0.066)(-0.173-0.062)+(0.513-0.066)(0.098-0.062) +・・・+(0.154-0.066)(0.176-0.062)}/18と表されるみたいなのですが どうやっているのでしょうか。 どういう計算で行っているのでしょうか。 ちょっとよくわからないのですがよろしくお願い致します。 ={(-0.305-0.066)・・・の0.305はどこから出てきたのでしょうか。

  • 統計学 分散について

    今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。  ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。  分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。  2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。  言ってる事がいまいち伝わらないかと思いますが・・・  どなたか解説お願いします。  分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・

  • 分散と標準偏差について

    不偏分散をVとした場合、標準偏差sはルートVで出てきますが、分散が1以上の場合は標準偏差は分散より小さい値になり、分散が1未満の場合は標準偏差の方が大きい値になります。この場合(分散が1未満)の標準偏差値は正しいのでしょうか?分散より標準偏差の方が小さくなるという概念があるので、理解しがたいのです。どのたか判り易く説明した頂けませんでしょうか?

  • 正規分布に従うときの母平均と母分散の求め方

    今、数千件のデータを解析しています。 ヒストグラムから、それぞれの時点のデータが正規分布に従うことが分かりましたので、母集団も正規分布に従う、という仮定の下で話を進めます。 各時点での平均と標準偏差をプロットしたところ、右上がりの一次関数になり、一定の値にはなりませんでした。 そこで、このような場合(標本平均も標本分散も一定の値にならない)、どうやって全体の母集団のパラメータを推定するのでしょうか。 教えてください。