締切済み

標準偏差の意味がわかりません

2015/08/11 14:36

標準偏差の意味がわかりません。１　平均との差を求め２　それを2乗して３　その総和を求めて４　データ数で割って５　その平方根以上が一般的な標準偏差の説明の説明のようですが、４、５が入れ換わり . . ３　その総和を求めて４　その平方根５　その平方根をデータ数で割るならば標準偏差の値の意味が理解できるのですが？数学に疎い私でも理解できるような説明をお願いします。ネット上も探したのですがよくわかりません。

a_yamada
お礼率92% (39/42)

数学・算数
回答数6
ありがとう数5

みんなの回答 （6）
専門家の回答

みんなの回答

noname#227064

2015/08/11 20:05 回答No.6

実際に具体的なデータで平均、分散、標準偏差及び貴方が提案された標準偏差を計算してみましょう。例１（■で頻度1。以下同様） -1:■ 0 :■■　 1 :■ 平均　0 分散　1/2 標準偏差　(√2)/2 提案された標準偏差　√2/4 例２ -1:■■ 0 :■■■■　 1 :■■ 平均　0 分散　1/2 標準偏差　(√2)/2 提案された標準偏差　1/4 例３ -1:■■■■ 0 :■■■■■■■■　 1 :■■■■ 平均　0 分散　1/2 標準偏差　(√2)/2 提案された標準偏差　√2/8 以上３つの具体例を挙げてみましたが、如何でしょうか？３つの例は、データ数は違いますが頻度ではなく割合で表示しますと、全部同じであることはお分かりかと思います。さて、分散も標準偏差もデータが平均からどれだけばらついているかの指標ですが、この例のように割合で表示したときに同じ分布になるものは、ばらつきの指標も同じ値になって欲しいと思いませんか？残念ながら、貴方の提案された標準偏差では同じにはならず、データ数に依存した値になっています。データ数が多ければ多いほどその値が小さくなっています。一方、分散と標準偏差は３つの例で全て一致しています。

atkh404185
ベストアンサー率65% (77/117)

2015/08/11 17:45 回答No.5

例えば、 a,b,c,d,e の５個のデータの平均値は x=(a+b+c+d+e)/5 と、データの個数５で割るから、標準偏差も同じように、 √{(a-x)^2+(b-x)^2+(c-x)^2+(d-x)^2+(e-x)^2}/5 のように、　　５で割るべきだ。と考えているわけですね。 √[a-x)^2+(b-x)^2+(c-x)^2+(d-x)^2+(e-x)^2}/5] だと、　　√5 個の平均になってしまうのではないかと。この、平均値　や　標準偏差　を学習するとき、平均値　と　標準偏差　の間に　分散というのを学習すると思います。これが、 {(a-x)^2+(b-x)^2+(c-x)^2+(d-x)^2+(e-x)^2}/5 であり、データの個数５で割ります。でも、これは　２乗　しているためデータの平均値からの　平均的なばらつき　を表していない　と考えられ、（← ここの表現はいろいろあるのでウィキペディア等参考にして下さい）　　　データがテストの点数だと　　(得点)^2 データが長さ（cm）だと　　　(cm)^2 になってしまい、 √　をとる（平方根にする）ことによって、単位がそろい、データの平均値からの　平均的なばらつき　を表すことができる。のではないかと。　　　平均値　→　標準偏差ではなく　　　平均値　→　分散　→　標準偏差の流れを考えれば、理解できるのではないでしょうか。　

質問者

お礼 2015/08/11 18:06

回答ありがとうございます。分散までは数字の意味が理解できるのですが？

bran111
ベストアンサー率49% (512/1037)

2015/08/11 15:31 回答No.4

１　平均との差を求め２　それを2乗して３　その総和を求めてここまでは一緒です。総和＝Ｓ、データ数＝ｎとします。統計では v=S/n　（これを分散といいます）をもとめ、この平方根として標準偏差σを決めます。つまり σ=√ｖ=√(S/n) です。質問者の手順は σ’＝√S/n を求めるものであり、 σ’とσの関係は σ’＝σ/√n ということです。データ数が100の場合 σ’＝σ/10 となり、質問者の方式で得られるσ’は統計で使う標準偏差の1/10になります。多くのデータは平均値の左右2σの間に95％以上が入ってしまうことが解っています。この性格はデータの種類、データ数、平均値、標準偏差の値によらず普遍的に認められます。標準偏差の1/10である、σ’はその意味で何の意味も持ちません。データ数が大きくなるとそれはさらに明らかです。

質問者

お礼 2015/08/11 18:11

意味があるかないかはわかりませんがσ’ならば数字の意味がわかるのですが？

Willyt
ベストアンサー率25% (2858/11131)

2015/08/11 15:05 回答No.3

標準偏差の求め方はご質問に書かれているとおりですが、それが何を意味するかがわからないわけですよね。それをこれから説明します。平均値は判りますね。それは測定したデータの中心値ということでよく使われ、データは平均値の両側にばらついて存在することになります。そこでそのデータがどのくらいばらついているかを知りたくなることがあります。そのばらつきの程度をこの標準偏差が示しているのです。この値が大きいとデータは平均値からばらついた状態で存在しており、小さいとデータは平均値の周りに密集して存在しているいということを示すのです。ではどのくらいなのかというと、標準偏差のプラスマイナス３倍の間にほぼ１００％のデータが入ることが保証されているのです。これでデータのばらつきが掴めることになりますね。

質問者

お礼 2015/08/11 18:21

回答ありがとうございます。やはりσと実データ関係のイメージが掴めません。

trytobe
ベストアンサー率36% (3457/9591)

2015/08/11 15:02 回答No.2

なぜ、後者だと「標準偏差の値の意味が理解できる」のか、というご自身の理論がわからないと、ご自身が「統計の数学的理論のどこに疑問を抱いているのか」がわからないので、答えようがありません。なぜなら、ご自身の定義のほうが、統計学としてより便利で有用な系が構築できるのだ、という主張であれば、その検討価値がありますが、そこまでの深い理由ではないのであれば、統計学の入門書を最初から読んで、標準偏差を活用した検定のところまで読んだ上で、冒頭の定義であるメリットがご理解できるかと思うためです。

質問者

お礼 2015/08/11 18:24

かいとうありがとうございます。やはりσと実データの関係がイメージできません

noname#209945

2015/08/11 14:45 回答No.1

いづれにしても数は変化しません。相加平均も相乗平均も理解しているなら単に順番が違うだけです。

質問者

お礼 2015/08/11 18:32

回答ありがとうございます。やはり数値としてのσは理解できません。（分散までは数字としての理解はしているつもりですが）

関連するQ&A

標準偏差について
標準偏差について調べていたところ、↓のような説明がありました。「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。バラツキを見るために、個々のデータから平均値60を引きます（偏差）。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 －－－－－　計　0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を２乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 －－－－－　計　1000 このままでは、データ１個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。標準偏差＝ルート（1000/5)＝14.1 この製品は14.1cmのバラツキがあるということです。」この説明を読んで、なぜ偏差を２乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ１個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは？と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この２者間にはどのような関係があるのでしょうか？よろしくお願いします。
- 締切済み
- 数学・算数
標準偏差について
下記、アドバイスをお願いします。前提：標準偏差＝データの各観測値と平均との差の２乗の平均を取って、その平方根を取った値。正規化された形で表されたデータのばらつきを示す数値。１．0.86 ２．4.4 ３．-0.72 ４．0.44 ５．1.57 ６．1.13 ７．-1.70 ８．-0.58 上記の平均は、0.86←これは、理解できます。上記の標準偏差は、1.86←これが、分かりません。上記の標準偏差に対する比率0.36←これも、分かりません。標準偏差・標準偏差に対する比率の出し方の指南をお願いします。宜しくお願いします。
- 締切済み
- 数学・算数
標準偏差
平均を求め、平均との差の2乗を求め、差の2乗の平均を求め、平方根をはずしましたが、これで標準偏差は求まっているのでしょうか。平均：AVERAGE　平方根：SQRT
- ベストアンサー
- オフィス系ソフト
標準偏差の成り立ち
標準偏差の意味について、質問致します。（質問を簡潔にするため、母集団を分析の対象とします）標準偏差を求める場合、偏差の２乗和をデータ数で割り、その値の平方根を計算しますよね。なぜ、偏差２乗和の平方根で求めた数値を、データ数で割るという方法ではないのでしょうか？？（偏差２乗和）^０．５÷データ数の方がイメージがつかみやすい気がします… 分散は、対象データとは次元（単位？）が違うので、感覚的に分かり易いように、標準偏差が使用されると理解しています。単位を揃えることが目的ならば、データ数で割るという行為はルートの外に出すべきなのではと考えてしまいます。私は、どこで訳がわからなくなっているのでしょうか。。。アドバイス頂ければ幸いです。
- ベストアンサー
- 科学
統計　標準偏差について素朴な疑問
ＳＤについて、標準偏差は、データのばらつきを表す分散に平方根をつけた値である。分散に平方根をつけることによって、データと同じ単位で比較できるのだ。という理解をしています。そこで素朴な疑問です。データのばらつきをデータの単位と同じ水準でみたいのなら、わざわざ二乗して平方根つけるなんてめんどくさいことしないで、各データの平均値の差を絶対値で求めて平均値を求めればいいのでは？？と思いました。どんな弊害が出てくるのでしょう？教えてください。
- ベストアンサー
- 数学・算数
標準偏差について
標準偏差とは、「数列の平均と各値の差を２乗し、それらを平均したものの平方根」ということがシスアドの教科書に書いてあったのですが、何故こうなるのかわかりません。何故こうなるのでしょうか？
- ベストアンサー
- 数学・算数
標準偏差と誤差
初めて質問します。一般に標準偏差の計算は，母集団＝標本集団とすると（測定値－平均値）の２乗の和をデータ数で割ったものの平方根だと思います。（EXCELのSTDEVP関数もこの計算をしているようです。）ところで，大学のときに習った平均自乗誤差は，母集団＝標本集団の場合（測定値－平均値）の２乗の和をデータ数の２乗で割ったものの平方根ただし，母集団＞標本集団の場合は，（測定値－平均値）の２乗の和を（データ数＊データ数－１）で割ったものの平方根以上のように習いました。そこで質問です。１．分母が標準偏差は１乗で，平均自乗誤差は２乗なのはなぜでしょうか？２．母集団＞標本集団の場合は，（データ数＊データ数－１）になるのはなぜでしょうか？３．EXCELには母集団＝標本集団のSTDEVP関数と母集団＞標本集団のSTDEV関数がありますが，母集団＞標本集団の場合の標準偏差の計算というのはどんな計算をしているのでしょうか。よろしくお願いします。
- ベストアンサー
- 数学・算数
標準偏差等の求め方
公式はわかるのですが、教科書には細かい説明がなく、どう計算していいのかわからないので教えてください。（少し数学もはいるかも・・・）薬包紙の重さを測った結果 0.4125 0.4137 0.4205 0.4196 0.4139 0.4187 0.4099 となっていて、平均値は0.4161になりました。標準偏差の求め方を教えてください。平方根が外れないので、相対標準偏差や検出限界も出せないんです。。。（泣）お願いします！！
- 締切済み
- 化学
標準偏差を求めるにあたり
もうすでに質問されていることかもしれませんが・・・質問します。標準偏差を求めるときに、Σ(測定値ー平均値)^2を、母集団で考える場合はnで割り、標本で考える場合はn-1で割って、平方根を取って算出しますよね。標本で考える場合自由度が１下がるため、回数から１引いた数で割ればいいとテキストや考えたらなんとなくイメージすることができるのですが、数学的に考えた場合、なんで１を引くのか？どういう意味を持っているのか？理解できませんし、分かりません。１引くことがおそらく数学的に非常に重要なことなのでしょうが...気持ち悪くて気になります。私自身、勉強不足で標準偏差自体曖昧な理解なのですが、疑問に思ったので、どなたか分かる方教えてください。
- ベストアンサー
- 数学・算数
標準偏差算出方法をご教授ください。
下記の数値の標準偏差を出し方を教えてください。不安です。わからないと思います。 (1)21.8 (2)22.3 (3)21.9 (4)21.8 (5)22.1 ・与えられた数値の集合の標準偏差　1) 平均を求める　2) 平均と各数値の差を求め、それを二乗する　3) それを、データの個数で割る　4) その平方根を求める　これで、 0.193 が求められます。・与えられた数値が、ある大きな集団からとられた数値だとして、もとの大きな集団の標準偏差を推定する　上の 3) を、「データの個数 - 1」で割るに読み替えます。　これで、 0.217 が求められます。上記の【データ個数　-1】＝4（合っていますか？）で割るとするとどの数値を割ればよいか教えてください。
- ベストアンサー
- その他（ビジネス・キャリア）

標準偏差の意味がわかりません