- 締切済み
- 困ってます
標準偏差について
標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 ----- 計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 ----- 計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。
- massa-
- お礼率73% (44/60)
- 数学・算数
- 回答数4
- ありがとう数0
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- 回答No.4
- Ishiwara
- ベストアンサー率24% (462/1914)
「そのまま平均するとゼロになってしまうので2乗する」という説明が、実はインチキなのです。なぜ2乗するのか、という理由には、先人たちの努力の積み重ねが含まれているのです。(インチキな説明によるなら、4乗だって6乗だっていいことになります。) 数学に限らないかもしれませんが、私たちは「体系化」された学問を習うときに「先人が苦労した課程を追いつつ」その順序で学習するのではありません。最初にその結論を「便利な道具」として、まず提供されて体系を学びます。ですから、この方法ですと「なるほどそのようなわけで2乗するのか」と納得するのは、かなり勉強が進んでからになってしまいます。そのあたりになれば「差の絶対値の平均」が、たいして役に立たないパラメータであることが分かります。 私たちは、とても自力では証明できないような定理を、毎日のように道具として使っています。「体系化された学問」というものは、そうして役に立っているのだ、と理解してください。
- 回答No.3
- Tacosan
- ベストアンサー率23% (3656/15482)
「平均偏差」というやつですね. 標準偏差と同じく「データのばらつき」を表す尺度なんですが, 標準偏差より扱いにくいので使われないんだそうです. 偏差の絶対値を使うなら, 平均値じゃなくて中央値を使いたい気もするなぁ. 「中央値からの偏差の絶対値の中央値」... うん, 「データのばらつき」を表す尺度としてはそれなりに合理的かもしれない. 数学的な扱いにくさはかなりのものだと思うけど.
- 回答No.2
- sanori
- ベストアンサー率48% (5664/11798)
もしも分布が二等辺三角形型の分布であるならば、おっしゃるような偏差の絶対値での統計は有力でしょう。 しかし、世の中にある確率分布は、現実問題、正規分布(ガウス分布)やポワッソン分布の形になっています。 それらは元々、二項分布の極限です。 私は、その説明をするときに、専ら、パチンコの釘と玉のモデルを使っています。 ここに図は描けないので、ネットで探してきたリンクを下記に示しておきます。 http://gakuen.gifu-net.ed.jp/~contents/museum/probability/page92_5.html http://gakuen.gifu-net.ed.jp/~contents/museum/probability/bin_dis.html http://gakuen.gifu-net.ed.jp/~contents/museum/probability/binomial_dis.html http://www.hokuriku.ne.jp/fukiyo/math-obe/nikou.htm ということで、正規分布等を前提とした確率統計論によって、#1さんがおっしゃるような、偉大なる先人達が残した便利ツールを利用することができるわけです。
- 回答No.1
- kumipapa
- ベストアンサー率55% (246/440)
バラツキを求めるのならば、偏差の絶対値の平均を求めれば良いのでは、ということですね。 「偏差の絶対値の平均」も立派な統計量と言うべきで、それでバラツキを把握されるのが間違っているとは言えないと思います。 ただ、お聞きしたいのは、なぜバラツキの量を把握したいのですか、それを把握して、どう利用されるおつもりですか、ということです。 例えば、製品の長さのバラツキを調べるとします。さて、バラツキを調べて、それから何をしましょうか。例えば、(1)製品の長さのバラツキを抜き取り検査で調べて、製品全体の不良率を推定したい、というのが一つの例でしょうか。ちょっと毛色を変えて(2)製品1個の長さのバラツキはわかったけど、それをn個つなげたときの長さのバラツキを推定したい、などというのもあるかも知れません。 このような要望に対して、「偏差の絶対値の平均」は現実的に無力です。一方、標準偏差は、(1)、(2)のような要望に答えてくれる統計量として活用されています。 (1)については、平均値と標準偏差σを調べれば、「では、平均からこのぐらい外れる確率は?」という数値(分布表)が、統計の教科書に必ず載っており、不良率などを見積もることができます。 (2)については、n個つなげた時には分散σ^2がn倍になりますので(分布によらずです)、標準偏差は√n 倍になると見積もることができます。 先にも言ったように、残念ながら「偏差の絶対値の平均」ではこのような応用をすることができません。 多くの分布関数が平均値と分散(or 標準偏差)をパラメタとして記述されていることもありますし、分散や平均値に対しては数学的な多くの議論も可能ですので、特別な理由がなければ標準偏差でバラツキを把握しておくのが無難だと思います。
関連するQ&A
- 標準偏差の意味がわかりません
標準偏差の意味がわかりません。 1 平均との差を求め 2 それを2乗して 3 その総和を求めて 4 データ数で割って 5 その平方根 以上が一般的な標準偏差の説明の説明のようですが、4、5が入れ換わり . . 3 その総和を求めて 4 その平方根 5 その平方根をデータ数で割る ならば標準偏差の値の意味が理解できるのですが? 数学に疎い私でも理解できるような説明をお願いします。 ネット上も探したのですがよくわかりません。
- 締切済み
- 数学・算数
- 標準偏差の成り立ち
標準偏差の意味について、質問致します。 (質問を簡潔にするため、母集団を分析の対象とします) 標準偏差を求める場合、偏差の2乗和をデータ数で割り、 その値の平方根を計算しますよね。 なぜ、偏差2乗和の平方根で求めた数値を、 データ数で割るという方法ではないのでしょうか?? (偏差2乗和)^0.5÷データ数 の方がイメージがつかみやすい気がします… 分散は、対象データとは次元(単位?)が違うので、 感覚的に分かり易いように、標準偏差が使用されると 理解しています。 単位を揃えることが目的ならば、データ数で割るという 行為はルートの外に出すべきなのではと考えてしまいます。 私は、どこで訳がわからなくなっているのでしょうか。。。 アドバイス頂ければ幸いです。
- ベストアンサー
- 科学
- 統計 標準偏差について素朴な疑問
SDについて、標準偏差は、データのばらつきを表す分散に平方根をつけた値である。分散に平方根をつけることによって、データと同じ単位で比較できるのだ。 という理解をしています。 そこで素朴な疑問です。データのばらつきをデータの単位と同じ水準でみたいのなら、わざわざ二乗して平方根つけるなんてめんどくさいことしないで、各データの平均値の差を絶対値で求めて平均値を求めればいいのでは??と思いました。 どんな弊害が出てくるのでしょう?教えてください。
- ベストアンサー
- 数学・算数
- 標準偏差と誤差
初めて質問します。 一般に標準偏差の計算は,母集団=標本集団とすると (測定値-平均値)の2乗の和をデータ数で割ったものの平方根だと思います。 (EXCELのSTDEVP関数もこの計算をしているようです。) ところで,大学のときに習った平均自乗誤差は, 母集団=標本集団の場合 (測定値-平均値)の2乗の和をデータ数の2乗で割ったものの平方根 ただし,母集団>標本集団の場合は, (測定値-平均値)の2乗の和を (データ数*データ数-1)で割ったものの平方根 以上のように習いました。 そこで質問です。 1.分母が標準偏差は1乗で,平均自乗誤差は2乗なのはなぜでしょうか? 2.母集団>標本集団の場合は,(データ数*データ数-1)になるのはなぜでしょうか? 3.EXCELには母集団=標本集団のSTDEVP関数と 母集団>標本集団のSTDEV関数がありますが,母集団>標本集団の場合の標準偏差の計算というのはどんな計算をしているのでしょうか。 よろしくお願いします。
- ベストアンサー
- 数学・算数
- 標準偏差と分散の単位についての質問です.
標準偏差と分散の単位についての質問です. データのばらつきを評価する1つの手段として,分散が使われます.この時,分散の計算式から,「分散の単位は,標本のデータの2乗である.そこで標本のデータと単位をそろえるために,平方根を取り,標準偏差とする」と,しばしば説明されます.この説明の,特に前半部分がピンときません. 例えば標本の単位がメートルであった時,分散の単位は平方メートルになります.「そりゃ,機械的にそうなるよな」と,私はまず思います.次に「単位が平方メートルということは,じゃあ,分散というものは面積か?」と考えてしまいます.そして「長さのばらつきを評価したいだけなのに,なぜ面積なんかが登場するのだ」,と混乱します.標本の単位がグラムであれば,「グラムの2乗ってなんなんだ?」とますます混乱します. 混乱しないためにはどのように考えれば良いのか,アドバイスをいだたければ幸いです. メートルの2乗だから面積,などと具体的に踏み込んでしまうのがいけないのでしょうか?メートルの2乗はメートルの2乗以上のものではなく(つまり面積を意味しているわけではなく),機械的にメートルの2乗になっているだけなのでしょうか?グラムの2乗についてもそうで,その具体的な意味を考えることが無意味なのでしょうか? それとも,グラムの2乗にもちゃんと意味があって,混乱するのは,私が単位というものの本質を理解していないからでしょうか?
- ベストアンサー
- 数学・算数
- 標準偏差について詳しい方お願いします
お世話になります。 標準偏差は平均からのばらつき・・とききますが、「標準偏差が大きい」「小さい」という、その目安がわかりません。 たとえば、50人の集団で平均年齢30歳、標準偏差1.2だったらどうでしょうか? また、平均年齢が同じぐらいでも、標準偏差が1.0と10.0と違う2つの集団についていろんなデータを比べると、何か問題がありますか? どちらかでもいいので、わかるかたがいましたらおねがいいたします。
- ベストアンサー
- 数学・算数