標準偏差の計算について

このQ&Aのポイント
  • 標準偏差の計算方法として、データの個数が5であるにも関わらず割る4なのかについて質問があります。
  • 標準偏差を求める際に、データの個数が5であるにも関わらず割る4なのはなぜなのか疑問です。
  • 標準偏差の計算において、データの個数が5であるにも関わらず割る4なのかを疑問視しています。
回答を見る
  • ベストアンサー

標準偏差の計算について

標準偏差の計算について教えてください。 データが次のように用意されていたとします。 1,3,0,-1,-3 このときの解答が 平均値 = (1+3+0+-1+3)/5=0                          標準偏差=√ [ { (1-0)^2+(3-0)^2+(0-0)^2+(-1-0)^2+(-3-0)^2 } / 4 ] = √(20/4) = √5 このようになっておりました。 標準偏差を求める際に、なぜデータの個数が5であるにも関わらず割る4なのでしょうか。 平均値と同じ値のデータは分散のデータ数にカウントしないのでしょうか。 初歩的な質問かもしれませんが教えていただければ幸いです。

質問者が選んだベストアンサー

  • ベストアンサー
  • f272
  • ベストアンサー率46% (7995/17090)
回答No.2

たぶん,その解答が間違っている。標準偏差は5で割って √(20/5) = 2とすべきです。 なお,不偏標準偏差と言われるものもあって,こちらはデータの個数-1で割ります。この不偏標準偏差のことを,単に標準偏差と呼んでいるのであれば計算は正しいということになります。不偏標準偏差は,「得られているデータは多数の元データからサンプリングして得られた標本であって元データ全体ではない。しかし標本データから元データの標準偏差を推定したい」というときにその推定値として用いられるものです。

その他の回答 (2)

  • ddtddtddt
  • ベストアンサー率55% (174/311)
回答No.3

 #2さんの仰るように不偏標準偏差と言うべきなんですが、それを標準偏差として問題が作られる事も多いようです。何故ならサンプルの属するもとの多数データ(母集団といいます)の全てを測定する事は、ふつう実用的に不可能なので。  なので何にも考えてない問題が、標準偏差の名のもとに不偏標準偏差を正解ととする可能性は、けっこうあると思います。

qwewqwe
質問者

お礼

内容を補足いただいてより分かりやすかったです。ありがとうございました。

  • hue2011
  • ベストアンサー率38% (2800/7250)
回答No.1

データが5個だったら、関係は4でしょう。自分と他、ですから。標準偏差というのはばらつきですから、個々の視点ではなく、他との差異です。

関連するQ&A

  • 標準偏差の計算について教えてください。

    確率統計が超苦手なのですが,計算しなければなりません。よくわからないので教えてください。 例えば, 数:10 平均:1.1 標準偏差:0.05 数:5  平均:1.2 標準偏差:0.03 数:20 平均:1.05 標準偏差:0.1 が与えられたとき,どのようにして計算すれば,全体の標準偏差が算出できますか?

  • 分散と標準偏差の計算

    分散および、標準偏差の計算があっているか確認をお願いします。    英語(e) |数学(m) A君 60, 90 B君 60, 60 C君 90, 90 D君 40, 120 E君 50, 90 ここで、英語の平均:60点で、数学の平均:90点です。 英語の分散Se = 280、数学の分散Sm=360 英語の標準偏差:√280、数学は√360 共分散Sem = (-120)/(√280 √360)≒-0.378 で合っていますか?

  • 累計の標準偏差の計算方法とは?

    統計学的な計算について教えてください。 前提: ある商品Aの出荷量は毎日変動があり、過去のデータから計算したら平均50個で±5個の標準偏差でした。 標準偏差を2倍(=2シグマ)し、約95%の確率で、明日の出荷量の変動は、±10個の標準偏差の値に収まると予測しました。 質問: では、7日後の累積の出荷量は、95%の確率で、どれほどになるでしょうか。 予想では、95%の確率で、 ・累積出荷量が50個×7日 = 350個、 ・標準偏差は、 [10個の分散である100個]×[7日]の平方根で = 約26.5個 よって95%の確率で、350個に上限のぶれが26.5ぐらいの範囲に収まる 上記の計算で合っているでしょうか? 合っていない場合、正しい計算式を教えて頂けますと幸いです。 よろしくお願いします。

  • 標準偏差の成り立ち

    標準偏差の意味について、質問致します。 (質問を簡潔にするため、母集団を分析の対象とします) 標準偏差を求める場合、偏差の2乗和をデータ数で割り、 その値の平方根を計算しますよね。 なぜ、偏差2乗和の平方根で求めた数値を、 データ数で割るという方法ではないのでしょうか?? (偏差2乗和)^0.5÷データ数 の方がイメージがつかみやすい気がします… 分散は、対象データとは次元(単位?)が違うので、 感覚的に分かり易いように、標準偏差が使用されると 理解しています。 単位を揃えることが目的ならば、データ数で割るという 行為はルートの外に出すべきなのではと考えてしまいます。 私は、どこで訳がわからなくなっているのでしょうか。。。 アドバイス頂ければ幸いです。

  • 標準偏差と平均偏差の計算方法

    標準偏差と平均偏差について質問させてください。 平均偏差を求める際は  (a) |サンプルA-平均値|/サンプル数 + |サンプルB-平均値|/サンプル数... という計算式になると思います。 では何故、標準偏差は  (b) (サンプルA-平均値)^2^(1/2)/サンプル数 + (サンプルB-平均値)^2^(1/2)/サンプル数... とせず  (c) {(サンプルA-平均値)^2/サンプル数 + (サンプルB-平均値)^2/サンプル数...}^(1/2) となるのでしょうか。 よく「微分ができないから、平均偏差を使わず、標準偏差を使う」というお話を伺いますが (b)の方法でも同様に微分ができないのでしょうか。 稚拙な質問で申し訳ありませんが、お時間のある際にでもどなたかお答えいただければ幸いです。

  • 【数学・標準偏差σ】標準偏差のσ(シグマ)は全部の

    【数学・標準偏差σ】標準偏差のσ(シグマ)は全部のデータの標準偏差とサンプル抽出データの標準偏差は等しくなるそうですが、全部のデータから平均を出すのが難しい膨大な数のデータだから標準偏差を用いると書かれていたのに、標準偏差を導き出すのに全部のデータから標準偏差を出して、さらにサンプルから標準偏差を2度出しした方が計算処理は負荷が大きいのでは? 全てのデータから標準偏差を出すなら最初から全部のデータから平均を出したらよいのでは?

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。

  • 標準偏差の評価において妥当なデータ数は幾つか?

     標準偏差や分散などのデータのばらつきを調べる場合、評価の対象にするデータ数が多い程、その母集団の性質に近くなります。しかし、評価するデータ数が2個では、それから標準偏差を求めても、それが母集団の性質を表す数値とは言い難いです。評価するデータ数が幾つ以上であれば、その標準偏差や分散が意味のある値となるのでしょうか?一般的に。

  • 標準偏差の使い方について

    標準偏差の使い方についてお聞きしたいんです。 例えば、3つの処理区A,B,Cがあり、一つの区には、8つの調査個体があります。 それを同時期に2反復で試験を行いました。 以下のような感じでしょうか。 A(1,2,3,4,5,6,7,8) B(1,2,3,4,5,6,7,8) C(1,2,3,4,5,6,7,8) A'(1,2,3,4,5,6,7,8) B'(1,2,3,4,5,6,7,8) C'(1,2,3,4,5,6,7,8) この結果をまとめて、A,B,Cの棒グラフを作りたいのです。 その場合、Aの8個の平均と、A'の8個の平均をさらに平均を取ってして処理Aの値とするのと、 AとA'の16個を平均して処理Aの値とするのとは意味が違いますか? また、AとA'の平均を取った場合は2個の値の平均なので分散や標準偏差は求められなくなりますよね。 一方、AとA'の16個を平均して値を出した場合は標準偏差を出してグラフに示すことは出来るのでしょうか?また、その意味はあるのでしょうか。 また、A,A',B,B',C,C'の6つをグラフにして、それぞれの8個の値から標準偏差を付けるというのはおかしいでしょうか?

  • 標準偏差の計算方法。

    関数電卓で使われている、 2乗合計、合計、データ数から標準偏差を計算する方法をご存知の方、いらっしゃったら教えて下さい。 調べたけれど、各データが解っている方法しか出て来ません。 AIに聞きましたが、全然違う値になりました。