• ベストアンサー

標準偏差と平均偏差の違い

標準偏差と平均偏差は、数字としての意味は何が違うのでしょうか。(算出方法の違いなどは分かります) 換言すれば、平均偏差でもサンプルのばらつきが表現できるのに、わざわざ計算過程をややこしくして標準偏差を求めることにどのようなメリットがあるのかということです。 『数種類の検体を用いて同一行程の実験を行い、その結果の値の揺れ(ばらつき)を求めたい』 このレポートへのアプローチとして、平均偏差または標準偏差を利用するとき、両者が意味的にどのような違いをもつのか、ご教授ください。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

ばらつきの大きさを比較したいなら、どちらでも同じでしょう。 違いを考えるには、平均とは何か?ということが鍵になります。サンプルの平均は m=(x1+...+xn)÷n で求めるのが通例ですが、なぜこうするのがよいか?を考えてみてください。 実は、このようにして求める平均は、標準偏差の2乗和を最小にします。 では、平均偏差を最小にするような値を計算してみましょう。つまり、   J= |x1-μ|+...+|xn-μ| を最小にするμを求めるわけです。 例えば、データが(1,1,1,0,-3)だったとします。 m=0 となりますが、(2)式を最小にする値は、0ではありませんね。 一方で,標準偏差の2乗和  V= (x1-μ)^2+...+(xn-μ)^2 を最小にするμはVをμで微分して=0と置いて、とけば  μ=m であることがわかります。 平均偏差を最小にする値は中央値ですので、そこが違うということになるわけです。

その他の回答 (3)

  • cyoki_par
  • ベストアンサー率28% (9/32)
回答No.3

普通は、誤差は正規分布に従うと考えられます。 単にバラツキを見るだけなら、どちらでもよいでしょうが、そのばらつきから何かを推定しようとする場合は、標準偏差の方が良いと思います。  つまり、xもyも測定値に誤差が考えられるという場合は、標準偏差を用います。

回答No.2

ANo.1の方がおっしゃっているように、扱いの差が違うようです。 平均偏差の方が数字的には実感があるですが、絶対値をとるので、数学的に扱いづらい。 標準偏差は2乗するために、プラス・マイナスを考えなくてもよいので、その後の計算がしやすいということでした。 一見2乗する方が計算が面倒だと思えますが、プラス・マイナスのベクトルを考えなくてよいということがその後の展開を楽にしています。 そのため、実験計画法や正規分布など標準偏差(あるいはその2乗の分散)を使ったモデルが確立されています。 質問内容によれば、実験におけるバラツキについて調べるとか。 単純にバラツキだけを見るなら平均偏差で十分だと思いますが、実験計画法や平均値の差、予測などを行うなら、すでに理論のある標準偏差の方がいいと思います。

  • liar_adan
  • ベストアンサー率48% (730/1515)
回答No.1

私も同じ疑問を持って、教授に質問したことがあります。 すると、 「平均偏差も意味があるのだが、数学的には標準偏差の方が扱いやすい」 とのことでした。 平均偏差だと、サンプルから計算するとき、 絶対値計算をしなければなりません。 これは本質的に場合分けをしなければならず、 そういった計算方法は解析的には扱いづらい。 標準偏差は、2乗計算があって一見複雑だけど、 場合分けの手間がないので解析的には扱いやすい。 と、どこまで先生が言った言葉か忘れたけど、 たしかそういうことだったと思います。

関連するQ&A

  • 母平均が分からないのに母標準偏差が分かるのは何故?

    今、統計学の本の「母標準偏差が既知の場合の母平均の推定」という項目を読んでいます。 その計算自体は簡単なのですが、そもそも、母平均が分からないのに母標準偏差が分かる状況ってどんな状況ですか?母標準偏差を算出する際に母平均を使うでしょう?基準(平均)が分からないのにバラツキが分かりますか?

  • 標準偏差について疑問が!

    データの評価に標準偏差というものを使おうと思うのですが、疑問があります。 88 40 41 74 47 3 90 94 42 57 88 95 60 91 83 97 65 95 79 36 25 27 63 83 2 15 27 32 っというデータ群があります。 平均が59で、標準偏差が30です。 で、ばらつきの範囲というので μ+3σ(99%含まれる) μ+2σ(95%含まれる) μ+1σ(64%含まれる) 標準偏差(σ) μ-1σ(64%含まれる) μ-2σ(95%含まれる) μ-3σ(99%含まれる) μは平均値 という式があるので、これに上記結果を当てはめると μ+3σ 149 μ+2σ 119 μ+1σ 89 標準偏差 30 μ-1σ 29 μ-2σ -1 μ-3σ -31 っとなります。 ここで不思議なのですが、今回のサンプルデータは国語のテストの点数という事で、最低を0点、最高を100点としています。 平均に対するバラツキという意味で考えると、サンプルデータの最高点と最低点よりも上下のあるのがおかしく思えます。 っというか100点以上と、0点いかが存在するのは本当に不思議です。 私の計算が間違っているだけだと思うのですが、 どなたかこの間違いを指摘していただけないでしょうか?

  • 標準偏差の2つの出し方の違い

    データのばらつきを統計処理して標準偏差を出したいのですが、2つのやり方で値が異なるので困っています。 ・標準偏差の定義の式でもとめるやりかた ・データから度数分布表を作ってヒストグラムを描きそれをガウスフィットしてそのガウス関数の式から標準偏差を求めるやり方。 この2つを比較したらフィットするやり方のほうが標準偏差が低くでました。  この標準偏差の値の違いの原因がおわかりになりましたら教えて下さると非常に助かります。 また、正しく母集団の標準偏差を算出できる方法はどちらなのでしょうか。 不勉強で申し訳ありません、教えて下さると幸いです。

  • 標準偏差と平均偏差の計算方法

    標準偏差と平均偏差について質問させてください。 平均偏差を求める際は  (a) |サンプルA-平均値|/サンプル数 + |サンプルB-平均値|/サンプル数... という計算式になると思います。 では何故、標準偏差は  (b) (サンプルA-平均値)^2^(1/2)/サンプル数 + (サンプルB-平均値)^2^(1/2)/サンプル数... とせず  (c) {(サンプルA-平均値)^2/サンプル数 + (サンプルB-平均値)^2/サンプル数...}^(1/2) となるのでしょうか。 よく「微分ができないから、平均偏差を使わず、標準偏差を使う」というお話を伺いますが (b)の方法でも同様に微分ができないのでしょうか。 稚拙な質問で申し訳ありませんが、お時間のある際にでもどなたかお答えいただければ幸いです。

  • 標準偏差/平均値で何がわかるの

    標準偏差の意味と標準偏差/平均値で何がわかるか教えて

  • -1~1までの一様乱数の平均値と標準偏差、標準誤差について

    -1~1までの一様乱数の平均値と標準偏差、標準誤差について サンプルとなる乱数の数が増えるほど平均値は0に近づきますよね? そのサンプルを1,10,100,・・・とどんどん増やしていくときの 平均値と標準偏差、標準誤差の挙動を知りたいです。 サイトではどこも○○個のサンプルではこうだ!としか載っていないので。。 こういったことがわかるサイト、書籍はないでしょうか。

  • 標準偏差についての質問です.

    標準偏差についての質問です. 実験データの標準偏差を求めて,ある対象における測定結果のばらつきを調べたいのですが,1つの実験における検体数はどの程度が妥当といえるのでしょうか?

  • 標準偏差の平均値の求め方

    二つの標準偏差σaとσbがあったとします。 このとき両者の平均値は(σa+σb)/2ではなく、 SQRT((σa^2+σb^2)/2) となるらしいのですがどうして単純に足して割るだけではだめなのでしょうか?

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。