• ベストアンサー
  • 暇なときにでも

標準平均Xバーの標準偏差について

たびたびすみません。 http://oshiete1.goo.ne.jp/qa3484149.html を質問させていただいたものです。 まず、「標準平均Xバーの標準偏差」というのは「標本誤差」という のですか? そもそもこの標本誤差というのは何に役立つのでしょうか? 高校の数学の教科書の問題で、下記のようなものがありました。 「ある県の17歳男子の体重の平均値は62kg、標準偏差は9kgである。  この県の17歳男子100人を無作為抽出で選ぶとき、100人の体重の  平均Xバーの期待値と標準偏差を求めよ。」 この標準誤差?というのは9/√100で0.9kgとなると思うのですが、 この0.9kgはどんな意味をもつのでしょうか? 100人全体の標準偏差は、「標本標準偏差」というものになり本来は 分母をn-1にして、これが母標準偏差の推定値ということなんです よね?それでこれはだいたい9kgに近いということですよね? (分母をnにしたものを標本標準偏差と呼ぶの?) 文章下手ですみません。 よろしくお願いします。

共感・応援の気持ちを伝えよう!

  • 回答数3
  • 閲覧数535
  • ありがとう数2

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1
  • backs
  • ベストアンサー率50% (410/818)

高校の教科書の問題が意図しているものが標準誤差なのかどうかは分かりませんが、標本平均値のばらつきの程度(つまり平均値の標準偏差)は標準誤差によって表されます。標準誤差が分かると、推定の精度がわかります。詳しくは参考書を読むか、googleすれば分かるでしょう。 > この標準誤差?というのは9/√100で0.9kgとなると思うのですが、 95%の信頼区間は標本平均±標準誤差*1.96で表されます。つまり、今回の場合だと [62 - 0.9 * 1.96, 62 + 0.9 * 1.96] = [60.236, 63.764] となりますから、母平均が60~63の区間に含まれる確率が95%ですよというわけです。 > 100人全体の標準偏差は、・・・ 標準偏差はデータのばらつきの程度を表したものです。今回の場合だと、標準偏差が9なのですから、 [62 - 9 * 1.96, 62 + 9 * 1.96] = [44.36, 79.64] という公式に基づいた計算をすると、標本値(データ)は44kg~79kgの範囲内に95%程度のデータが存在しているというわけです。 > 分母をnにしたものを標本標準偏差と呼ぶの? 違います。分母がnであろうと、n-1であろうとそれはまぎれもなく標本標準偏差(単に標準偏差と呼ぶ)です。分母がnであるのは普通の標準偏差で、分母がn-1であるのは不偏推定量です。不偏推定量の標準偏差だとサンプルサイズが小さくても誤差が少ないというわけ。

共感・感謝の気持ちを伝えよう!

質問者からの補足

ご回答ありがとうございます。 計3回の質問でかなり理解させていただきました。 ところで、 >[62 - 0.9 * 1.96, 62 + 0.9 * 1.96] = [60.236, 63.764] >となりますから、母平均が60~63の区間に含まれる確率が95% とのことですが、今回の教科書の問題では問題文に「平均62kg」 とあります。これがわかっているのだから意味がないのではないか・・・ と思うわけです。

関連するQ&A

  • 母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

    (聞きたいのは、最後の3行がメインです) http://oshiete1.goo.ne.jp/qa3478996.html の質問をしたものです。 標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」 の2種類があることはわかりました。 母標準偏差であっても標本標準偏差であっても「n」で求められる が、標本から母標準偏差を推定するときが「n-1」を使うという ことで理解しました。 ところで、「n」にしても「n-1」にしてもそんなに値としては 変わらないということなんですよね? 高校の時の教科書で、「標本平均(Xバー)の標準偏差」という のがありました。  「母平均m、母標準偏差sの母集団から大きさnの無作為標本  抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」 というのがありました。  「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの は全然違うものなんですよね?(値も全然違うものになってしま うと思います。)

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準偏差およびt-分布表について

    教えてください。 本に下記の例題がありました。 「取り出した標本が10、20、30、40であった と仮定します。この平均値の信頼区間をt表でもとめてください。」 回答は以下のようです 「平均xは(10+20+30+40)/ 4=25 標準偏差sは SQR{((10-25)^2+(20-25)^2 ・・・+(40-25)^2)/4)}=11.2 このxとsを下記の式に代入して t=(x-μ)/(s/SQR(n-1)) と記述して計算しますとあります。 質問1 標本から取り出したサンプルからの標準偏差の分母は 標本数nでなく、標本数nから1を引いた値n-1を分母として計算すると習ってきましたが、なぜこの問題ではsを求めるのにn-1でなくnで割ってあるのでしょうか? t分布表を使うときの標本の標準偏差はnで計算した値を利用しておこなうと考えるのでしょうか? 質問2 標本の標準偏差の分母はn-1とすると習ってきましたが、標本数が2のときには2-1ではなく2のままで標準偏差を計算すのですか? 標本が3を超えたときn-1を適応するのでしょう か?

その他の回答 (2)

  • 回答No.3
  • backs
  • ベストアンサー率50% (410/818)

> これがわかっているのだから意味がないのではないか・・・ そんなことはありません。この「平均62kg」という平均値は標本平均であって、母平均ではないのです。つまり、推定値であって真の値(母数)ではないということ。 > a <- rnorm(100, mean=62, sd=9) #平均62、標準偏差9の正規分布から100個サンプリング > mean(a) #100個のデータの平均値 [1] 63.74326 > b <- rnorm(100, mean=62, sd=9) > mean(b) [1] 63.1398 > c <- rnorm(100, mean=62, sd=9) > mean(c) [1] 62.29182 上記のように、コンピュータによって、平均が62で標準偏差が9という正規分布に従うデータを100個発生させて、その都度に平均値を求めてみる。そうすると、微妙には標本平均値はばらついているのが分かりますでしょ?

共感・感謝の気持ちを伝えよう!

  • 回答No.2

期待値や標準偏差をバラツキがあるデータ固有のものと思っていませんか? バラツキがある母集団から標本を採って統計量を計算すればその値もバラツキを 持ちますからそれらも期待値と分散(⇒標準偏差)を持ちます。 例えば、サイコロを転がして出目の平均を求めたとします。 100回振って平均がぴったり3.5になると思いますか(合計がぴったり350) 確率としては結構低いです。(実行すれば合計で330から370ぐらいだと思います) ある程度の標本を採って平均を求めても真の値からの誤差は常に含まれることを覚悟することが必要です。 理論値が分かっているときは『誤差だと思います』でいいですが、理論値が分かっていないときはどうしましょう。 A県の高校生女子の身長を100人のデータに基づいて出したとします。 平均158cmでした。これってどれぐらい正確なデータなのでしょう? 真の平均から誤差はないのでしょうか。(誤差が0.0cmというのはありえそうもないですね) 標準偏差が5cmと分かっていれば(分かってないときは標本から求めた標準偏差で代用するしか ないのですが)5/√100=0.5 という計算結果から 158±2*0.5から真の平均は157から159cmであると確率95%で言えるのです。 逆にもっと精度を上げて幅1cmで結論つけたければ 5/√x=0.25   x=400 標本数が400必要と計算もできます。その結果が158cmなら157.5~158.5の範囲であると確率95%で結論がつけられます。 こういうことをするための標準誤差なのです。 >今回の教科書の問題では問題文に「平均62kg」 >とあります。これがわかっているのだから意味がないのではないか・・・ 教科書だからそう書いていますが、実際にどういうときに統計が必要でしょう。 実際に平均や標準偏差が分かっているときはとる必要がありませんから、 分かっていない時の方がはるかに多いです。そして、それらを理解してもらうための 初期段階として分かっているときの求め方、式の操作を勉強して、やがて推定を勉強して いくのだと思います。算数から数学への移行もまず、数字の計算をしっかり勉強してから 方程式などの勉強に入るでしょう。+-×÷ができなければ方程式、等式変形など できるわけありませんから。それと同じだと思います。 とりあえず、この段階では平均62kg、標準偏差9kgと分かっていても標本を100とって 平均を求めたら60.2~63.8ぐらいのデータが得られそうだということは理解してください。

共感・感謝の気持ちを伝えよう!

関連するQ&A

  • 標準偏差と誤差

    初めて質問します。 一般に標準偏差の計算は,母集団=標本集団とすると (測定値-平均値)の2乗の和をデータ数で割ったものの平方根だと思います。 (EXCELのSTDEVP関数もこの計算をしているようです。) ところで,大学のときに習った平均自乗誤差は, 母集団=標本集団の場合 (測定値-平均値)の2乗の和をデータ数の2乗で割ったものの平方根 ただし,母集団>標本集団の場合は, (測定値-平均値)の2乗の和を (データ数*データ数-1)で割ったものの平方根 以上のように習いました。 そこで質問です。 1.分母が標準偏差は1乗で,平均自乗誤差は2乗なのはなぜでしょうか? 2.母集団>標本集団の場合は,(データ数*データ数-1)になるのはなぜでしょうか? 3.EXCELには母集団=標本集団のSTDEVP関数と 母集団>標本集団のSTDEV関数がありますが,母集団>標本集団の場合の標準偏差の計算というのはどんな計算をしているのでしょうか。 よろしくお願いします。

  • 標準偏差について

    エクセルで、標準偏差の式は4種類あり (STDEV、STDEVA 、STDEVP、STDEVPA) 違いがよくわかりません。 はじめの2つは分母が(n-1)、あとの2つは分母がn となっています。 高校の数学で習ったときは、分母はnだったと思います。 この違いはなんですか? (2つずつ同じ数式ですが、Aがあるのと無いのでは何が  違うかわかりますか?) エクセルのヘルプでは、下記のように書いてあります。 STDEV 引数を正規母集団の標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します。 STDEVA 数値、文字列、および論理値を含む引数を正規母集団の標本と見なし、母集団の標準偏差の推定値を返します。 STDEVP 引数を母集団全体と見なし、母集団の標準偏差を返します。 STDEVPA 数値、文字列、および論理値を含む引数を母集団全体と見なし、母集団の標準偏差を返します。

  • 統計学-母集団が少ない場合の標準偏差について-

    はじめまして。よろしくお願いします。 現在、70個ほどのデータの標準偏差と平均をグラフにしてまとめている作業をしています。(エクセルで、まず平均の棒グラフをつくり、その後、y誤差範囲に標準偏差を代入してグラフ化しています。)母集団もすくなく、データも明らかにばらつきがある、たとえて言うと、1のものもあれば、1000のものあるのに、データは70前後。 もちろん、標準偏差もものすごく大きくなります。 エクセルで作成しているのですが、STDEVPという母集団全部を考慮に入れる(標本としないで)式でやっています。 本題ですが、そのばらつきのある標準偏差をどうにかして縮めたいのです。「誤差を範囲に入れるような感じでやればもっと標準偏差のバーが小さくなるだろう。それを考えろ。」と上司は言ってきますが、私にはさっぱりわかりません・・・。 母集団がすくなく、明らかにばらつきが見て取れる場合の標準偏差の式が何か別にあるのでしょうか・・・。

  • 平均値±標準偏差は?

    質問させていただきます。 平均値±標準誤差はわかるのですが 平均値±標準偏差は何を表しているのかよくわかりません どなたかご教授ください・・・。

  • 標準偏差について

     標準偏差の問題です。回答がわかりません。教えてください。  あるテストの男子10人の平均点は60点、標準偏差は8点、女子10人の平均点は70点、標準偏差は6点、男子、女子合わせた標準偏差の求め方を教えてください。

  • 平均値の標準誤差と標準偏差の関係式について

    平均値の標準誤差と標準偏差の関係式について 平均値の標準誤差と標準偏差にはどのような関係式がありますか? 調べたのですがわからなくて困っています。わかる方がいましたら教えてください。

  • 平均と標準偏差の求め方について

    同じパラメーターについて、平均と標準偏差のみわかっているA群とB群の、2群をまとめた平均と標準偏差の求め方が知りたいのですが。

  • 母標準偏差について教えてください

    統計をあまりよくわかっていないので教えてください。 標本の平均、サンプル数、標準偏差 母集団の平均はわかっています。 この状態で母標準偏差を出す方法を教えてください。 よろしくお願いします。

  • 標準偏差/平均値で何がわかるの

    標準偏差の意味と標準偏差/平均値で何がわかるか教えて

  • -1~1までの一様乱数の平均値と標準偏差、標準誤差について

    -1~1までの一様乱数の平均値と標準偏差、標準誤差について サンプルとなる乱数の数が増えるほど平均値は0に近づきますよね? そのサンプルを1,10,100,・・・とどんどん増やしていくときの 平均値と標準偏差、標準誤差の挙動を知りたいです。 サイトではどこも○○個のサンプルではこうだ!としか載っていないので。。 こういったことがわかるサイト、書籍はないでしょうか。