• ベストアンサー

統計学 推定の標本標準偏差

試験に備えて区間推定の練習問題をやっているのですが、どうしても標本標準偏差の値が解答とずれてしまいます。 何度もテキストを読み直しましたが、自分ではまったく原因がわかりません。 統計に詳しい方がいらっしゃいましたら、どうか教えてください。 お願いします。 問題:某地区の10世帯について1ヶ月の電気使用量を調査した。    5900 4300 4200 3800 5200 4500 5100 6200 4700 4100 この地区の電気使用量の平均を信頼係数90%で区間推定せよ。   (解答では、標本標準偏差は790.2となっている)

質問者が選んだベストアンサー

  • ベストアンサー
  • age_momo
  • ベストアンサー率52% (327/622)
回答No.4

分散の計算式の基本は 1/(n-1)Σ(x-m)^2=1/(n-1)Σ(x^2-2mx+m^2) です。これが元々の定義ですね。(不偏分散の方です) これで計算すると普通に790.2になります。ここで質問者さんや#2さんの計算をしたいなら m=1/nΣx ⇒ nm=Σx からΣ(-2mx+m^2)=-2mΣx+nm^2=-nm^2 不偏分散=1/(n-1)(Σx -nm^2) となります。つまり、 s^2 = 236020000 / 9 - 23040000 = 3184444 s = 1784.501 ではなく s^2 = 236020000 / 9 - 23040000*10/9 = 624444.444444444 s = 790.2 と計算します。

igosyo2005
質問者

お礼

迅速な御回答ありがとうございます。 とても詳しく教えていただいたおかげでばっちり理解することができました。 この度は、本当にありがとうございました。

その他の回答 (4)

  • backs
  • ベストアンサー率50% (410/818)
回答No.5

age_momoさん補足ありがとうございます。私も投稿してから気づいたのですが,不偏分散の公式とそうでない普通の分散の公式とでは元々の定義式がことなるので,式の変形も異なるのですね。 私は勘違いして不偏分散でない公式を変形したもの(つまり私が提示した式2の公式)を使って,それを不偏分散だと思い込んでしまっていました。 不偏分散の公式を計算しやすいように変形したものは, s^2 = ( ΣX^2 - n * X'^2 ) / (n -1)  X'は標本平均値 ですね。完全に勘違いしておりました。質問者さんも申し訳ありませんでした。まぁ,こういう間違いはしないようにということでご勘弁を!!

igosyo2005
質問者

お礼

御回答ありがとうございます。 そんなことはありません。充分に参考になりました。 ありがとうございました。

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

s^2 = Σ(X - X')^2 / n …(式1) X'は標本平均 s^2 = ΣX^2 / n - X' …(式2) X'は標本平均 質問者さんは(式2)のほうで計算されたようですね。実は私もExcelのセルに数値を打ち込んでチマチマと計算してみたのですが,なぜか(式2)の方では答えが質問者さんと同じになってしまいました。(式1)では正常に答えが出るのに。。。 各標本値を2乗 = (34810000, 18490000, 17640000, 14440000, 27040000, 20250000, 26010000, 38440000, 22090000, 16810000) これの合計 = 236020000 標本平均値 = 4800 これの2乗 = 23040000 以上の値をもとに計算すると, s^2 = 236020000 / 9 - 23040000 = 3184444 s = 1784.501 …どうしてでしょう?同じ手順で他の数値例を使ってやれば正常に答えがでるのですが,この数値例で計算すると何度やっても答えが合いません。誰かが間違いを指摘してくれれば良いのですが,もう少し考えてみます。 No.1さんは何かソフトウェアを使ったのでしょうか?

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

問題が「この地区の電気使用量の平均を信頼係数90%で区間推定せよ。」なのに,なぜ解答が標本標準偏差なのでしょう? 平均値の区間推定についてまとめておくと, 1. 母分散は既知か未知か。未知ならば標本値から得られる不偏分散を用いる(今回の例では624444.4)。 2. 教科書に載っているであろう区間推定の式に値を当てはめて計算すればできるはずです。 これとは別に,質問者さんが計算した標本標準偏差と解答の値が異なっているのは,解答の値は不偏推定量(不偏分散の平方根)で,質問者さんが用いた計算式は不偏推定量の公式ではないのでしょう。その辺りを確認してみるとよろしいかも。 不偏推定量を用いた場合=790.218 そうでない場合=749.6666

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.1

少し気になったのですが、区間推定するなら必要なのは標本から計算された 母集団の標準偏差の予想値(期待値)です。標本標準偏差ではありません。 不偏分散を求めて平方根とったら普通に790.2になるのですが、 質問者さんはどう計算されて、いくつになったのでしょうか? 標本数10から1引いて9で割っていますか?

igosyo2005
質問者

補足

そうなんですか? すみません。ずっと標本標準偏差かと思っていました。 計算ですが、まず上の10個の数をそれぞれ2乗したものを足した後、9で割って平均値の2乗で引き、平方根をとりました。 (34810000+1849000……)÷9-23040000 →√をとる そうすると、1784.501になってしまいます。 計算方法が間違ってるのでしょうか?

関連するQ&A

  • 統計学の練習問題 解説が理解できないので…

    統計学の練習問題を解きたいのですが、解説が理解できないので教えてください。 「世帯数が約10万の市でn世帯を無作為に抽出して各世帯の人数を調べて市の人口を推定する。 推定量の変動係数を5%以下にするためには 抽出する世帯数nはおおよそいくら必要か。 ただし母集団の変動係数は1.0以下であることがわかっている。」 解説には 「世帯数を推定するのに推定量の分散が最大となる場合、つまり母集団の変動係数が1.0である場合を考えて、この場合でも推定量の変動係数が5%以下になるように標本サイズを定めればよい。標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。これが5%以下になるためには、標本サイズは(1/0.05)^2=400以上あればよい。」 と書いてあります。 理解できないのは、 『標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。』 この部分です。 変動係数=標準偏差/平均値 標準誤差=標準偏差/√n というのは調べました。 どうして『』のような流れになるのでしょうか? 教えてください。よろしくお願いします。

  • 統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本

    統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本平均9.1(標準偏差2.3、n=25)を平均値検定した結果、z=2.43で有意水準5%で有意差ありとなっていました。ところが、それぞれの母平均を区間推定すると95%信頼区間で推定幅に重なりを持ってしまいます。もし、有意差があるなら、重なりを持たないと理解していますが…。当方の計算法の誤りまたは計算違いでしょうか?計算方法は、例えば前者の場合、7.5±1.96×不偏分散の平方根/28の平方根でやってます。

  • 2つの正規母集団に関する統計量の分布&推定

    (1)二つの標本平均をX、Yとしたとき、X-Yの標準偏差は?という問題の解き方はわかるのですが、3X-2Yのときどうやったら良いのでしょうか?(2)320名を標本抽出したとき検査の陽性率は67.8%であった。陽性率Pを信頼係数95%で区間推定すると~となる、という問題はどうやって解けばよいのでしょうか。統計学初心者ですが教えてください!

  • 誤差はほんとに「1.96×標準偏差」?

    某問題集で次のような問題がありました。 母標準偏差を20として信頼度95%で誤差2以内で推定するには標本の大きさをいくら以上にする必要があるか。 自分の解答も問題集の解答も一致していて、「1.96×20/√n≦2」を解いて、n≧385」を得ました。ただ、これの解説を求められたときに、この「誤差」という意味をうまく説明できませんでした。なぜなら例えば母平均が30だったとして誤差2の推定は、「誤差」を上記解答の意味でとらえると信頼度95%の推定区間は、「大きさnの標本から推定区間を作るという調査を何度も繰り返すと、区間として[25,29]や[28,32]などいろいろありうるが、95%くらいの割合で間に30をはさんでいる」という意味になると思うのですが、もちろんそこには[26,30]や[30,34]の場合も含んで言っているわけです。しかし、そうするとこの場合区間の中で母平均との差が最大4あることになります。これで誤差2ということになるのでしょうか。つまり、本来は「誤差」という言葉を実質「信頼区間の幅」と置き換えて解釈して、「2×1.96×20/√n≦2」として解かなければならないのではないかと思うのです。 標準誤差という意味は全く違う単語だし、はっきり数学的に定義されていない中で「誤差」をどう解釈すればうまく「1.96×標準偏差」という意味になるか、うまい説明があれば教えていただきたいと思います。

  • 【統計】区間推定の問題

    はじめまして。 統計で下記のような問題が出されましたが、 解答がわからず、もし詳しい方がいらしたらお答えいただけないでしょうか。 単純な問題だと思いますが、参考書等みてもどのスキームの問題なのか 判別できず、解答が手付かずの状態です... よろしくお願いいたします。 問 A市とB市で標本調査を行ったところ、 禁煙者は、A市では200人中140人、 B市では900人中630人であった。 (1)A市における禁煙者の割合を信頼度95%で区間推定しなさい。 (2)B市における禁煙者の割合を信頼度90%で区間推定しなさい。

  • 母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

    (聞きたいのは、最後の3行がメインです) http://oshiete1.goo.ne.jp/qa3478996.html の質問をしたものです。 標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」 の2種類があることはわかりました。 母標準偏差であっても標本標準偏差であっても「n」で求められる が、標本から母標準偏差を推定するときが「n-1」を使うという ことで理解しました。 ところで、「n」にしても「n-1」にしてもそんなに値としては 変わらないということなんですよね? 高校の時の教科書で、「標本平均(Xバー)の標準偏差」という のがありました。  「母平均m、母標準偏差sの母集団から大きさnの無作為標本  抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」 というのがありました。  「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの は全然違うものなんですよね?(値も全然違うものになってしま うと思います。)

  • 統計 母平均推定?

    統計の課題で、以下のような問題が出されました。 100世帯の家計調査の結果によると、年間の医療費支出は平均値275,000円、標本分散の平方根である標準偏差が75000円であった。1世帯あたりの医療費の母平均が95%の確率を持って含まれると期待される区間を求めよ。 教科書などで調べたところ、「母平均が○○円であると言えるか」という場合はRでt検定を行えばいいということまで分かりましたが、この問題とは少し違うようなので困っています。検定方法、Rで出来るならコマンドなどの解説をお願いします。

  • 統計学、区間推定についてお尋ねします!

    区間推定する際、標本平均に何を引いたり足したりしているか? 式を書いて説明しなさい。 統計学を勉強していて、このような問題に出くわしました。 どなたか回答お願いできますか?考えても、解りませんでした。

  • 統計の標準誤差について教えてください

    統計の問題を解いているんですが誤差についての問題でつまずいています。わかる方いましたら解答・解説をご教示願います。 問、ある県の高校入試の数学の成績は標準偏差14点であろうと予想されている。母平均を95%信頼区間で推定するとき、次の問いに答えよ。 (1)無作為抽出した100人の平均点がx~(エックスバー)のとき、母平均μの誤差はいくらか。 (2)母平均μの誤差を2点以内にするには、抽出する標本の大きさnをどれくらいにすればよいか。 よろしくお願いします。

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。