• ベストアンサー

正規母集団の母分散の推定?

標本平均を使って、母平均の推定の仕方を習いました。 (母標準偏差がわかっているときです。) -1.96≦(標本平均-X)/(母標準偏差を√サンプルサイズで割った数)≦+1.96 でXについて解けば母平均の95パーセント推定範囲が出ると思うのですが この式を使って、(母平均がわかっているときに)母分散の範囲を推定することはできないのですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • gef00675
  • ベストアンサー率56% (57/100)
回答No.4

「それは適当じゃない」ことの理由は、#3の方がわかりやすく説明してくれた通りです。付け加えるべきことは何もないですが、私なりの説明してみましょう。慣習により n個の標本の値をX1,...,Xn、 標本平均をX~ (Xの上にバーをつけたつもり) 母平均をμ (ご質問の記号ではXになってますが) とかくことにします。このとき、 Σ(Xk - μ)^2 =Σ(Xk - X~ - (X~ - μ) )^2 =Σ(Xk - X~)^2 + 2Σ(Xk - X~)(X~ - μ) + Σ(X~ - μ)^2 と変形できますが、Σ(Xk - X~)=ΣXk - nX~ = 0であるため、 Σ(Xk - μ)^2 =Σ(Xk - X~)^2 + n(X~ - μ)^2 ・・・☆ が一般的に成立します。これは、n個の標本のばらつき(偏差平方和)に関する情報が、第1項と第2項のような成分に分解できることを意味しています。 ご質問の式では、(X~ - μ)^2だけしか利用していません。これでは、単に「X~とμにどれぐらいの違いがあるか」だけを見ているに過ぎず、せっかく得られたX1,X2,...,Xnに関する個々の情報を、1つを残してすべて捨ててしまっていることになります。 これは大変もったいない。 残りn-1個の「ばらつき情報」はΣ(Xk - X~)^2の中にあるのです。母分散の推定値として標本分散がよく使われる理由は、だいたいこのあたりの事情によります。 ☆の関係式は重要な関係式です。この先、姿かたちを変えていろいろなところに顔を出すと思います。自由度という言葉のニュアンスも、この式を意識すると理解しやすいのでは? Σ(Xk - μ)^2 の自由度はn Σ(Xk - X~)^2 の自由度はn-1 (X~ - μ)^2 の自由度は1 ですから。

un-chien
質問者

お礼

ふむふむ。 質問したやり方だと「母平均と標本平均」って情報しか使ってないことになるわけですなー。だから#3さんがグラフに描いてくれたように、サンプルサイズを上げてもなにも変わらないことになるのかぁ。 あは!標本平均を使ってカイ二乗分布作るとき出てくるn-1って☆と関係あったのかな!? で質問のやり方では1の方だけ取って大事な「ばらつき情報」が入ってる残りを捨ててたのか。 ☆はしっかり覚えとかなきゃ。 ふむふむ。。ムズカシー! けど少しは分かって来たかも! 私の頓珍漢な質問にこんなに丁寧に答えて頂いて本当にありがとうございます!感謝感謝です!また何か機会がありましたらよろしくお願いします!

その他の回答 (3)

noname#227064
noname#227064
回答No.3

その式を変形した サンプルサイズ*(標本平均-X)^2/1.96^2 ≦ 母分散 と、カイ二乗分布を使った場合の Σ(観測値-X)^2/c ≦ 母分散 (cは自由度nのカイ二乗分布の95%点) のどちらがよい推定方法かわかるように図にしてみました。 横軸は推定値を母分散で割った値ですので、1より小さい値で1に近い値をとりやすいほど良い推定方法ということになります。 赤い線が「サンプルサイズ*(標本平均-X)^2/1.96^2/母分散」の分布で、青い線が「Σ(観測値-X)^2/c/母分散」の分布です。 サンプルサイズを5, 10, 100とした場合を、それぞれ実線、破線、点線で表示しています。 赤い線は実線しか見えませんが、実は三つとも一致しているので一つしか見えません。 つまり、母平均の推定方法を利用した方法はサンプルサイズを大きくしても、その労力に見合った推定値が得られません。 一方、カイ二乗分布を利用した方法はサンプルサイズが大きくしていくほど、1に近い値が出やすくなっていることが見て取れると思います。

un-chien
質問者

お礼

うは!すごい! おバカの私にも一目でわかりました! これはカイ二乗分布を利用するべきですなー。 いやー、私なんかのためにこんなきれいなグラフまで描いていただいて。。恐縮です。またなにか機会がありましたら、その際はよろしくお願いします。本当にありがとうございました!!

  • gef00675
  • ベストアンサー率56% (57/100)
回答No.2

#1補足です。念のため。 母平均が既知の場合、カイ二乗分布の自由度はn(=サンプルサイズ)になります。 母平均が未知のため標本平均で代用する場合は、カイ二乗分布の自由度はn-1になります。

  • gef00675
  • ベストアンサー率56% (57/100)
回答No.1

その式で母分散を推定するのは適当ではありません。母分散の推定値としては、標本分散を用いるのが普通でしょう。正規母集団からの標本分散を使って母分散の区間推定を行うには、カイ二乗分布を利用することになります。 Wikipediaのカイ二乗分布の項目をご覧ください。

参考URL:
http://ja.wikipedia.org/wiki/%E3%82%AB%E3%82%A4%E4%BA%8C%E4%B9%97%E5%88%86%E5%B8%83
un-chien
質問者

お礼

ご回答ありがとうございます! >正規母集団からの標本分散を使って母分散の区間推定を行うには、カ>イ二乗分布を利用することになります。 はい。今そこを勉強しているところなのですが、質問に書いた式を使っても一応答え(母分散の区間推定)は出せそうな気がして・・・。 「それは適当じゃない」って覚えとけばそれでいいのかな?

関連するQ&A