• 締切済み

区間推定の問題

鳥居泰彦先生の書いた「はじめての統計学」という統計学の入門書の153頁にある問題なのですが理解できません。教えていただきたいです。 問題文:あるエレベーター(11人乗り)の利用客の一人一人の体重の母標準偏差は、σ=10kgである       ことがわかっている。利用客の中から121人を選んで調査したところ、標本の平均体重は       65kgであった。 (Question):信頼係数95%のもとでは、満員(11人)での総体重をどのくらいに見積もればいいか。区         間推定せよ。 エレベーターを利用する人達の体重xは正規分布に従っていて、x:N(μ,10^2)である。 n人の体重xの和の分布は正規分布の再生性より、N( nμ , n*10^2 )に従っている。 つまり、11人の体重の和の分布は、N( 11*μ , 11*10^2 )に従っていることになる。 体重xの母集団から11人を標本抽出したときの標本平均は、N( μ , 10^2/11 )に従う。 N ( μ , 10^2/11 )に従う標本平均(平均体重)が11人集まった時の総体重は、標本平均を11倍したと考えると、標本平均を11倍した総体重の分布は、N ( 11μ , 11^2*10^2/11 )に従うので、総体重の母平均11μを信頼係数95%で区間推定すると、 65*11 - 1.96*10*√(11) ≦ 11μ ≦ 65*11 + 1.96*10*√(11) 715 - 1.96*33.1662 ≦ 11μ ≦ 715 + 1.96*33.1662 650 ≦ 11μ ≦ 780 となる。  以上の様に考えると答えが合うのですが、どうもスッキリしません。理由としては、標本平均を11倍したと考えましたが、標本平均は正規分布に従っているから標本平均を11人分足したものは正規分布の再生性より、N ( 11μ , 11*10^2/11 ) に従うので、総体重の分散は10^2となり、総体重の標準偏差は10になってしまい、答えと合わなくなります。 また、標本の平均体重65kgは121人を選んで調査したと問題文に書いてありますが、これは121人分の体重を加えて121で割った値なのでしょうか?それとも11人を1つの標本として11回抽出して、11回平均体重を出して、この平均体重の平均が65kgなのでしょうか?だとしたら根本的に間違っているきがします・・・。 この問題の解き方を教えていただきたいです。正規分布の再生性の理解に問題がありましたらご指摘ください。

みんなの回答

noname#231195
noname#231195
回答No.2

#1 です。 あぁ、やっとわかりました。つまり >n人の体重xの和の分布は正規分布の再生性より、N( nμ , n*10^2 )に従っている。 これと >標本平均を11倍した総体重の分布は、N ( 11μ , 11^2*10^2/11 )に従うので これの言っていることが違うって話ですか? 1時間以上何が問題なのかずっと悩んじゃったさ。 正規分布の再生性とは一般にこう書きます。 確率変数X₁、X₂が独立でそれぞれ正規分布N(m₁,σ²₁)、N(m₂,σ²₂)に従うとき、a₁,a₂を定数として Y=a₁X₁+a₂X₂ とおくと、Yは正規分布N(m₁+m₂,a₁²σ²₁+a₂²σ²₂)に従う。 n人の体重xの和、と言ったら個々それぞれの人の体重の和ですから、分散はnσ²になります。個々の体重をX、合計をYとすると Y=X₁+X₂+・・・X₁₁ という計算をしているわけですからね でも平均値を11倍しているのは、個々それぞれの人のことではなく文字通り平均値を11倍しているのでしょう?つまりこういう計算をしているわけです。 Y=11X だから分散は11²σ²になります。 その正規分布の再生性自体の説明や証明は書きません。その教科書に書いてあるんじゃないですか? 平均値は個々の標本の値とは違います。平均値を何倍かしたものと、個々の標本の合計値は違う分布になって当然です。 余談ですが、その教科書の回答は半分余計です。 >つまり、11人の体重の和の分布は、N( 11*μ , 11*10^2 )に従っていることになる。 普通ならここで95%の信頼区間の表を見ればいいのです。 その教科書は11人の和の分布を求めて、それをわざわざ一人一人に分けて(前提条件として一人一人の体重の分布はすでに与えられている)、また11人分にまとめています。 一回自動車を分解して、再組立てして、やっと「お、これはプリウスだ」とか言っているようなものです。

noname#231195
noname#231195
回答No.1

>標本平均を11人分足したものは正規分布の再生性より、N ( 11μ , 11*10^2/11 ) に従うので、・・・ その教科書にN(nμ,n*10^2)となると書いてあるのに、どうしてN(11μ,11*10^2/11)という話が出てくるのですか? 実際、N(nμ,n*10^2)となることを正規分布の再生性というのですが。 分散が大きくなることは、わざわざ証明を読まなくても明らかです。 11人全員が平均以下の場合は平均から大きく離れますし、平均以上なら平均からより大きく離れます。分散が同じってはずはないです。 また、121人の平均、といったら121人の合計体重を121で割った数です。 もっとも、11人のサブグループを11グループ作って、サブグループの平均の平均を計算したって別に構いません。サブグループのサイズが同じなら、どっちで計算しても同じ値が出てきます。

www0722
質問者

補足

回答ありがとうございます。解法の流れを教えて頂けると助かります。

関連するQ&A

  • 90%の信頼区間における区間推定

    統計学の区間推定に関する質問です。 このとき、標本平均は標準正規分布に従っているものとします。 95%の信頼区間の場合、標準正規分布から1.96のときちょうど0.9750なので、-1.96<X<1.96と割り出すことができますよね。 ところが90%の信頼区間の場合、ちょうど0.9500になる値がありません。 これに近い値では0.9495(1.64)と0.9505(1.65)とがありますが、どちらも0.9500との差は0.0005ですよね。 この場合、1.64と1.65のどちらの値を採用すればよいのですか?

  • 統計の区間推定についてお尋ねします。

    95%信頼区間の母平均の近似的な推定で、標本平均ー1.96√(σ^2/n) < μ < 標本平均+1.96√(σ^2/n)という式があります。ここで1.96というものを持ち出すのは標準正規分布(N(0,1))の計算から求まるということになると思いますが、例えばポアソン分布に従うという場合でも使えるようです。まず、信頼区間の設定の式で上記の式が近似的に使える分布はどのようなものがあるでしょうか。 また、二項分布→近似→正規分布、とか二項分布→近似→ポアソン分布という関係があります。近似の仕方が違うわけですが、そのような分布はあの区間推定の式が使えるということになるでしょうか。あとt分布は自由度をあげると正規分布に近くなるということですが。試験とかだと丸暗記的覚えていくことが多いと思いますが、95%信頼区間といわれたら上記の式とか1.96がすぐに出てくるというのはどのような限定の下なのかを知りたいのですが。 また、これらは近似法ということであり、厳密法というのは各分布によって計算法が個別に決まっているのでしょうか。 よろしくお願いします。

  • 推定量

    統計の問題で 【分散の異なる正規分布 N(μ,σ1^2),N(μ,σ2^2) から2つずつ無作為標本をとる. このとき,μの有効推定量は大体幾らか?】 という問題があるのですが,よくわかりません. 分散が小さい推定量が「良い」ことは分かるのですが, 「これ以上良い推定量はない」といえるような推定量はあるのでしょうか?

  • 統計学の問題です。

    確率変数X1,・・・,Xnが正規分布N(μ、σ^2)に従うとき、標本平均X=(X1+・・・+Xn)/nは正規分布N(μ、σ^2/n)に従う。母分散10^2の正規母集団から無作為に9個のデータx1,・・・,x9を抽出したところ、x1+・・・+x9=720であった。 このとき、母平均μを信頼係数95%で区間推定した結果は(1)<μ<(2)となる。 答.(1)73.47 (2)86.53 答えはわかっているんですが、導き方がわかりません。 途中式を全てわかりやすく書いていただけるとありがたいです。

  • 最尤推定

    ビタビを用いた最尤推定では、 n個の標本が、平均μ ,分散σ^2 の正規分布に 従う場合を想定しています。 しかし、n個の標本は有限の観測ですので、 たまたま出現値が偏っている場合があるように 思います。 要するに、n個の標本の平均がμ でなかったり, 分散がσ^2でない場合です。 聞きたいのは、ビタビを用いた最尤推定は n個の標本に着目した時、最適ではないと考えて良いのでしょうか?

  • 統計学、区間推定についてお尋ねします!

    区間推定する際、標本平均に何を引いたり足したりしているか? 式を書いて説明しなさい。 統計学を勉強していて、このような問題に出くわしました。 どなたか回答お願いできますか?考えても、解りませんでした。

  • 統計学の問題

    早速ですが問題を書かせてもらいます. 身長の分布は正規分布N(170.5 , 36)に従うと仮定する. (1)N(170.5 , 36)からの大きさ10の無作為標本の標本平均の分布は何か. (2)前問における身長の平均をx0とおく.(1)の標本平均がx0より大きくなる確率を求めよ. 質問内容は2つあります.まず、(1)の「N(170.5 , 36)からの大きさ10の無作為標本」とはどういう意味なのでしょうか.また(2)の「前問における身長の平均」とは170.5のことなのでしょうか. よろしくお願いします.

  • 標準偏差が分かっている場合の平均値の推定について

    下記のような統計の問題があり、困っています。 <問題文> ある動物の集団から無作為に1匹を取り出して重さを量ったところ、300gであった。この集団の重さの標準偏差σは10gであることがわかっている。 この集団の平均体重μを推定せよ。ただし体重は正規分布するものとする。 --- これを考えるにあたっての解説は次のようなものでした。 「無作為に取り出された1匹の標本(体重300g)がこの集団の「μ±10g」の範囲から取り出されている確率は、正規分布の性質によって約68%である。ということは、「300g±10g」の範囲にμが含まれている確率も約68%である。・・・」 この最後の一文(「ということは、」以下)が、どうしてそう考えられるのか、理由が分かりません。 どなたかご教授いただけないでしょうか?

  • 統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っ

    統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っているならば、標本の大きさnの大小に関わらず、その平均の分布は正規分布」という記述があります。であるならば、母平均を区間推定する場合、zの値を用いて推定してもいいのかなと思いますが、ほとんどの書籍では、標本の大きさが小さい場合、tの値を用いて推定しています。なぜでしょうか?たぶん、自分がどこかで誤解をしているのだと思いますが、宜しくお願いします。

  • 正規分布絡みの区間推定の問題

    問題  16歳から20歳の多数の男性を調べると、その身長はx:N(170、11^2)の正規分布をすることが分かった。信頼係数95%のもとで上方信頼限界と下方信頼限界を求めよ。 回答 _ X = X 表記上このようにします。 [X - Za/2 ・ σ/√n, X + Za/2 ・ σ/√n] σ = 11、α = 0.05、Z0.025 ≒ 0.41 なので [X - 0.41 ・ 11/√n, X + 0.41 ・ 11/√n] ここまではわかったんですが、この問題でいう X と n の値がわかりません。 そもそも根本から間違えているかもしれませんがお願いします。