• 締切済み
  • 困ってます

母分散と標本分散

母分散と標本分散の違いで混乱しています。 『例題で学ぶ 初歩からの計量経済学』白砂堤津耶著のP26以降の記述が理解できません。何で標本分散だと(n-1)で割るに母分散だと単純にnで割るのですか? さらにネットで調べてみると、上記の本と違う内容(たとえば、標本分散のほうをnで割り、母分散を(n-1)で割る)などがあり混乱しています。実際は何が正しのでしょうか? もし宜しければご回答よろしくお願いします。

共感・応援の気持ちを伝えよう!

みんなの回答

  • 回答No.2
  • guowu-x
  • ベストアンサー率41% (33/80)

修正 >このように、標本分散はまた確率変数になり、さっきの2回コインを投げて表が2回とか表と裏が1回ずつというのは、その(確率変数の標本分散という)確率変数になります。 このように、標本分散はまた確率変数になり、さっきの2回コインを投げて表が2回とか表と裏が1回ずつというのは、その(確率変数の標本分散という)確率変数【の実現値】になります。

共感・感謝の気持ちを伝えよう!

  • 回答No.1
  • guowu-x
  • ベストアンサー率41% (33/80)

ありがちな混乱かもしれません。 まず母分散というのは「真の分散」のことです。 たとえば、コインを2回投げるという試行を考えてみるとコインにゆがみがないとすれば、母分散は1/2と計算できます。(このような試行は2項分布に従うことを既に知っている) 一方、確率変数の標本分散というのは、やはり確率変数になります。 コインの例だと、コインを2回投げて2回とも表が出たとしましょう。すると標本分散は0で、このような結果が起こる確率は1/4です。 もう一回同じことをやってみると今度は表と裏とが1回ずつかもしれません。それをもとに分散を計算すると0とは別の値になります。 このように、標本分散はまた確率変数になり、さっきの2回コインを投げて表が2回とか表と裏が1回ずつというのは、その(確率変数の標本分散という)確率変数になります。 さて、標本分散をn-1で割る理由ですが、おそらく標本分散を不偏推定量になるようにしたい体と思います。不偏推定量とはこの場合だと標本分散(確率変数!)の期待値が母分散に等しくなるように調整してあることを意味します。不偏推定量についてはもう少し勉強すると必ず出てくると思いますので、それまでがんばって勉強してみてください。無理に標本分散を不偏推定量にしようと思わないときは普通にnで割っていることもあります。 またn-1で割るほうを不偏分散、nで割るほうを標本分散としている本もありこの辺りはテキストによってまちまちです。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございました。 勉強不足もあって理解しにくいところもありますが、なんとなくわかりました。丁寧ね説明に感謝します。

関連するQ&A

  • 母分散と標本分散

    母分散と標本分散の違いがいまひとつわかりません。 母分散は母集団の分散、標本分散は標本の分散ということは文字通りですが、分散(偏差?)σ^2として、なぜ標本分散はσ^2/nで表されるのでしょうか?nで割る理由はあるのでしょうか? もしよければ、違いが分かるような典型的な例題(文章問題)等も教えてください。

  • 標本分散について

    標本分散の分母がnなのかn-1なのかで、よく混乱します。 標本分散を計算する場合は、n-1でわり、 全標本分散を計算する場合は、nでわると理解しているのですが、 こんな問題が出ました。 問、次のデータに関して変動係数を求めよ -3,-4,3,5,-1,7,-2 この問題では、標本分散を計算するときに、 回答では、n-1でわる(分散を計算する際の分母は標本分散だから)と 書いてあります。 しかし、 問、次のデータに関してXとYの標本相関係数を求めよ。 ただし、標本に対する操作にとって必要な自由度調整を行うこと [x,y]=[1,3][0,-1][-2,-3][2,1] この問題の回答では、標本分散を計算する際に、nで割っていました。 変動係数を計算する場合は、n-1でわり、 標本相関係数を計算する場合は、nでわる こう考えてOKなのでしょうか?回答が間違っているのか、 私が勘違いしているのかどうかもわからない状態です。 ご教授お願いします。

  • 「標本平均の分散」についての質問です.

    「標本平均の分散」についての質問です. 「母集団からn個のデータを無作為抽出する.すると,サンプルサイズnの標本ができ,標本平均が計算できる.これを,標本平均1としよう.この作業を何度も繰り返し,標本平均2,標本平均3・・・と,多数の標本平均を集める.これらの標本平均の分散は,母分散のn分の1(母分散/n)である」という説明をある本で読みました. では,極端な話,1000個のデータからなる母集団(有限母集団)から,サンプルサイズ1000個(母集団サイズと同じ)の標本をいくつも作ったとします.標本平均は,いつも母平均そのものであり,よって,標本平均の分散は0です.母分散/1000とはなりません. 上記の説明が間違っているのでしょうか?私が何か勘違いをしているのでしょうか?それとも,説明は無限母集団を対象としている,とか,母集団サイズとサンプルサイズが一致するような抽出は想定されていない,と言った理由があるのでしょうか?

  • 標本分散が母分散より少し小さくなる理由、不偏分散をn-1でわる理由

    お世話になっております。 統計学初心者で、母平均の信頼区間の推定について勉強しています。 勉強している中で、標本分散が母分散より少し小さくなるということ、 そのため標本分散ではなく不偏分散を利用し、不偏分散の算出は偏差平方和、サンプルサイズから1引いたもので割ることを勉強しました。 しかし標本分散が母分散より少し小さくなる理由、そして、そのために不偏分散の算出においてn-1でわる理由が分かりませんでした。 わかりやすい形で教えて頂けないでしょうか? どうぞよろしくお願い申し上げます。

  • 正規母集団の標本平均と標本分散の独立性

    X_1,…,X_nを正規母集団から取った大きさnの標本とします。 簡単のため、母集団の平均は0、分散は1と仮定します。 このとき標本平均X=(X_1+…+X_n)/nと 標本(不偏)分散s=((X_1-X)^2+…+(X_n-X)^2)/(n-1) を考えます。 Xは平均0、分散1/nの正規分布に、 (n-1)sは自由度n-1のχ^2分布に従うと思いますが、 このXとsの独立性の証明はどうやったらよいのでしょうか? 結合分布の計算にX_i^2が混じるので大変に面倒です。 非芯χ^2分布の特性関数の計算などを使うのでしょうか。 方針は立つものの、あまりに煩雑な計算になりそうで尻込みしています。 簡便な計算法をご存知であれば教えていただきたく思います。 よろしくお願いします。

  • 標本平均と分散について

    こんばんは。先日もお世話になったshingetsuです。 今回また数学でわからない問題があったのでアドバイスをいただきたく、質問させていただきました。よろしくお願いします。 今回、標本平均とその分散について勉強しているのですが、確認問題をしているところ、わからない公式(?)がでてきたのです。 問題の中でE(m)=μ、E(s2乗)=σ2乗を例題を用いて証明しているのですが、この問題でV(s2乗)=σ2乗という始めてみる式が登場し、成り立つか証明しなくてはいけないのですが、このVとはなんでしょうか?これは標本分散と母分散の何を成り立たせる式なのでしょうか? よろしくお願いします。 また、質問内容に不備がありましたらご指摘お願いします。

  • 統計学: 不偏標本分散の分母は、なぜ(n-1)なの?

    好奇心から統計の入門書を読んでの疑問です。 標本分散(sample variance)=偏差平方和(SS)/標本サイズ(n) は理解できたのですが、 この分母を (n-1) にして、 不偏標本分散(unbiased sample variance)=SS/(n-1) というものをわざわざ考えるのはなぜですか? 標本分散だけで充分役に立つと思うのですが…。 分母を n でなく (n-1) とする意義は何でしょうか? 「突出した標本を未然に除外する」ということなんでしょうか? オリンピック体操種目の採点の際、不公正を排すために最高点・最低点を除外して計算するというのを聞いたことがありますが、それと同じ目的でしょうか? だとすれば、なぜ (n-2)や(n-3)ではなく、あえて (n-1) なのでしょうか? よろしくお願いいたします。

  • 標本平均、分散、期待値・・・混乱しています。。。

    統計の勉強をしていますが、 標本平均、分散、期待値とたくさん用語が出てきて、計算の仕方も混乱しています。 まず、標本平均x’(’は上の棒線) の期待値E[x']とは何を表しているのでしょうか? E[x]=npとの違いは?  pは確率 nは個数? あと、標本平均の分散V[x']=σ^2/nと 分散V[x]=npq  の違いが解りません。 i番目のV[xi]やE[xi]と言うのも出てきて更に混乱しています。 問題によって表し方が違うのでしょうか?

  • X,Yは無作為標本で母平均をμ、母分散をσ^2(シグマの2乗)とする。

    X,Yは無作為標本で母平均をμ、母分散をσ^2(シグマの2乗)とする。 aX+bYがμの不偏推定量で、その分散を最小にするa,b の値を求めよ という問題が分かりません。 私なりに考えてみたものの、 正規母集団からの標本分布がN(aX+bY,σ^2/2)になることしか分かりません。あってますか?? どなたか分かりやすく教えて下さい。

  • 不偏分散の分母の n-1

    標本平均 Xav を求める式、  Xav = 1/nΣxi を不偏分散で用いるため自由度が1減り、不偏分散の分母が n-1 になると思います。 母平均は標本から求めるものではなく(それは標本平均になる)、既知であることが前提であるため上式は不要であり、 標本分散では自由度が減らず分母が n-1 ではなく n になる。 この考えは間違っていないでしょうか? もし間違っていないとすると、母平均は事前にわかっているものなのでしょうか? 例えば、母集団をクラス40人のテストの点数とすると(これは母集団と言わない?)、上式より母平均(?)を求めることができます。 母平均が40個のデータに独立でないため、分散の自由度は1減らす必要がある気がします。 これは結局不偏分散を求めているのでしょうか?