- ベストアンサー
統計学の不偏分散と変動係数について
大学で出された問題です(特に課題というわけではありません) 1、次のデータの不偏分散を求めよ 7、11、9、8、11、5、7、2 2、変動係数の値はすべてのデータをスカラー倍しても変わらないのはなぜか説明せよ 1は自分で解いたところ答えが9.14・・・となりました。 解答は配られていないので間違っていないか不安です。 2は具体的な数値を入れて計算していくと確かに変わらないのですが 説明せよと言われるとどう説明してよいか分かりません。 優しく解説していただけると助かります。 お力添えをよろしくお願いいたします。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
ANo.1補足 > 私はまったく納得いかないのですが、このまま授業を進めるようです。 > こんがらがりそうですが授業では先生の考え方に従うしか・・・ その先生の言うことは信じてもよさそうです。 例を挙げて、標本分散と不偏分散の説明をしてみます。 確率1/4で-1、確率1/2で0、確率1/4で1が得られる分布があるとします。 この分布の平均は0で、分散は1/2となりますが、あなたはこの平均と分散の値を知らないとします。 さて、この平均と分散(混乱しないように母平均と母分散と呼びます)を推定するために、この分布から独立に大きさが2の標本を得たとします。 例えば-1,0という標本が得られた場合、母平均の推定値は-1と0の平均で推定してみることにします。 また、母分散の推定値を-1と0のその平均からの偏差平方和の平均(nで割る方法)、つまり {(-1 - (-1/2))^2 + (0 - (-1/2))^2} / 2 = 1/4 で推定してみることにします。 しかしこの-1,0という組み合わせは6通りの一つの組み合わせにしか過ぎませんし、この場合母平均と母分散とは違う値となっています。 とはいえ、あなたにはこれが母平均と母分散と一致しているかどうかはわかりませんし、そもそも妥当な推定方法なのかという疑問が出てくるかもしれません。 その妥当かどうかの考え方の一つに「不偏性」というものがあります。 「不偏」とはどういうことかというと、その推定値の期待値が母数に一致するということです。 上の例で言えば、6通りの全てのパターンについて平均と分散を計算してみますと -1, -1という標本が得られる確率は1/16で、平均は-1、分散は0 -1, 0という標本が得られる確率は1/4で、平均は-1/2、分散は1/4 -1, 1という標本が得られる確率は1/8で、平均は0、分散は1 0, 0という標本が得られる確率は1/4で、平均は0、分散は0 0, 1という標本が得られる確率は1/4で、平均は1/2、分散は1/4 1, 1という標本が得られる確率は1/16で、平均1、分散は0 となるので、標本の平均の期待値は (-1) * 1/16 + (-1/2) * 1/4 + 0 * 1/8 + 0 * 1/4 + 1/2 * 1/4 + 1 * 1/16 = 0 で不偏であることがわかります。 標本の分散(nで割る方法)の期待値は 0 * 1/16 + 1/4 * 1/4 + 1 * 1/8 + 0 * 1/4 + 1/4 * 1/4 + 0 * 1/16 = 1/4 と不偏でないことがわかります。 しかし、n-1で割る方法ですと 0 * 1/16 + 1/2 * 1/4 + 2 * 1/8 + 0 * 1/4 + 1/2 * 1/4 + 0 * 1/16 = 1/2 で母分散と一致し不偏であることがわかります。 そして、この母分散と一致する分散の推定方法を不偏分散と呼んでいるのです。 ANo.5にもありますように、標本分散は標本から計算した分散のことで、特にnで割る方法を意味するわけではありません。
その他の回答 (5)
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
不偏分散の定義で補足です。 質問者さんが迷われたように,標本分散=不偏分散という定義もあるのです。 例えば, ウィキペディアの「分散」 http://ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3#.E4.B8.8D.E5.81.8F.E5.88.86.E6.95.A3 でも,この点に触れ, 不偏分散を標本分散と呼ぶ文献もある。 と書かれています。 回答1で述べられたようには確定してない点に注意が必要です。 ただし,二者択一で言えば, n-1で割るほうを,「不偏分散」と言います。 例えば,EXCELのVAR関数のヘルプをご覧ください。 母集団の分散の推定値 (不偏分散)として,n-1で割ってあります。 私自身も説明する時には,n-1で割るほうを不偏分散と言います。
お礼
そうだったのですか! そこまで自分で調べられなかったのでとても助かりました。 てっきり先生が勘違いしているのかと思っていたので これでスッキリ迷いなく授業を受けられそうです。 本当にありがとうございます。
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
- 井口 豊(@Iguchi_Y)
- ベストアンサー率68% (157/228)
No.1です。補足しますとn個のデータの不偏分散(母分散)の求め方は {(x[1]-m)²+(x[2]-m)²+……+(x[n]-m)²}÷n または (x[1]²+x[2]²+……+x[n]²)÷n-m² で求められます。 ただし m=(x[1]+x[2]+……+x[n])÷n 詳しくは教科書をご覧ください。
1のみ回答。8個のデータの平均は7.5。各データの値から平均7.5を引くと -0.5,3.5,1.5,0.5,3.5,-2.5,-0.5,-5.5 これらを2乗して 0.25,12.25,2.25,0.25,12.25,6.25,0.25,30.25 以上の平均は8,これが不偏分散となる。 【別解】8個のデータを2乗すると49,121,81,64,121,25,49,4となり, これらの平均は64.25……(1) また各データの平均7.5の2乗は56.25……(2) (1)-(2)から8,これが不偏分散となる。 9.14……は標本分散です。 不偏○○(母○○)と標本○○の違い 不偏○○(母○○)はデータの個数で割り,標本○○は(データの個数)-1で割る
補足
早速のご回答ありがとうございます 9.14・・・が標本分散だと言われびっくりして確認したところ 統計学の授業で先生が配ったプリントでは 「nで割る方が標本分散、n-1で割る方が不偏分散」となっていました。 あれ、と思って図書室で統計学の本を調べてみたのですが やっぱりTheWK1981さんお仰る方が正しいと書いてありました。 そこで先生に問い詰めたところ「人によって捉え方が違うかもねぇ~。 あくまでも不偏だから、不偏分散が”データの個数-1”で割る方だよ」 と言われ、笑われてしまいました。 私はまったく納得いかないのですが、このまま授業を進めるようです。 こんがらがりそうですが授業では先生の考え方に従うしか・・・ お礼に書こうか捕捉に書こうか迷い、こちらに書かせていただきました。
お礼
分かりやすい具体例まで書いていただいてありがとうございます! 不偏(母分散と一致する)だから不偏分散、なんですね。 そう考えると、n-1で割る方を不偏分散と呼ぶことが理解できました。 実は今日の授業で先生が私の指摘した不偏分散と標本分散の 呼び方について言及していて、本などによっては違うこともある、と おっしゃっていました。 でも、このような回答をいただいてその意味が理解できたので これからは惑わずに言葉を使えそうです。 本当にありがとうございました!