• ベストアンサー
  • すぐに回答を!

分散と標本分散についてです

私の学校のテストなんですが、ある2変数の数値が10個ずつあり、分散、標本分散、共分散を求めろという問題がありました。 共分散を求めろはわかるのですが、いまいち分散と標本分散を求めろの意味がわかりません。この場合は不偏分散として求めればよろしいのですか? 教えてください。

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.4
noname#227064
noname#227064

不偏分散も標本分散の一つです。 JIS Z8101-1では不偏分散と標本分散は同じことになっています。 参考URLのサイトで確認できます。

参考URL:
http://www.jisc.go.jp/

共感・感謝の気持ちを伝えよう!

質問者からのお礼

見てきました! 公式的にそうなってるんですね。 ありがとうございました。

その他の回答 (3)

  • 回答No.3
  • sanori
  • ベストアンサー率48% (5664/11798)

こんばんは。 困ったことに、不偏分散のことを標本分散と言う‘流派’があります。 (「不偏分散」の項の文章を参照。) http://ja.wikipedia.org/wiki/%E4%B8%8D%E5%81%8F%E5%88%86%E6%95%A3 ご参考になりましたら幸いです。

共感・感謝の気持ちを伝えよう!

  • 回答No.2
  • kgu-2
  • ベストアンサー率49% (787/1592)

>この場合は不偏分散として求めればよろしいのですか? 分散は、母集団についてであって、全てのデータを用いて計算するので、誰がやっても同じ結果になります。  標本分散は、標本の数があまりにも多かったり、蛍光灯の寿命など全てのものを測定すると商品がなくなるなど、全ての標本のデータを得るのが困難な場合、すなわち、母集団の分散が使えない場合にその代用としてもちいます。  すなわち、母集団の分散を推定しているわけです。この場合、標本の取り方(抽出時)に、ランダムサンプリングをしても、する人によって、標本が異なるわけですから、当然分散もズレマス。そこで、nではなくn-1で割って、外れる危険性を減らしましょう、これが不偏分散です。  練習問題にしても、データ10個が、それですべてのデータ(田舎の10人のクラスなど)なら、分散。10個が、多くの集団から抽出した標本なら、普遍分散を用います。  それを明確にしないで、単に10個のデータ、というのなら、粗雑な問題ですね。

共感・感謝の気持ちを伝えよう!

質問者からの補足

回答ありがとうございます。 この問題は母集団から抽出したという記述もないみないで、ただX(i)、Y(i)の数値がそれぞれ10個ずつしか書かれていなくて、いきなり分散や標本分散を求めろとのことなんです。 つまり粗雑な問題であり、不偏分散を求めろ(nではなくn-1で計算しろ)と解釈してよろしい問題ですか?

  • 回答No.1
  • e_o_m
  • ベストアンサー率58% (30/51)

普通、分散と標本分散と言ったら同じ意味で、nで割る方を指すと思いますが・・・

共感・感謝の気持ちを伝えよう!

質問者からの補足

私もそう思いますが、問題には別のものとしてだすように書かれていました。

関連するQ&A

  • 標本分散と不偏分散

    標本分散と不偏分散について勉強しているのですが 例えば、分散についての問題が出たときには「不偏分散を求めよ」 「標本分散を求めよ」といった、どちらの公式を使うか問題で指定されるものなのでしょうか? それとも、自分でどちらの公式を使うか見分けるものなのでしょうか? もし、見分けるものなら見分けるポイント等を教えていただけたらと思います。 質問の内容が分かりにくいとは思いますが、よろしくお願いします。

  • 標本分散と不偏分散の使い分けについて。

    標本分散と不偏分散の使い分けについて。 私はメーカーに勤めており、電子部品のばらつきなどでよく標準偏差σを目にします。 自分で少し調べてみると標準偏差にも標本分散を使うときと不偏分散を使うときがあることを知ったのですが、説明が難しくどのように使い分けていいのか分かりません。 標本分散と不偏分散はどのように使い分ければいいのでしょうか。 例えば電子部品の性能や実験データのばらつきにはどちらが使われているのでしょうか? ご存知の方、教えてください。 よろしくお願いします。

  • 不偏分散での「すべての可能な標本・・」とは?

    数学を趣味で勉強してる者です よろしくお願いします。 解説書に「すべての可能な標本の不偏分散の平均は、母分散に一致する」とあり、 例えば 母集団の大きさが、5  標本の大きさが、2 のときの、すべての可能な標本には、5*5=25通りとあります。 と言うことは、この場合の2つの標本は、同じもの(重複している)も、ありえるという前提と 解釈すればいいのでしょうか。 つまり、標本の採り方は、必ず元に戻すが基本なのでしょうか? またどうしても、2つの標本が必ず異なる(標本を戻さない)場合は、 不偏分散の考え方とは異なる、別の考え方があるのでしょうか? 理解不十分で、すみません、アドバイスお願いします。

  • 標本分散と不偏分散

    平方和で、個々の測定値と平均値の差の2乗(偏差の絶対値の2乗?)の総和を出せますね。その総和から、測定値と平均値の差の2乗の平均を出したものが標本分散。 単なる平均よりは余裕を持って出した平均(平均値の一部をn-1等分で振り分け?)が不偏分散ですか? また、不偏分散と標本分散は実際、どちらも使われるのでしょうか。 宜しくお願いします。

  • 標本分散が母分散より少し小さくなる理由、不偏分散をn-1でわる理由

    お世話になっております。 統計学初心者で、母平均の信頼区間の推定について勉強しています。 勉強している中で、標本分散が母分散より少し小さくなるということ、 そのため標本分散ではなく不偏分散を利用し、不偏分散の算出は偏差平方和、サンプルサイズから1引いたもので割ることを勉強しました。 しかし標本分散が母分散より少し小さくなる理由、そして、そのために不偏分散の算出においてn-1でわる理由が分かりませんでした。 わかりやすい形で教えて頂けないでしょうか? どうぞよろしくお願い申し上げます。

  • 標本分散について

    標本分散の分母がnなのかn-1なのかで、よく混乱します。 標本分散を計算する場合は、n-1でわり、 全標本分散を計算する場合は、nでわると理解しているのですが、 こんな問題が出ました。 問、次のデータに関して変動係数を求めよ -3,-4,3,5,-1,7,-2 この問題では、標本分散を計算するときに、 回答では、n-1でわる(分散を計算する際の分母は標本分散だから)と 書いてあります。 しかし、 問、次のデータに関してXとYの標本相関係数を求めよ。 ただし、標本に対する操作にとって必要な自由度調整を行うこと [x,y]=[1,3][0,-1][-2,-3][2,1] この問題の回答では、標本分散を計算する際に、nで割っていました。 変動係数を計算する場合は、n-1でわり、 標本相関係数を計算する場合は、nでわる こう考えてOKなのでしょうか?回答が間違っているのか、 私が勘違いしているのかどうかもわからない状態です。 ご教授お願いします。

  • 母分散と標本分散

    母分散と標本分散の違いがいまひとつわかりません。 母分散は母集団の分散、標本分散は標本の分散ということは文字通りですが、分散(偏差?)σ^2として、なぜ標本分散はσ^2/nで表されるのでしょうか?nで割る理由はあるのでしょうか? もしよければ、違いが分かるような典型的な例題(文章問題)等も教えてください。

  • 分散について

    こんにちは。 標本分散と不偏分散の違いが分かりません。 ご存じの方、是非、書き込みをお願いします。

  • 不偏分散の分布は?

    不偏分散の分布について混乱していますので、ご助言頂けましたら幸甚です。 例えば母集団の分布を正規分布N(μ,σ^2)とした際、 標本平均x(=1/nΣxi)を区間推定する場合、正規分布の再帰性より、標本平均の分布はN(μ,(σ/√n)^2)となることから、μの区間推定が可能と理解しています。 また、若干やり様は異なりますが、標本分散s^2=1/nΣ(x-xi)^2に対し、ns^2/σ^2がΧ2分布に従うことから、σの導出が可能と理解しています。 ここで、上記と同様に、不偏分散(=1/n-1Σ(x-xi)^2)についての分布とは、どのような分布になるのでしょうか? おそらくΧ2分布になると推察しますが、証明できてません。 また、不偏分散の導出方法は、 E[S^2]、即ちS^2の平均と理解していますが、 S^2を確率変数とした際の分布がΧ2分布なのであれば、 このΧ2分布の平均が、不偏分散になってもよさそうですが、 Χ2分布の平均=n ですので、不偏分散とは不一致です。 上記のとおり、整理がついておりませんので、教えて頂けましたら助かります。 特に上記のとおり混乱しておりますので、現在はむしろ、「不偏分散については、点推定でのみ用いるのか?」と考えております。

  • 不偏分散の分母の n-1

    標本平均 Xav を求める式、  Xav = 1/nΣxi を不偏分散で用いるため自由度が1減り、不偏分散の分母が n-1 になると思います。 母平均は標本から求めるものではなく(それは標本平均になる)、既知であることが前提であるため上式は不要であり、 標本分散では自由度が減らず分母が n-1 ではなく n になる。 この考えは間違っていないでしょうか? もし間違っていないとすると、母平均は事前にわかっているものなのでしょうか? 例えば、母集団をクラス40人のテストの点数とすると(これは母集団と言わない?)、上式より母平均(?)を求めることができます。 母平均が40個のデータに独立でないため、分散の自由度は1減らす必要がある気がします。 これは結局不偏分散を求めているのでしょうか?