• 締切済み

標本分散の合併について

標本分散の合併についてわからないことがございます。 ------------------------------------------------------ 標本Aの分散:Σ{(Xi - Xmean)^2} / (n-1) 標本Bの分散:Σ{(Yi - Ymean)^2} / (n-1) 合併標本分散(A+B) Σ{(Yi - Ymean)^2} + Σ{(Xi - Xmean)^2} / (n-1) + (n-1) Xmean(Ymean)は標本A(B)の標本平均です。 分散は未知だが等しいことがわかっている。 ------------------------------------------------------ なぜ、AとBの分母同士、分子同士足し合わすのでしょうか? そのようなことをしてもよいのでしょうか? なぜ、 Σ{(Xi - Xmean)^2} / (n-1) + Σ{(Yi - Ymean)^2} / (n-1) では駄目なのでしょうか? 教えていただけましたら幸いです。 以上、宜しくお願いいたします。

みんなの回答

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

#1です。私も少し勘違いをしていたみたいなので訂正です。 これは標本の合併というより、平均の差の検定をt検定(等分散)で 行う際の母分散の推定ですね。平均が等しいと勘違いしていました。 標本Aと標本Bがそれぞれあって分散が等しいがその値が 分かっていない場合の母分散の推定値の計算式は [Σ{(Xi - Xmean)^2} + Σ{(Yi - Ymean)^2}] / {(n-1) + (m-1)} であっています。私も完全に理解できているわけではありませんが、 それぞれの平均をそれぞれの標本で求めているので自由度は (n-1) + (m-1)になります。不偏分散は自由度で割りますから 計算式としては上の式になります。 感覚としては平均値が2つあるので2減るといったところでしょうか。 通常は平均値が1つなので自由度が標本数から1減ります。 極端な話、標本数が1で値がXなら平均X、分散0/0で定義できずが 単一の標本での不偏分散による母分散の推定です。 (標本分散なら0/1=0と計算できてしまうところが標本分散の弱さでしょう) 同様にA,Bともに標本数1ずつなら分子0になりますから分母も0に なるはずです。その意味で標本数から2引くのは納得できる話です。

cardman
質問者

補足

ご返答ありがとうございました。 でもなぜ、下記式にはならないのでしょうか? Σ{(Xi - Xmean)^2} / (n-1) + Σ{(Yi - Ymean)^2} / (n-1) 分母同士・分子同士足し合わせる理由がわかりません。 意味合いもかわってくるような気がしないでもないのですが・・・。

全文を見る
すると、全ての回答が全文表示されます。
  • age_momo
  • ベストアンサー率52% (327/622)
回答No.1

質問者さんはその単元で何をしようとしているか理解できていますか? 期待値、分散の加法性と混同していませんか?全く別のことですよ。 正直なところ、考え込むような式ではありません。 実際に計算してみれば分かりますが、めちゃくちゃ当たり前のことを言っています。 (少し式が違うように思いますが) 例えば Aさんがランダムに成人男性10人の身長を調査してきた。結果は平均170、分散26.22 Bさんも同様に8人の調査をしてきた。結果は平均170、分散13.43 二人のデータを併せたら分散はどうなるか? それぞれのデータが A:171,173,175,161,166,168,175,165,169,177 B:169,166,166,168,172,169,174,176 だったとしたら計算は平均170なので各値の170からの偏差平方和を計算して 足した値を(10+8-1)で割りますね。 Σ記号を入れて書けば {Σ(Ai-170)^2+Σ(Bi-170)^2}/(10+8-1) それぞれのデータがなくても (26.22*9+13.43*7)/(10+8-1) で計算できます。それぞれの偏差平方和は分散に(標本数-1)をかければ出ますから。 (平均が同じだからできるのですが)

cardman
質問者

補足

ご丁寧な回答ありがとうございました。 加法性と混同しているかもしれません。 これは、2つの標本を混ぜて1つの標本にして、 再度分散を求めているということでしょうか? それにしても、分母が(n-1) + (m-1)になる理由がわかりません。 (n+m-1)ならわかりますが。 すいません。 質問にある、標本Bのnをmに変更します。 合併標本分散(A+B) [Σ{(Xi - Xmean)^2} + Σ{(Yi - Ymean)^2}] / {(n-1) + (m-1)} 上記はハンバーガー統計学という本の推定母分散の式として載っていました。 (少し書き方を変えていますが) (http://kogolab.jp/elearn/hamburger/chap4/sec3.html)

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 標本分散について

    標本分散の分母がnなのかn-1なのかで、よく混乱します。 標本分散を計算する場合は、n-1でわり、 全標本分散を計算する場合は、nでわると理解しているのですが、 こんな問題が出ました。 問、次のデータに関して変動係数を求めよ -3,-4,3,5,-1,7,-2 この問題では、標本分散を計算するときに、 回答では、n-1でわる(分散を計算する際の分母は標本分散だから)と 書いてあります。 しかし、 問、次のデータに関してXとYの標本相関係数を求めよ。 ただし、標本に対する操作にとって必要な自由度調整を行うこと [x,y]=[1,3][0,-1][-2,-3][2,1] この問題の回答では、標本分散を計算する際に、nで割っていました。 変動係数を計算する場合は、n-1でわり、 標本相関係数を計算する場合は、nでわる こう考えてOKなのでしょうか?回答が間違っているのか、 私が勘違いしているのかどうかもわからない状態です。 ご教授お願いします。

  • 標本分散と分散の違い

    標本分散の分母N-1の意味がさっぱりわかりません。本には自由度が関係してるとかいてありますがどういうことでしょうか?   

  • 不偏分散の分母の n-1

    標本平均 Xav を求める式、  Xav = 1/nΣxi を不偏分散で用いるため自由度が1減り、不偏分散の分母が n-1 になると思います。 母平均は標本から求めるものではなく(それは標本平均になる)、既知であることが前提であるため上式は不要であり、 標本分散では自由度が減らず分母が n-1 ではなく n になる。 この考えは間違っていないでしょうか? もし間違っていないとすると、母平均は事前にわかっているものなのでしょうか? 例えば、母集団をクラス40人のテストの点数とすると(これは母集団と言わない?)、上式より母平均(?)を求めることができます。 母平均が40個のデータに独立でないため、分散の自由度は1減らす必要がある気がします。 これは結局不偏分散を求めているのでしょうか?

  • 標本分散と不偏分散

    平方和で、個々の測定値と平均値の差の2乗(偏差の絶対値の2乗?)の総和を出せますね。その総和から、測定値と平均値の差の2乗の平均を出したものが標本分散。 単なる平均よりは余裕を持って出した平均(平均値の一部をn-1等分で振り分け?)が不偏分散ですか? また、不偏分散と標本分散は実際、どちらも使われるのでしょうか。 宜しくお願いします。

  • 【緊急です】期待値、分散について

    【緊急です】期待値、分散について 今日の統計学の試験勉強をしていたら以下の質問がわからなくなり、困っています。 平均E(x)=5、E(x^2)=30のとき分散Var(x)=??となる。さらにE(y)=1,E(xy)=-1ならば、共分散Cov(x,y)=-6である。n-3のとき平均u、分散σ^2=1の正規母集団から無作為抽出された標本(x1,x2,x3)について、Σi=1 n(xi―標本平均値xバー)^2の期待値E(Σ(xi―標本平均値xバー)=???である。またE(Σ(xi-u)^2=???となる。 以上3点の問題がわかりません。噛み砕いて説明していただけると幸いです。

  • 統計学: 不偏標本分散の分母は、なぜ(n-1)なの?

    好奇心から統計の入門書を読んでの疑問です。 標本分散(sample variance)=偏差平方和(SS)/標本サイズ(n) は理解できたのですが、 この分母を (n-1) にして、 不偏標本分散(unbiased sample variance)=SS/(n-1) というものをわざわざ考えるのはなぜですか? 標本分散だけで充分役に立つと思うのですが…。 分母を n でなく (n-1) とする意義は何でしょうか? 「突出した標本を未然に除外する」ということなんでしょうか? オリンピック体操種目の採点の際、不公正を排すために最高点・最低点を除外して計算するというのを聞いたことがありますが、それと同じ目的でしょうか? だとすれば、なぜ (n-2)や(n-3)ではなく、あえて (n-1) なのでしょうか? よろしくお願いいたします。

  • 標本平均、分散、期待値・・・混乱しています。。。

    統計の勉強をしていますが、 標本平均、分散、期待値とたくさん用語が出てきて、計算の仕方も混乱しています。 まず、標本平均x’(’は上の棒線) の期待値E[x']とは何を表しているのでしょうか? E[x]=npとの違いは?  pは確率 nは個数? あと、標本平均の分散V[x']=σ^2/nと 分散V[x]=npq  の違いが解りません。 i番目のV[xi]やE[xi]と言うのも出てきて更に混乱しています。 問題によって表し方が違うのでしょうか?

  • 正規母集団の標本平均と標本分散の独立性

    X_1,…,X_nを正規母集団から取った大きさnの標本とします。 簡単のため、母集団の平均は0、分散は1と仮定します。 このとき標本平均X=(X_1+…+X_n)/nと 標本(不偏)分散s=((X_1-X)^2+…+(X_n-X)^2)/(n-1) を考えます。 Xは平均0、分散1/nの正規分布に、 (n-1)sは自由度n-1のχ^2分布に従うと思いますが、 このXとsの独立性の証明はどうやったらよいのでしょうか? 結合分布の計算にX_i^2が混じるので大変に面倒です。 非芯χ^2分布の特性関数の計算などを使うのでしょうか。 方針は立つものの、あまりに煩雑な計算になりそうで尻込みしています。 簡便な計算法をご存知であれば教えていただきたく思います。 よろしくお願いします。

  • [確率]一致推定量

    確率の一致推定量の問題です。 母平均μが既知のときに、標本分散(1/n)Σ(Xi-μ)^2は母分散σ^2の一致推定量であることを示せ。 ただしV[(Xi-μ)^2]は存在するとする。 という問題です。ヒントとして、Yi = (Xi-μ)^2 (i = 1,2,…,n)と置いて{Yi}の標本平均を考える。とあるのですが、最終的に一致推定量であることの定義 limP(lT-θl < k)=1 (T:推定量、θ:母数、k:定数) n→∞ にあてはめるまでに、全然到達することができませんでした… お手数おかけしますが、よろしくお願いします。

  • 測定値のばらつきにおける分散

    物理実験で測定を行い誤差評価において測定値のばらつきを求める際に、分散は   (分散)= Σ(xi-x)^2/n もしくは  (分散)= Σ(xi-x)^2/(n-1) のどちらかを使って算出するのだと思うのですが、使い分けがよくわかりません。 私が大学から与えられたテキストには「測定数nが大きくないときには分散として (分散)= Σ(xi-x)^2/(n-1)を用いる方が良い」と書いてありました。 この測定数が大きくないとは、どの程度を指すのでしょうか? たとえば、測定データが10個程度のならばどちらの式を使うのでしょうか? また、最初に提示した二つの式は「標本分散」や「不偏分散」といった標本の分散を 求めるものですが、そもそも実験で得られる測定データというのは「標本」として扱うのでしょうか? 全体の中から一部を取り出してるわけではないので、測定データは「標本」ではなく 「母集団」のように思えてしまいます・・・。 回答よろしくお願いいたします。

このQ&Aのポイント
  • イノヴィス2500Dでフッドコントロールなしで縫うことができない場合の解決方法について教えてください。
  • フッドコントロールなしでイノヴィス2500Dを使って縫うことができない場合、どのように設定を変える必要があるのか教えてください。
  • 縫製時にイノヴィス2500Dがフッドコントロールなしでは縫えない場合の対処方法について教えてください。
回答を見る