交互作用の母分散推定に関する質問

このQ&Aのポイント
  • 交互作用の母分散推定について具体的な分布をイメージすることはできますか?
  • なぜ、交互作用の母分散推定の式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?
  • 交互作用の母分散推定について具体例を追加しました。子どもたちの成績に関して3つの要因について2元配置の分散分析を行い、交互作用に関する母分散の推定を求める際の式と具体的な値について詳細を教えてください。
回答を見る
  • ベストアンサー

統計学(交互作用に関して)

前回と同じ質問ですが、具体性を欠いていたため、補足して再掲します。 以下、二元配置の分散分析に関しての話です。 一般に母分散の推定は σハット^2=(データ-○)^2/N-1 ※○=分布の平均値 なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。 しかし、交互作用の母分散推定に出てくる式は、 σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度 ※○△×=各水準の平均値 なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。 質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか? 質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?) 以上が前回の質問ですが、具体性に欠いていたため、具体例を追加致します。統計入門書から例を用います。 子どもたちの成績は、1.先生によってちがうのか、2.教えてもらう時間帯によってちがうのか、3.それらの交互作用、の3点について2元配置の分散分析を行う。尚、子どもたちは合計18名、同じような学力で3人ずつ、6つのグループに分けて実験した。授業の後で10点満点のテストを行った。     A先生         B先生       C先生 午前    3、4、5         6、7、8       3、4、5 午後    2、3、4         3、4、5       1、2、3 ちなみに、平均値に関しては、     A先生         B先生          C先生 午前      4         7           4          5.0 午後      3          4           2          3.0      3.5           5.5           3.0 交互作用に関する母分散の推定は、まず、標本平均の分散の推定値を求めます。 標本平均の分散の推定値=(4-3.5)×(4-5.0)+(7-5.5)×(7-5.0)+…+(2-3.0)×(2-3.0)/【(先生の数-1)×(時間帯の数-1)=0.5 わたしが、イメージできないと表現したのは、この「平均がたくさんあり、分散は同一(=0.5)の分布です。 (ちなみに、その後の計算は、標本平均の分散は母分散の1/nですので、3(=n)を掛けた値(=1.5)を推定母分散とします。後は、F値は推定母分散の比ですので、この値を用いて検定します)。 以上、宜しく御願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

回答1への補足:  「標本平均の共分散も母分散のときと同じように1/nか」について: 確率変数の組(X1,Y1),(X2,Y2), ... ,(Xn, Yn)は互いに独立に同一の分布に従うとします。つまり,(Xi,Yi)において、XiとYiには相関が0ではないが、(Xi,Yi)と(Xj,Yj)のように組をまたいだ確率変数間では独立です。 さらに、E(Xi) = m, i=1,2,...,n V(Xi) = s2,i=1,2,...,n Cov(Xi,Yi) = c, i=1,2,...,n のように記号を定義しておきます。 X1,...,Xn の標本平均を Xbar とします。 Y1,...,Yn の標本平均を Ybar とします。 XbarとYbarの共分散( Cov(Xbar,Ybar) )を求めます。 Cov(Xbar,Ybar) = E(Xbar*Ybar) - E(Xbar)E(Ybar) E(Xbar*Ybar) = E[((X1+…+Xn)/n)*((Y1+…+Yn)/n)] = E[ X1Y1 +…+ X1Yn +X2Y1 +…+ X2Yn + … +XnY1 +…+ XnYn ] / (n*n) =(E[X1Y1] + … + E[X1Yn] +E[X2Y1] + … + E[X2Yn] + … +E[XnY1] + … + E[XnYn]) / (n*n) 確率変数の組は互いに独立であるので,E[X1Y1],...,E[XnYn]以外の期待値は E[Xi]E[Yj](i≠j)である。よって、 E(Xbar*Ybar) = (E[X1Y1]+…+E[XnYn])/(n*n) +(∑E[Xi]E[Yj])/(n*n) ← i≠jに該当する項のすべての和 である. E(Xbar)E(Ybar) = E[X1+…+Xn]E[Y1+…+Yn]/(n*n) = (E[X1]+…+E[Xn])(E[Y1]+…+E[Yn])/(n*n) = (E[X1]E[Y1]+…+E[Xn]E[Yn])/(n*n) +(∑E[Xi]E[Yj])/(n*n) ← i≠jに該当する項のすべての和 ゆえに、 Cov(Xbar,Ybar) = E(Xbar*Ybar) - E(Xbar)E(Ybar) = {(E[X1Y1]-E[X1]E[Y1]) + … + (E[XnYn]-E[Xn]E[Yn])}/(n*n) = ( Cov(X1,Y1) + … + Cov(Xn,Yn) )/(n*n) = c*n/(n*n) ← 確率変数の組は同一の分布に従うと仮定しているから。 = c/n 以上より,Cov(Xbar,Ybar) = c / n ,すなわち,標本平均の共分散は,もとの確率変数の共分散の 1/n 倍 である.

161016
質問者

お礼

大変丁寧な解説を頂き、感謝の気持ちで一杯です。有難うございました。当方、初心者なもので、これから少し時間をかけて数式を追い、理解に努めたいと思います。その中で、また疑問点が出たら、新たな質問を立てたいと思います。

その他の回答 (1)

回答No.1

質問1の回答  交互作用は因子A(先生)とB(時間帯)を組み合わせたときの特別な効果なので、分散の推定値と考えるのではなく、共分散(相関)の推定値と考えてみてはいかがでしょうか。 そうすると、 (1) 各グループ内のデータ(得点)は、先生と時間帯については同じ情報を持っているので平均し、これを交互作用に関してデータ(標本平均)と見なす。 (2) 先生によって平均値が異なるので、標本平均の母平均をそろえるため、先生ごとの平均値を差し引く。 X = (4.0-3.5 , 3.0-3.5 , 7.0-5.5 , 4.0-5.5 , 4.0-3.0 , 2.0-3.0 ) 同様に、時間帯についても標本平均の母平均をそろえる。 Y = (4.0-5.0 , 3.0-3.0 , 7.0-5.0 , 4.0-3.0 , 4.0-5.0 , 2.0-3.0 ) (3) XとYについて共分散を求める。ただし、自由度は(a-1)(b-1)なので、 標本平均における交互作用に関する母分散の推定値 = (4.0-3.5)(4.0-5.0)+…+(2.0-3.0)(2.0-3.0) / (a-1)(b-1)。 これをもとのデータのレベルに戻すために、n倍する。 のように考えればすっきりすると思います。

161016
質問者

お礼

なるほど!「標本平均の分散」を推定したのではなく、「標本平均の共分散」を推定したと考えるのですね。 ただ、1つ難しい点は「標本平均の分散」は母分散の1/Nになっているので、Nを掛ければ母分散になりますが、「標本平均の共分散」も母分散の1/Nになっているのですか?もし、そうならスッキリ理解できるのですが。お手数ですが宜しくお願い致します。

関連するQ&A

  • 統計学(交互作用に関して)

    以下、二元配置の分散分析に関しての話です。 一般に母分散の推定は σハット^2=(データ-○)^2/N-1 ※○=分布の平均値 なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。 しかし、交互作用の母分散推定に出てくる式は、 σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度 ※○△×=各水準の平均値 なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。 質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか? 質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?) 以上、宜しくお願い致します。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 確率統計 問題について教えてください。

    平均、分散、比率に関する推定と検定についてです。 母分散、有意水準、標準偏差などさっぱり分かりません。おそらく教科書の最後の方にある分布表?のようなものを使って解くのだろうと思いますが、これの読み取り方もいまいち分かりません。 よろしくお願いします。

  • 3要因分散分析における単純交互作用について

    3要因というか、多様因の分散分析で、 統計ソフトの操作などは理解できたのですが、 交互作用の解釈の仕方で非常に悩んでおります。 3要因の分散分析として2次の交互作用が見られた場合、 単純交互作用を調べた後、単純・単純主効果検定をしますよね? この単純・単純主効果については、2要因の場合と同様に理解できるのですが、 単純交互作用については以下のようなことで悩んでいます。 単純交互作用が見られないとは、 「Aのどの水準においてもこの交互作用自体(B-C間の交互作用)が見られないということだろうか?」 それもと、 「交互作用は見られるが、Aのどの水準でもその交互作用に差がないということ」 を言うのだろうか? という点です。 2要因(各2水準)の場合、私の交互作用の解釈は 「A1水準で見られるB1とB2の違い、A2水準で見られるB1とB2の違いに差があれば、交互作用が見られる」 という解釈です。 この解釈を3要因に広げて考えると、 A・B・C(各2水準)の3要因が存在し、 A1の水準におけるB-C間の交互作用と、 A2の水準におけるB-C間の交互作用に差(違い)がなければ、 単純交互作用は見られないということになります。 (というか、私がそう考えてしまうだけなのですが・・・) 前述の例ですごく平たい言い方をすると、 「交互作用が見られなければ、単純交互作用はない」 ということか 「見られる交互作用にA水準が影響していなければ単純交互作用はない」 なのかと言う点で悩んでいます。 詳しい方、ご教授ください。

  • 確率・統計です。 助けてください!

    母平均0,母分散1の標準正規分布に従う母集団から無作為抽出された標本X1,…,Xnを 用いて母平均μについて有意水準α=0.05で H0:μ=0 H1:μ≠0 の検定を行った時,「標本数n」により「正しい検定結果が得られる確率」がどのように変化するかについて検討せよ.乱数を用いたシミュレーション,思考実験,理論からの考察など手法は問わない 大学の課題なんですが、わかりません。 詳しく解説してもらえると助かります。 よろしくお願いしますm(__)m

  • 検定の質問です

    問題がどうしても解けないのでお願いいたします。 母分散と母平均が両方未知で正規母集団から大きさ51の標本を無作為抽出し、不偏分散Vを計算しました。 帰無仮説:母分散がvを有意水準0.05%で検定するときの棄却域をどうか教えてください。 カイ2条分布を用いて解けるとは思うのですが、どのように区間推定したら良いのかわからないのでよろしくお願いいたします。

  • 統計学の基礎?

    前提 日本人の身長の真の平均値を知るためには、日本人全員の身長を測定しなければならないが、それはおそらく不可能である。 そこで、一部の人(標本)の身長を測定し、その結果から推測したい。 標本(n)の身長もばらつき(標本分散:v)を持つし、日本人全体(母集団:N)の身長もばらつき(母分散:σ^2)を持つが、これらと真実の値(母平均:μ)や標本平均(m)との関係はどうなっているだろうか? ただし、各人の測定結果(身長)はX1,X2,X3・・・XNとあらわす。 問 1)日本人の平均身長= 2)日本人の平均身長の標準偏差= 3)標本の平均身長= 4)標本の平均身長= 5)標本の平均身長の分散から推定される日本人の平均身長の標準偏差= 6)標準誤差はσ/√nで与えられるが、これを標本分散を用いて表すと次のようになる。  標準誤差= 7)標準誤差を用いると、真実の平均値(母平均)があるであろう範囲(信頼区間)を特定の有意水準で求めることができる。有意水準5%のときの範囲(95%信頼区間)を表す式を示せ。 8)160、165,170,175,180というデータの平均の95%信頼区間を求めよ また、145,165,170,175,195というデータの平均の95%信頼区間と比較せよ。 以上の問です。 7と8以外は、数値を聞いているわけではなく、求める式を問うていることはなんとなくわかるのですが、ちょっとパソコンを利用して調べて回ったところ、どれが必要な情報かさえわからないレベルで、頭が痛くなってしまいました。 よろしければ問いの回答、その回答に至る考え方の流れなどを、簡単なものでも構わないのでご教授願えないでしょうか?

  • 分散分析の交互作用について

    はじめまして、 SPSSの三要因分散分析についてお尋ねします。 (1) A×B×Cの三要因分散分析を行いました。すべて2水準です。 結果、主効果、交互作用ともに有意さはありませんでした。 (2) 次にA×B×Dの分散分析を同様に行いました。 すると、A×Bの交互作用が有意でした。 (1)と(2)におけるAとBは同じデータなのに、なぜ(2)では交互作用が生じてしまったのでしょうか。 ちなみにA、Bは被験者内要因、C、Dは被験者間要因です。 ご教授の程、どうぞ宜しくお願い致します。

  • 統計学の問題ですが、まったく分かりません。。

    統計学の問題ですが、まったく分かりません。。 どなたか回答していただけないでしょうか。 ある国出身の成人男性8人と成人女性10人について身長を測定し たところ、標本平均がそれぞれ 171.3 cm と 165.2 cm 、標本不偏 分散がそれぞれ 10.2 cm2 と 8.5 cm2 となった。男性と女性の身長 が正規分布に従っており、また、母分散の値が等しいとして、こ の国の成人男性と成人女性の平均身長の差を95%信頼係数で区 間推定せよ。 という問題です。 よろしくおねがいいたします。