交互作用の母分散推定と自由度について

このQ&Aのポイント
  • 統計学における二元配置の分散分析では、交互作用の母分散推定に特有の式が使用されます。
  • この式では、平均値とそれぞれの水準の差と自由度が組み合わさって母分散を推定します。
  • また、自由度の決定方法は、要因1と要因2の水準数から求められますが、なぜそのようになるのか疑問に思うこともあるかもしれません。
回答を見る
  • ベストアンサー

統計学(交互作用に関して)

以下、二元配置の分散分析に関しての話です。 一般に母分散の推定は σハット^2=(データ-○)^2/N-1 ※○=分布の平均値 なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。 しかし、交互作用の母分散推定に出てくる式は、 σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度 ※○△×=各水準の平均値 なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。 質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか? 質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?) 以上、宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

質問1の回答:  二元配置と母分散の推定のつながりが、いまいち理解できません。二元配置は基本的に 母平均の違いを見るものです。母分散が水準組合せで異なるかどうかを見たいのでしょうか? ちなみに,因子Aの平方和を自由度で割った平均平方は,母分散の推定量ではありません。 Aの各水準での平均値と全平均との差をまとめたものです。 交互作用とは,因子AとBの水準組合せにおける平均から,因子A単独による影響,因子B単独の影響を取り除いても、さらに水準組みわせ間で違いがあることです。 質問2の回答:  一元配置を考えると、因子Aの水準数が a 個あるとき、Aの自由度は a-1 です。基本的に、水準間で母平均に差があるかどうかをみるので、水準数が a 個あるとき、母平均の差の数は a-1 個です。これが自由度です。このとき、第1水準の値から出発したとすると,a-1 個の母平均の差を知っておけば,どの水準の母平均も推定できます。これが重要です。  二元配置に戻って、交互作用は水準組合せ間で母平均の差について考えています。 まず初めに,因子Bを第1水準に固定して、(1,1),(2,1),...,(a,1)間の a-1 個の母平均の差を知れば、(1,1)の平均値と a-1 個の母平均の差で他の水準組みわせでの母平均の値を推定することができます。同様にして、因子Aを第1水準に固定して、(1,1),(1,2),...,(1,b)間の b-1 個の母平均の差を知れば、(1,1)の平均値とその差で他の水準組合せでの母平均の値を知ることができます。交互作用がない場合は、これら a-1個の差とb-1個の差、(1,1)の平均値でもって他のすべての水準組合せの母平均を一応、推定できます。 交互作用があるとき、誤差の範囲内で推定が当たる水準組合せは、(1,1),(2,1),...,(a,1),(1,2),...,(1,b)の a+b-1 個です。残りの ab - (a+b-1) = ab-a-(b-1) = a(b-1)-(b-1) = (a-1)(b-1) 個の水準組合せは誤差の範囲を超えて外れます。したがって、(a-1)(b-1)個の水準組合せについては特別に外した分の値を知る必要があるわけです。よって、交互作用があるとき、すべての水準組合せの母平均を良く推定するためには、(a-1)(b-1)個の交互作用を知る必要があるわけで、これが交互作用の自由度になっているわけです。

161016
質問者

お礼

詳細な解説有難うございます。特に質問2の回答は読み応えがあり、理解に努めております。尚、おそらく質問に具体性を欠いていたので、具体例を追加した質問を立てました。よろしければ、ご確認下さい。

関連するQ&A

  • 統計学(交互作用に関して)

    前回と同じ質問ですが、具体性を欠いていたため、補足して再掲します。 以下、二元配置の分散分析に関しての話です。 一般に母分散の推定は σハット^2=(データ-○)^2/N-1 ※○=分布の平均値 なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。 しかし、交互作用の母分散推定に出てくる式は、 σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度 ※○△×=各水準の平均値 なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。 質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか? 質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?) 以上が前回の質問ですが、具体性に欠いていたため、具体例を追加致します。統計入門書から例を用います。 子どもたちの成績は、1.先生によってちがうのか、2.教えてもらう時間帯によってちがうのか、3.それらの交互作用、の3点について2元配置の分散分析を行う。尚、子どもたちは合計18名、同じような学力で3人ずつ、6つのグループに分けて実験した。授業の後で10点満点のテストを行った。     A先生         B先生       C先生 午前    3、4、5         6、7、8       3、4、5 午後    2、3、4         3、4、5       1、2、3 ちなみに、平均値に関しては、     A先生         B先生          C先生 午前      4         7           4          5.0 午後      3          4           2          3.0      3.5           5.5           3.0 交互作用に関する母分散の推定は、まず、標本平均の分散の推定値を求めます。 標本平均の分散の推定値=(4-3.5)×(4-5.0)+(7-5.5)×(7-5.0)+…+(2-3.0)×(2-3.0)/【(先生の数-1)×(時間帯の数-1)=0.5 わたしが、イメージできないと表現したのは、この「平均がたくさんあり、分散は同一(=0.5)の分布です。 (ちなみに、その後の計算は、標本平均の分散は母分散の1/nですので、3(=n)を掛けた値(=1.5)を推定母分散とします。後は、F値は推定母分散の比ですので、この値を用いて検定します)。 以上、宜しく御願い致します。

  • 3要因分散分析における単純交互作用について

    3要因というか、多様因の分散分析で、 統計ソフトの操作などは理解できたのですが、 交互作用の解釈の仕方で非常に悩んでおります。 3要因の分散分析として2次の交互作用が見られた場合、 単純交互作用を調べた後、単純・単純主効果検定をしますよね? この単純・単純主効果については、2要因の場合と同様に理解できるのですが、 単純交互作用については以下のようなことで悩んでいます。 単純交互作用が見られないとは、 「Aのどの水準においてもこの交互作用自体(B-C間の交互作用)が見られないということだろうか?」 それもと、 「交互作用は見られるが、Aのどの水準でもその交互作用に差がないということ」 を言うのだろうか? という点です。 2要因(各2水準)の場合、私の交互作用の解釈は 「A1水準で見られるB1とB2の違い、A2水準で見られるB1とB2の違いに差があれば、交互作用が見られる」 という解釈です。 この解釈を3要因に広げて考えると、 A・B・C(各2水準)の3要因が存在し、 A1の水準におけるB-C間の交互作用と、 A2の水準におけるB-C間の交互作用に差(違い)がなければ、 単純交互作用は見られないということになります。 (というか、私がそう考えてしまうだけなのですが・・・) 前述の例ですごく平たい言い方をすると、 「交互作用が見られなければ、単純交互作用はない」 ということか 「見られる交互作用にA水準が影響していなければ単純交互作用はない」 なのかと言う点で悩んでいます。 詳しい方、ご教授ください。

  • 分散分析の交互作用について

    はじめまして、 SPSSの三要因分散分析についてお尋ねします。 (1) A×B×Cの三要因分散分析を行いました。すべて2水準です。 結果、主効果、交互作用ともに有意さはありませんでした。 (2) 次にA×B×Dの分散分析を同様に行いました。 すると、A×Bの交互作用が有意でした。 (1)と(2)におけるAとBは同じデータなのに、なぜ(2)では交互作用が生じてしまったのでしょうか。 ちなみにA、Bは被験者内要因、C、Dは被験者間要因です。 ご教授の程、どうぞ宜しくお願い致します。

  • 分散分析、回帰分析の交互作用について

    分散分析、回帰分析の交互作用について質問させていただきます。 以下、参考書より引用です。 ーーーーーーーーーーーーーーーーー 二元配置分散分析の第一要因をU、第二要因をVとするとき、交互作用を以下のように表す。 μ+U_i+V_i   ※i,jは、第一要因がi番目の水準のときの目的変数の期待値を,jはは第二要因のときの期待値を表す。 制約条件はΣU_i=0, ΣV_i=0 同じ状況をダミー変数を使って表す。第一の水準のときは0、第二の水準では1とすると、4つの水準での組み合わせのそれぞれについて、ダミー変数を使った表し方と分散分析的な表現は β_0 と μ-U_2-V_2 β_0+β_1 と μ+U_2-V_2 β_0+β_2 と μ-U_2+V_2 β_0+β_1+β_2 と μ+U_2+V_2 それぞれ等しいとすると、 U_2=(β_1)/2 V_2=(β_2)/2 μ=β_0+(β_1)/2+(β_2)/2 要因の効果は正負はは同じで、単純に2倍の関係になる。 ーーーーーーーーーーーーーーーーー U_2=(β_1)/2 V_2=(β_2)/2 μ=β_0+(β_1)/2+(β_2)/2 4つの組み合わせから、この上記部分への式変形はどのように導けばよいのでしょうか。 どう理解したら分母に「2」がでてくるのでしょうか。 お忙しいと思いますが、丁寧に解説していただければ幸いです。 よろしくお願いします。

  • 交互作用について

    二要因の分散分析をしたところ、 要因Aには有意差がでました。 要因Bには有意差がでませんでした。 ところがAとBの交互作用は有意でした。 こういう場合、なぜAとBの交互作用を検討することが重要なのでしょうか? また要因Aに有意差があり=主効果 でよろしいでしょうか? 統計に詳しい人だれかたすけてください・・・。

  • 確率統計 問題について教えてください。

    平均、分散、比率に関する推定と検定についてです。 母分散、有意水準、標準偏差などさっぱり分かりません。おそらく教科書の最後の方にある分布表?のようなものを使って解くのだろうと思いますが、これの読み取り方もいまいち分かりません。 よろしくお願いします。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 心理学統計 分散分析について。お願いします。

    心理学統計で困っています。 2×3の2要因分散分析を行おうとしています。 それぞれの要因で主効果が見られ、同時に交互作用も見られたときは、 3水準を有する要因についての多重比較を行うことなく、 交互作用の方の単純主効果を見るだけで良いのでしょうか? 回答よろしくお願いします。

  • 分散分析の主効果と交互作用

    二元配置分散分析結果について質問します。 要因Aの主効果 → 有意差あり 要因Bの主効果 → 有意差あり A*Bの交互作用 → 有意差あり となりました。 そこでF値の大きさを見たのですが、 要因A >> 要因B > A*B となっています。 要因AのF値は他2つに比べて10倍以上大きい値です。 この場合、「交互作用による制限は受けるが、要因Aの影響はかなり支配的である」 というような結論付けを行って良いものでしょうか。 実験の主旨としては、「有意差があるかないか」を言いたいわけではなくて、 「傾向があるかどうか」がいえればよいと思い、説得力を持たせるために検定を行っています。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。