• ベストアンサー

共分散分析について教えてください

共分散分析は,どのような時に使うべきなのかや, 共変量が何なのかかいまいちよくわかりません. また,3要因を手計算でするのは無謀でしょうか? 具体例をあげて教えていただけるとありがたいです. よろしくお願いします.

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.1

こんにちは. 共分散分析ですか… 分散分析は心理学や社会科学などでメジャーな分析法ですが,共分散分析は教科書によっては説明されていないいささかマイナーな手法ですね. この教科書に説明されていないというのが問題でして,どんな計算原理で行われるかについては簡単ながらも説明されていますが,【実際の計算過程がよくわからない】ために,また,統計ソフトに必ずしも実装されていないことが多いなどいまいち使い勝手が悪い手法だと常々感じています. > また,3要因を手計算でするのは無謀でしょうか? そのため,上の質問については,「具体的に計算式をどこかの本で見つけているのならばできるかもしれないけど,そもそもその計算式を発見できるのか?」と回答させていただきます. 石村貞夫『分散分析のはなし』,岩原信九郎『教育と心理のための推計学』に計算式が少しばかり説明されていますが,一要因(対応なし),一共変量のについての説明はされていますが,二要因,二共変量以上の場合には計算の原理が説明されている程度で,具体的な計算過程については自分で組み立てないといけません.自分で組み立てるためには,分散分析,回帰分析などの数理的な側面を理解していなければなりませんのでかなり難しいと思います.普段統計解析法を数理的な観点から勉強していない人にとっては正直無謀のような気もします(私もまだまだ数理統計学は勉強中なので,途中で止まってしまいます…). さらにはこれらの本には「対応なし」についてのみ扱っており,「対応あり」については触れられていませんので,もしお望みの三要因の共分散分析が「対応あり要因」を含むものならば,すぐに共分散分析を使わなければならないのであれば諦められた方がよいと思います.なんとか,共分散分析が使える統計ソフトを使いましょう. ひとまず,共分散分析の基本的な考え方についてだけ,ごく簡単に説明します.共分散分析は「回帰分析+分散分析」の分析法だとよくいわれます.このため,共分散分析を使うためには,分散分析の他に【(重)回帰分析も理解していなければなりません】.ここでは質問者さんが(重)回帰分析を理解されていることを前提として話を進めます. とりあえず説明データとして,以下のような,2×2の分散分析データ,共変量が二つというもので説明します. 独立変数(原因);A要因(a1,a2水準),B要因(b1,b2水準) 従属変数(結果):Y 共変量:Z1,Z2 このデータでふつうの分散分析を行うのであれば,共変量のZ1,Z2を無視して「A&B→Y」という二要因分散分析を行うでしょう. 分散分析は,そのデータを収集する時には「A」「B」要因以外の要因(剰余変数)からは大きな影響が出ないような形で,データ収集をしなければなりません(例えば,Yが学力データであるならば,「学習場所(A)」「教科(B)」以外は統制されたものでなければなりません).しかし,データによっては別の要因の影響が大きい,というものもあります(学力はその人本来が持っている知能に影響を受けますが,「A」「B」に知能要因が含まれていない場合は,知能要因の影響はない形,つまりは知能はほぼ一定の人から被調査者に協力してもらわなければなりません).そのようなデータ収集はいわゆる失敗なのですが,しかし,何とか統計学的にそのような剰余変数の影響を(回帰分析の力を借りて)処理しよう,というのが共分散分析です. 簡単に言えば,そのままでは従属変数であるYが(剰余変数の影響を受け)データとしては不適切なので,回帰分析をすることでYをY’に修正して,その修正値であるY’に対して分散分析を行う……これが共分散分析といえます. このことから,共分散分析は計算上,大きく二つの段階に分かれます. 1)(重)回帰分析による従属変数の値の修正 (重)回帰分析も分散分析同様に,原因-結果の観点でデータ分析を行いますが,この修正作業の段階においては  共変量(原因)→ 分散分析の従属変数(結果) として,重回帰分析モデルを作ります.先の例で言えば,本来は平均であるIQ100の人たちを被調査者全員とした方が望ましいのですが,ある人はIQ120,IQ90などのようにバラバラになっている場合はモデルを作り,本来IQ120(90)の人がIQ100であった場合のデータ……のように,修正を施せるようなモデル式を作るわけです. ただし,この修正のためのモデル式がデータによっては有効ではない場合もありますので(実は,学力は知能の影響を受けていない,など),共分散分析においてその回帰分析モデル式が有効であるかを調べなければなりません.kのため,(重)回帰分析の重要な数値である「回帰係数」が有効であるかとして「回帰係数の平行性の検定」「回帰係数の有意性の検定」などを調べなければなりません.これで有効でなければ,回帰分析による修正が行えず,単にふつうの分散分析を行うことになります(詳しくは,先に挙げた参考資料を見てください). 2)修正値に対する分散分析  この過程は【基本的には】分散分析と同様で,結果も通常の分散分析とほぼ同じような感じで出力されます.「A要因の効果」「Bの要因の効果」「A×Bの交互作用」などです.共分散分析では,これに加えて「共変量の効果」という項目も併せて算出されます. .

bon-chan
質問者

お礼

ありがとうございました. 回帰分析は,完璧ではないですが,多少は理解しているつもりでした f(^^; アドバイス,とてもわかりやすかったです. 回帰分析+分散分析というのは知っていたのですが,共変量がよくわからなかったんです. やっぱり手計算は無理ですよね.ソフトを使えるはずなので,ソフトに頼ります… ところで,岩原信九郎『教育と心理のための推計学』がアマゾンや紀伊国屋で見当たらなかったんです. 手計算は無理だと判明しましたので,もしよろしければ 計算方法はなくても,わかりやすく書いてある本を紹介していただけませんでしょうか?

その他の回答 (1)

  • selfer
  • ベストアンサー率76% (104/136)
回答No.2

再度登場です. > アマゾンや紀伊国屋で見当たらなかったんです. あれ? 念のためにAmazonで確認をしてみました…… 「分散分析のはなし」 http://www.amazon.co.jp/exec/obidos/ASIN/4489003803/ref=sr_aps_b_/t/250-2887644-6018655 「教育と心理のための推計学(新訂版)」 http://www.amazon.co.jp/exec/obidos/ASIN/4821062046/ref=sr_aps_b_/t/250-2887644-6018655 と,在庫がありました(2004/02/04,20:09時点).質問者さんが検索された時に,在庫が切れていたのかも? もしかすると「~のための推計学」の無印を探されたのでしょうか? 申し訳ありません「新訂版」の方です. . 共分散分析の説明としては「分散分析のはなし」が読み物としてはわかりやすかったです.

参考URL:
http://www.amazon.co.jp/exec/obidos/ASIN/4821062046/ref=sr_aps_b_/t/250-2887644-6018655
bon-chan
質問者

お礼

ありがとうございました. 「分散分析のはなし」を読んでみたのですが,けっこうわかりやすくていいですね(^-^) 共変量が何なのかもわかるようになりました☆ いろいろご親切にありがとうございました.

関連するQ&A

  • 共分散分析に関して。

    通常,高低群に分けたものを独立変数とし,平均値の差を知りたい変数を従属変数とした場合には,t検定でも分散分析でも同じ値が算出するかと思うのですが,そこに共変量の影響を仮定した場合には共分散分析が検定力を強め,有意差が異なってくるのではないかと考えました。 そこで,SPSSの「一般線形」「1変量」で共変量をすべて投入して分析を行ったんですが結果をどう見ればいいのかよく分かりません。また,共変量の投入が妥当なのかも疑問です。そこで,どういった場合に共分散分析を行えて,またそれが妥当なのか,ご教授いただけると嬉しいです。 ちなみに,分散分析を行う際に影響を及ぼすと思われる共変量は,性別や年齢,職種など全部で5つあります。これを全部一括して投入するのか,もしくは1つづつ投入するのか,それとも分散分析が妥当なのか,よろしくお願い致します。

  • 共分散分析(ANCOVA)で困っています

    共分散分析(ANCOVA)で分からない点があり困っています.  疫学研究系の国内誌に投稿したところ,査読者から,共分散分析のモデルについて再考すべしとの指摘がありました.  要因A(体操教室の参加者,不参加者)が従属変数Y(握力の強さ:連続変数)に及ぼす影響について,共変量X(年齢,性別,教育年数,喫煙)を投入した共分散分析のモデルにより検討しようとしています.  そこで質問です:  ・質問(1) 共変量Xは,従属変数Yとじっさいに有意な相関関係にあるものしかモデルに投入できないのでしょうか?    ・質問(2) 共変量Xのうち,要因Aと相関関係に有るもの,要因Aと相関関係に無いものの両方を混在させてモデルをつくることは妥当なのでしょうか?  ・質問(3) 査読者から,共分散分析を実施する上での前提を確認することとの指摘がありました.共分散分析を実施するうえで必ずチェックしなければいけない点について分かりやすく教えてください.  以上について,お教えいただければ幸いです.

  • 共分散分析

    共分散分析で,共変量による影響を調整したうえでの平均値の求め方がわかりません. "adjusted meanというようなのですが・・・. 私はStat Viewを使っているのですが,このソフトでできるのでしょうか. できない場合は,どうやって計算すればいいのでしょうか. 文型の私にもわかりやすいアドバイスをいただけたら,嬉しいです.

  • 分散分析の誤差について

    現在,心理学の統計で分散分析を行っています。 1要因に対応が無く,1要因に対応がある2要因の混合分散分析を行っています。(データ数が異なる) 現在使用しているソフトのバージョンでは混合分散分析ができないため手計算を行っています。 そこで問題が発生したのですが,参考書(心理学のためのデータ解析テクニカルブック)を見てやっているのですが, 平方和(SS)の誤差がどうしてもマイナスの値になってしまいます。 主効果の誤差は大丈夫なのですが,交互作用の誤差ででます。 良いのでしょうか? 以前,習った時にマイナスは出ないので出た場合には計算間違いだよ!と言われた気がして前に進めません。 すみませんが,よろしくお願いします。

  • 分散分析のNの数

    統計全体の知識がありませんが、なんとか本をみながら統計を進めている状態です。 どなたか教えて頂けないでしょうか? まず、2要因の分散分析をしようと思って、SPSSで本をよみながらすると、 一変量の分散分析にたどり着きました。(一変量??が気になるのですが・・) 背景としては、対応なしで等分散していない値を扱っています。 従属変数をストレス値としています。 2要因の水準(?)は、2×2です。 私のためにも、例で書くと、男・女×小学生・中学生とします。 結果として、交互作用(?)のところで優位確率が0.02と出ています。 単独、男女と、年齢だけでは有意差がでていません。 これは、どのように解釈すればいいのでしょうか? 結果として論文に書けるのでしょうか? 後、気になることとして、例えば女の小学生が2名しかおりません。 ※全体数は40です。 ご助言よろしくお願いいたします。

  • 分散分析について

    分散分析についての質問なのですが 被験者間要因のみに注目をし分析する場合 同じ被験者が、同じ実験を繰り返し得られた結果のデータは 各被験者ごとに結果の平均をとってから、分散分析をしても問題はないのでしょうか? 回答よろしくお願いします。

  • 二要因の分散分析について質問です!!!

    二要因の分散分析について質問です!!! 二要因の分散分析をSPSSでやっていたら、Leveneの等質性の検定という等分散を仮定する検定で 有意になってしまいました。⇒帰無仮説が棄却されない で、t検定だと等分散を仮定しない場合の値が書いてあったり、 一元配置分散分析ではWelchの検定というのがあります。 二要因の分散分析でなんとかこの状況を打開する手はないでしょうか? できればパラメトリック検定で行いたいと考えております。

  • 分散分析で、水準の効果を母数と変量、どちらととらえるか?

    分散分析で、水準の効果を母数と変量、どちらととらえるか? こんにちは。よろしくお願いします! まずこの質問の目的です。 「この分散分析は、こうゆうわけで変量モデルとして分析しよう。」というように、自身で、変量なのか母数なのか混合なのかを判断できるようになることが目的です。 そこで、ここからが質問になります。質問は3点あります。 1、そもそも「母数」「変量」という言葉はどのような意味でしょうか?教科書にのっているような説明をいくつか読んでみて、わかりませんでした。ですので、なるべくわかりやすく、できれば例を入れて説明していただけると幸いです。 2、どのモデルにするか判断をする際に、みなさんが気をつけていることは何でしょうか? 3、その他、なにか根本的に勘違いしているなど、なんでもかまいませんのでお気づきの点がありましたら、ご指摘おねがいします。 1点の質問についてのみの回答でも、回答の順序が質問の順序と違っていても、かまいません。よろしくお願いいたします!

  • ・・・どの分散分析?

    卒論で分散分析をやらなければならないのですが、どの分散分析を使えばいいのかわかりません。計7枚のそれぞれ床の色が違う部屋の写真を提示し、それぞれの写真につき13個の形容詞対をSD法で答えてもらいました。 色、被験者の数、形容詞対、どれが要因とかさっぱりわかりません。教えてください。締め切り間近なんです!!

  • 分散分析について

    統計初心者です。 分散分析についての質問です。 今実験データを分散分析にかけて主効果を見ようと試みています。 その中で要因が、「色1、色2、文字、環境」と 4要因あり4元配置で分析を行っています。 色1は、白、黒、灰で3水準、 色2は赤、青、黄、緑、白、黒、灰の7水準なのですが、 色1と色2が同じ色の組み合わせ (色1の白と、色2の白など) でのデータは存在していません。 つまり、色1には色2が6水準かかってくる。しかし、6水準は同じ種類ではない。といった状況です。 この状況で分散分析を行った場合、主効果として色1、色2は効いていると言えるのでしょうか? なんとなく腑に落ちません。よろしければどなたかよい方法を教えていただけると 大変助かります。 よろしくお願いいたします。