- ベストアンサー
重回帰と偏相関の違い
重回帰分析も偏相関分析もともに、複数の説明変数と1つの従属変数が登場人物となって、その関係を分析するものと認識しています。 が、大きな違いとして、重回帰は多重共線性を示す説明変数を同時投入した分析はできないのに対し、偏相関分析は寧ろそういう変数たちを同時に取り扱って分析することに使うと聞きました。 どういう理由で、両者にこのような違いがあるのか、ご教示頂けないでしょうか。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
なかなか回答がないので私から, 私は,企業の品質管理の部門に在籍し,SQCを推進する立場にあります. 応用統計で学位を取っています. 重回帰分析は説明変数で目的変数(こちらは従属)を説明することに用いられますが, 相関分析や偏相関分析は,回帰分析や因果分析をやるまえに, 変数間の関係を見るために行われます. 相関係数と偏相関係数の違いは分かりますか? 相関係数行列の逆行列をとったのもが偏相関係数行列になります. 偏相関は,擬相関を取り除いた関係を示しており,「真の関係」と言えます. 今,小学生(例えば1~6年各30名くらいずつ)のデータがあるとします. データは各人について 学年,靴のサイズ,覚えている漢字数の3変数とします. このとき,覚えている漢字数を目的変数として,重回帰分析を行いなさい という問題があったとします. 学年が決まれば,おおよそ靴のサイズと,覚えている漢字数が決まります. でも,靴のサイズと覚えている漢字数には擬相関があり, 重回帰分析を行うと,学年と,靴のサイズに多重共線性の問題が発生します. 偏相関分析を行うと,靴のサイズと覚えている漢字数の関係が消えますので, 覚えている漢字数は,学年を説明変数として回帰式が立てられることが分かります. 偏相関係数をもっと積極的に使ったモデル化手法として 「グラフィカル・モデリング」があります. ただ,注意が必要です.統計は万能ではありません. 今,粗暴犯の収監者と一般人が,子供の頃にマクドナルドのような ジャンクフードをどれだけ食べていたかというデータがあったとします. このデータから,小さい頃にマクドナルドを食べると キレやすくなるという回帰分析の結果が得られます. このときは,偏相関分析を行って擬相関を取り除こうにもデータは ほかにありません.では,この結論は「真」なのでしょうか? 実は,観測していないデータに「貧困度合い」というのがあるのです. 貧困家庭は,親が共働きして子供に外食をさせていたということです. むしろ,貧困による劣等感や遊び仲間が影響していると思われます. 話が逸れてしまいましたが, 多くの変数を取り上げ,多重共線性で悩む前に とりあえずは,本当は関係の無い擬相関を取り除こう,というのが偏相関分析. ただ,万能ではなく,観測変数として重要なものを上げることを 忘れていれば,お手上げ, ということです. データ解析の前に,しっかり仮説を検討して,どのようなデータを採取するか 十分検討することが必要です.
お礼
お礼が遅くなりました。 貴重な回答をありがとうございました。