重回帰分析(多重共線性)について

このQ&Aのポイント
  • 重回帰分析における交互作用に関して質問させていただきます。
  • 回帰モデルでX4のダミー変数を使用している場合、多重共線性の問題が生じます。
  • 標準化や平均化を行うことで多重共線性に対処できるが、ダミー変数の場合は平均化ができないため対処方法を知りたい。
回答を見る
  • ベストアンサー

重回帰分析(多重共線性)について

いつもお世話になっております。 重回帰分析における交互作用に関して質問させていただきます。 Y = α + β1X1 + β2X2 + β3X3 + β4X4 + β5X1X4 という回帰モデルがあり、 X4に関しては0または1をとるダミー変数です。 説明変数としてX1とX4の交互作用を投入しているのですが、 上記モデルを用いて分析を行うと多重共線性の問題が発生します。 さまざまな文献を読んで、通常、標準化ないし平均化(各変数ごとにその平均を引き変数の平均をゼロにすること) を行うことによりこのような多重共線性には対処できるということがわかったのですが、 あいにく、この場合にはX4がダミー変数であるため平均化(標準化)いう作業を行うことができません。 今回のような多重共線性に関する問題を適切にクリアする方法をご存知であれば、 ご教示のほどよろしくお願いいたします。

noname#65404
noname#65404

質問者が選んだベストアンサー

  • ベストアンサー
  • at9_am
  • ベストアンサー率40% (1540/3760)
回答No.1

> 今回のような多重共線性に関する問題を適切にクリアする方法 一番簡単には、モデルを少しいじって、多重共線性が発生しない形にすればよいです。 X4 がダミーということですから、 Y = α + β1 X1 + β2 X2 + β3 X3 for X4=0 = (α + β4) + (β1 + β5) X1 + β2 X2 + β3 X3 for X4=1 というモデルになりますので、α+β4 = α'、β1 + β5 = β1' とおけば、 Y = α + β1 X1 + β2 X2 + β3 X3 for X4=0 Y = α' + β1' X1 + β2 X2 + β3 X3 for X4=1 と書くことが出来ます。したがって、通常のモデル分析で解けるわけです。 推定値は、方程式モデルのメソットでも、通常の最小自乗法などのメソットでも、どちらでも容易に推定することが可能です。

noname#65404
質問者

お礼

リッチ回帰等他の回帰推定を行う必要があるのかと思っていましたが, 意外と簡単に対処できるようでたいへん助かりました。 ご回答いただき誠にありがとうございました。 今後ともよろしくお願いいたします。

関連するQ&A

  • 階層的重回帰分析

    階層的重回帰分析の変数解釈について 例えば、 目的変数:y 説明変数(強制投入法):x1 x2 x3  があるとし、 モデル1では、x1とx2を投入した所、x2が目的変数に対して、有意な変数でした。 そして、次にモデル2では、x1とx2に加え、x3を投入しました。 その結果、目的変数にたいし、x3は有意な変数となりましたが、 モデル1で有意な変数であったx2が有意な変数ではなくなりました。 このような場合の目的変数に対しての影響関係の解釈がいまいち理解できません。 これはどのように解釈すればよいのでしょうか。 よろしくお願いします。

  • 多重共線性について

    重回帰分析においては,変数間の相関関係から多重共線性が非常に重要な問題であることは以下のサイトから理解しました。 http://blogs.yahoo.co.jp/pironotakarabako/1048887.html この多重共線性の問題は,重回帰分析のような回帰モデルが線形回帰の場合だけに発生する問題なのでしょうか?他の多項式モデルや非線形回帰モデルの場合にもやはり多重共線性は発生するのでしょうか?

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 線形回帰分析:多重共線性と主成分回帰について

     最小二乗法による線形回帰モデルのあてはめについて,説明変数間に多重共線性がある場合,回帰係数の信頼性や予測精度が低下すると習いました.これを防止する方法として,元の説明変数行列の主成分を説明変数としてあてはめを行う主成分回帰(PCR)等があるようです.  しかし,説明変数行列の線形変換は,回帰モデルのあてはめ値(fitted values),残差,新たなデータに関する予測値に影響を与えません.主成分も線形変換の1つなので,元の説明変数と同数の主成分を説明変数に用いる場合,全く同じあてはめ値,残差,予測値が得られます. それでは,主成分回帰は何故,多重共線性による回帰係数の信頼性,予測精度の低下を防止する手段と言えるのでしょうか? (主成分回帰の狙いは,元の説明変数より少数の重要な主成分のみを説明変数に用いることにもあるようですが,これは,多重共線性の問題の防止とは関係ないと思います.) 勘違いしている点もあるかもしれないので,コメントを頂ければ嬉しいです。

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • 重回帰分析について

    重回帰分析についての質問です *学生本人、その父親・母親の身長および性別 身長  性別(X) 父の身長(X2) 母の身長(X3) 176 1     174      166 173 1     169      160  ・  ・      ・        ・  ・  ・      ・        ・  ・  ・      ・        ・ というデータがあるとします。説明関数xが性別のダミー変数で男なら1女なら0の値をとる。変回帰分析係数β^1の値からどの様なことが読み取れますか?

  • 重回帰と偏相関の違い

    重回帰分析も偏相関分析もともに、複数の説明変数と1つの従属変数が登場人物となって、その関係を分析するものと認識しています。 が、大きな違いとして、重回帰は多重共線性を示す説明変数を同時投入した分析はできないのに対し、偏相関分析は寧ろそういう変数たちを同時に取り扱って分析することに使うと聞きました。 どういう理由で、両者にこのような違いがあるのか、ご教示頂けないでしょうか。

  • エクセルの回帰分析について

     エクセルで回帰分析をおこなったのですが、有意な結果がでませんでした。説明変数がすべてダミー変数であるからでしょうか?ダミー変数のみで回帰分析を行うことは可能ですか?

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。