• 締切済み

重回帰分析の多重共線せんいついて

重回帰を行います。説明変数間に相関がないか確認するために、ピアソンの相関係数を確認します。名義尺度をダミー変数化し、連続変数として扱う場合、他の説明変数間との相関は、ピアソンの相関係数を参考にすべきか、その検定のp値を参考にすべきかわかりません。ご指導ください。

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 他の説明変数間との相関は、ピアソンの相関係数を参考にすべきか、その検定のp値を参考にすべきかわかりません。 あくまで相関があるかどうかは「相関係数の値そのもの」を参考にします。母相関係数が0であるという帰無仮説はサンプルサイズを大きくすれば棄却されるようになります(つまりp値が小さくなる)。だから、最近はp値のみに着目するような表記を推奨しない学会誌もあります。 仮にr=0.89でp=0.15とかであったとしても、それらの変数を説明変数としておいてしまうと多重共線性の問題が生じる可能性があります。しつこくいえば、あくまでも母相関係数がどうであるかについて検定しているのであって、実データ(実測値)について重回帰分析を行うのですから、この場合のp値に実質的な意味は全くありません。 ちなみに、 > 名義尺度をダミー変数化し、連続変数として扱う場合、 というのは分散分析をしていることになりますね。もし連続型の変数とカテゴリカル型の変数(名義尺度のデータ)が混在していれば、共分散分析ということになります。

関連するQ&A

  • ダミー変数だけによる重回帰分析

    被説明変数は連続変数、説明変数はすべてダミー変数、という重回帰分析を行う際に何か注意することはあるのでしょうか。あるいはこうした場合は単純な重回帰分析は使うべきでないのでしょうか。

  • ダミー変数を用いた重回帰分析での影響度の比較

    ダミー変数と連続変数の両方を含むデータで、重回帰分析を行おうとしています。その際、各説明変数の目的変数への影響度の大きさに興味があります。 連続変数のみの重回帰分析であれば、標準偏回帰係数の大小で影響度が比較できると思います。 またあるWebページでは、ダミー変数のみの重回帰分析(数量化1類?)では、各アイテム変数のレンジ・単回帰係数・偏回帰係数などで比較をしていました。 しかしダミー変数と連続変数が同時に含まれる場合は、各説明変数の影響の大きさをどのように比較すれば良いのでしょうか。 例えば下記参考URLのWebページで、単価・曜日・天気から売り上げ本数を予測していますが、最後の方で出てくる係数は単価、日~月までの7種類、曇~雨の3種類、の合計11種類の係数が出ています。 これを単価・曜日・天気の3種類の影響度という形にして比較する、という事は可能なのでしょうか。 偏回帰係数とレンジをそのまま比較はできないと思うのですが、方法はあるのでしょうか。 参考URL: http://homepage2.nifty.com/nandemoarchive/toukei_hosoku/tahenryo_jirei_02.htm

  • 重回帰分析(多重共線性)について

    いつもお世話になっております。 重回帰分析における交互作用に関して質問させていただきます。 Y = α + β1X1 + β2X2 + β3X3 + β4X4 + β5X1X4 という回帰モデルがあり、 X4に関しては0または1をとるダミー変数です。 説明変数としてX1とX4の交互作用を投入しているのですが、 上記モデルを用いて分析を行うと多重共線性の問題が発生します。 さまざまな文献を読んで、通常、標準化ないし平均化(各変数ごとにその平均を引き変数の平均をゼロにすること) を行うことによりこのような多重共線性には対処できるということがわかったのですが、 あいにく、この場合にはX4がダミー変数であるため平均化(標準化)いう作業を行うことができません。 今回のような多重共線性に関する問題を適切にクリアする方法をご存知であれば、 ご教示のほどよろしくお願いいたします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析

    現在、大学4年です。 工学部で都市計画を習っており、卒業論文は経済学に 近いテーマです。 具体的には、福岡市に新しい地下鉄ができたので、そ の効果を調べようというもの。 方法は地下鉄周辺の家賃を2002年から2005年 まで調べ、2005年に家賃が上がっていたら、それ は地下鉄の効果であるという構想です。 家賃の推定式を重回帰分析であらわし、2004年の 家賃と2005年の家賃を比較、2003年と200 5年の家賃を比較、2002年と2005年の家賃を 比較しています。 比較の方法はダミー変数を加え、2005年には1を とり、それ以外の年は0をとるという方法です。 ここで疑問が生じるのですが、普通にExcelを使って重 回帰分析を行うと、ダミー変数以外の係数も変化して しまいます。 つまり、重回帰分析により2004年と2005年を 比較したときと、2003年と2005年を比較した ときとではダミー変数の係数だけでなく、家賃に関係 するほかの変数(面積や築年数など)も変化してしま います。 係数が変化してもいいのか不安なので、どなたか教え ていただけないでしょうか。 また、係数を変えてはいけないのであれば、係数を変 えずに地下鉄の効果を求める方法を教えていただきた いと思います。 説明にわかりにくい部分があればご指摘ください。 よろしくお願いいたします。

  • 重回帰分析の結果の解釈について

    修士論文執筆(看護系大学院)のためSPSSで重回帰分析を行いましたが、結果の解釈につまずいています。 標準偏回帰係数にマイナスがついた場合、「負の影響」と解釈すると思うのですが、ダミー変数を用いた場合にはどにように解釈すればよいのでしょうか。 ちなみに、従属変数は対処行動尺度の5つある下位項目の中の一つ「私的支援追求」で、独立変数は続柄(1=親、0=配偶者)です。独立変数は続柄を含め7つあります。対象数は約100です。 標準偏回帰係数は-.256で、その他に有意だったのは家族機能の.449でした。 Rは.551、R2乗は.304、VIFは全て2以下で多重共線性はないと判断しましたが、t検定では尺度全体、下位項目とも親の方が対処行動は全て高くでていました。 この結果を私は配偶者である方が私的支援追求の得点が高い(できている)というように解釈しました。しかし、t検定の結果とは符号が異なります。 私の解釈が違うのか、解釈があっているとしたらt検定の結果と逆になっていることをどのように説明するのかここまでの情報でなにかご指摘いただけましたらお願いいたします。

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • 重回帰式の応用

    重回帰分析の結果と回帰式の使い方、応用の方法について質問です。相関係数0.85、決定係数0.72と出たのですが、全部で7つの説明変数のうち6つは有意ではありませんでした。多重共通性の問題に該当する説明変数を省き、再度分析したのですが結果として有意と判断されるのは1つの要因のみでした。そこで、その1つの要因に対して単純回帰分析を行うと相関係数0.72、決定係数0.51と重回帰分析よりも数値が低下してしまいました。この場合有意性の問題を無視し、はじめの重回帰式を用いて被説明変数を求めること(有意ではない説明変数を多く使うことで、被説明変数の誤差を少なくすること)に何かしらの問題はありますでしょうか? 素人のため質問内容がわかりにくかったら申し訳ありません。よろしくお願いします。

  • 重回帰分析について

    重回帰分析についての質問です *学生本人、その父親・母親の身長および性別 身長  性別(X) 父の身長(X2) 母の身長(X3) 176 1     174      166 173 1     169      160  ・  ・      ・        ・  ・  ・      ・        ・  ・  ・      ・        ・ というデータがあるとします。説明関数xが性別のダミー変数で男なら1女なら0の値をとる。変回帰分析係数β^1の値からどの様なことが読み取れますか?

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。