• ベストアンサー

重回帰式の応用

重回帰分析の結果と回帰式の使い方、応用の方法について質問です。相関係数0.85、決定係数0.72と出たのですが、全部で7つの説明変数のうち6つは有意ではありませんでした。多重共通性の問題に該当する説明変数を省き、再度分析したのですが結果として有意と判断されるのは1つの要因のみでした。そこで、その1つの要因に対して単純回帰分析を行うと相関係数0.72、決定係数0.51と重回帰分析よりも数値が低下してしまいました。この場合有意性の問題を無視し、はじめの重回帰式を用いて被説明変数を求めること(有意ではない説明変数を多く使うことで、被説明変数の誤差を少なくすること)に何かしらの問題はありますでしょうか? 素人のため質問内容がわかりにくかったら申し訳ありません。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.2

重回帰分析を行って相関係数が0.85だったというのはどういうことでしょう(重相関係数のことですか?)。ちなみに、変数を標準化(基準化)して回帰分析を行うと回帰係数は応答変数(従属変数、目的変数)との相関係数と一致します。そういうこともあるので、回帰分析においては「係数が**であった」という風に使い分けた方がよろしいかと思います。 > 結果として有意と判断されるのは1つの要因のみでした。 適切な方法(判断)によって変数が取り除かれたのであれば、その1つの変数のみが有意に応答変数の変動を説明しているということでしょう。それで決定係数が下がるということは、まだ応答変数の変動を説明できていない変数が他にあるだろうということです。 > この場合有意性の問題を無視し、はじめの重回帰式を用いて被説明変数を求めることに何かしらの問題はありますでしょうか? 適切でないモデルより得られた予測値は、やはり適切でないといえます。要は役に立たない変数をもとに予測したわけですから、その結果も無意味(役に立たない)ということです。 多重共線性が疑われる場合にNo.1さんがあげているPCA回帰を行うことは有効です。しかし、そもそも役に立たない変数が組み込まれているのであれば、何をやってもどのみち得られる結果は相違ないでしょう。 場合によっては係数に対するp値が0.10くらいならモデルに組み込んだ方が良いとすることも一手段です。

tatsuaka
質問者

お礼

>重回帰分析を行って相関係数が0.85だったというのはどういうことでしょう(重相関係数のことですか?) 申し訳ありません。重相関係数のことです。 >それで決定係数が下がるということは、まだ応答変数の変動を説明できていない変数が他にあるだろうということです。 なるほど!そういうことなのですね。 分かりやすいご回答非常に参考になりました。有難うございました。

その他の回答 (1)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

主成分分析(principal component analysis)を行うと良いのでは?すなわち、説明変数をむきだしで使うのではなくて、幾つかの説明変数の線形結合として作られる、互いに独立な複数の「因子」を(自動的に)算出して、それらの因子の線形結合でデータの分布を説明するのです。説明への寄与率が小さい因子は単に無視します。(因子たちが互いに独立だから、「ノイズ」と見なすことが出来る。)  ご質問の場合、説明に有意に寄与する因子の個数はごく僅かでしょう。でも、1個の因子の中にいろんな説明変数がブレンドされているので、高い相関係数が得られます。特に、一番寄与率が高い因子は、ご質問にある7個の説明変数を使った重回帰分析の結果である回帰式そのものになるでしょう。  この方法の欠点は、因子に名前が付けられないこと。すなわち、(1個の因子の中にいろんな説明変数がブレンドされているので)その因子が何を意味しているかを一言では言えないために、定性的な話に持って行きにくいことです。ことに、何からの因果関係に関する理論があって、その因果関係の傍証を得るために分析を行った(分析では相関関係しか分からないから、あくまで傍証です)という場合には、因子の持つ意味がよく分からないんじゃ「命題」の形にできなくて困ります。  しかしこの欠点は、ただ欠点であるばかりではない。主要な因子のひとつひとつに各説明変数がどんな重みで組み込まれているかをじっくり見ると、その因子の持つ意味がなんとなく見えてくる。これは現象の本質を洞察するための手掛かりになることがあります。また、単に測定の都合でたまたま選んだ説明変数なんぞよりも、もっと旨い測り方(別の説明変数の選び方)に思い至れるかもしれない。

tatsuaka
質問者

お礼

ご回答有難うございました。ご回答をもとに主成分分析についても理解を深めたいと思います。

関連するQ&A

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • 重回帰分析について

    重回帰分析で、増減(ステップワイズ)法を選んだ際の結果として、変数A-Fのうち、変数A-Dがモデルに含まれました。その中でABが偏回帰係数が有意でした。CDについては有意でありません。なぜ、CDはモデルに含まれるのですか?これを抜いたらモデルの適合度(決定係数)が下がるからでしょうか。有意でないなら最初から含まなければいいのに、と思います。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • 重回帰と偏相関の違い

    重回帰分析も偏相関分析もともに、複数の説明変数と1つの従属変数が登場人物となって、その関係を分析するものと認識しています。 が、大きな違いとして、重回帰は多重共線性を示す説明変数を同時投入した分析はできないのに対し、偏相関分析は寧ろそういう変数たちを同時に取り扱って分析することに使うと聞きました。 どういう理由で、両者にこのような違いがあるのか、ご教示頂けないでしょうか。

  • 回帰分析 エクセル

    アンケートを作成し、その結果をエクセルツールにある「回帰分析」を用いて解析を行った結果、以下のような結果が得られました。 重相関 R  0.431510471 重決定 R2  0.186201286 補正 R2  0.176356947 標準誤差  3.572812597 観測数  1005 有意 F  2.49462E-37 この結果として言えることは、 「回帰式に取り入れられた説明変数の変動によって、目的変数の変動の17.6%(補正Rの値)が説明できる。」 また有意Fの値の解釈としては、 「このアンケート結果は99%有意なので、統計的に信頼できる結果である。」 ということでいいんでしょうか? 文献を読んで説明を理解したいのですが、日ごろの勉強不足が祟ってまったく理解が出来ず苦戦しています。

  • 回帰分析で「有意な相関がある」という言葉はあり得るのか

     回帰分析(単回帰、重回帰)において、例えば単回帰では「2つの間には有意な正の相関関係が認められる」という日本語はあり得るのでしょうか。そもそも、回帰分析において相関関係の有意性を検定する検定方法というものが存在するのでしょうか。または、相関係数や決定係数で判断するしかない(例えばr2が0.8以上なら精度が高い)のでしょうか。  また、回帰式や回帰係数の有意性の検定といわれているものは母集団に対する検定ということですので、今回の質問の答えに当てはまらないと考えていますが、この考えは合っているのでしょうか。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • 相関分析と重回帰分析について

    研究の中である因子同士で相関分析を行いました。その結果有意な相関を得られた因子が複数見つかったため、それらの因子を用いて重回帰分析を行うことにしました。 この分析の流れを担当教員に伝えたところ、重回帰分析を行う際になぜ相関が得られなかった因子も含めなかったのかと問われ、上手く説明ができませんでした。というか先生の言ってることが理解できませんでした。なぜなら全く相関がないとわかっているものを重回帰分析の中に含めたところで結果は見えていると考えたためです。 まだ知識は浅いですが、先生の問いについて理解できる方がいれば教えていただきたいです。