• ベストアンサー
  • 困ってます

重回帰分析について

重回帰分析で、増減(ステップワイズ)法を選んだ際の結果として、変数A-Fのうち、変数A-Dがモデルに含まれました。その中でABが偏回帰係数が有意でした。CDについては有意でありません。なぜ、CDはモデルに含まれるのですか?これを抜いたらモデルの適合度(決定係数)が下がるからでしょうか。有意でないなら最初から含まなければいいのに、と思います。

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数343
  • ありがとう数0

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1
  • Oubli
  • ベストアンサー率31% (744/2382)

偏回帰分析をどうやったのかがわかりませんが、有意でなければその変数の変化は他の変数の変化で説明できるということですから、はじめから重回帰分析から除いた方がよいのでは。重回帰分析は多量のデータが必要な解析で、1変数につき最低10ポイント以上必要といわれていると思います。膨大なデータがある場合は別ですが、少数ならまず解析する変数を絞った方がよいように思います。

共感・感謝の気持ちを伝えよう!

質問者からの補足

解析ソフトを使って分析しています。ステップワイズ法なので、既述の通り除かれた変数もあります。それでモデルに残ったのに有意ではなかったときの解釈についてお聞きしています。 また、1変数につき10ポイント以上、ということはA~F変数があったらN=60のサンプルが必要ということですか?多いほうがいいのでしょうけど、それ以下の場合でやるのはダメなのでしょうか?

関連するQ&A

  • 重回帰分析について

    お世話になります。 階層的重回帰分析において、決定係数が0.253→0.431→0.468とあがっていきます。 そこで、最後の0.468という決定係数は、まだ説明できる要因が他にもあるということでしょうか?段階的に説明力の向上はあると言えると思いますが、他にも「関係があると否定できない」項目があることについて言及する必要はありますか? 全ての決定係数はp<0.001となっています。 どなたか詳しい方、お願いします。

  • 重回帰分析における効果量と決定係数は違いますか?

    重回帰分析について質問があります。 重回帰分析において効果量と決定係数は違うものでしょうか? というのは、表記の仕方はどちらもR2なのですが、効果量に関するCohenの基準をみると、0.3くらいで中程度の効果量があると説明されており、決定係数の説明を見ると、重回帰式の当てはまりを示すもので一概には言えないが0.6-0.7くらいあるといい(6,7割説明できることになる)と書いてあり、同じ表記なのに、解釈が別々になっていてよくわかりません。 効果量と決定係数の意味の違いを理解していなくて恐縮ですが、このあたりの考え方の違いを含めて教えていただけるとありがたいです。

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

その他の回答 (1)

  • 回答No.2
  • Oubli
  • ベストアンサー率31% (744/2382)

#1です。 1変数につき10データという根拠は私には解りませんが一般に言われていると思います。それと変数は正規分布に近いことが必要で、場合によっては対数変換とかする必要があります。 また、重回帰分析では「多重共線性」、いわゆるマルチコがつきまといますので、相関の強い変数はあらかじめ絞った方がよいです。その意味でも偏相関係数をあらかじめしらべるのがよいのではないでしょうか。

共感・感謝の気持ちを伝えよう!

質問者からの補足

ご返信ありがとうございます。正規分布の仮定やマルチコなどは心得ており、マルチコの指標であるVIFでは一応問題ありませんでした。 偏相関係数をあらかじめ調べるというのがどういう意味かわからないのですが、多くのソフトで偏回帰係数は算出されると思います。あらかじめ相関分析をかけ、高いもののみをモデルに組み込むということですか?なんか違うような気がするのですが、そのようなやり方をしている論文等ご存知でしたらお教えください。

関連するQ&A

  • 重回帰分析について(至急)

    重回帰分析(SPSS)について質問です。 従属変数(a)と独立変数(b)を入れ、ステップワイズ法でR2の決定係数を算出した結果、 p値は有意な結果が得られつつも、R2値が.10~.29と低い値が出てしまいました。 この際、その関係性は10%~29%ほどしか説明出来ないと解釈出来ますが、 このまま考察に記述しても良いのでしょうか。 はたまた調整をするために、なにか作業を行った方が良いのでしょうか。 使用しているソフトはSPSSです。 ご教授お願い致します。

  • 重回帰分析に適したソフト

    重回帰分析によって、10種類ほどあるデータ(説明変数)から回帰式を作ろうと思います。 まずデータ数も10程度しかないので単回帰係数や、物理的な意味合いからデータの 候補を絞り、そののち説明変数を数学的に選ぼうと思います。自分は、本を少し読んで ステップワイズ法や偏回帰係数など勉強しはじめました。 そこで、上司に「市販ソフトを使って解析をすればよい」というアドバイスをもらったのですが、 何かお勧めのソフトはありませんか。数千円くらいがベストですが、2,3万となると少し抵抗があります。 SPSSなど有名なソフトは高そうなので、本屋に売っている、「本+おまけCD」のようなものを探しています。 できれば、なぜそういう結果が出るのか(ステップワイズ法なら、例題に対してステップごとの 数学的な説明がついている)わかるものがよいのですが。 贅沢な話だとは思いますが、アドバイスよろしくお願いします。

  • エクセルでの重回帰分析

    エクセルで重回帰分析を行なっています。 目的変数1種類、説明変数が1種類ないし2種類で、分析を行なっているのですが、 自由度調整済み決定係数が負の値となっています。 (ちなみに、Rが0.123。R^2が0.015.nが56です。定数項は0ではありません) 「自由度調整済み決定係数が負」が示す意味は何なのでしょうか? 統計についての知識が乏しく、初歩的な質問で申し訳ないのですが、 よろしくお願いいたします。

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。

  • 重回帰分析について

    現在海外の大学で、今学期社会調査のコースをとっています。 先日、重回帰分析を学んだのですが、頭がついていかず、まったくわかりませんでした。どなたか、わかりやすく説明していただけないでしょうか? 日本語のサイトをさらってみたのですが、まだよくわかりません。 重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。 例にだされた、モデルが以下のようなものとなっています。 二酸化炭素の排出量に関するもでるです。               モデル1  モデル2  モデル3 定数            -0,019 -0,244 -0.790 電気消費   2.315*** 2.296*** 2.293*** 都市よりかどうか        0.004 0.007 人口の伸び 0.349 R-squared 0.908 0.910 0.911 *Siginificant at p< .05 **Siginificant at p< .01 ***Siginificant at p< .001 この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。 相関度が強いのは、モデル1、2、3いずれも電気消費となっているのだと思います。 R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。また、モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか? 英語を翻訳して記しているので、多少ニュアンスの間違い等あると思います。また、グラフがずれて表示されよみにくくなっているかもしれません。すみません。 よろしくお願いします。

  • 回帰分析

    回帰分析をやってベータ値や決定係数などはわかったのですが、t値がわかりません。t値から何が分かったり、できたりするのですか?

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰式の応用

    重回帰分析の結果と回帰式の使い方、応用の方法について質問です。相関係数0.85、決定係数0.72と出たのですが、全部で7つの説明変数のうち6つは有意ではありませんでした。多重共通性の問題に該当する説明変数を省き、再度分析したのですが結果として有意と判断されるのは1つの要因のみでした。そこで、その1つの要因に対して単純回帰分析を行うと相関係数0.72、決定係数0.51と重回帰分析よりも数値が低下してしまいました。この場合有意性の問題を無視し、はじめの重回帰式を用いて被説明変数を求めること(有意ではない説明変数を多く使うことで、被説明変数の誤差を少なくすること)に何かしらの問題はありますでしょうか? 素人のため質問内容がわかりにくかったら申し訳ありません。よろしくお願いします。

  • 相関分析や回帰分析について

    相関分析や回帰分析についての記述が正しいのかわかりません。 間違っていたらどこが違うのか理由も教えていただけると幸いです! (1)ある特性、例えば、身長についてゴールドンのいう第二世代(子)の平均への回帰が観測される(b<1)のとき説明変数と被説明変数を逆にした回帰計算をしてもいわば、おやの平均への回帰が観測される可能性はない。(親と子の身長には、正の相関があると考えてよい) (2)第二世代(子)が平均へと回帰するのならば、将来は、個人のもつ身長その他、さまざまな諸特性がすべて一様な社会になってしまう。(ある経済学者はそう考えた) (3)重回帰の場合、通常の決定係数を使用すると、説明変数の増加のよるあてはまりのよさの改善を誇張してしまうので、修正済み決定係数(自由度調整済み決定係数)を使用するのが普通である。もいろん、単純回帰については、決定係数と修正済み決定係数は同じものになる。 (4)決定係数は、マイナスになることはないが、修正済み係数はマイナスになりうる。 (5)回帰分析を因果関係と結びつける(説明変数を原因、被説明変数を結果と見る)ことは、記述統計の範囲を逸脱している。 よろしくお願いいたします!!!

  • 単回帰分析でも決定係数を導くのでしょうか?

    単回帰分析でも決定係数を導くのでしょうか?

専門家に質問してみよう