エクセル2010での回帰分析のおかしな結果についての対策とは?

このQ&Aのポイント
  • エクセル2010での回帰分析における結果がおかしくなり、一部変数の係数・標準誤差・t・P-値が正しく表示されない現象が発生しています。同様の問題は、変数の数が多い場合にも生じます。原因と対策について解説します。
  • エクセル2010での回帰分析において、変数の係数・標準誤差・t・P-値が正しく表示されない問題が生じることがあります。特に、変数の数が多い場合にこの現象が発生しやすくなります。原因と対策について説明します。
  • エクセル2010での回帰分析において、変数の係数・標準誤差・t・P-値が正しく表示されない問題が発生しています。変数の数が多い場合に特に注意が必要です。原因と対策について詳しく説明します。
回答を見る
  • ベストアンサー

【エクセル2010での回帰分析】

現在エクセルでの回帰分析に取り組んでいるのですが、おかしな結果になってしまいます。 原因がわかる方いらっしゃいましたら、ご教授いただけないでしょうか。 回帰分析は説明変数2つ、ダミー変数5つ、観測数466で行っています。 添付画像のように、 概要のうち、一つの変数の係数・標準誤差が0、tが65535、P-値が#NUM!になってしまい、 その一つ下の行の変数が、P-値が同様に#NUM!になってしまいます。 また、説明変数とダミー変数の種類・数を変えて回帰分析を行うと、変数の数が多いときに、この現象(変数のうち一つが係数・標準誤差・t・P-値がおかしな値になり、その下の行の変数のP-値が#NUM!になる)が生じます。 このような場合 どういった原因が考えられ、対策としてはなにが必要でしょうか? よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • keithin
  • ベストアンサー率66% (5278/7940)
回答No.1

一例としては、ダミー3に一定数が並んでいるような状況で、そういう結果が出ます。 実際には、ダミー3が他のダミー系列の1つと完全な線形関係にある(たとえば2倍とか+10とか)場合に、そういう結果になります(共線性)。 最初の例はゼロ倍+定数だったと状況です。

wgoldopnity
質問者

お礼

keithinさん ご回答ありがとうございます。 ご指摘の通り、共線性が問題のようでした。 「全てのデータがダミー変数のいずれかに属する」ということをすっかり忘れて回帰分析を行っていました。 ダミー変数を一つ減らせば問題なく回帰分析を行うことができました。 回帰分析は初心者なもので、keithinさんのご回答は本当に助かりました。 ありがとうございました。

関連するQ&A

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • エクセルの回帰分析について

     エクセルで回帰分析をおこなったのですが、有意な結果がでませんでした。説明変数がすべてダミー変数であるからでしょうか?ダミー変数のみで回帰分析を行うことは可能ですか?

  • エクセル回帰分析について

    エクセルでダミー変数を含む重回帰分析をした結果, 数値は出力されましたが 重相関 R 重決定 R2 補正 R2 標準誤差 観測数 といった文字が出力されません. 一般的なテキストを使って例題を分析した際は 文字は出力されます. これは私の分析方法に問題があるのでしょうか 宜しくお願いします

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • 重回帰分析について

    重回帰分析についての質問です *学生本人、その父親・母親の身長および性別 身長  性別(X) 父の身長(X2) 母の身長(X3) 176 1     174      166 173 1     169      160  ・  ・      ・        ・  ・  ・      ・        ・  ・  ・      ・        ・ というデータがあるとします。説明関数xが性別のダミー変数で男なら1女なら0の値をとる。変回帰分析係数β^1の値からどの様なことが読み取れますか?

  • 回帰分析

    回帰分析 回帰分析結果が、偏回帰係数-0.176 T値-3.009 P値0.00287 とでたのですが、これをどうやったら答えが導けるのでしょうか? よろしく御願いします。

  • 回帰分析 エクセル

    アンケートを作成し、その結果をエクセルツールにある「回帰分析」を用いて解析を行った結果、以下のような結果が得られました。 重相関 R  0.431510471 重決定 R2  0.186201286 補正 R2  0.176356947 標準誤差  3.572812597 観測数  1005 有意 F  2.49462E-37 この結果として言えることは、 「回帰式に取り入れられた説明変数の変動によって、目的変数の変動の17.6%(補正Rの値)が説明できる。」 また有意Fの値の解釈としては、 「このアンケート結果は99%有意なので、統計的に信頼できる結果である。」 ということでいいんでしょうか? 文献を読んで説明を理解したいのですが、日ごろの勉強不足が祟ってまったく理解が出来ず苦戦しています。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

専門家に質問してみよう