• 締切済み

エクセル統計2012を使用した重回帰分析について

統計に関する質問をさせていただきます。 わかる方がいらっしゃいましたら、ご教授願います。 エクセル統計2012を使用して重回帰分析をしようとしたのですが、意図していた結果が出ず悩んでいます。 分析したい内容は以下の通りです。 1月から12月までの各月の「イベント入場者数」は、「その地域の観光客数」「気温」「降水量」が関係しているか?についてです。 エクセル統計2012にて、 目的変数:イベント入場者数 従属変数:その地域の観光客数、気温、降水量 それぞれ入力し、変数選択を「増減法」としたところ、重相関係数Rは「0.0000」、回帰式に含まれる変数は「定数項」のみという結果が出ました。 今回ご質問したいのは、 1、上記のようなRが0という結果がありえるのでしょうか? 2、また、増減法ではなく「全変数」を選択して再度分析したところ、こちらはRが0.78という結果が出ましたが、「全変数」で出すべきなのでしょうか? 3、変数選択はどのように見分ければよいのでしょうか? 以上の3点についてお願いいたします。 よろしくお願いいたします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 補足 ですが >「全変数で、0.78から明らか」の部分ですが、全変数を選択して良いということでしょうか? どの変数を選択するのかは、制約はありません。しかし、12のデータで、変数が12では話になりません。  重回帰分析は、パソコンでやれるので、数字はだせます。『とりあえずやってみて』というのは、間違いではありません。しかし、『切符があるので(=データがあるので)、どうすればいいのですか』と訊かれて、なんと答えますか。「目的があって、買われたのなら、明らかでしょう」としか返答しようがありません。今の状況は、私が切符を見せられ、「これはどこ行きの切符です。JRの指定席券なので、規則上は自由席には乗れませんが、車掌に言えばOKでしょう。」のアドバイスしか。  ただ、重回帰分析には厄介な問題を内在しています。それは、単回帰をすれば、明らかにできます。指定席券を持っていても、その列車が事故などで運行停止になったようなものです。厄介な問題というのは、ご質問内容から判断して、ご理解いただけない、というより私自身経験していますが、数学の能力不足で説明できません。  回答していて疑問に感じているのは、質問者が院生(にしてはお粗末)か学生だろうと。ならば、回答すること自体が、研究者の倫理に触れますので、以上は独り言。  院生、学生でないのなら、状況か目的を書いて下さい。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

 面白そうな話ですね。面白いというのは、データを見つけて、私が発表できるということです。まあ、こんなところでデータまでさらけだして質問する人もいるので、・・・  重回帰分析は、エクセルのアドインソフトがいると思っていました。早速、2012を買いますというのば、嘘です。  まず、毎月、ということですが、データ数は、12でしょうか。これは、説明変数が3つのようなので、少ないかも。といって、増やす方法も提案できませんが。  また、目的変数であるイベントというのは、イベントの内容は同じなのでしょうか。それが異なると、話になりません。 >変数選択を「増減法」としたところ、重相関係数Rは「0.0000」 増減法でR=0.00は、選択の誤りです。全変数で、0.78から明らかです。  無相関の場合は、R=0.00です。が、重回帰をやって、「0.00」では、「あんた馬鹿」と何かのアニメなら言われそう。  全変数を使用すれば、相関係数(正確には、その絶対値)が高くなるのは、当然です。その中から、有意なものを選択するのが、増減法の手法です。  重回帰分析では、変数の選択に重要な前提があります。その前提をクリアするのが、私には困難なので、しないことにしています。重回帰分析の前に、単回帰をやって、その前提をクリアしないと、突っ込まれて沈没かも・・・

raisurasu
質問者

補足

ご回答ありがとうございました。 補足と頂いた回答への質問をさせていただきます。 >まず、毎月、ということですが、データ数は、12でしょうか。 一年分のデータで分析したいので、データ数は12です。 これ以上のデータは持っていません。 >また、目的変数であるイベントというのは、イベントの内容は同じなのでしょうか。 もちろん同じ内容です。 >増減法でR=0.00は、選択の誤りです。全変数で、0.78から明らかです。 やはり変数選択を誤っていたのですね。参考になりました。 「全変数で、0.78から明らか」の部分ですが、全変数を選択して良いということでしょうか? 理解に乏しくて申し訳ありません。 >重回帰分析の前に、単回帰をやって、その前提をクリアしないと それぞれの説明変数との相関を出してから、ということでしょうか? 質問ばかりで申し訳ありませんが、よろしくお願いいたします。

関連するQ&A

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • 回帰分析 エクセル

    アンケートを作成し、その結果をエクセルツールにある「回帰分析」を用いて解析を行った結果、以下のような結果が得られました。 重相関 R  0.431510471 重決定 R2  0.186201286 補正 R2  0.176356947 標準誤差  3.572812597 観測数  1005 有意 F  2.49462E-37 この結果として言えることは、 「回帰式に取り入れられた説明変数の変動によって、目的変数の変動の17.6%(補正Rの値)が説明できる。」 また有意Fの値の解釈としては、 「このアンケート結果は99%有意なので、統計的に信頼できる結果である。」 ということでいいんでしょうか? 文献を読んで説明を理解したいのですが、日ごろの勉強不足が祟ってまったく理解が出来ず苦戦しています。

  • 重回帰分析

    今、研究で重回帰分析を行っているのですが、説明変数を絞りたいと考えています。 それで、増減法で説明変数を絞ったときに、赤池の情報量規準の値って出せるんですけど、そこから何が読み取れるのですか? よろしくお願いします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • エクセル回帰分析について

    エクセルでダミー変数を含む重回帰分析をした結果, 数値は出力されましたが 重相関 R 重決定 R2 補正 R2 標準誤差 観測数 といった文字が出力されません. 一般的なテキストを使って例題を分析した際は 文字は出力されます. これは私の分析方法に問題があるのでしょうか 宜しくお願いします

  • 重回帰分析について

    重回帰分析で、増減(ステップワイズ)法を選んだ際の結果として、変数A-Fのうち、変数A-Dがモデルに含まれました。その中でABが偏回帰係数が有意でした。CDについては有意でありません。なぜ、CDはモデルに含まれるのですか?これを抜いたらモデルの適合度(決定係数)が下がるからでしょうか。有意でないなら最初から含まなければいいのに、と思います。

  • Excelの回帰分析でわからないことがあります。

    統計学の初心者です。 Excel2007の分析ツールをつかって重回帰分析しようと試みています。 目的変数は1つで、説明変数は2つの回帰方程式を求めたいのですが、かなりデータの精度が低く、回帰方程式を求めると切片がマイナスになってしまいます。 このままでは、説明変数の数値がある一程の数値よりも低くなると、目的変数がマイナスになってしまいます。 ただ、私の分析では実際問題として目的変数も説明変数も全て、0以上しかあり得ません。 回帰方程式はあくまでも予測で、実際にはおこらないけれども、そのような数値がでる。ということは理解しているのですが、予測で求めた理論値を使って、次に行いたいことがありまして、どうしてもマイナスになることを避けたいのです。 この現象を防ぐために定数項を0にするを選択したところ、説明変数が0以上において、目的変数がマイナスにならない回帰方程式を求められたのですが、補正R2が、定数項を0にするを選択しない場合に比べ、大幅に数値が大きくなりました。 ネットで調べていると、定数項を0にする場合としない場合において、補正R2の算出方法が異なり、比べることはできないと書かれていました。 ご質問なのですが、それは比べては行けないだけで、この補正R2は使用しても良いのでしょう? レポートなどに補正R2=○○と書いても良いのでしょうか? 素人のため、何か的外れな質問をしているかもしれません、よろしくお願い致します。

  • エクセルでの重回帰分析

    エクセルで重回帰分析を行なっています。 目的変数1種類、説明変数が1種類ないし2種類で、分析を行なっているのですが、 自由度調整済み決定係数が負の値となっています。 (ちなみに、Rが0.123。R^2が0.015.nが56です。定数項は0ではありません) 「自由度調整済み決定係数が負」が示す意味は何なのでしょうか? 統計についての知識が乏しく、初歩的な質問で申し訳ないのですが、 よろしくお願いいたします。

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。