• 締切済み

重回帰分析で偏回帰係数を全て正の値にする方法はありますか?

はじめまして。 現在、複数のエリアのエネルギー消費量と、そのエリアに内包される施設の面積との関係を調査しています。 例として ・エリアA:消費量100MJ 商業施設 a m2、病院 b m2、飲食店舗 c m2、事務所 d m2 ・エリアB:消費量360MJ 商業施設 e m2、病院 f m2、飲食店舗 g m2、事務所 h m2 ・エリアC:消費量600MJ 商業施設 i m2、病院 j m2、飲食店舗 k m2 ・エリアD:消費量492MJ 商業施設 l m2、病院 m m2、飲食店舗 n m2、事務所 o m2 のようなものになります。 そのうえで、施設の用途別に単位面積あたりのエネルギー消費量を重回帰分析によって予測する事を考えたのですが、偏回帰係数が負の値を取ってしまうものが多く出てしまい、困っています。 それぞれの独立変数の係数を全て正の値にする方法はないでしょうか? 使用しているソフトは EXCEL SPSS11.5J for windows です。 稚拙な内容で申し訳ありませんが、よろしくお願いします。

みんなの回答

回答No.4

 念のため、多重共線性のチェックはしましたか? 共線性(VIF)の値が10を超えてはいないでしょうね。 時間がかかりますが、総当たり法でも変数選択は可能です。 ただし、スクリプトの実行が必要ですが。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

No2です。  重回帰分析の落とし穴は、No1の方が書いておられる様に、多重共線性の問題のようです。統計学のテキストなどには、この問題に触れていますが、悲しいことに解決法については、述べていません。述べていても、Xの項目として、適当なものを選べ、くらいです。しかし、どうすれば適当なものを選べるのか、については読んだことはありません。そこで行き詰ってしまいました。「適当」という言葉で分かった気分にはなれるのですが、実際には何にも出来ません。  私の場合は、重回帰分析は止めて、全て単回帰分析にし、その中で回帰係数の最も高いものを選んでいます。このばあい、バイアスが問題になりますが。  重回帰分析も、バイアスの問題です。バイアスのかかっているものを除去するしかありません。その除去には、実際の経験しかないと考えています。私の場合、医師が正なのに、看護師が負になるのはおかしいという判断は、経験から来ているからです。  ですから、単回帰分析をして、その最も強いものを残して、あとは変数を増やしたり減らしたりするのが現実な解決法では。  一人当たりエネルギー消費に関しては、世界の各国をみると、その国のGNPと強い相関があります。ちなみに、日本人は、アフリカの住民の1000倍程度消費しています。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>偏回帰係数が負の値を取ってしまうものが多く出てしまい、困っています。  ありません。回帰係数が負であれば、負の相関があるわけですから、正にすると事実を捻じ曲げることになります。  データーを全て統計ソフトにブチ込んで、パソコンで計算させると、正になるハズのものが負になってでてきます。  私の場合は、平均寿命の重回帰分析で、人口1000人当たりの医師の数は正の回帰係数に、看護師の数は負の回帰係数になった経験があります。看護師の数は減らした方が良い、という結論はありえないので、行き詰まりした。  同様の結果であれば、続きを書きますので、

kahase
質問者

補足

ご回答ありがとうございます。 私のほうでも、同じように 飲食店舗の係数が負になり、飲食店舗を増やせば増やしただけ そのエリアは発電してしまうというように結果づけられてしまい、 それはおかしいだろ、と思い、係数を正にする方法がないだろうかと考え、質問させていただきました。 是非続きをお聞かせ願えるでしょうか?よろしくお願いします。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

重回帰分析において,「これをすれば偏回帰係数の値をすべてプラスにできる」という方法はないと思います(私が知らないだけでホントはあるのかもしれませんが)。 まず,基本的なこととして消費量や施設の面積などといった単位の違うものは基準化(標準化)してから分析する必要があります。後は説明変数の選択を誤るとよろしくない結果が出る場合もあります(いわゆる多重共線性の問題)。 回帰分析は変数の選択が重要で,これを怠ると間違いなく無意味な数値が出てきます。

kahase
質問者

お礼

ご回答ありがとうございます。 説明変数は多くしすぎない事がコツだ、というような事が多変量解析のテキストにも書いてあったのですが、 全体の消費量を構成するものとして、いくらかの用途を省いてしまうのはちょっと目的にそぐわなくて困っていました。 やはり多すぎるとダメなんですね。。。

関連するQ&A

  • 重回帰分析について

    現在海外の大学で、今学期社会調査のコースをとっています。 先日、重回帰分析を学んだのですが、頭がついていかず、まったくわかりませんでした。どなたか、わかりやすく説明していただけないでしょうか? 日本語のサイトをさらってみたのですが、まだよくわかりません。 重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。 例にだされた、モデルが以下のようなものとなっています。 二酸化炭素の排出量に関するもでるです。               モデル1  モデル2  モデル3 定数            -0,019 -0,244 -0.790 電気消費   2.315*** 2.296*** 2.293*** 都市よりかどうか        0.004 0.007 人口の伸び 0.349 R-squared 0.908 0.910 0.911 *Siginificant at p< .05 **Siginificant at p< .01 ***Siginificant at p< .001 この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。 相関度が強いのは、モデル1、2、3いずれも電気消費となっているのだと思います。 R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。また、モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか? 英語を翻訳して記しているので、多少ニュアンスの間違い等あると思います。また、グラフがずれて表示されよみにくくなっているかもしれません。すみません。 よろしくお願いします。

  • 消費電力量のJ(ジュール)換算について教えて下さい。

    消費電力量のJ(ジュール)換算について教えて下さい。 既存の換算係数は1CAL=1/860W,1CAL=4.1868J、であり、そうすると1KWH=3.6MJとなりますが、財団法人省エネルギーセンター等の官公の換算係数は、1KWH=9.97MJとなっています。すみません、混乱しているのか、訳がわかりません、お教え下さい。 数学的には、1KWH=3.6MJが正解と思いますが、財団法人省エネルギーセンター等の官公の換算係数の、1KWH=9.97MJは一体なんなのでしょうか?官公庁の省エネ数値には必ずこの数値が使われているようです、別の意味(使い方)があるのでしょうか?

  • 重回帰分析の回帰係数について

    重回帰モデル:Y = X b + ε の回帰係数の導出について調べているのですが,本やサイトによって,次の2通りの表現があります。  b = (X'・X)^(-1)・X'・Y (I)  b = Cxx^(-1)・Cxy (II) ただし,'は転置,^(-1)は逆行列,・は積を表しています。また,CxxはXの分散共分散行列,CxyはXとYの共分散ベクトルです。 どうして(I)と(II)の表現はイコールになるのでしょうか?教えて頂ければ幸いです。

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

  • 用途地域における「店舗」「事務所」とは?

    用途地域における制限対象の建築物として「店舗」「事務所」とありますが、この「店舗」「事務所」というのは、単独の店舗・事務所に限られるのでしょうか。 それとも、マンション・アパートなどの一室に入っている店舗・事務所も含まれるのでしょうか。 含まれるとすると、それは「店舗・事務所兼用住宅」とは異なる概念(「居住施設」という分類ではなく「商業業務施設」という分類)と考えるのでしょうか。

  • 相関係数と重回帰分析

    心理学専攻の大学生です。 卒業論文作成のため、質問紙を製作し配り、集計しました。 検定はほとんど先生がSPSSを使ってやったので、どういう結果なのか聞いただけです。 検定結果をエクセルに貼り付けてもらったのですが、見方が分からず論文にすることができません。 ピアゾンの相関係数を求め、重回帰分析をしたのはわかるのですが、それからどう見ればいいのかわかりません。 諸事情により先生に直接聞くことができなくなったもので… もしよろしければこちらから結果をファイル送信しますのでどなたか分かる方がいらしたら教えてください。

  • 重回帰分析のパス係数

    重回帰分析においてパス係数はどのようにして導出されるんですか? よろしくお願いします。

  • ガスの統計資料について

    横浜市の統計ポータルサイトに、「ガス需要戸数及び消費量」という統計書があります。そこでは需要戸数・消費量が家庭用、商業用、公用、医療用、工業用と、用途別に記されていました。 しかし実際どうやって使っているのかについて、家庭用は「料理・給湯・冷暖房」などと想像がつくのですが、商業用、公用、医療用、工業用はいまいちイメージしきれません。 商業用はレストランなど飲食業界での消費や企業オフィスの給湯及び冷暖房、公用は公共施設の給湯及び冷暖房、医療用は各種医療ガスのほか施設内の給湯及び冷暖房、工業用は主に熱源…というイメージでいるのですが、不備がある点をご指摘いただきたいです。

  • 建築の用途変更について

    店舗付住宅の店舗部分(レコード販売)を飲食店に用途変更しようと考えています。延200m2で店舗部分の面積は90m2です。この場合用途変更に関わる部分が100m2以下なので確認申請は不要なのでしょうか?それとも10m2以上だと必要になってくるのでしょうか?大規模の模様替・修繕はありません。

  • 電力量の原油換算方法

    いつも参考にさせて頂いております。 早速ですが首記の件、電力量の原油換算方法なのですが、小生が2年ほど前に作成した資料には【1kWh(電力量)= 0.2356L(原油量)= 9.0MJ(エネルギー消費量)】となっており、換算方法の引用資料等の記載が無かったためネット等で調べたところ、合致する換算係数、式等に行き当たらず困っております。 どなたかご存知の方がおりましたらどうかご教示下さい。 また、小生が誤っている様であればご指摘いただけたら幸いです。 よろしくお願いいたします。