• ベストアンサー

回帰分析の目的変数と説明変数の組み合わせの例

経済統計学の夏休みの課題で統計局の時系列データを使い、回帰分析をするというのが出たんですが、目的変数と説明変数の組み合わせ方がわかりません。 使うデータは目的変数も説明変数も比率のものを使えということなのですが、どういう風にくみあわせたらいいのかわかりません。 何か良い例があれば、教えてください。 ちなみに目的変数は離婚率か完全失業率を使おうと思っています。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 離婚率を目的変数として、出生率を説明変数にすると、密接な相関が得られるでしょうが、説明は難しい。すなわち、出生率が低くなると、離婚率が上がるような負の相関になります。でも、この関係を説明するのが困難、すなわち、説明変数に成り得ない。「子はカスガイ」なので、子供がいないと離婚する、なんぞは無理でしょう。この関係は、おそらく擬相関。出生率は交絡因子でしょう。  というのも、出生率よりも、乳児死亡率を説明変数にした方が強い負の相関が得られる。そうすると、「乳児死亡率が低くなると、離婚しやすくなる」ということになるのですが。赤ちゃんが死なないと、ウルサイ、子育てが大変なので離婚に繋がると、反論もできないし。  出生率は、「少子化担当大臣」なんぞを置いているが、有効な手を打てていない。すなわち、専門家でも困っているので、こんなものを説明変数に使うのは、・・・。  離婚とか失業とかは、要因が一つではありません。単純であれば、離婚も完全失業も、問題は解決されています。政府が悩む必要も、社会問題になることもありません。離婚理由の第一は、性格の不一致だと記憶しています。これは数値化できないので、分析できません。  社会的な事象を目的変数に使うと、交絡因子(影響する因子)が多すぎて、専門家でも正解が難しいのです。こんなものを取り上げるのなら、いくらでも突っ込んであげますが。 >何か良い例があれば、教えてください。 これは、課題の回答を教えるのと同等なので、規約違反になります。  離婚率や失業を目的変数にすると、何故? を考える説明変数を自分で想定しなければなりません。これは繰り返しになりますが、社会問題となっているように解決できていない、すなわち、原因の説明が政府が有能なハズの学者・官僚を東京に集めて取り組んでも困難なのです。  むしろ、説明変数を考え、これによって影響されそうなもの(=目的変数)を想像する、の順番の方が、考えやすいのでは。  すなわち、比率という条件に、一人当たりのGNPが該当しますか。経済というのなら、GNPが経済の根本です。GNPを説明変数にすれば、それによって変動するものが説明変数。経済(説明変数)によって強く影響を受けるもの(目的変数)はいくらでもあるので、その関係を探る(相関分析と回帰分析をする)のが、課題のレベルなら考えやすいのでは。  ちなみに、GNPと無関係のものは少なく、一人当たりの殺人件数、結婚率、炭水化物摂取量、その国の人口くらいなものです。いくらでもあります。社会は、経済次第、ということです。経済学も、「社会にいかに影響しているか」を教えると、経済学に対する興味も湧くでしょうに・・・。  法学部の学生などには、「先進国と発展途上国で、どちらが犯罪が多いか」と問いかけています。これも、回帰分析で答えを示すことができますが、データを見つけられないと想います。 >やっぱりこれ重回帰分析というんですか!  なお、単回帰分析さえ、専門家でも誤った解釈が少なくありません。重回帰分析に手を出すのは、早いのでは。さらに、重回帰分析は、多重共線性の問題を常に念頭に置く必要があります。

katachanko
質問者

お礼

わかりました。。 とりあえず、自力でがんばります。

その他の回答 (1)

  • ecotomed
  • ベストアンサー率56% (34/60)
回答No.1

比率のものを使うということですが、実数のデータが手元にあるならば全国平均との比率(対数データ)を自分で用意するという手もあります。データをきちんと示せれば全く問題ないはずです。 離婚率なら「共働きの割合」「出生率(都道府県別ですよ)」などがいいt値を出してくれると思います。 完全失業率はちょっと骨のある題材ですね。。単独の説明変数ではほぼ不可能であるといっていいと思います。回帰分析ということですが、重回帰分析と捉えていいのでしょうか?ダミー変数の使用が認められているならば、それを考慮してみるといいかもしれません。

katachanko
質問者

お礼

ご回答ありがとうございます。やっぱりこれ重回帰分析というんですか!!!出生率は見つけたのですが、「共働きの割合」の式の出し方がわかりませんので他の説明変数にあたりたいと思います。(・´з`・)

関連するQ&A

  • 回帰分析の説明変数

    回帰分析を行っています。 説明変数を設定する際に、分析対象の財務諸表から得られるそのままの数値ではなく、増加率に加工して回帰分析しています。 なぜ、この加工を施したかということを説明しなくてはなりません。 どこかで、そのままの数値を使用しない方がいいとうことを書いてあるのを読んでそのような加工を施したのですがらどこで読んだかを忘れてしまいました。 合理的な説明をしなくてはならないため、とても困っています。どなたか助けていたただけないでしょうか。よろしくお願いいたします。

  • おしえて!重回帰分析の独立変数(説明変数)

    重回帰分析の目的変数が、(A+B+C+D)というものとします。 A~Dは、数量データです。 説明変数にAやBなどが入っていたら、それはダメですか? 説明変数X(Aとか)が目的変数Y(A+B+C+D)の一部の構成要素だったら、Xを使って重回帰分析はやったらダメなのですか?

  • 回帰分析の仕方

    今課題で統計の勉強をしているのですが、景気と選挙結果について回帰分析しようと思っています。 景気に関するデータは物価や失業率など日々更新されているものなのでデータはいっぱいあるのですが、選挙は決められた回数しか行われていないので選挙結果についてのデータの数が少なくて、どのようにやればいいのかわからいません。 つまり、景気に関するデータは月毎に更新されているけど、選挙は数年に一度しか行われていないということです。 二つのデータ数に差がある時の回帰分析の仕方についてわかる方いましたらよろしくお願いします。

  • 重回帰分析をして仮説検定を行いたいのですが

    自分が感心のある現象を被説明変数(Y)とし、それに影響を与えるいくつかの説明変数(X)を考えて時系列データを集め、重回帰分析を使って仮説検定を行う という課題なのですが どのような時系列データを用いて、何をYとしXとして分析すればよいのでしょうか。 また、時系列データを探っても企業の財務データでは過去10年ほどのものしかでてきません。 何についてのデータでもいいので過去20年ほどのデータで分析しなければならないのですが・・・。 どなたかご教授ください。おねがいします

  • Excelの回帰分析でわからないことがあります。

    統計学の初心者です。 Excel2007の分析ツールをつかって重回帰分析しようと試みています。 目的変数は1つで、説明変数は2つの回帰方程式を求めたいのですが、かなりデータの精度が低く、回帰方程式を求めると切片がマイナスになってしまいます。 このままでは、説明変数の数値がある一程の数値よりも低くなると、目的変数がマイナスになってしまいます。 ただ、私の分析では実際問題として目的変数も説明変数も全て、0以上しかあり得ません。 回帰方程式はあくまでも予測で、実際にはおこらないけれども、そのような数値がでる。ということは理解しているのですが、予測で求めた理論値を使って、次に行いたいことがありまして、どうしてもマイナスになることを避けたいのです。 この現象を防ぐために定数項を0にするを選択したところ、説明変数が0以上において、目的変数がマイナスにならない回帰方程式を求められたのですが、補正R2が、定数項を0にするを選択しない場合に比べ、大幅に数値が大きくなりました。 ネットで調べていると、定数項を0にする場合としない場合において、補正R2の算出方法が異なり、比べることはできないと書かれていました。 ご質問なのですが、それは比べては行けないだけで、この補正R2は使用しても良いのでしょう? レポートなどに補正R2=○○と書いても良いのでしょうか? 素人のため、何か的外れな質問をしているかもしれません、よろしくお願い致します。

  • 回帰分析の目的変数が0~1の確率の場合は?

    今、集団の中のある割合(具体的には、ある集団の中の外国人の割合)を目的変数にして回帰分析を行っています。 目的変数は0から1の連続変数を取るのですが(割合なので)、この場合用いる回帰分析はロジスティック回帰でよいのでしょうか? 自分が勉強した範囲では、ロジスティック回帰の目的変数は、0 or 1の2項変数を取るので、違うのかなという気がするのですが・・・(でも代わりに何を使ったら良いのかわかりません)。 勉強不足で申し訳ないのですが、どなたかご教授頂けますでしょうか。 宜しくお願いします。

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • 重回帰分析での説明変数

    重回帰分析で説明変数が、例えば5因子あったとします。 通常は、重回帰分析した後に、有意な因子(目的変数に対して効果のある因子)を例えばF>2等の基準でもって、抽出すると思いますが、 これら説明変数のがMKSA(mg、um、sec等)の次元が異なる場合、同じ基準で有意な因子が抽出できるのでしょうか?  例えば、同じ次元であっても、cmとmmの因子を混在させては、平方和計算から異なってくるので、同じ基準で有意な因子は抽出できないですよね? もし、出来るのであれば、証明するにはどうしたらよいですか?  よろしくお願いします。

  • 相関分析や回帰分析について

    相関分析や回帰分析についての記述が正しいのかわかりません。 間違っていたらどこが違うのか理由も教えていただけると幸いです! (1)ある特性、例えば、身長についてゴールドンのいう第二世代(子)の平均への回帰が観測される(b<1)のとき説明変数と被説明変数を逆にした回帰計算をしてもいわば、おやの平均への回帰が観測される可能性はない。(親と子の身長には、正の相関があると考えてよい) (2)第二世代(子)が平均へと回帰するのならば、将来は、個人のもつ身長その他、さまざまな諸特性がすべて一様な社会になってしまう。(ある経済学者はそう考えた) (3)重回帰の場合、通常の決定係数を使用すると、説明変数の増加のよるあてはまりのよさの改善を誇張してしまうので、修正済み決定係数(自由度調整済み決定係数)を使用するのが普通である。もいろん、単純回帰については、決定係数と修正済み決定係数は同じものになる。 (4)決定係数は、マイナスになることはないが、修正済み係数はマイナスになりうる。 (5)回帰分析を因果関係と結びつける(説明変数を原因、被説明変数を結果と見る)ことは、記述統計の範囲を逸脱している。 よろしくお願いいたします!!!

  • 回帰分析

    レポートで回帰分析をするんですが、自分で何を回帰分析するか考えないといけないんです... 今考えているのは 死亡者数と経済要因(失業者数) なんですが、あと1つは何にしたらいいでしょうか? また、これで回帰分析っておかしくはないでしょうか? よろしくお願いします!