• 締切済み

回帰分析に使うデータの加工

経済現象をデータを用いて分析するという課題が出されました。 そこで、私は家計消費状況調査(以下、家計)、景気ウォッチャー調査(以下、景気)の2つのデータを使って、景気がいい時は何に対する消費行動が高まるのかを調べようと思い、特に自動車や旅行への支出に着目して、R commanderを使って回帰分析することにしました。 ですが、2つのデータを分析できるようにcsvファイルに加工するところで、どのようにしたらいいのか分からなくなってしまったので質問させていただきます。 まず、地域区分が10前後に分かれているのですが、家計は九州と沖縄が一緒、景気は別々になっています。この場合そのまま景気は九州(または沖縄)のだけど家計は「九州・沖縄」のを使って分析してしまうのか、景気を九州と沖縄を足して2で割って「九州・沖縄」にして家計に合わせるのかどちらがいいのでしょうか。 そして、四半期毎に’02~’11年までの40の期間を使いたいが、景気の方は毎月の結果しかないため、3か月分のDIを足して3で割り四半期ずつの値に直してしまっていいのか。 構成は、行を40の期間、列を地域ごとの景気と自動車・旅行に対する支出でいいのか。(行が地域で列が期間ごとの景気と支出?) それから、支出は単位が円なのですが、このままでも回帰分析はできるのでしょうか。もしできるなら、説明変数が支出になるので読み取れる意味としては「自動車(旅行)への支出が1円上がると景気が○上がる」のような感じでしょうか。 説明が下手で分かりづらくすみません。 お答えいただけたら助かります。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>景気がいい時は何に対する消費行動が高まるのかを調べようと思い、 景気の良否が、目的変数(従属変数)になりますが、それが不明確。 >構成は、行を40の期間、列を地域ごとの景気と自動車・旅行に対する支出でいいのか。(行が地域で列が期間ごとの景気と支出?) 単回帰分析では、一列に説明変数、もう一列に従属変数、の2列です。 >それから、支出は単位が円なのですが、このままでも回帰分析はできるのでしょうか。 単位に条件はありません。 >「自動車(旅行)への支出が1円上がると景気が○上がる」のような感じでしょうか。 この式ので、景気の判断ができるとは想えないので、・・・。

関連するQ&A

  • 回帰分析について

    回帰分析について 家計調査2009年の 「年間収入五分位階級・世帯人員別1世帯当たり年平均1か月間の収入と支出」 のExcel表から世帯人員・消費支出・食料支出・教育支出の四項目を抜き出し 食料支出・食料支出・教育支出を一人当たりのデータに直したあと これらを対数変換し、消費支出を独立変数とし回帰分析を行なって回帰式をだそうとしているのですが Excelのデータ分析ツールを使用して回帰式をだしたあとに確認のために計算したところ誤差がでてしまいました。 この誤差は回帰式上仕方のないものなのでしょうか 分かりにくいかもしれませんがよろしくお願いします ↓計算してでた回帰式です。 食料支出=6693.0903+0.14791147*消費支出 教育支出=-5942.3124+0.12495474*消費支出

  • 回帰分析の仕方

    今課題で統計の勉強をしているのですが、景気と選挙結果について回帰分析しようと思っています。 景気に関するデータは物価や失業率など日々更新されているものなのでデータはいっぱいあるのですが、選挙は決められた回数しか行われていないので選挙結果についてのデータの数が少なくて、どのようにやればいいのかわからいません。 つまり、景気に関するデータは月毎に更新されているけど、選挙は数年に一度しか行われていないということです。 二つのデータ数に差がある時の回帰分析の仕方についてわかる方いましたらよろしくお願いします。

  • 単回帰分析(?)について教えてください

    現在、大学院入試の出願のため研究計画を考えているのですが、研究の中でどのような統計的手法を使用したらいいのかがわからず、質問させていただきました。 以下に分析したい内容を書きますが、内容はちょっと置き換えてあるので意味不明な研究になっていますが、ご容赦ください。 Aという人は、食事には主に箸を使います。。 そのAに恋人ができたのですが、その恋人は食事には主にナイフとフォークを使います。 その恋人と長く付き合ううちに、Aはだんだんナイフとフォークを使うことが多くなりました。 このA、Bそれぞれが食事でナイフとフォークを使った回数を数えたデータがある場合(付き合う前~付き合って一年後まで)、このAのナイフとフォークを使用する割合が増加したことは、Bの影響によるものだということは、どのように示せばいいのでしょうか? 一応、予備調査としてデータは持っていますが、大学院に入ったら改めてデータの収集をします。 ただ予備調査の結果として研究計画に載せたいので、実際に分析を行ってみたいと思っています。 統計を学んだことがなく、基礎知識が全くないのですが、一応調べたところでは、単回帰分析というものなのかな?と思いました。 でも、単回帰分析の例をみると、「最高気温とアイス屋の客足」など、二つの変数(?)を比べているのですが、 私の見たいのは、Bと付き合う前のA→付き合って1年後のAへの変化に、Bが影響しているかどうかなので、3つの数字を比べることになると思うので、実際に何と何とで分析をしたらいいのかがわかりませんでした。 もし単回帰分析であっているのであれば、実際にどのような表を作り、何をXにし、何をYに指定して分析を行えばよいのか、 もし単回帰分析ではできないのであれば、どのような分析をすればよいのか教えてください。 思いっきり私事ですが、年明けに出願しなければならず、焦っています。 どうかよろしくお願いいたします!

  • 重回帰分析について。

    重回帰分析について。 私は今卒論で中小企業の動向について調べています。 現段階では、業界別に売上高から全企業の売上高の成長率への寄与度を出したり、業界別の成長率、企業数の増減などを調べました。 データは中小企業庁の中小企業実態調査を使っています。 このデータを使って、重回帰分析をしたいのですが、初心者なので、どのデータを組み合わせていいのかわかりません。 参考までに、アドバイスお願いします。

  • 重回帰分析について

    現在海外の大学で、今学期社会調査のコースをとっています。 先日、重回帰分析を学んだのですが、頭がついていかず、まったくわかりませんでした。どなたか、わかりやすく説明していただけないでしょうか? 日本語のサイトをさらってみたのですが、まだよくわかりません。 重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。 例にだされた、モデルが以下のようなものとなっています。 二酸化炭素の排出量に関するもでるです。               モデル1  モデル2  モデル3 定数            -0,019 -0,244 -0.790 電気消費   2.315*** 2.296*** 2.293*** 都市よりかどうか        0.004 0.007 人口の伸び 0.349 R-squared 0.908 0.910 0.911 *Siginificant at p< .05 **Siginificant at p< .01 ***Siginificant at p< .001 この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。 相関度が強いのは、モデル1、2、3いずれも電気消費となっているのだと思います。 R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。また、モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか? 英語を翻訳して記しているので、多少ニュアンスの間違い等あると思います。また、グラフがずれて表示されよみにくくなっているかもしれません。すみません。 よろしくお願いします。

  • 回帰分析は日常生活でどのような時に活用できますか?

    因果関係 Aが増えることでBも増えるのようなAが原因で Bに影響するのような関係 相関関係 Aが増えることでBが増えというような因果関係にみえるが Aが増えたからBが増えたというわけではない 因果関係があるように見える関係 について原因と結果の経済学という本を読んで勉強しました。 (*´ω`*) 因果関係の証明には反事実、例えば ◯大学に進学しなかった!! (IF)有名大学に進学した IFの反事実を検証できればいいわけですが、自分の人生においては 人生は一度切りなのでタイムマシーンでもつくらなければ 反事実は試せないわけです。 そこで反事実をもっともらしい値で穴埋めする必要があります この場合、自分と状況がにている人 同じような年齢、同じような偏差値、同じような趣味嗜好 同じような家族環境、同じような居住地域、同じような経済力 etc の有名大学に行った人の状況を比較検討することで調べることができます。 このように、 因果関係を分析するには 信頼度が高い分、試験を行い確認するのが難い順に メタアナリシス ↓ ランダム化比較試験 ↓ 自然実験と疑似試験 ↓ 回帰分析 ということで、すでに手元に統計データーなどデータがある場合 それをもとに回帰分析で因果関係を割り出すことがあると 思いますが、 回帰分析を的確に使った場合であれば有効でしょうが、 間違った算式をたてるとめちゃめちゃな結果がでると 思うのですが、 素人でも回帰分析を有効に因果関係を求められる 分野というとどのような状況がありますか? 試験とかで数学的に問題として設問されているものを 答えるという以外で実学的な日常生活で活用できる 場面を教えてくださいよろしくお願いします。 =================================== 回帰分析 で何がわかる? 回帰分析とは、 「何かを行うこと(説明変数)が何かの結果(被説明変数)に どのような影響を及ぼしたか」という因果関係を関数の形で 明らかにする分析手法です。 説明変数が1つの単回帰分析に対して2つ以上のものを 重回帰分析と呼び、単回帰に比べてバイアスを 減少させることができる分析手法です。

  • 消費関数 統計分析 回帰分析

    C(t)=(1+δ)C(t-1)+θ{A(t)-(1+δ)[A(t-1)+w(t-1)]}+β[D(t)-(1+δ)D(t-1)]+μ[Y(t)-(1+δ)Y(t-1)] この消費関数に、C:消費支出、A:全資産、D:公債、Y:可処分所得のデータを代入し、 δ、θ、β、μ、の値を出し、有意か有意でないかの分析を行いたいです。 これはエクセルでできますか? それとも、プログラミングですか? 分かる方、教えてください。お願い致します。

  • クロス集計の数量データによる相関などの分析

    公表されている調査結果報告書から相関分析等をすることによって、構造を把握したい。 例えば、x、y、zについて満足、普通、不満足という回答を得て、それぞれに3点、2点、1点を配点して、 それを地区別に集計して平均した数値と、被説明変数についても地区別に集計して平均した数値が、表1として 公表されていた場合。 (もちろん個別のサンプルについての生データを得ることが難しいので、このような公表データで分析をして、 その構造を把握するとともに、今後の改善に役立てたいと思っています。) x、y、z間の単相関係数の状況 被説明変数とx、y、zの相関の状況 および重回帰分析 を試みたいと思っています。 この場合の、相関分析、重回帰分析などの統計分析を行う場合の問題点、課題、解決方法、留意点などについて、教えてください。 また、このようなことについて、いい本があれば教えてください。 調査結果報告書 表1 *************************************************************** * 項目 * 被説明変数 * x満足度 * y満足度 * z満足度 * 調査者数 * *************************************************************** *A地区*  15    *  3.5  * 2.1 * 1.3 * 60 * *************************************************************** *B地区*  13   *  2.5  * 2.9 * 3.3 * 30 * *************************************************************** *C地区*   8   *  1.5  * 2.0 * 2.3 * 10 * *************************************************************** データに基づく現状分析と改善方策の策定を目指す、文系の統計初心者(経営コンサルタント)より

  • 単回帰と季節指数、それぞれの練習になる数字を探してます

    大学の授業の復習で、単回帰や季節指数の算出練習にちょうどいい数字を探しているのですが、どうも上手く見つかりません。単回帰では、明らかに鰻登りで、しかも相関係数が1に近いもの、季節指数では、季節ごとに同じような傾向が見られる数字(傘の売り上げとか)が欲しいです。単回帰は、この不景気に鰻登り(しかも10年単位で)の数字は全く思い浮かびません。授業中にGDPや消費者物価指数関連のものを使ってしまいましたから、他のものが欲しいです。季節指数は、テーマはわかっていても、どうも長期のデータが手に入りません。宜しければ、数字のおいてある場所をお教え願えませんでしょうか? よろしくお願いいたします。

  • 重回帰分析で偏回帰係数を全て正の値にする方法はありますか?

    はじめまして。 現在、複数のエリアのエネルギー消費量と、そのエリアに内包される施設の面積との関係を調査しています。 例として ・エリアA:消費量100MJ 商業施設 a m2、病院 b m2、飲食店舗 c m2、事務所 d m2 ・エリアB:消費量360MJ 商業施設 e m2、病院 f m2、飲食店舗 g m2、事務所 h m2 ・エリアC:消費量600MJ 商業施設 i m2、病院 j m2、飲食店舗 k m2 ・エリアD:消費量492MJ 商業施設 l m2、病院 m m2、飲食店舗 n m2、事務所 o m2 のようなものになります。 そのうえで、施設の用途別に単位面積あたりのエネルギー消費量を重回帰分析によって予測する事を考えたのですが、偏回帰係数が負の値を取ってしまうものが多く出てしまい、困っています。 それぞれの独立変数の係数を全て正の値にする方法はないでしょうか? 使用しているソフトは EXCEL SPSS11.5J for windows です。 稚拙な内容で申し訳ありませんが、よろしくお願いします。