• ベストアンサー

回帰分析について

どうか教えてください 回帰分析をする際のデータに、 成長率(%)を使っても良いのですか? 例えば GDP成長率(%)=労働力人口成長率(%)+民間投資額成長率(%) などといった感じです。 教科書を見ていると、 単位が%のデータで回帰分析をしている 箇所が見当たらないので疑問に思いました。 どうか教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • solla
  • ベストアンサー率59% (45/76)
回答No.3

比率データであっても、説明変数と目的変数の間に線形性を仮定できる範囲(レンジ)でなら可能です。もちろん誤差の独立性、等分散性といった回帰分析における前提を満たさなければならないのは通常の数値データを扱うときと一緒です。 ただし、ご質問の場合は時系列データですので説明変数に時間を入れておかないと、時間的変化による見かけ上の相関が生じてしまいます。そして重回帰分析において説明変数に時間を入れるということは目的変数が時間について線形、つまり単調に増加するか減少するか、とすることになります。その仮定が成り立つような時間的範囲なら線形回帰でも構わないと思いますが、一般には成長率のようなデータは周期性をもって変動するのではないかと思われますので、その場合には線形回帰は適切ではなく、時系列分析をする必要があります。AR モデル、ARMA モデル、ARIMA モデルといったものを調べてください。計量経済学のテキストなどに載っていると思います。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

その他の回答 (4)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

>GDP成長率(%)=労働力人口成長率(%)+民間投資額成長率(%) 仮説として、GDPの成長率は、GDP成長率(%)=労働力人口(労働人口?)成長率(%)+民間投資額成長率(%)で説明したい、ということなら、可能です。  方法としては、単回帰ではなく、重回帰分析でないと無理。すなわち、エクセルを単純には使えない(未確認:おそらくアドインソフトが必要)。  また、多重共線性のチェックが必要。すなわち、労働力人口成長率(%)と民間投資額成長率との間に、相関が無いことが前提になります。実際には、相関係数が0.4以下なら、OKと訊いたことはあります。 日本については成立しても、他の国にあてはまらい場合もあるので、結果の解釈には注意が必要です。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

noname#21649
noname#21649
回答No.4

>良いのですか? だめです。回帰分析では.基準となる点(通常X軸方向の値)の誤差を認めていませんから。また.基準となる点に対して与えられた点(通常Y軸方向の値)は平均値を持ち正規分布であることが必要です。 誤差が存在するような場合には「相関分析」を使います。 相関分析の場合には.それぞれの点を表すベクトル(二次元として,a(x,y)として).角軸方向の値(xとかyとか)がそれぞれ.正規分布となっていることが必要です。 %指標の場合に正規分布にならないために.相関分析が使えない場合があります。 実際には.これら条件を満たしていると仮定して計算し.残差がこの条件に適応しているかを調べて.適応しているならば使います。適応していなければ.計算自体が無意味ですから.分析が失敗したことになります。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

理論的に式が立つ事を見込めるのなら、十分、回帰分析できますよ。 ただし、質問者さんが例で書かれているのは単回帰ではなく y=ax_1+bx_2+c の式に回帰する重回帰分析だと思いますが。それだけに必要なデータ数も多いと思います。 >教科書を見ていると、 >単位が%のデータで回帰分析をしている >箇所が見当たらないので疑問に思いました。 一般に十分関係が見込める式として身長と体重のような分かりやすい例が無いので教科書に出てこないだけじゃないでしょうか。

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

  • sunasearch
  • ベストアンサー率35% (632/1788)
回答No.1

どうやって、%のデータで回帰分析を行うのですか? (x1,y1),(x2,y2),(x3,y3),...というたくさんのデータをもとに行うのが、回帰分析なので、 %にした時点で、たくさんのデータの平均(xの平均やyの平均)として、値が1つに要約されてしまっていますよね?

ottotto54
質問者

お礼

大変参考になりました。 どうもありがとうございました。

ottotto54
質問者

補足

全てのデータの平均を使うのではなくて、 前々年から前年への増加率の 時系列データを使います。 例えば経済成長率です。 経済成長率は%表示ですが、 毎年発表されますから。

関連するQ&A

  • 重回帰分析について。

    重回帰分析について。 私は今卒論で中小企業の動向について調べています。 現段階では、業界別に売上高から全企業の売上高の成長率への寄与度を出したり、業界別の成長率、企業数の増減などを調べました。 データは中小企業庁の中小企業実態調査を使っています。 このデータを使って、重回帰分析をしたいのですが、初心者なので、どのデータを組み合わせていいのかわかりません。 参考までに、アドバイスお願いします。

  • 回帰分析が分かりません。

    合計特殊出生率と一人あたりの所得の関係について埼玉県を市町村別に回帰分析を行い、その結果を都道府県を単位とした分析の結果と比較して考察する問題なのですが、教科書を見ながらExcelの散布図で一人あたりの所得を従属変数、合計特殊出生率を独立変数として回帰分析を行う所まではできたのですが、結果として何が分かってどのようなことが考察できるのかが分かりません。教えてください。 埼玉県がy=396671x+2E+06,Rの2乗=0.0379, 都道府県別がy=-1E+06x+5E+06,Rの2乗=0.1915となりました。 Excel操作が苦手で回帰分析が全く理解できていない状態です。

  • 単回帰分析について教えてください!!

    学校の試験問題で困っています・・・。 授業ぜんぜんいってなくてわかりません・・・。 こういう問題です。 国名 UNDP GDP 日本 100.000  4245191 米国 80.00  10171400 ... ... ... 他続きますけど、とりあえずこんな表があります。 そしてUNDP=Y GDP=Xとし、回帰分析の結果を示すグラフを作成しなさいという問題です。 【データの散布図】【回帰直線】【回帰式(t値と決定係数も含む】がグラフに集約されている。回帰式は数式エディタを使用すること。 以上です・・・。 助けてください! お願いします!

  • 説明変数に対数を使う理由は?

    計量経済の重回帰分析で、「n年度の一人当たりGDPの成長率」を被説明変数とし、説明変数として「n-1年度の一人当たりGDPの成長率の自然対数」+「(n-1年度の人口成長率+0.05)の対数」を置いている回帰式がありました。 これについて、質問なのですが、 (1) なぜ「自然対数」なのか、普通に「成長率」そのままではなぜだめなのでしょうか? (2) なぜ人口成長率に0.05を足しているのでしょうか?

  • 回帰分析

    現在回帰分析を用いて、レポートを書こうとしています。そこで扱う変数の一つに、インターネットの普及率を用いようと考えています。しかし、他の変数は月次データが取れたのですが、インターネット普及率だけは年次データしか見つかりません。このような場合、他の変数を年次にしてインターネットの普及率に合わすしか方法はないのでしょうか。できれば、月次のほうがサンプルも多くなるのでうれしいのですが。 どなたか、回答よろしくお願いします。

  • 回帰分析の仕方

    今課題で統計の勉強をしているのですが、景気と選挙結果について回帰分析しようと思っています。 景気に関するデータは物価や失業率など日々更新されているものなのでデータはいっぱいあるのですが、選挙は決められた回数しか行われていないので選挙結果についてのデータの数が少なくて、どのようにやればいいのかわからいません。 つまり、景気に関するデータは月毎に更新されているけど、選挙は数年に一度しか行われていないということです。 二つのデータ数に差がある時の回帰分析の仕方についてわかる方いましたらよろしくお願いします。

  • 生産関数のモデル推計について

    Y=A・K^α・L^β  (α+β=1) ・・・(1) というモデルがあったとします。 これを変形して lnY=lnA+αln・K+βln・Lとし、 Y:GDP K:民間資本ストック L:就業者数 といったデータを用いて回帰分析をしますと、 資本分配率であるαや労働分配率であるβが求まりますよね?ここまでを分析1とします。 分析1で求めた労働分配率や資本分配率を 他のモデルを用いて分析する際に使用しても いいのでしょうか? 分析2の目的は、Yの上昇に対するKやLの要因分析であるとします。 分析2のモデルは Y=T・K^α・L^β  (α+β=1) ・・・(1) データを Y:GDP K:稼働率×民間資本ストック  L:就業者数 として回帰分析をすると検定をクリアできない場合、 すでに求めた労働分配率や資本分配率を 当てはめてその後の要因分析を進める事は可能ですか? 『分析1では稼働率はAに吸収されていたから問題ない』という言い訳(?)は通用しませんか?

  • 重回帰分析について

    現在海外の大学で、今学期社会調査のコースをとっています。 先日、重回帰分析を学んだのですが、頭がついていかず、まったくわかりませんでした。どなたか、わかりやすく説明していただけないでしょうか? 日本語のサイトをさらってみたのですが、まだよくわかりません。 重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。 例にだされた、モデルが以下のようなものとなっています。 二酸化炭素の排出量に関するもでるです。               モデル1  モデル2  モデル3 定数            -0,019 -0,244 -0.790 電気消費   2.315*** 2.296*** 2.293*** 都市よりかどうか        0.004 0.007 人口の伸び 0.349 R-squared 0.908 0.910 0.911 *Siginificant at p< .05 **Siginificant at p< .01 ***Siginificant at p< .001 この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。 相関度が強いのは、モデル1、2、3いずれも電気消費となっているのだと思います。 R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。また、モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか? 英語を翻訳して記しているので、多少ニュアンスの間違い等あると思います。また、グラフがずれて表示されよみにくくなっているかもしれません。すみません。 よろしくお願いします。

  • 因子分析の回帰係数とは何を指すのでしょうか?

    因子分析の係数って何を指すのでしょうか? 論文を書くにあたって、先行研究を読んでいたところ、 企業の成長率を雇用・賃金・付加価値・売上の成長などをもとに、因子分析、バリマックス法を行っているようなのです。 この際、 These four indicators were specified as the rate of growth (regression coefficient) divided by the mean value of the dependent variable over a 10-year period, 1986–1995. とあります。 成長率を表す指標として、 the rate of growth (regression coefficient) があげられています。 regression coefficientは、回帰係数と 訳すようですが、 因子分析における回帰係数に該当するものとは何なのでしょうか? ご教授いただきたくよろしくお願いいたします。

  • <★困っています!>等分散性が成り立たない場合等の回帰分析

    いくつかの生物種について、独立変数である環境因子Xに基づいて、ある従属変数Yがどんな値を示したかを線形回帰分析した結果を簡単に外人の専門家に見てもらった所、 ・等分散性が成り立っていないのでPerasonの係数を用いた一般的な回帰分析はできない ・生物種によっては(複数回の実験に基づく)複数回データを(回帰分析に)使っている種もあれば、1回しかデータとして登場していない種もあるので、データ間の相互独立性が必ずしも成り立っていない という指摘を受けました。 しかし英文でのやりとりであることと私の基礎的知識の不足がたたり、理解が十分にできていません。具体的には以下の2点が疑問で残っています; ・等分散性が成り立たない場合には回帰分析はできないのでしょうか?できないにしても、変数XとYの関係を何らかの方法で評価できないのでしょうか。 ・ある種は複数のデータが使用され、ある種は1つのデータしか回帰分析に使用されていないことについて指摘を受けた所ですが、その対処方法として、一つは当然「全ての種について1つずつのデータ(プロット)しか使わない」という方法があるかと思います。しかし、折角複数のデータがある種については、それらのデータを全て回帰分析に用いる方が、より有効にデータを使っている様にも思えるので、全てのデータを使いつつ適切な回帰分析を行うという方法はないのでしょうか。 以上、どちらか一つだけでもご回答頂ければ非常に助かります。また、解決につながる単語又は概念だけでもヒントを頂ければ後は自分で調べたいと思います。