• ベストアンサー

回帰分析の時に対数をとる意味は?

現在、計量経済学の授業で、 回帰分析、最小二乗法について勉強しているのですが、 たまに先生がデータの対数をとって回帰分析をするのですが、 どうして対数をとるのかよくわからないんです。 一応、弾力性を一定とする時や、非線形の関数を 線形にする時に使うらしいことまでは、 わかっているのですが (でも、それすら怪しいです。間違っていたら訂正してください…) どうして、対数をとるとそのようなことができるのか よくわからないんです。 ご存知の方がいらっしゃれば、アドバイスお願いします。 参考書籍・参考サイト等の紹介でもかまいません。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

追加の質問の件ですが,ある回帰式について,その説明変数でよいか,その関数形でよいか,ということを統計的に検証する手続きは,特定化の検定(specification test)として確立しています。 よく用いられる例が,Hausman検定やRamseyのRESET検定です。両者は,対立仮説などが異なるので,何を目的とするかで一長一短があり使い分けられます。 ただし,そうした検定はそれなりに難しい(大標本の検定なので,確率極限 plim の概念が必要)ので,学部の4単位くらいの内容ではそこまで至らないでしょう。学部の上級講義か,大学院の修士課程で学ぶ内容ですね。ちゃんとした教科書でも,かなり後の方に説明してある検定です。 ただ,対数をとったモデルと,とらないモデル,どちらの方が望ましいかというだけだったら,上の一般的な定式化の検定よりもずっと簡単な問題で,より簡単なBox-Cox変換で十分です。これだと,入門的な教科書でも手短かに書いてあるでしょう。 なお,その先生の説明を直接聞いたわけではないですが,「対数をとれば,どんな非線形の関係でも,線形回帰式として推定できる」と思われたのなら,誤解を招く説明ですね。 実際,対数をとるだけでは線形にならないような非線形の関係を推定する手法として,非線形最小2乗法とか一般化モーメント法(GMM)とかが用いられているんですからね。これらも,中級以上の教科書なら説明があるでしょう。

kureva
質問者

お礼

なるほど!検定方法がしっかりあるんですね。 ここからはしっかり自分で調べて見ます。 本当に丁寧な説明ありがとうございました。 ポイント発行します。

その他の回答 (2)

回答No.2

1点目: 例えば,YのXに対する弾力性が一定である場合,YはXの1次関数では表せません。X,Y平面にその関係を書いてみればわかりますが,当然ながら,直線上にのりませんね。これが非線形の関係の一例です。 しかし,X,Yそれぞれの対数をとったものの関係は,先の回答の手順で, logY=α+βlogX と表されますよね。すると,logYとlogXの関係は1次式です。logX,logY平面(つまり両対数軸)にその関係を書くと,直線上に載ります。 これで,非線形の関係を線形の関係に変換できたわけです。 もちろん,どのような非線形の関係も,対数をとれば線形に直せるというわけではありません。そういう場合がある(弾力性が一定の関係の場合など)というだけです。 2点目: ひじょーに丁寧に書けば以下のとおりです。 logY=α+βlogX という関係がX,Yに成り立ったとしましょう。dlogY/dlogXを計算すると,当然ながらβですね。つまり,関数logY=α+βlogXは,dlogY/dlogX=βをつねに満たしています。整合的ということです。 なお,dlogY/dlogX=βを満たす関数が他にもないか,気になるかもしれません。それだと,対数を取った回帰式以外も考えなくてもなりませんので。 さて,dlogY/dlogX=βを満たす関数をすべて求めよという問題は,(最も簡単なタイプの)微分方程式を解くことといえます。この微分方程式の一般解は,両辺をlogXで積分することで, logY=α+βlogX……(1) αは任意の定数 となります。つまり(1)以外に解がないことも簡単に示せるわけです。 dlogY/dlogX=βを満たす関数は,すべて(1)のように表せるということです。そこで,(1)を推定すべき回帰式とすれば十分で,それ以外を考えなくてよいのです。

kureva
質問者

お礼

どうも、丁寧な説明ありがとうございました! 弾力性のところに関しては、しっかり理解できました! あと、非線形関数に関してですが、 >もちろん,どのような非線形の関係も,対数をとれば >線形に直せるというわけではありません。 >そういう場合がある(弾力性が一定の関係の場合など)というだけです。 ↑ ということは、データを分析する際には、 とりあえず、対数をとってみて、それで関係性がないか、 そういう場合に当てはまっているか、回帰分析で調べてみる ということになるのでしょうか? もし、そうなら、具体的にどのような形で 当てはまっているか確かめるのでしょうか? どうも、授業で先生が片っ端から対数をとっていた 記憶があったので、その辺が疑問なのですが…。 分かる範囲で良いので、お返事いただけると幸いです。

回答No.1

YのXに対する弾力性は,その定義により, (dY/Y)/(dX/X)……(1) ですよね。 一方,一般に対数関数logZ,(Z>0)の微分は, dlogZ/dZ=1/Z ですよね。これから, dlogZ=dZ/Z と書けますね。 すると,弾力性の表現(1)は, (dY/Y)/(dX/X)=dlogY/dlogX とかけますよね。 この弾力性が,一定の値βだということは, dlogY/dlogX=β この関係は,Yの対数をXの対数に回帰した式 logY=α+βlogX と整合的なわけです。 以上が,弾力性が一定の関係をデータから推定しようとするときに,それぞれの変数の対数をとった回帰式を用いることになる理由です。

kureva
質問者

お礼

あー、なるほど! 弾力性のことに関してはかなりわかりました。 説明どうもありがとうございます。 あと、非線形の時に対数を使う理由とかはわかりますか? わかったらでいいんで教えてもらえると助かるのですが…。 それと、 >この弾力性が,一定の値βだということは, >dlogY/dlogX=β >この関係は,Yの対数をXの対数に回帰した式 >logY=α+βlogX >と整合的なわけです。 ↑ この部分なんですけど、「dlogY/dlogX=βがlogY=α+βlogXに整合」という部分がまだよくわからなかったので、 詳しく説明してもらえるとうれしいのですが…。 色々注文ばっかりつけて、すいません。 わかる範囲でいいので、もしよかったら教えてください。 (わからなかったら、そのまま放置してもらってかまいませんので)

関連するQ&A

  • 対数をとった回帰分析の解釈について

    対数をとった回帰分析の解釈について教えてください。 y = {5, 10, 13, 18, 21} x = {10, 20, 30, 40, 50} というデータセットがあったとして、x,yともにlog(x),log(y)と対数変換し、 弾力性を仮定したモデルを想定します。 このとき対数変換したものを最小二乗法で回帰分析を実行すると、下記の結果が得られると思います。 log(y) = -0.41 + 0.88*log(x) 解釈として、xが1%増えると、yが0.88%増加するとなると思うのですが、 このときのxの1%とは、何に対する1%と解釈すればよろしいのでしょうか。 yも0.88%増加するというのは、何に対する0.88%なのでしょうか。 これまでは、対数をとって回帰分析をしたときに、y = exp(-0.41 + 0.88*log(x))と変換してxとyの関係を見ておりましたが、「xが1%増えると、yが0.88%増加する」という部分を考えてみたところ、理解できず質問させていただきました。 xが1%増えるというのは、対数スケールではなく、通常のスケールでxがどのくらい増えていることを意味するのでしょうか。 お手すきの際にご回答いただけますと幸いです。

  • 自然対数を用いた重回帰分析

    ネットでたまたま見つけた郵政省(当時)の為替メカニズムの論文を理解したいのですが・・・ 論文では、重回帰分析(?)の結果、為替決定式を以下のとおりとしていました。 logS=α0+α1log(N/N*)+α2log(Y/Y*)+α3(i-i*)・・・式1 logは自然対数 S:為替レート(1ドルS円表示) α0~α3:係数 M:日本のマネーサプライ(M1) M*:アメリカのマネーサプライ(M1) Y:日本のGDP Y*:アメリカのGDP i:日本の短期金利 i*:アメリカの短期金利 logS=20.33+0.59log(N/N*)-0.65log(Y/Y*)+0.03(i-i*)・・・式2 でした。 これにつきまして、 1.logS=の式を、S=の式にするにはどうしたら良いのでしょうか? 自分なりに解いたのは次式です。(おそらく間違っていると思いますが)   S=e^20.33×(M/M*)^0.59÷(Y/Y*)^0.65×e^(0.03(i-i*))・・・式3 2.従属変数(?)が対数表示されている理由は、縦軸を対数表示するため   でしょうか?それとも、回帰分析する際に便利だからでしょうか?   また、金利は自然対数を取らないのですね? 3.自分も式1から、エクセルのソルバ等を用いて計算値と実績値との差の自乗の合計   が最小となる係数を求めてみたいのですが、エクセルのLn関数を用いて、式1から   回帰式を求めることはできますか? 私は文系出身のため対数というものを初めて知りました。とても不思議な世界があるのだなあ と興味を持っていろいろ調べたり、書籍にあたったりしましたが、もともと数学は苦手で基礎 ができていないものですから、いまいち式を解くことができません。 何か良い書籍・ウェブサイトをご紹介願えないでしょうか? (ちなみに、数学はミクロ経済学のための偏微分ができる程度です。)

  • 統計に関する基礎的な質問です。線形判別モデル、線形回帰分析モデル、ロジット分析モデルの違いをうまく説明できません。

    統計に関する基礎的な質問です。線形判別モデル、線形回帰分析モデル、ロジット分析モデルのそれぞれの特徴と違いを大学のゼミでうまく説明したのですが、不勉強のためうまく説明できません。 とくに、線形判別モデルと線形回帰分析モデルの違いがよくわからず困っています。どちらも、最小二乗法などを用いて回帰式を求めているので同じようなものだと思えてしまうのですが・・・どなたか、教えてください。

  • 不均一分散の回帰分析に適した変数変換とは?

    不均一分散する変数について回帰分析をする場合、加重最小2乗法や変数変換等があるという情報をウエブで見つけました。 手持ちのデータ(独立変数が大きくなるほど、残差のばらつきが大きくなっているデータ)で試しに従属変数の対数変換をして回帰したら、確かに元の結果よりかなり鮮明な傾向が認められ、また分散もほぼ一定となっている様に見受けられたのですが、その様になる理由は、簡単にイメージ的に説明すると何なのでしょうか。 また上記の様に“綺麗な結果”になる場合、そのまま対数変換の手法を採用して回帰してしまって差し支えないでしょうか。似た様な曲線形をとる関数に平方根(y=√x)等もあると思うので、ひょっとしたら「平方根変換」等も選択肢としてはあり得るとも思うのですが…何故対数変換なのでしょうか。 やはり実際に使う以上、直感的イメージだけでもその手法の仕組みを理解したいので、ご教示頂けると非常に助かります。

  • 回帰分析の際のデータの指数化

    どうか教えてください。 計量経済の本を読んでいると、 回帰分析をする際にデータを指数化 (例えば95年のデータを全て100にする) しているものがあるのですが、 指数化とは何のためにするのですか? また、どのような方法でするのですか? 指数化をして回帰分析をした場合、 指数化をする前と結果が異なるのでは ないのですか? 異なるのであれば、指数化をすることで 実態を正確に計測できていないという事に なるのではないですか? どうか教えてください。

  • 数学の知識なしで計量経済学や回帰分析は学べますか

    仕事の関係で、計量経済学や回帰分析の知識が必要となりました。自分なりに書籍を読んだり、ネット上の関連するサイトを見ていますが、数学的な話(Σとか微分など)になると全く理解できず、数学の参考書も読みましたが、理解できません。現在の当方の数学のレベルは、客観的にみて因数分解ができる程度だと思います。そこで以下の点についてご質問致します。 (1)数学を使わない(数式が全く入らない)解説書や書籍をご存知であればご紹介ください。 (2)数学が全くできなくても、計量経済学などをマスターできた方がいれば、その方法を教えてください ※難しいことだとは感じております。数学的な知識なしで理解することが不可能だとはっきりわかれば、諦めもつきますのでよろしくお願いします。

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。

  • 非線形モデル回帰分析の前提条件

    非線形回帰分析で、従属変数の母集団は正規分布を仮定できる必要はありますか? 回帰分析では従属変数の母集団は正規分布を仮定できる必要があると思いますが、これは線形の時だけでしょうか、それとも、非線形でもそうなのでしょうか?

  • 最小2乗法→回帰分析→?

    本には、「あるデータについて最小2乗法を行った後、回帰モデルの標準的仮定を置くと、最小2乗推定量は望ましい統計的性質を持ちます。しかし、実際の分析では、誤差項の正規性が付け加えられた「正規回帰モデルの標準的仮定」が仮定されることがほとんどである。」と書いてあるのですが、この正規性の条件はなぜ必要なのですか。 アバウトな質問になってしまいましたが、よろしくお願いします。

  • エクセルにおける回帰分析について

    統計分析初学者です。よろしくお願いいたします。 お聞きしたいのは、エクセルにおいて 回帰分析した結果の決定係数と散布図作成から近似曲線作成した場合の決定係数に違いがあるケースがあります。これはどう解釈したよいのかという質問です。近似曲線はもちろん線形で近似させています。マイクロソフトのサイトでは散布図からの近似曲線は最小2乗法によるとのことですので、縦軸と横軸を入れ替えても決定係数は変わらないと思っているのですが、このケースの場合変わってしまいます。ご存知の方がいましたら、是非教えていただきたいと思います。 <追記> パワーポイント資料等で説明する際には、 やはり決定係数だけでなく、t値やP値も併記するべきなのでしょうか。 合わせて皆様の見解をお聞かせください。 よろしくお願いいたします。