• ベストアンサー

AICについて教えてください

stomachmanの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

AIC(A Information Criterior, Akaike's Information Criterior)はかなり難しい理屈なんですが、要するに「モデルがなるべくシンプルで、かつデータをよく説明するようなものであるか」ということを評価するための指標です。  モデルの自由度を増やせば、当然モデルはデータをよく説明するようになる。だからモデルとデータのずれ(残差)が小さくなる。  でも小さくなり方が問題である。モデルの自由度を増やしても残差が余り小さくならない場合、それはデータにそれ以上系統的な変動がなくて、ランダムなノイズしか残っていないということだ。  だから逆に、「ランダムなノイズしかない、と仮定したときに、自由度を増やすことでどの位残差が小さくなるか」を予測する式を作る。それに比べて、実際にモデルの自由度を増やすことによって残差が小さくなる効果が勝るようなら、それ(自由度を増やすこと)は妥当だが、さもなければ無駄に自由度を増やしただけであると判定する。  てなところでいかがでしょうか。

skk
質問者

お礼

早々のご助言誠にありがとうございました。浅学故、ご回答に少し質問があるのですが、ご教示願えますか。 「ランダムなノイズしかない、と仮定したときに、自由度を増やすことでどの位残差が小さくなるか」を予測する式を作る。 という個所ですが、ランダムなノイズのみとかていした場合、予測式をたてる意味は失われないでしょうか。つまり何らかの時間相関構造が時系列を構成する系に存在することを仮定する必要はないのでしょうか。たとえば相関次元が有限値で飽和すなどの・・・。素人考えなおので誤りがあるかもしれませんが、よろしくお願いします。

関連するQ&A

  • 赤池情報量基準AICとベイズ情報量基準BIC

    赤池情報量基準AICとベイズ情報量基準BIC シミュレーション実験ではBICの方が良い結果を与えると聞きますが、何故そうなるのか教えてください。 繰り返し誤差が存在しないことが原因でしょうか?

  • 自己回帰モデルと自己回帰移動平均モデルについて「

    現在,自己回帰モデルと自己回帰移動平均モデルから パワースペクトル密度を導出する過程について勉強中なのですが いくつかわからないことがあるのでよろしければ教えてください (1)自己回帰モデルではユールウォーカ法により線形予測係数を求めたのですが この線形予測係数とは物理的な意味として何を表しているのでしょうか. パワースペクトル密度の導出するにあたって観測信号をいくつかの 振動成分(減衰正弦波?)に分解して解析を行っていることから この係数は振動を表すような値?を示していると考えていますがいまいち 納得できません. (2)自己回帰移動平均モデルでは高い次数のARモデルを低い次数で表現可能とあったのですが なぜそのように表現できるのでしょうか. ARモデルをARMAモデルに拡張する手法としてARモデルのインパルス応答を求めて それをProny法で近似してARMAモデルにしました. もしよろしければよろしくお願いします

  • 自己回帰モデルと自己回帰移動平均モデルについて

    現在,自己回帰モデルと自己回帰移動平均モデルから パワースペクトル密度を導出する過程について勉強中なのですが いくつかわからないことがあるのでよろしければ教えてください (1)自己回帰モデルではユールウォーカ法により線形予測係数を求めたのですが この線形予測係数とは物理的な意味として何を表しているのでしょうか. パワースペクトル密度の導出するにあたって観測信号をいくつかの 振動成分(減衰正弦波?)に分解して解析を行っていることから この係数は振動を表すような値?を示していると考えていますがいまいち 納得できません. (2)自己回帰移動平均モデルでは高い次数のARモデルを低い次数で表現可能とあったのですが なぜそのように表現できるのでしょうか. ARモデルをARMAモデルに拡張する手法としてARモデルのインパルス応答を求めて それをProny法で近似してARMAモデルにしました もしよろしければよろしくお願いします

  • <計量経済学>定数項のない回帰モデルについて

    定数項のない回帰モデルについて、次の2つの質問に答えていただきたいです。 1.定数項のない回帰モデルでは決定係数が特殊になるとのことですが、この場合には回帰線の当てはまりをどのように判断すればよいのでしょうか?決定係数に変わる指標があるのであれば教えていただきたいです。 2.定数項のない回帰モデルでは、攪乱項の期待値は0になるのでしょうか?または、定数項のない回帰モデルでは攪乱項の期待値が0にならなくても最小2乗推定量が最良線型不偏推定量(BLUE)になるのでしょうか? どなたか詳しい方、ご教授いただければありがたいです。 よろしくお願いいたします。

  • AIC(赤池情報量基準)について

    統計学初心者です。ピント外れな質問だったら申し訳ありません。 ある医学データの解析で、AICを用いて変数選択を行いたいのですが、 1、AICというのはそもそも相対的な基準なのでしょうか?それとも絶対的な基準なのでしょうか? 2、もし絶対的基準だとしたら、どのくらいの値より小さくなれば、モデルに意味があるとみなされるのでしょうか? よろしくお願いいたします。

  • 非線形回帰分析の定義が分かりません.

    回帰分析を勉強しているのですが,非線形回帰分析が何なのか分からなくて困っています. 線形回帰モデルは Y = b0 + b1*X1 + b2*X2 + … + bp*Xp で与えられますが,この場合の線形とはパラメータに関して線形という 意味であって, Y = b0 + b1*lnX や Y = b0 + b1*X1 + b12*X1*X2 + b22*X2^2 も線形回帰モデルに含まれると聞いたのですが, だとすると非線形回帰分析とはどのようなモデルを想定することを言うのでしょうか?どなたか教えて頂けるとありがたいです.

  • R言語について

    以下の時間情報についてRで、ARモデル(自己回帰モデル)でモデリングを行いたいのですが、R初心者につきどう扱っていいかわかりません・・・時系列予測を行いたいのです。 (関数変換による時間情報) 1323512577 1323525434 1325724531 1326216520 1326220240 1326220882 1326448740 1326608999 1327035002 1327371331 1327451383 1328012544 1328612173 1328791696 1329520836 1329751769 1330199586 1330409160 1330430784 1330461680 1331513221 1331737234 1331740144 1331852055 ar( データ , aic=TRUE )でモデリングできるらしいのですが、この”データ”のところはどうやって上の情報をいれたらいいのでしょうか?

  • 線形混合モデルにおけるモデル適合度判定方法について

    線形混合モデルの異なるモデル間におけて適合度を判定したい場合,AICやBICなどのモデル適合度の判断基準を用いるかと思いますが,両モデルで観測数(もしくは自由度)が異なる場合はAICなどを使用することができません。 この場合,どのようにしてモデルの適合度を判定すればよいのでしょうか? (簡単に言うと,観測数500,AIC500のモデル1と観測数300,AIC300のモデル2ではどちらがモデルとして適合していると判断されるのか?) できましたら,SPSSでの判定方法を教えていただけると助かります。(Rでも可) どなたかご存知の方がおられましたらご教授ください。 よろしくお願いいたします。

  • 統計学 線形重回帰分析についての問題

    問題 高校生22名の物理の学力yと、物理の興味x_1、数学の学力x_2、知能偏差値x_3との関係を調べたデータ(100点満点で点数化)(22record.xls)に関して、yのx_1,x_2,x_3に対する線形重回帰分析を行え。 以下は、この問題について、R上で実行した結果と、※は自分が補足した部分です。これについて、間違ったことを言っていないか見てほしいです。 よろしくお願いします。 > record<- read.table("clipboard",header=TRUE) ※Excel上で範囲指定したデータを読み込む > record y x_1 x_2 x_3 1 43 35 50 55 2 62 44 50 70 3 15 20 10 32 4 23 32 15 45 5 84 70 88 80 6 90 76 90 92 7 67 58 82 54 8 45 37 52 45 9 75 85 92 60 10 13 10 15 25 11 56 52 58 73 12 86 62 83 89 13 24 30 24 60 14 18 22 20 32 15 52 60 46 42 16 80 50 72 86 17 70 92 63 76 18 32 38 25 17 19 37 45 30 25 20 50 46 55 73 21 60 63 59 73 22 72 43 70 72 > lm1<- lm(y~.,data=record)  ※yを目的関数、他のすべての変数を説明変数として線形重回帰分析を実行 > summary(lm1) ※実行結果の要約 Call: lm(formula = y ~ ., data = record) Residuals: ※残差の5数要約 Min 1Q Median 3Q Max -8.871 -4.041 -0.737 5.087 8.921 Coefficients: ※係数の最小二乗推定値と対応t値など Estimate Std. Error t value Pr(>|t|)   (Intercept) -1.95005 3.95936 -0.493 0.6283  ※β_0 x_1 0.17629 0.10686 1.650 0.1163  ※β_1 x_2 0.61691 0.10483 5.885 1.43e-05 *** ※β_2 x_3 0.23466 0.09315 2.519 0.0214 *  ※β_3 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 5.976 on 18 degrees of freedom Multiple R-squared: 0.9485, Adjusted R-squared: 0.94 ※寄与率、自由度調整済み寄与率 F-statistic: 110.6 on 3 and 18 DF, p-value: 8.711e-12 ※回帰式に関する分散分析 > slm<- step(lm1) ※変数選択実行 Start: AIC=82.25 ※AIC(Akaike's Information Criterion);赤池情報量規準 y ~ x_1 + x_2 + x_3 Df Sum of Sq RSS AIC <none> 642.83 82.25 - x_1 1 97.21 740.04 83.34 ※AIC最小 - x_3 1 226.66 869.49 86.89 - x_2 1 1236.70 1879.53 103.85 上記では、AIC法による変数選択を行っている。この方法では、AICの値が小さいほど良いモデルとされる。 独立正規誤差を仮定する場合: AIC=2p+n/2+n/2log(2πσ^2) (p:説明変数の数、n:標本数、σ:誤差分散の不偏推定量) ・・回答よろしくお願いします。

  • 統計に関する基礎的な質問です。線形判別モデル、線形回帰分析モデル、ロジット分析モデルの違いをうまく説明できません。

    統計に関する基礎的な質問です。線形判別モデル、線形回帰分析モデル、ロジット分析モデルのそれぞれの特徴と違いを大学のゼミでうまく説明したのですが、不勉強のためうまく説明できません。 とくに、線形判別モデルと線形回帰分析モデルの違いがよくわからず困っています。どちらも、最小二乗法などを用いて回帰式を求めているので同じようなものだと思えてしまうのですが・・・どなたか、教えてください。