• ベストアンサー

赤池情報量基準AICとベイズ情報量基準BIC

赤池情報量基準AICとベイズ情報量基準BIC シミュレーション実験ではBICの方が良い結果を与えると聞きますが、何故そうなるのか教えてください。 繰り返し誤差が存在しないことが原因でしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kzkz_tool
  • ベストアンサー率78% (22/28)
回答No.1

こんにちは。だいぶ前の質問のようですが,回答させていただきます。 まず,AIC,BICは数式的には, AIC=-2{対数尤度}+2{モデルパラメータ数} BIC=-2{対数尤度}+log({サンプルサイズ}){モデルパラメータ数} とあらわされます。 第1項は,モデルの当てはまりを表すものですので,当てはまりが 良いほど小さくなります。また,同じデータでは関係ありませんが, サンプルサイズが大きくなれば,小さくなります。 第2項は,「罰則項」とも呼ばれ,パラメータ数が多いほど(すなわちモデルが 複雑になるほど)大きくなります。 あてはまりが良くても滅茶苦茶複雑なモデルは好ましくないということで, いずれの指標も,当てはまりが良く,なおかつシンプルなモデルが 志向される指標といえるでしょう。 AICとBICの数式的な違いは第2項ですが,AICは,罰則項がサンプルサイズによらず, サンプルサイズが大きいときに,第1項の比重が大きくなり,複雑なモデルが選ばれがちに なります。その点BICは罰則項もサンプルサイズの関数ですので,AICよりもシンプルな モデルが選ばれがちです。 ただし,そもそもの考え方のベースが両指標で異なります(AICは尤度推測, BICはBayes推測)ので,モデルパラメータの推測ストラテジに合わせる必要がある と考える人もいます。たとえば,モデルパラメータをBayes流で推定するならば BIC,最尤法で求めるならAICというように。必ずしもこのように用いなければならない というコンセンサスはないとは思いますが。 以上,ご参考まで。

関連するQ&A

  • SSEからAICやBICを求められるのはなぜ?

    次のようにしてSSE(二乗和誤差)からAICやBICを求められるという記述を見かけましたが納得できません。 AIC= nlog(SSE/n) + 2(k+2) BIC= nlog(SSE/n) + (k+2)log(n) n:観測値数 k:パラメーター数 第1項のSSEは観測値のスケールの影響を受けるように思います。しかし第2項は観測値のスケールの影響を受け内容に見えます。その結果、スケールによって選ばれるモデルが変わってしまうような事が起きると思うのですが問題ないのでしょうか?それともSSEを求めるときに何らかのスケーリングを行うのでしょうか? よろしくお願いします。

  • AIC(赤池情報量規準)の導出過程

    現在AIC(赤池情報量規準)について勉強しています。 対数尤度/平均対数尤度/期待平均対数尤度 といった似た言葉が多く混乱しています。 以下の記述は私の理解を整理したものですが、おかしな点はあるでしょうか? ----------------------------------------------- 以下のように記号を定義する θ:未知のパラメータ θ*:真のパラメータ θ★:パラメータの最尤推定量 K:モデルの自由パラメータ数 対数尤度:l(θ) 平均対数尤度のn倍:l*(θ) 期待平均対数尤度:l'*(K) 統計モデルの良さを評価したいとき ●(K-L情報量)が小さい(0に近い)モデルほど良いモデル ↓ ●(K-L情報量)は (定数)-(平均対数尤度) で表されるので (平均対数尤度)が大きいほど良いモデル ↓ ●(平均対数尤度のn倍)が大きいほど良いモデル (∵nは標本数であり一定だから) ↓ ●(平均対数尤度のn倍)の不偏推定量である(対数尤度)が最大になるような未知のパラメーターθ★を求める。これが最尤推定値。 ↓ ●(平均対数尤度のn倍)に最尤推定値θ★を代入した、 l*(θ★)が大きいほど良いモデル ↓ ●l*(θ★)は、得られた標本 x_i (i=1,2,…,n) に依存する値 (∵最尤推定値θ★はx_iによって表される) なので、 l*(θ★)の x_i (i=1,2,…,n) についての期待値をとると これが(期待平均対数尤度) l*'(K) となり、この値が大きいほど良いモデル ↓ ●とはいえ、真のモデルが未知であるため、(期待平均対数尤度)は 実際には求められない ↓ ●(期待平均対数尤度)の不偏推定量である l(θ★)-K が大きいほど 良いモデル ↓ ●歴史的経緯により、l(θ★)-K を-2倍した値が、AIC(赤池情報量規準) であり、AICが小さいほど良いモデル 以上 ----------------------------------------------- ここまでで、どこかおかしなところはあるでしょうか? よろしくお願いします。

  • AICについて教えてください

     線形自己回帰モデルの次数選択の指標となるAIC(赤池情報量基準)のもつ意味について教えて下さい。  

  • 線形混合モデルにおけるモデル適合度判定方法について

    線形混合モデルの異なるモデル間におけて適合度を判定したい場合,AICやBICなどのモデル適合度の判断基準を用いるかと思いますが,両モデルで観測数(もしくは自由度)が異なる場合はAICなどを使用することができません。 この場合,どのようにしてモデルの適合度を判定すればよいのでしょうか? (簡単に言うと,観測数500,AIC500のモデル1と観測数300,AIC300のモデル2ではどちらがモデルとして適合していると判断されるのか?) できましたら,SPSSでの判定方法を教えていただけると助かります。(Rでも可) どなたかご存知の方がおられましたらご教授ください。 よろしくお願いいたします。

  • 気体の分子量

    実験をしました 実験の目的:ライター用ガスとして用いられているブタン(C4H10)の分子量を気体の情報方程式を応用することによって実験的に求める。 仮説:分子量=58(ブタンの真の分子量) ということで 実験は数回行いました。 (1)水温13.5℃  水蒸気圧(hPa)15.4989  大気圧 762.2mmHg 体積 0.196リットル  質量1.55グラム  分子量 ?? (2)水温14℃  水蒸気圧(hPa)16.0054  大気圧 762.2mmHg 体積 0.152リットル  質量0.39グラム  分子量 ?? 2回分を記載しましたが 分子量はどちらも約58になるはずですよね?? 何回計算をしても100近い誤差がでてしまいます。 これは実験失敗してるのでしょうか?? 計算間違っているのでしょうか?? 回答お願いします(>_<)

  • AIC(赤池情報量基準)について

    統計学初心者です。ピント外れな質問だったら申し訳ありません。 ある医学データの解析で、AICを用いて変数選択を行いたいのですが、 1、AICというのはそもそも相対的な基準なのでしょうか?それとも絶対的な基準なのでしょうか? 2、もし絶対的基準だとしたら、どのくらいの値より小さくなれば、モデルに意味があるとみなされるのでしょうか? よろしくお願いいたします。

  • 加熱によるビタミンCの量の変化について

    自由研究で、ブロッコリーを生の状態、レンジで加熱したもの、炒めたもの、茹でたものに分けてどれがビタミンCの量が多いか実験じました。 方法としては、ヨウ素がビタミンCに反応すると無色になる性質を利用して測定しました。少ない量で無色になるほどビタミンCの量が多いようです。 ブロッコリーは、調理したものや生のものをそれぞれ少量の水を入れてミキサーで撹拌し、カスを取り除いて液体化してヨウ素液に混ぜました。 普通生が1番ビタミンCが多いと思うのですが、何かの誤差なのかレンジ加熱が生のものとそこそこ差をつけて1番ビタミンCが多い結果となってしまい考察を書くのに困ってしまいました。 何が原因だと思いますか? 困っているので、詳しい方原因や推測など教えていただけると嬉しいです。

  • 塩化ナトリウム水溶液の電気分解について2

    先ほども質問をした者です。申し訳ありませんがもうひとつ疑問がありました。実験結果の水素の体積が電気量から計算で求めた値と異なり、誤差が出ました。この原因は何なのでしょうか?どなたか教えてください。お願いします。

  • 四塩化炭素の分子量の測定

    タイトルはこの間、学校の授業でやった実験の名前です。 実験方法は釘で小さな穴を開けたアルミホイルをかぶせたフラスコに四塩化炭素を入れて水の入ったビーカーにつけてそのビーカーを熱して四塩化炭素が全部気化するまで熱し続けて、水で冷やして液化させて気体の状態方程式やボイルシャルルの法則を使って四塩化炭素の分子量を求める実験です。 それのレポートが夏休みの宿題として出されたのですが、考察に「分子式から求めた分子量と一致していない場合は原因を考えよ」とあって、確かに分子式から求めた分子量は154[g/mol]で、気体の状態方程式を使って求めた分子量は147.8[g/mol]、ボイルシャルルの法則を使って求めた分子量は112.90[g/mol]で分子式から求めた分子量とは誤差が生じてました。 そこで質問です!なぜ誤差が生じるのですか?このままじゃ宿題が出来ません…。どうか助けてください…。

  • 情報量とエントロピーの関係について

    大学の物理化学の講義で、異なる2種類の気体を混合した際のエントロピーの変化量は ΔS=-Rn{x_alog(x_a)+x_blog(x_b)} (x_a, x_bは気体のモル分率、Rは気体定数、nは全モル、logは自然対数) となることを習いました。先生によれば、これは情報量と関係があるとのことでした。 そこで、m種類の気体の混合とl(<m)種類の気体の混合において、どちらのエントロピーの変化がどれだけ大きくなるのか、またそれが情報量とどのような関係にあるのか考えました。 まず、2つの体積が等しい球形の容器を用意し、それらを仕切板で、それぞれm個の部屋とl個の部屋に区切ります。ただし、部屋は互いに区別できないとします(上から見ると、ホールケーキをm等分したときのような分け方になります)。 次に、m個の部屋にm種類の気体を n/m molずつ入れていきます。同様にl個の部屋にも n/l molずつ気体を入れます。ただし、気体については「それぞれが異なる」ということしかわかっていないとします。 最後ににそれらを温度、圧力が一定の部屋に置き、仕切り版を全て一斉に取り除きます。 するとエントロピーの増加はm個の気体の方では Rnlogm、l個の気体の方では Rnloglとなり、差がRnlog(m/l) となるので、たしかに情報量の比 m/l と明確な関係があるとわかりました。 しかし、以下の思考実験では、情報量に差があってもエントロピーが同じになることもあるという結果になりました。 まず、上の実験と同じ容器を用意し、m個の仕切り版で区切り、m種類の気体を n/m molずつ入れ、温度、圧力が一定の部屋に置きます。 ここで、仕切り版の取り方を(1)時計回りに一つずつ取る (2)ランダム一つずつに取る の二通りにすると、仕切り版を一つずつ取る取り方は全部でm!通りあるので、(1)では仕切り版の取り方は確率1/mでわかりますが(始めの一つはわからない)、(2)では確率1/m!でわかります。ここで情報量の差(不確かさの差?)が (m-1)! 倍だけ生じると思うのですが、エントロピーは状態量なのでその変化は仕切り版の取り方によらず同じになります。 この思考実験のどこかが間違っていますか? それともエントロピーと情報量は必ずしも相関しないのですか?