-2対数尤度ってなんですか?

このQ&Aのポイント
  • エクセル統計2008の多重ロジスティック回帰分析を行っています。モデルの適合度を調べる際に、Cox & SnellのR2乗やNagelkerkeのR2乗を計算しようとしていたときに、計算に使用する対数尤度にどの値を用いればよいかわからなくなって色々調べていたところ、統計WEBのあるページ(http://software.ssri.co.jp/statweb2/sample/example_7.html)の「変数選択過程 - 回帰式の有意性」の部分に「-2対数尤度」というものを見かけました。
  • -2対数尤度とは、統計解析においてモデルの適合度を評価する指標の一つです。対数尤度は最大対数尤度を基準としており、その値が大きいほどモデルの適合度が高いことを示します。-2対数尤度では、対数尤度を2倍した値が使用されます。検定などで比較する際に、統計的な意味を持つ値として使われます。
  • したがって、多重ロジスティック回帰分析において適合度を評価する際には、-2対数尤度を使用することが推奨されます。Cox & SnellのR2乗やNagelkerkeのR2乗は、-2対数尤度を最大対数尤度で割った値として計算されます。これらの指標は、モデルの説明力を示すために用いられます。
回答を見る
  • ベストアンサー

-2対数尤度ってなんですか?

エクセル統計2008の多重ロジスティック回帰分析を行っています。モデルの適合度を調べる際に、Cox & SnellのR2乗やNagelkerkeのR2乗を計算しようとしていたときに、計算に使用する対数尤度にどの値を用いればよいかわからなくなって色々調べていたところ、統計WEBのあるページ(http://software.ssri.co.jp/statweb2/sample/example_7.html)の「変数選択過程 - 回帰式の有意性」の部分に「-2対数尤度」というものを見かけました。 この-2対数尤度というのは何でしょうか?上記統計値を求める際には使用しますか? もし詳しい方がいらっしゃいましたら教えて頂ければ幸いです。どうぞよろしくお願い申し上げます。

質問者が選んだベストアンサー

  • ベストアンサー
  • ur2c
  • ベストアンサー率63% (264/416)
回答No.2

> Cox & SnellのR2乗やNagelkerkeのR2乗を求める際に、どのようにこれを使用するか それらの pseudo-R^2 も尤度比の関数なので、 -2 対数尤度比 の値があれば、それを尤度比について解いて計算できます。式はたとえば ↓ に出てます。

参考URL:
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm
mon-monkey
質問者

補足

ご回答ありがとうございます。かなり理解が進みました。 多く質問をしてしまって大変申し訳ないのですが、さらに回帰式の精度を表す ・Cox & SnellのR2乗 ・NagelkerkeのR2乗 は、具体的にいくらぐらいの値であれば精度が高いと言えるのでしょうか?通常のR2乗と同じように考えてよろしいでしょうか?

その他の回答 (2)

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.3

Cox & Snell を修正したのが Nagelkerke で、その修正の目的は予測が正確なときは pseudo-R^2 が 1 になるようにすることでした。そういう経緯ですから、少なくとも Nagelkerke は通常の R^2 と同様に扱って良いと思います。 つまり、目安として大小の比較ができれば良いという意見です。検定で危険率をどう設定するかという問題と同じく、哲学的に突き詰めればどうせ主観なのですから。(別な見解もありそうですけど。)

mon-monkey
質問者

お礼

なるほど、承知しました。度重なる質問に答えていただきどうもありがとうございました。

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.1

尤度比検定を Wiki で見ると、意味が書いてあります。その「例」の直前に、なぜわざわざ対数尤度比を -2 倍するのかの説明があります。

参考URL:
http://ja.wikipedia.org/wiki/%E5%B0%A4%E5%BA%A6%E6%AF%94%E6%A4%9C%E5%AE%9A
mon-monkey
質問者

補足

ありがとうございます。Cox & SnellのR2乗やNagelkerkeのR2乗を求める際に、どのようにこれを使用するかについても教えていただけませんか?

関連するQ&A

  • ロジスティック回帰分析のモデルのあてはまり具合の基準。

    SPSSを用いてロジスティック回帰分析で統計データを 処理しようとしています。 出力される結果のCox&Snell R2乗、Nagelkerke R2乗の 値が、統計に用いたデータのロジスティックモデルへ のあてはまり具合の指標であることはわかるのです が、これらの値がどの程度の値を基準として「モデル にあてはまっている」と言えるのかがわからなくて困 っています。 統計学の初心者で統計学の本を調べながらデータ処理 を進めているのですが、上記に示した内容についての 説明が載っていなかったためこれらの値をどう捉えて いいのかわからなくて困っています。 出来るだけ具体的な値を示して教えてくれるとありが たいです。どなたか参考になるようなCox&Snell R2 乗、Nagelkerke R2乗の基準値のようなものを教えてい ただけないでしょうか。よろしくお願いします。

  • SPSS17で二項ロジスティック回帰分析を行うには

    SPSS統計に関する基礎的な質問です。 SPSSを使って二項ロジスティック回帰分析を行う方法として、「分析」→「回帰」→「二項ロジスティック」を選択するとネットで調べました。 以前使っていたSPSS12ではこのやり方で二項ロジスティックの変数増加法、尤度比で解析していたのですが、SPSS17でやってみたところ、同じようにできず困っています。 SPSS17では「分析」→「回帰」を開くと、「線形」、「曲線推定」、「偏相関最少2乗法」、「順序」の4つしかなく、あちこち探ってみたのですが結局分からずじまいでした。 急いで解析しなければいけないデータがあり、また、SPSS12はもう使えない状況であるため、なんとかSPSS17で対応していかねばと思っております。 どうぞ具体的なやり方をご存じの方がいましたら、ご指南いただけないでしょうか。 宜しくお願いいたします。

  • ロジスティック回帰分析のcrudeと調整済み

    論文で多重ロジスティック回帰分析を使用した際のcrude modelとadjusted modelについて教えて下さい。 crudeモデルは調整していない状態というのは分かるのですが、これは単ロジスティック回帰分析を独立変数ごとにかけたものと同じでしょうか?それとも性別や年齢などの背景因子を入れない状態での多重ロジスティック回帰分析でしょうか? またよく調整済みモデルでは性別や年齢などの背景因子で調整したと書いてありますが、これはこれらを複数の独立因子にさらに加えて多重ロジスティック回帰分析をかけたという意味でしょうか? よろしくお願いします。

  • 統計学: 尤度推定量、最小二乗法

    統計学なのですが、悩んでいるところは 微分の極値問題 なので 微分ができる方にも アドバイスをお願いしたいです。 さて、問題ですが L = - Σ(i=1->n)(Yi - θ*Xi)^2/(2*σ^2) - (n/2)ln(2*π*σ^2) を最大化するθ,σ^2を求め、 そのθとσ^2がLを最大化していることを示せ。という問題です。  ただし X1,X2,...,Xn と Y1,Y2,...,Yn は定数扱い。 また θ>= 0 , n は自然数,σ^2 > 0 です。 もとは 統計学の問題で 線形回帰モデル  Yi = θ*Xi + εi ,εi は 正規分布 N(0,σ^2) に従う。 を考えたとき θとσ^2の最尤推定量を求め、その推定量が尤度を最大化していることを証明せよ。 という問題で (対数)尤度L を計算すると L = - Σ(i=1->n)(Yi - θ*Xi)^2/(2*σ^2) - (n/2)ln(2*π*σ^2) となり、 あとは極値問題を解くだけというところから 分からなりました。 この先、私が考えたのは ∂L/∂(σ^2) =0 かつ ∂L/∂θ =0 を満たす θ,σ^2 を求めること(grad(L)を導出) 前者は  σ^2 = Σ(Yi-θ*Xi)^2 /n 後者は  Σ(Yi-θ* Xi)*Xi = 0 という 形に変形できたのですが、 後者の式をこれ以上 くずせませんでした。 ここでアドバイスがほしいのです。 統計、もしくは解析ができる方、アドバイスをいただけないでしょうか。 文が長くなってしまいましたが、よろしくお願いします。

  • エクセル統計のロジスティック回帰について

    エクセル統計でロジスティック回帰をしようと思っています。 「関数のあてはめ-ロジスティック」と、 「多変量解析-多重ロジスティック」とツールが2つあり、 上限がともに1で、変数が1つであれば、理屈上は全く同じ推計結果が得られるようです(パラメータ推定方法の違いで、微妙に結果が異なるようですが)。 ちなみに、 前者はy=K/(1+a・exp(-bx))、後者はy=1/(1+exp(a+bx)) という式です。 質問1: 皆さんは、両者をどのように使い分けておられるでしょうか。 参考となるご意見などあれば、お伺いしたく存じます。 (数学的?(モデル表現的?)な意味合いで、本質的に異なるものなのでしょうか?) 質問2: フリーソフトのRでもロジスティック回帰ができるようですが、 これは上記のどちらに該当することになるのでしょうか。 ご存知の方がおられましたら、ご教示頂けると幸いでございます。 どうぞ宜しくお願い申し上げます。

  • 対数をとった回帰分析の解釈について

    対数をとった回帰分析の解釈について教えてください。 y = {5, 10, 13, 18, 21} x = {10, 20, 30, 40, 50} というデータセットがあったとして、x,yともにlog(x),log(y)と対数変換し、 弾力性を仮定したモデルを想定します。 このとき対数変換したものを最小二乗法で回帰分析を実行すると、下記の結果が得られると思います。 log(y) = -0.41 + 0.88*log(x) 解釈として、xが1%増えると、yが0.88%増加するとなると思うのですが、 このときのxの1%とは、何に対する1%と解釈すればよろしいのでしょうか。 yも0.88%増加するというのは、何に対する0.88%なのでしょうか。 これまでは、対数をとって回帰分析をしたときに、y = exp(-0.41 + 0.88*log(x))と変換してxとyの関係を見ておりましたが、「xが1%増えると、yが0.88%増加する」という部分を考えてみたところ、理解できず質問させていただきました。 xが1%増えるというのは、対数スケールではなく、通常のスケールでxがどのくらい増えていることを意味するのでしょうか。 お手すきの際にご回答いただけますと幸いです。

  • 正規分布を両対数グラフにプロットする

    正規分布している事象があるとして(例えば、身長と個体数)、 身長を横軸、縦軸を累積度数にして両対数グラフ上にプロットすると曲線を描きますよね? この曲線を一般的に式に表すとどういった式になるのでしょうか。 適当にモデルを作って軽く計算してみたのですが、こんがらがってしまいました・・・・ ベキ乗則に従う事象と正規分布する事象を同じ両対数グラフ上にプロットして、さらに回帰曲線をひきたいのです。 どうかよろしくお願いいたします。

  • 統計学のついて2つ質問が…

    自分で解けずに困っています。教えていただけないでしょうか? 1.標準偏差σ=40の無限母集団から大きさ400の標本を無作為抽出し、その標本平均を求めたら、x=54.1であった。これにより H0:μ=60 (帰無仮説)、H1:μ<60 (対立仮説)を有意水準を5%として検定しなさい。 2.下記のデータについて、x上のyの単純正規線形回帰模型を仮定し、   (1)β、α、rの2乗、σ、σβの値を計算せよ。   (2)βのt値を求め、βが統計的に有意な値かどうかを判定せよ。 2はExcelの「回帰分析」を使っても解けるらしいのですが今までExcelがないので分かりません。一応、インストールはされてます。 文章が分かりにくいかもしれないですが教えていただけないでしょうか?よろしくお願いします。 くだらない質問で申し訳ありません…

  • モデル間の係数比較

    多重ロジスティック回帰について、2点質問があります。 具体的には、z=1/(1+exp(-(a+bx+cy)))の回帰式について質問です。 同じ属性のデータから上記の回帰式でモデルを2つ作ったとき、 それぞれの係数(a1とa2,b1とb2,c1とc2)に有意な差があるかどうかを 調べる方法はありますか?また、無償での便利なツールはありますか? (分散分析?共分散構造分析?) より一般的に、2つのモデル間で偏回帰係数に有意な差があるかどうかを検定する方法を知りたく思っております。どうぞ宜しくお願い申し上げます。

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?