• ベストアンサー

ロジスティック回帰分析のモデルのあてはまり具合の基準。

SPSSを用いてロジスティック回帰分析で統計データを 処理しようとしています。 出力される結果のCox&Snell R2乗、Nagelkerke R2乗の 値が、統計に用いたデータのロジスティックモデルへ のあてはまり具合の指標であることはわかるのです が、これらの値がどの程度の値を基準として「モデル にあてはまっている」と言えるのかがわからなくて困 っています。 統計学の初心者で統計学の本を調べながらデータ処理 を進めているのですが、上記に示した内容についての 説明が載っていなかったためこれらの値をどう捉えて いいのかわからなくて困っています。 出来るだけ具体的な値を示して教えてくれるとありが たいです。どなたか参考になるようなCox&Snell R2 乗、Nagelkerke R2乗の基準値のようなものを教えてい ただけないでしょうか。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 まず、回帰分析において、有意な相関があれば、両者に関係がある、と統計学的には言えます。逆に、有意でなければ、「両者に関係はなく」、したがって何も言えません。その回帰式を利用する根拠を失います。  有意差は、データの数が多いほど、出しやすいのですが、統計学とはそんなものです。    検定法は、基本的には有意が出るように、どれを採用しても良いのです。もちろん、t-検定については、データがt-分布をしていることが前提なのですが、意識的にデータを取捨選択しない限り、t-分布をしているものとして、計算しています。t-分布をしていれば、データは図の真ん中が密になり、両端ではほとんど無いのです。しかし、論文などでは、図の端の方にデータが固まっている回帰分析の結果も何度もみかけます。  回帰式もいろいろあるので、どの回帰式を採用するかは、研究者の自由です。直線ではなく、ロジスティク曲線を選ぶのは、「頭打ちになることが予想される」などの根拠があるはずです。  常通その理由として、一般的には、相関係数(決定係数と事実上同じ)を比較して、その絶対値の高い回帰式を採用します。  例外もあって、例えば、二次式や三次式の方が、一次式である直線よりも相関係数が高いことを経験します。しかし、X軸とY軸の両者の項目の因果関係を説明しにくいので、私は直線である一次式を採る場合もあります。

megbell
質問者

お礼

具体的な例を挙げて説明していただきありがとうございました。 大変わかりやすく、参考になりました。 自分の予想している結果と回帰式の形が合うかどうかを考えて一番適した回帰式を採用して統計結果を出そうと思います。 回答ありがとうございました。

その他の回答 (2)

回答No.2

回帰分析一般の適合度について、あてはまり具合の基準は存在しません。説明変数の増減により適合度が一番高いモデルを採用するだけです。どうしても比較したいのなら、重相関係数0.8以上、以下で判断すべきでしょうか?

megbell
質問者

お礼

回答ありがとうございました。 あてはまり具合に基準はないのですね。 統計学の素人のため、理解が足りませんでした。 重相関係数ですね。 あらためて本を読んで理解したいと思います。 参考になりました。 ありがとうございました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

統計学の基準は、有意差です。すなわち、危険率5%以下であれば、「有意なので、相関あり」と判断します。  ロジスティク曲線の当てはめは、知りません。が、指数回帰なども直線化し、その相関係数(決定係数R2の平方根)と、サンプル数から、t-検定を行い、有意差の有無を判定します。  実際のt-検定は、計算する必要は無く、部厚い推計統計学で、回帰分析に言及してあるテキストなら、一覧表になってでています。

megbell
質問者

お礼

回答ありがとうございました。 ロジスティック曲線のあてはめはないのですね。 ロジスティック回帰分析においてもt-検定は行うもの なのでしょうか。 SPSSを使用しているものの、出力された結果の理解に まだまだ悪戦苦闘中です。 もう少し自分で統計学についての知識がベースにない とSPSSを使いこなすわけにはいかなそうですね。 参考になる意見をありがとうございました。

関連するQ&A

  • SPSS17で二項ロジスティック回帰分析を行うには

    SPSS統計に関する基礎的な質問です。 SPSSを使って二項ロジスティック回帰分析を行う方法として、「分析」→「回帰」→「二項ロジスティック」を選択するとネットで調べました。 以前使っていたSPSS12ではこのやり方で二項ロジスティックの変数増加法、尤度比で解析していたのですが、SPSS17でやってみたところ、同じようにできず困っています。 SPSS17では「分析」→「回帰」を開くと、「線形」、「曲線推定」、「偏相関最少2乗法」、「順序」の4つしかなく、あちこち探ってみたのですが結局分からずじまいでした。 急いで解析しなければいけないデータがあり、また、SPSS12はもう使えない状況であるため、なんとかSPSS17で対応していかねばと思っております。 どうぞ具体的なやり方をご存じの方がいましたら、ご指南いただけないでしょうか。 宜しくお願いいたします。

  • -2対数尤度ってなんですか?

    エクセル統計2008の多重ロジスティック回帰分析を行っています。モデルの適合度を調べる際に、Cox & SnellのR2乗やNagelkerkeのR2乗を計算しようとしていたときに、計算に使用する対数尤度にどの値を用いればよいかわからなくなって色々調べていたところ、統計WEBのあるページ(http://software.ssri.co.jp/statweb2/sample/example_7.html)の「変数選択過程 - 回帰式の有意性」の部分に「-2対数尤度」というものを見かけました。 この-2対数尤度というのは何でしょうか?上記統計値を求める際には使用しますか? もし詳しい方がいらっしゃいましたら教えて頂ければ幸いです。どうぞよろしくお願い申し上げます。

  • ロジスティック回帰モデルでの多変量の外れ値の検討法

    ある多変量データ(説明変数x1, x2, x3(比例尺度)、 目的変数y(名義尺度で0,1で表される)、それぞれ10000個くらいのデータ)をロジスティック回帰モデルを使ってモデル化しようとしています。 SPSSやエクセル統計分析のソフトを使ってモデル化を行ったところ、変数の有意性については確認できたのですが、Hosmer-Lemeshow検定や相関値によってモデルの適合度を確認するとモデルが適合していないことがわかり、元の生データに外れ値が含まれていると考えております。 この外れ値を除去する方法がわからないため書きこませて頂きました。 重回帰分析の場合は、残差をその標準偏差で割って標準化したもの(標準残差または標準化残差)についてある閾値を設けて外れ値の判定を行えばよいと思うのですが、ロジスティック回帰分析についても同じやり方でよいでしょうか?ロジスティック関数を使用しているので、予測値と観測値の残差や標準偏差をそのまま使ってはいけないような気もしています。 詳しい方がいらっしゃいましたら、教えていただけると幸いです。また、説明が詳しいホームページなどがございましたら、併せて教えていただけると幸いです。どうぞよろしくお願い申し上げます。

  • グループに属するかどうかにロジスティック回帰分析?

    統計手法について教えて下さい。 人数が10~100人程度のグループが100個あって、その人たちの環境について10個ほどの得点(1~10点)を得ます。 そのグループから事例が発生する(例えば病気になる人が出現する)ことを観察し、事例発生グループと発生しなかったグループとします。 この場合従属変数をグループからの事例発生の有無として、独立変数を各得点としてロジスティック回帰分析をかけることは出来ないのでしょうか? 対象者自身がグループに属してるのでロジスティック回帰分析は用いることが出来ないのではと言われマルチレベルモデルを用いるように指摘されました。マルチレベル分析では従属変数が二値変数の場合は一般化線形混合モデルを用いる様ですが資料が少なくSPSSでの資料や本はほとんど無いように思います。 またこの場合グループからの事例発生の有無の2群に分けてt-testで各得点の差を見ることは意味がありますでしょうか。 よろしくお教えいただきますようお願いいたします。

  • 順序データを用いたロジスティック回帰分析

    ロジスティック回帰分析についてお聞きしたいことがあります。 ロジスティック回帰分析の独立変数として順序データを用いる場合は、3つ以上の値をとる名義データを用いる時のように、ダミー変数に変換する必要があるのでしょうか? ご存知の方がおられましたら、教えていただけないでしょうか。

  • 回帰分析のフィット具合について質問させて頂きます。

    回帰分析のフィット具合について質問させて頂きます。 回帰直線や回帰曲線のフィット具合(当てはまり具合? )を見る指標として、カイ二乗値(値が小さいほど良い)と相関係数(値が大きいほど良い)があるんですよね? この二つの指標は、どう違うのですか?また、どちらの値が優れているほうが、よりフィットしていると言えるのですか? よろしくお願いします。

  • 統計分析の方法について。

    独立変数、従属変数ともに質的な変数である場合に、 複数の因子から結果を予測するための統計学的方法に はどのようなものがあるでしょうか? 統計学の素人で統計学の本を片手にSPSSなどで統計処 理を行いたいと考えているのですが、どの方法を用い て処理をすればよいのかわからずに困っています。 質的変数を扱うのでロジスティック回帰分析かとも考 えたのですが、「ロジスティック回帰分析の場合、独 立変数は連続変数、従属変数が質的変数の時に用い る」らしい・・・ということで、ロジスティック回帰分析 もあてはまらないのかな、と思います。 どなたか統計学や医療分野での統計処理に詳しい方、 教えていただけないでしょうか。 よろしくお願いします。

  • エクセル統計のロジスティック回帰について

    エクセル統計でロジスティック回帰をしようと思っています。 「関数のあてはめ-ロジスティック」と、 「多変量解析-多重ロジスティック」とツールが2つあり、 上限がともに1で、変数が1つであれば、理屈上は全く同じ推計結果が得られるようです(パラメータ推定方法の違いで、微妙に結果が異なるようですが)。 ちなみに、 前者はy=K/(1+a・exp(-bx))、後者はy=1/(1+exp(a+bx)) という式です。 質問1: 皆さんは、両者をどのように使い分けておられるでしょうか。 参考となるご意見などあれば、お伺いしたく存じます。 (数学的?(モデル表現的?)な意味合いで、本質的に異なるものなのでしょうか?) 質問2: フリーソフトのRでもロジスティック回帰ができるようですが、 これは上記のどちらに該当することになるのでしょうか。 ご存知の方がおられましたら、ご教示頂けると幸いでございます。 どうぞ宜しくお願い申し上げます。

  • SPSSのロジスティック回帰分析の調整オッズ比

    現在,研究にてSPSSを使用し,統計処理を行っております。 方法として,ロジスティック回帰分析を行いました。 ある程度結果としては出すことはできた状況です。 最終的に影響要因として示されたXがいくつかあるのですが, ・ダミー変数で(0,1)として投入したもの ・尺度を利用したもの(4件法) があるとします。 SPSSの結果に表示されるオッズ比は,「調整オッズ比」とのことですが, オッズ比が調整されているということは,X同士の尺度幅(?)が違っても, 単純に算出されたオッズ比の数値を比べれば,影響要因の強さの比較ができると考えてもよさそうですか? 調整オッズ比の意味がいろいろ調べてみたのですが,あいまいなので,ご教授お願いいたします。

  • 統計おしえて!ロジスティック回帰でいいのかな?

    10項目程度の質問項目があります。 すべて、YES、NOで答えるタイプの項目です。(質的なデータで二値性) そのうち、ある一つの項目を従属変数(目的変数)としてほかの項目を独立変数として多変量解析したいのですが。。。 「ロジスティック回帰」を使えばいいのですか? 各独立変数ごとに従属変数に対するオッズ比が算出されるのですか? あと、これも重回帰のように独立変数の選択問題で当てはまりがよくないモデルがあったりするのでしょうか? あと、ロジスティック回帰を行いたいのですがソフトがなくて・・・ 無料でできるフリーソフト(初心者でもわかりやすい)とかあったら紹介してください。 たくさん質問してすみません。どれか一つでもわかるところがありましたら教えてください。お願いします。