• 締切済み

ロジスティック回帰モデル 独立因子

医療系の文献において、ある薬物による副作用発症に関連する要因を解析する上で、まずそれぞれの要因を単変量解析(univariate analysis)した後、ロジスティック回帰モデルを用いた多変量解析(multivariate analysis)し、独立した副作用に関連する要因を述べている文献があります。ここでロジスティック回帰モデルを用いた多変量解析とあるのであすが、この解析法を行うことで独立した要因かどうか分かるのでしょうか? おわかりの方がいましたらどうかよろしくお願い致します。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 二つの変量x[i], x[j]が互いに独立であるとは、両者の相互相関が0になることです。多変量解析をやってみて、偶然「二つの変量が互いにほぼ独立である」ということが分かる場合は確かにあります。  ところで、多変量解析においては、互いに独立とは限らない複数の変量x[1], x[2], …の線形結合で表した因子y[1], y[2],…を、因子同士のどの組み合わせの相互相関も0になるように構成します。従って、これらの因子は互いに独立です。文献がこちらの話をしているのだとすると、独立であるのは必然、当たりまえです。  で、それらの因子の中から、特に「副作用発症」への寄与率の絶対値が大きい因子を幾つか選び出し、残りは無視します。(ただし、選ばれた因子がそれぞれ「現実世界における何を表しているか」「どういう意味を持っているか」という問いに、数学は答えられません。)これらの選ばれた因子を使って、ロジスティック回帰モデルを構成したのだろうと思います。

関連するQ&A

  • 統計おしえて!ロジスティック回帰でいいのかな?

    10項目程度の質問項目があります。 すべて、YES、NOで答えるタイプの項目です。(質的なデータで二値性) そのうち、ある一つの項目を従属変数(目的変数)としてほかの項目を独立変数として多変量解析したいのですが。。。 「ロジスティック回帰」を使えばいいのですか? 各独立変数ごとに従属変数に対するオッズ比が算出されるのですか? あと、これも重回帰のように独立変数の選択問題で当てはまりがよくないモデルがあったりするのでしょうか? あと、ロジスティック回帰を行いたいのですがソフトがなくて・・・ 無料でできるフリーソフト(初心者でもわかりやすい)とかあったら紹介してください。 たくさん質問してすみません。どれか一つでもわかるところがありましたら教えてください。お願いします。

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?

  • ロジスティック回帰分析のcrudeと調整済み

    論文で多重ロジスティック回帰分析を使用した際のcrude modelとadjusted modelについて教えて下さい。 crudeモデルは調整していない状態というのは分かるのですが、これは単ロジスティック回帰分析を独立変数ごとにかけたものと同じでしょうか?それとも性別や年齢などの背景因子を入れない状態での多重ロジスティック回帰分析でしょうか? またよく調整済みモデルでは性別や年齢などの背景因子で調整したと書いてありますが、これはこれらを複数の独立因子にさらに加えて多重ロジスティック回帰分析をかけたという意味でしょうか? よろしくお願いします。

  • エクセル統計のロジスティック回帰について

    エクセル統計でロジスティック回帰をしようと思っています。 「関数のあてはめ-ロジスティック」と、 「多変量解析-多重ロジスティック」とツールが2つあり、 上限がともに1で、変数が1つであれば、理屈上は全く同じ推計結果が得られるようです(パラメータ推定方法の違いで、微妙に結果が異なるようですが)。 ちなみに、 前者はy=K/(1+a・exp(-bx))、後者はy=1/(1+exp(a+bx)) という式です。 質問1: 皆さんは、両者をどのように使い分けておられるでしょうか。 参考となるご意見などあれば、お伺いしたく存じます。 (数学的?(モデル表現的?)な意味合いで、本質的に異なるものなのでしょうか?) 質問2: フリーソフトのRでもロジスティック回帰ができるようですが、 これは上記のどちらに該当することになるのでしょうか。 ご存知の方がおられましたら、ご教示頂けると幸いでございます。 どうぞ宜しくお願い申し上げます。

  • ロジスティック回帰モデルでの多変量の外れ値の検討法

    ある多変量データ(説明変数x1, x2, x3(比例尺度)、 目的変数y(名義尺度で0,1で表される)、それぞれ10000個くらいのデータ)をロジスティック回帰モデルを使ってモデル化しようとしています。 SPSSやエクセル統計分析のソフトを使ってモデル化を行ったところ、変数の有意性については確認できたのですが、Hosmer-Lemeshow検定や相関値によってモデルの適合度を確認するとモデルが適合していないことがわかり、元の生データに外れ値が含まれていると考えております。 この外れ値を除去する方法がわからないため書きこませて頂きました。 重回帰分析の場合は、残差をその標準偏差で割って標準化したもの(標準残差または標準化残差)についてある閾値を設けて外れ値の判定を行えばよいと思うのですが、ロジスティック回帰分析についても同じやり方でよいでしょうか?ロジスティック関数を使用しているので、予測値と観測値の残差や標準偏差をそのまま使ってはいけないような気もしています。 詳しい方がいらっしゃいましたら、教えていただけると幸いです。また、説明が詳しいホームページなどがございましたら、併せて教えていただけると幸いです。どうぞよろしくお願い申し上げます。

  • spss ロジスティック解析と単変量解析について

    SPSSを使用してロジスティック解析をしています。 教員から、単変量解析もするようにと言われました。 独立変数を1つにしてロジスティック解析を行うと、 この結果は得られるのでしょうか。 それともカイ二乗検定をするもの?と1人悩んでいます。 お手数をお掛けしますが、教えて下さい。

  • 統計 ロジスティック回帰の従属変数

    従属変数についての質問。 多変量解析を行う場合従属変数を決めます。で、例えば従属変数が「疾患がある」と「疾患がない」という2値になるものにしようと設定したとします。その場合、変数としては「ない=0」「ある=1」としなければいけないのでしょうか? 自分の考えとしては、たぶんこれはダミー変数だと思いますが、2値だからロジスティック回帰で分析する場合、疾患のある・なしを確率でとらえるなら、確率は0~1までなので「ない=0」「ある=1」としておかなければダメなのでしょうか? 例えば「ない=1」「ある=2」としてはダメなのですか? あと、ロジスティック回帰の結果、従属変数に対する独立変数のそれぞれが調整オッズ比とその95%CIという形でよく論文に表が載せてあるのですが、・・・その解釈の仕方として、独立変数が「男」「女」の場合のような2値なら男より女は相対危険(オッズ比)が「いくらです」。という解釈ですよね。しかし、独立変数が「年齢」や「身長」など連続的な数量データなら、オッズ比に関してどう解釈すればよいのでしょうか? また、「年齢」が例えば4層くらいのわけてあったりもしますが、結局、オッズ比の解釈がわかりません。 結構権威ある先生の論文に年齢のところは「1歳の増加」とか書いてあって、そのオッズ比と95%CIが書いてありますが・・・ 「1歳の増加」? 意味がよくわかりません。連続データの独立変数の場合、「1の増加」に対するオッズ比と解釈しなければいけないのでしょうか?

  • 多変量ロジスティック回帰分析と独立変数

    ご質問があります。よろしければ、ご回答下さるとうれしいです。多変量ロジスティック回帰分析をしています。 従属変数;生死(あり、なしの2区分変数) 独立変数;年齢(連続変数)      性別(男性、女性の2区分変数)      高脂血症や糖尿病など(あり、なしの2区分変数)      病気の程度(ステージ0から5など 0-2と3-5に2区分)      血圧値 →質問はここです。       多変量ロジスティック回帰分析の場合、独立変数は連続変数・2区分変数は問題なく投入できると思います。また、順序変数の場合、ステージ0-2とステージ3-5と2区分変数として独立変数扱いになる場合もあると思います。 質問の内容です。 高血圧変数を(1)あり・なしの2区分変数、(2)血圧値そのもので連続変数、と扱うのではなくて、以下のような設定はどうでしょうか? 正常血圧をmean±SDと設定して、対象者の血圧と比較。    血圧値<2SD スコア0  2SD<血圧値<3SD スコア1  3SD<血圧値<4SD スコア2  4SD<血圧値<5SD スコア3  5SD<血圧値    スコア4  年齢があがると血圧もやや上がるため、例えば、正常者の血圧と比較するためにこのようなカテゴリー化をすると、このスコア0-4は連続変数でしょうか? 順序変数でしょうか? 連続変数は、1単位あたりの変化がスケール全体にわたって数量的に等しい変数と、定義されているようです。スコア化すると連続/順序変数どちらになるか確認させていただきたいと思います。 よろしくお願いします。

  • グループに属するかどうかにロジスティック回帰分析?

    統計手法について教えて下さい。 人数が10~100人程度のグループが100個あって、その人たちの環境について10個ほどの得点(1~10点)を得ます。 そのグループから事例が発生する(例えば病気になる人が出現する)ことを観察し、事例発生グループと発生しなかったグループとします。 この場合従属変数をグループからの事例発生の有無として、独立変数を各得点としてロジスティック回帰分析をかけることは出来ないのでしょうか? 対象者自身がグループに属してるのでロジスティック回帰分析は用いることが出来ないのではと言われマルチレベルモデルを用いるように指摘されました。マルチレベル分析では従属変数が二値変数の場合は一般化線形混合モデルを用いる様ですが資料が少なくSPSSでの資料や本はほとんど無いように思います。 またこの場合グループからの事例発生の有無の2群に分けてt-testで各得点の差を見ることは意味がありますでしょうか。 よろしくお教えいただきますようお願いいたします。

  • 統計は役に立たないのでは???

    ある事象を説明するために変数を設定しますよね。 そして、あらゆる要因(変数)を同時に考慮ないないと、疫学でいうところの「交絡因子」というバイアスになりますよね。 しかし、多変量解析を用いて予測式を立てたところでそれが使いものにならない場合が多いように感じるのです。 相関係数が著しく低くなったり、回帰係数が0になる確率が棄却できなかったり・・・共線問題が発生している可能性があったり・・・ そこで、一応の情報量基準を満たしたモデルの回帰式を使うことにしたとしても、独立変数のいくつかは除外されたモデルになったりします。 すると、結局は除外された独立変数は交絡因子として存在することになるし、また、考え付かなかったような(設定しなかった)独立変数も交絡因子となっている場合があると思います。 そのことに対して、一体論文ではどのように説明すればよいのでしょうか? こんな不完全な多変量解析なら、むしろ単(一)変量解析の検定を独立変数の個数回やったほうがいいのでは?