多変量ロジスティック回帰分析と独立変数

このQ&Aのポイント
  • 多変量ロジスティック回帰分析の独立変数について
  • 血圧値の連続変数化と順序変数化の比較
  • 年齢と血圧の関係についての考察
回答を見る
  • ベストアンサー

多変量ロジスティック回帰分析と独立変数

ご質問があります。よろしければ、ご回答下さるとうれしいです。多変量ロジスティック回帰分析をしています。 従属変数;生死(あり、なしの2区分変数) 独立変数;年齢(連続変数)      性別(男性、女性の2区分変数)      高脂血症や糖尿病など(あり、なしの2区分変数)      病気の程度(ステージ0から5など 0-2と3-5に2区分)      血圧値 →質問はここです。       多変量ロジスティック回帰分析の場合、独立変数は連続変数・2区分変数は問題なく投入できると思います。また、順序変数の場合、ステージ0-2とステージ3-5と2区分変数として独立変数扱いになる場合もあると思います。 質問の内容です。 高血圧変数を(1)あり・なしの2区分変数、(2)血圧値そのもので連続変数、と扱うのではなくて、以下のような設定はどうでしょうか? 正常血圧をmean±SDと設定して、対象者の血圧と比較。    血圧値<2SD スコア0  2SD<血圧値<3SD スコア1  3SD<血圧値<4SD スコア2  4SD<血圧値<5SD スコア3  5SD<血圧値    スコア4  年齢があがると血圧もやや上がるため、例えば、正常者の血圧と比較するためにこのようなカテゴリー化をすると、このスコア0-4は連続変数でしょうか? 順序変数でしょうか? 連続変数は、1単位あたりの変化がスケール全体にわたって数量的に等しい変数と、定義されているようです。スコア化すると連続/順序変数どちらになるか確認させていただきたいと思います。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

これは順序尺度でしょうね。 > 血圧値そのもので連続変数、と扱うのではなくて、以下のような設定はどうでしょうか? わざわざ尺度水準を落とす理由が私には分からないのですが、、、 連続型として得られているのにカテゴリカル型に変換することに何か特別な意味(考え)があるということでしょうか? 基本的にカテゴリカル型変数の解釈は難しくなるので、なるたけ連続型として使えるものはそれで使う。そもそも、あまりカテゴリカル型変数を1つのモデルに組み込まない。これが原則ですね(^_^;)

blue_76
質問者

お礼

ありがとうございました。

blue_76
質問者

補足

ありがとうございます。 純粋な統計学的見地からしたら、たしかに連続変数が尺度としては最もよいと思うのです。 血圧は年齢が上がるにつれて緩やかな上昇曲線をたどります。 たとえば、血圧150/80mmHgは、30歳男性なら高いですが、85歳男性なら標準分布(mean±SD)内におさまっているかもしれません。年齢に比して、血圧値が基準値内(有意な上昇なし → 高血圧なし)としてよいか、基準値より上(有意な上昇あり → 高血圧あり)としてよいか、迷った次第です。 そもそも、高血圧の定義を(1)年齢を問わず、140/80mmHg以上と定義、(2)血圧値>mean+2SD以上と定義するか、によって変わってくるかもしれませんね。 言いたいことがうまく整理できませんが、定義の問題と独立変数としては連続変数がベターということでしょうか。 ご回答いただき、ありがとうございます。

関連するQ&A

  • 多変量ロジスティック回帰分析

    初歩的な質問ですみません. 多変量ロジスティック回帰分析と多重ロジスティック回帰分析とは違うものでしょうか?違うとすれば,どのように違うのでしょうか? どなたか,教えて下さい.

  • 順序データを用いたロジスティック回帰分析

    ロジスティック回帰分析についてお聞きしたいことがあります。 ロジスティック回帰分析の独立変数として順序データを用いる場合は、3つ以上の値をとる名義データを用いる時のように、ダミー変数に変換する必要があるのでしょうか? ご存知の方がおられましたら、教えていただけないでしょうか。

  • 統計 ロジスティック回帰の従属変数

    従属変数についての質問。 多変量解析を行う場合従属変数を決めます。で、例えば従属変数が「疾患がある」と「疾患がない」という2値になるものにしようと設定したとします。その場合、変数としては「ない=0」「ある=1」としなければいけないのでしょうか? 自分の考えとしては、たぶんこれはダミー変数だと思いますが、2値だからロジスティック回帰で分析する場合、疾患のある・なしを確率でとらえるなら、確率は0~1までなので「ない=0」「ある=1」としておかなければダメなのでしょうか? 例えば「ない=1」「ある=2」としてはダメなのですか? あと、ロジスティック回帰の結果、従属変数に対する独立変数のそれぞれが調整オッズ比とその95%CIという形でよく論文に表が載せてあるのですが、・・・その解釈の仕方として、独立変数が「男」「女」の場合のような2値なら男より女は相対危険(オッズ比)が「いくらです」。という解釈ですよね。しかし、独立変数が「年齢」や「身長」など連続的な数量データなら、オッズ比に関してどう解釈すればよいのでしょうか? また、「年齢」が例えば4層くらいのわけてあったりもしますが、結局、オッズ比の解釈がわかりません。 結構権威ある先生の論文に年齢のところは「1歳の増加」とか書いてあって、そのオッズ比と95%CIが書いてありますが・・・ 「1歳の増加」? 意味がよくわかりません。連続データの独立変数の場合、「1の増加」に対するオッズ比と解釈しなければいけないのでしょうか?

  • ロジスティック回帰分析のcrudeと調整済み

    論文で多重ロジスティック回帰分析を使用した際のcrude modelとadjusted modelについて教えて下さい。 crudeモデルは調整していない状態というのは分かるのですが、これは単ロジスティック回帰分析を独立変数ごとにかけたものと同じでしょうか?それとも性別や年齢などの背景因子を入れない状態での多重ロジスティック回帰分析でしょうか? またよく調整済みモデルでは性別や年齢などの背景因子で調整したと書いてありますが、これはこれらを複数の独立因子にさらに加えて多重ロジスティック回帰分析をかけたという意味でしょうか? よろしくお願いします。

  • 統計おしえて!ロジスティック回帰でいいのかな?

    10項目程度の質問項目があります。 すべて、YES、NOで答えるタイプの項目です。(質的なデータで二値性) そのうち、ある一つの項目を従属変数(目的変数)としてほかの項目を独立変数として多変量解析したいのですが。。。 「ロジスティック回帰」を使えばいいのですか? 各独立変数ごとに従属変数に対するオッズ比が算出されるのですか? あと、これも重回帰のように独立変数の選択問題で当てはまりがよくないモデルがあったりするのでしょうか? あと、ロジスティック回帰を行いたいのですがソフトがなくて・・・ 無料でできるフリーソフト(初心者でもわかりやすい)とかあったら紹介してください。 たくさん質問してすみません。どれか一つでもわかるところがありましたら教えてください。お願いします。

  • ロジスティック回帰分析について教えて下さい。

    例えば、相手の話を十分に聴く事、詳しく説明する事が精神的な満足感をもたらすか?という仮説で、満足感と詳しい説明を従属変数、傾聴を独立変数にした場合、因果関係を調べるのは多重ロジスティック回帰分析で良いのでしょうか?

  • ロジスティック回帰分析

    例えば優しい説明を受けて楽な気持ちになったとして、楽な気持ちが従属変数で、優しい説明が予測変数にしたロジスティック回帰分析はできますか?

  • ロジスティック回帰モデル 独立因子

    医療系の文献において、ある薬物による副作用発症に関連する要因を解析する上で、まずそれぞれの要因を単変量解析(univariate analysis)した後、ロジスティック回帰モデルを用いた多変量解析(multivariate analysis)し、独立した副作用に関連する要因を述べている文献があります。ここでロジスティック回帰モデルを用いた多変量解析とあるのであすが、この解析法を行うことで独立した要因かどうか分かるのでしょうか? おわかりの方がいましたらどうかよろしくお願い致します。

  • ロジスティック回帰分析について

    ロジスティック回帰分析で、 (1)実験から得られた実測値(連続量と0,1の離散量が混在しているデータ)を用いたもの (2) (1)のデータの連続量のみを(実測値-平均値)/ 標準偏差で正規化したもの (3) (1)のデータの連続量のみを(実測値-最小値)/(最大値-最小値)で0から1までの数値に変換したもの 上述の(1)~(3)で回帰係数はそれぞれ異なるのに、目的変数のProbabilityが同じ数値になるのは、どのような理論的背景があるからなのでしょうか? ご存知の方がおられましたら、教えていただけないでしょうか?

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?