• ベストアンサー

統計学の多変量解析の考え方で困ってます

1)症例数が23程度で、多変量解析をしています。重回帰解析において、ある物質がP<0.05となるのですが、独立変数の選択の仕方で、Pが出たり出なかったりします。独立変数の選び方で、変わるならば統計者の意図が入る形になり、biasがかかる気がします。症例数が23程度での重回帰解析に意味はないのでしょうか?また同じ独立変数でstep-wise解析を行っても、その物質のみが採用されるようです。多変量解析を行ううえで、step wiseと重回帰解析の使い分けについてご教授ください。教科書的には重回帰で目安をつけて、step wiseで確認するみたいに書かれていますが、その認識でいいですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>独立変数の選択の仕方で、Pが出たり出なかったりします。 pは、危険率であって、常に計算できます。有意差の意味ではありません。科学の世界では、用語は厳密に定義されています。同じ用語を、人によって異なる使い方をしていては、混乱の元になります。  有意差が出たり・・・、というのは、当然です。そのように独立変数を選びます。それが、研究者の能力です。世界の賢い人が取り組んで、未だに明確でないのが、株価の独立変数です。 >独立変数の選び方で、変わるならば統計者の意図が入る形になり、biasがかかる気がします。 研究者が何を示したいか、例えばどの独立変数が関与しているかを示すのは、研究の目的そのものであって、バイアスには該当しません。 >症例数が23程度での重回帰解析に意味はないのでしょうか? 独立変数が23あるのなら、全く意味はありません。私なら、重決定係数が高くなるものを3つ程度に絞りますが。0.5はないと、   >重回帰で目安をつけて、step wiseで確認するみたいに書かれていますが、その認識でいいですか? 独立変数を選択して、有意差を示すのが、必要不可欠です。独立変数を適切に選ぶ方法の一つがステップワイズです。変数の数を増加させる、減少させる、増減させる方法があった、と記憶しています。  単回帰分析は、しょっちゅうやっていますが、重回帰は複雑なので、初心者の私は、やらないことにしていますので、ご参考までに。  ついでに書くと、私は有意差よりも、決定係数に着目します。

harvard11
質問者

お礼

返事が遅れて申し訳ありません。参考になりました。本当にありがとうございました。

その他の回答 (1)

回答No.2

>症例数が23程度で、多変量解析をしています  独立変数の10倍程度の症例数が望ましいと言われています。 >教科書的には重回帰で目安をつけて、step wiseで確認するみたいに書かれていますが、その認識でいいですか?  基本的には、そのとおりですが、その独立変数が外せないという考えがあれば、無理に除外する必要はありません。  No1さんの言うとおり、重決定係数が大きな意味をもちます。従属変数の50%も説明できないなら、何のための重回帰分析かということになります。

harvard11
質問者

お礼

返事が遅れて申し訳ありません。参考になりました。本当にありがとうございました。

関連するQ&A

  • 統計おしえて!ロジスティック回帰でいいのかな?

    10項目程度の質問項目があります。 すべて、YES、NOで答えるタイプの項目です。(質的なデータで二値性) そのうち、ある一つの項目を従属変数(目的変数)としてほかの項目を独立変数として多変量解析したいのですが。。。 「ロジスティック回帰」を使えばいいのですか? 各独立変数ごとに従属変数に対するオッズ比が算出されるのですか? あと、これも重回帰のように独立変数の選択問題で当てはまりがよくないモデルがあったりするのでしょうか? あと、ロジスティック回帰を行いたいのですがソフトがなくて・・・ 無料でできるフリーソフト(初心者でもわかりやすい)とかあったら紹介してください。 たくさん質問してすみません。どれか一つでもわかるところがありましたら教えてください。お願いします。

  • 多変量統計解析:重回帰分析の必要性...

    おはようございます。 今、大学で多変量解析(重回帰分析とか)を学んでいるのですが、先生は多変量がとてつもなくこれから大事になると何度も主張しています。 あ、自分は理工で、先生曰くエンジニアの部類に入るようです。 エンジニアには多変量がとても大事だということですが、いまいちピンときません。 多変量を用いることで劇的に経営システムを変える方法を見出せる可能性があるとのことです。 いろいろと事例を教えてくれたりするのですが、どうも釈然としません。 ほんとうに多変量統計解析とは応用の優れた良い手法なのでしょうか? それとエンジニアとしてはこれができないと危険なのでしょうか? 体験談などでもいいのでいろいろと教えてください。

  • 多変量解析、独立変数

    多変量解析を行いたいと考えておりますが、独立変数の設定については、各独立変数間に相関関係などがある場合はどちらかを除外しなければならないのでしょうか?その検定方法などについてご教授ください。

  • 多変量解析の使い方を教えてください。

    多変量解析の方法について質問です。 当方、統計学は素人です。ご協力お願いします。 都道府県別合計出生率と食品の消費量との相関を解析するには多変量解析のどの解析方法をもちいればよいのでしょうか? みたいのは、都道府県毎の酒類(清酒・ビール・焼酎など)消費量と合計出生率の相関です。 フリーソフトで重回帰分析など試しましたが、結果の見方すら分からない状態です。 (1)分析方法の選択 (2)結果の見方 以上2点、よろしくご教授いただけませんか? 何卒、ご尽力の程よろしくお願いします。

  • 解析方法

    今、研究をやっていて、多変量解析(重回帰分析)をかけたいのですが、説明変数を減らしたいです。 何か方法を教えていただけないでしょうか? よろしくお願いします。

  • spss ロジスティック解析と単変量解析について

    SPSSを使用してロジスティック解析をしています。 教員から、単変量解析もするようにと言われました。 独立変数を1つにしてロジスティック解析を行うと、 この結果は得られるのでしょうか。 それともカイ二乗検定をするもの?と1人悩んでいます。 お手数をお掛けしますが、教えて下さい。

  • 統計は役に立たないのでは???

    ある事象を説明するために変数を設定しますよね。 そして、あらゆる要因(変数)を同時に考慮ないないと、疫学でいうところの「交絡因子」というバイアスになりますよね。 しかし、多変量解析を用いて予測式を立てたところでそれが使いものにならない場合が多いように感じるのです。 相関係数が著しく低くなったり、回帰係数が0になる確率が棄却できなかったり・・・共線問題が発生している可能性があったり・・・ そこで、一応の情報量基準を満たしたモデルの回帰式を使うことにしたとしても、独立変数のいくつかは除外されたモデルになったりします。 すると、結局は除外された独立変数は交絡因子として存在することになるし、また、考え付かなかったような(設定しなかった)独立変数も交絡因子となっている場合があると思います。 そのことに対して、一体論文ではどのように説明すればよいのでしょうか? こんな不完全な多変量解析なら、むしろ単(一)変量解析の検定を独立変数の個数回やったほうがいいのでは?

  • 多変量解析・重回帰分析・クラスター分析

    こんばんは。 多変量解析と重回帰分析とクラスター分析について勉強したいのですが、素人でもわかりやすく解説したサイトと書籍をご存知の方、教えてください。 よろしくお願いします。

  • コクランのQ検定はなぜ多変量解析ではないのか、について教えてください

    卒論でSPSSを使うことになったので、本を一生懸命読んでいるのですが、分からないことが…(教授も素人で聞けない^^;) 理解した・分かったつもりのことは、 私が集めたデータは全て質的データってこと、 SPSSができることは大きく分けると 関係を調べるのか、差を調べるのかってこと、 変数の数によって検定方法が異なること。 で!その変数ですが、、、 多変量解析って、3変数以上のものの分析を行うんですよね? コクランのQ検定も3変数以上だと思うのですが、 これは多変量解析にならないのでしょうか…? 変数の定義が分かってないのかもしれないですが(; ;) あ、念のためですが、この2つは差を調べる為の方法ですよね? 長くなりましたが、どなたか教えてください!

  • 多変量解析のサンプル数の妥当性

    こんにちは。重回帰分析を実施して一応,よい精度(決定係数)が出たのですが,この時の解析対象サンプル数は300でした。これのサンプル数を1000とか2000に増やすと,当然かもしれませんが,精度は下がりました。重回帰分析等におけるサンプル数の妥当性はどのように判断すればよいのでしょうか?いくつ以上が妥当というような目安があるのでしょうか?