• 締切済み

多変量解析、独立変数

多変量解析を行いたいと考えておりますが、独立変数の設定については、各独立変数間に相関関係などがある場合はどちらかを除外しなければならないのでしょうか?その検定方法などについてご教授ください。

みんなの回答

回答No.1

独立変数(説明変数)間の相関関係について検定までやった事例は見たことがありませんが、ご心配のとおり、多重共線性という問題が発生します。 多重共線性とは、簡単に言えば、ある変数を説明変数として取り込むと、それと相関係数の高い変数は取り込むことができなくなってしまう現象です。 問題は、どちらを真に因果関係にある変数として取り込めばいいのか、あるいは、両方とも効いているはずなのに取り込めない、というようなことです。 多重共線性の判定では、CN値,VIF値などを見ます。一般の統計ソフトであれば、内部で求めて表示してくれます。 詳しい説明は避けますが、詳しくお知りになりたければ、 朝野(2000)「入門多変量解析の実際第2版」講談社サイエンティフィック の108ページ以降に書いてあります。対策も出ています。 さて、ご質問の件、 解析の際、どちらかを除外する必要があるかどうかですが、除外する必要はありません。(解析ソフトが「多重共線性あり」と表示してくれ、他の変数への影響を見ながら解析者が変数を選択するようになっています) 検定方法は最初に述べたように、教科書には出ていませんが、やろうと思えばできないことはないでしょう。ただ、CN値とかVIF値の信頼区間の求め方について書いてある参考書や論文を探さなければなりません。

miwakc2004
質問者

お礼

早速、回答を頂き有難うございました。まずはこのまま解析を行いたいと思います。助かりました。

関連するQ&A

  • spss ロジスティック解析と単変量解析について

    SPSSを使用してロジスティック解析をしています。 教員から、単変量解析もするようにと言われました。 独立変数を1つにしてロジスティック解析を行うと、 この結果は得られるのでしょうか。 それともカイ二乗検定をするもの?と1人悩んでいます。 お手数をお掛けしますが、教えて下さい。

  • コクランのQ検定はなぜ多変量解析ではないのか、について教えてください

    卒論でSPSSを使うことになったので、本を一生懸命読んでいるのですが、分からないことが…(教授も素人で聞けない^^;) 理解した・分かったつもりのことは、 私が集めたデータは全て質的データってこと、 SPSSができることは大きく分けると 関係を調べるのか、差を調べるのかってこと、 変数の数によって検定方法が異なること。 で!その変数ですが、、、 多変量解析って、3変数以上のものの分析を行うんですよね? コクランのQ検定も3変数以上だと思うのですが、 これは多変量解析にならないのでしょうか…? 変数の定義が分かってないのかもしれないですが(; ;) あ、念のためですが、この2つは差を調べる為の方法ですよね? 長くなりましたが、どなたか教えてください!

  • 多変量解析

    2つの変量について、相関がある、独立である、関係があるというのはそれぞれどう違うのかいまいちよくわかりません。それぞれの相違について教えてくださいませんか。

  • 多変量解析

    2つの変量について、相関がある、独立である、関係があるというのはそれぞれどう違うのかいまいちよくわかりません。それぞれの相違について教えてくださいませんか。

  • 統計学の多変量解析の考え方で困ってます

    1)症例数が23程度で、多変量解析をしています。重回帰解析において、ある物質がP<0.05となるのですが、独立変数の選択の仕方で、Pが出たり出なかったりします。独立変数の選び方で、変わるならば統計者の意図が入る形になり、biasがかかる気がします。症例数が23程度での重回帰解析に意味はないのでしょうか?また同じ独立変数でstep-wise解析を行っても、その物質のみが採用されるようです。多変量解析を行ううえで、step wiseと重回帰解析の使い分けについてご教授ください。教科書的には重回帰で目安をつけて、step wiseで確認するみたいに書かれていますが、その認識でいいですか?

  • 多変量解析の使い方を教えてください。

    多変量解析の方法について質問です。 当方、統計学は素人です。ご協力お願いします。 都道府県別合計出生率と食品の消費量との相関を解析するには多変量解析のどの解析方法をもちいればよいのでしょうか? みたいのは、都道府県毎の酒類(清酒・ビール・焼酎など)消費量と合計出生率の相関です。 フリーソフトで重回帰分析など試しましたが、結果の見方すら分からない状態です。 (1)分析方法の選択 (2)結果の見方 以上2点、よろしくご教授いただけませんか? 何卒、ご尽力の程よろしくお願いします。

  • 統計は役に立たないのでは???

    ある事象を説明するために変数を設定しますよね。 そして、あらゆる要因(変数)を同時に考慮ないないと、疫学でいうところの「交絡因子」というバイアスになりますよね。 しかし、多変量解析を用いて予測式を立てたところでそれが使いものにならない場合が多いように感じるのです。 相関係数が著しく低くなったり、回帰係数が0になる確率が棄却できなかったり・・・共線問題が発生している可能性があったり・・・ そこで、一応の情報量基準を満たしたモデルの回帰式を使うことにしたとしても、独立変数のいくつかは除外されたモデルになったりします。 すると、結局は除外された独立変数は交絡因子として存在することになるし、また、考え付かなかったような(設定しなかった)独立変数も交絡因子となっている場合があると思います。 そのことに対して、一体論文ではどのように説明すればよいのでしょうか? こんな不完全な多変量解析なら、むしろ単(一)変量解析の検定を独立変数の個数回やったほうがいいのでは?

  •  統計の手法(多変量解析)についてSuggestionください。あまり

     統計の手法(多変量解析)についてSuggestionください。あまり詳しくないので、質問が正確ではないかもしれません。現在 サンプル数n=20-30人の解析をしています。それらの方々の解析因子のなかで、統計的に有意に単相関するパラメーターが2つあります。ここで、その相関する因子に一般的に影響を与える因子で補正したモデル式をつくり多変量解析をしたいと考えています。ひとつのモデル式のなかで、解析に加えられる因子はこの場合 多くても従属変数 3つまでと考えていますが、補正したい因子が5-6つある場合に 従属変数に2つ固定した因子(この場合、(1)証明したい変数 (2)年齢)にひとつずつこの補正したい因子を加えていき、4-5つのモデル式を構成して証明をするのはAcceptableでしょうか?

  • 量的データの独立性について

    質的2変数の独立性は(χ2乗分布を使った)独立性の検定が可能かと思いますが,量的2変数の独立性について検定する方法はあるのでしょうか? (無相関の検定しかできない,あるいは量的データをカテゴリ別に分けて質的データにするような方法しかありませんでしょうか?). ご存知の方,ご教授願いいたします.

  • 多変量解析と検定の違いは?

    現在、アンケート調査の回答分析について学んでいます。 しかし、多変量解析と統計的検定の違いがわからなくて困っています。 どんなときに解析を使い、またどんなときに検定を使えば良いのでしょうか? ちなみに多変量解析は共分散構造解析、検定はカイ二乗検定を学んでいます。