- 締切済み
相関係数の使い方
およそ関係のなさそうな2つの統計量の相関係数を計算した時に、値として’相関がある’という結果が出たのですが、これは信用すべきなのでしょうか、それともこの計算および分析が成立するのには何か条件があり使ってはいけない場面で使ってしまっているのでしょうか、詳しい方ご教示ください。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- stomachman
- ベストアンサー率57% (1014/1775)
「相関がない」という帰無仮説が非常に小さなp値で棄却できた。つまり、「本当は相関がないのに偶然こんなデータが得られる確率(p値)は、ものすごく小さい」、という状況かと思います。それなら、「相関がある」んですよ。誰憚ることなく、そう仰って構いません。 「およそ関係なさそう」と仰るけれども、相関関係というのは因果関係を表すものではありません。一方が他方の原因、もう一方がその結果、という意味ではないんです。 しばしば、両方に共通の原因があり、特にデータの取り方(サンプルの選び方)自体にその原因があるということがよくあります。ANo.2で「誰も相手にしてくれない」と仰っている例だって、両方に共通する原因として「データを取った年代の範囲では、おおむね平和であった。経済成長が続いていた。医学を含め科学技術が進歩し続けていた」などが考えられましょう。 むしろ、気に入った相関関係ばかりを言い立て(論文にしたり報道し)て、社会的風潮に反するような相関関係は黙殺・隠蔽する、という作為的な選別こそが、「統計の嘘」を生み出しています。(タバコが死に直結する毒であるかのように言うヒステリックなキャンペーンも、その一つの例です。) さて、ご質問のタイトルおよび文中の「使う」という表現に危なっかしさを感じました。 仮に、相関関係を「勝手に因果関係と読み替えて使う」ということをなさっているのだとしたら、それは(「およそ関係なさそう」であろうが「ものすごく関係がありそう」であろうが)間違いです。
- shintaro-2
- ベストアンサー率36% (2266/6245)
>およそ関係のなさそうな2つの統計量の相関係数を計算した時に、値として’相関がある’という結果が出たのですが、これは信用すべきなのでしょうか、 例えば、年代毎のTVの普及率と、平均寿命とをプロットすると、如何にも相関がありそうなグラフを描くことができます。 これで、相関があると主張しても誰も相手にしてくれません。 >それともこの計算および分析が成立するのには何か条件があり使ってはいけない場面で使ってしまっているのでしょうか 相関性がある理由を述べられないのであれば、使ってはいけない場面で使っていると言えるでしょう。
お礼
早速のご回答ありがとうございます。 合理性に先立って相関係数が利用できるのかなと一瞬思ったのですが、やはり合理性が先なのですね。
- he-goshite-
- ベストアンサー率23% (189/802)
誰も今まで気づかなかった大発見をしたのかもしれません。ほかの手段を使ってさらに詳しく調べてみるとよいでしょう。 しかし,一般論ですが,普通は, およそ,合理的に考えて,関係があり得ないような二つの数値をもってきて,相関係数の計算だけしてみても,意味のないことだと思います。
お礼
早速のご回答ありがとうございます。 やはり闇雲に使っては意味がないのですね。
お礼
早速のご回答ありがとうございます。 そのための検定なのですね。 実施してみます。