• 締切済み

相関係数の使い方

およそ関係のなさそうな2つの統計量の相関係数を計算した時に、値として’相関がある’という結果が出たのですが、これは信用すべきなのでしょうか、それともこの計算および分析が成立するのには何か条件があり使ってはいけない場面で使ってしまっているのでしょうか、詳しい方ご教示ください。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.3

「相関がない」という帰無仮説が非常に小さなp値で棄却できた。つまり、「本当は相関がないのに偶然こんなデータが得られる確率(p値)は、ものすごく小さい」、という状況かと思います。それなら、「相関がある」んですよ。誰憚ることなく、そう仰って構いません。  「およそ関係なさそう」と仰るけれども、相関関係というのは因果関係を表すものではありません。一方が他方の原因、もう一方がその結果、という意味ではないんです。  しばしば、両方に共通の原因があり、特にデータの取り方(サンプルの選び方)自体にその原因があるということがよくあります。ANo.2で「誰も相手にしてくれない」と仰っている例だって、両方に共通する原因として「データを取った年代の範囲では、おおむね平和であった。経済成長が続いていた。医学を含め科学技術が進歩し続けていた」などが考えられましょう。  むしろ、気に入った相関関係ばかりを言い立て(論文にしたり報道し)て、社会的風潮に反するような相関関係は黙殺・隠蔽する、という作為的な選別こそが、「統計の嘘」を生み出しています。(タバコが死に直結する毒であるかのように言うヒステリックなキャンペーンも、その一つの例です。)  さて、ご質問のタイトルおよび文中の「使う」という表現に危なっかしさを感じました。  仮に、相関関係を「勝手に因果関係と読み替えて使う」ということをなさっているのだとしたら、それは(「およそ関係なさそう」であろうが「ものすごく関係がありそう」であろうが)間違いです。

okada2728
質問者

お礼

早速のご回答ありがとうございます。 そのための検定なのですね。 実施してみます。

  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.2

>およそ関係のなさそうな2つの統計量の相関係数を計算した時に、値として’相関がある’という結果が出たのですが、これは信用すべきなのでしょうか、 例えば、年代毎のTVの普及率と、平均寿命とをプロットすると、如何にも相関がありそうなグラフを描くことができます。 これで、相関があると主張しても誰も相手にしてくれません。 >それともこの計算および分析が成立するのには何か条件があり使ってはいけない場面で使ってしまっているのでしょうか 相関性がある理由を述べられないのであれば、使ってはいけない場面で使っていると言えるでしょう。

okada2728
質問者

お礼

早速のご回答ありがとうございます。 合理性に先立って相関係数が利用できるのかなと一瞬思ったのですが、やはり合理性が先なのですね。

回答No.1

誰も今まで気づかなかった大発見をしたのかもしれません。ほかの手段を使ってさらに詳しく調べてみるとよいでしょう。   しかし,一般論ですが,普通は, およそ,合理的に考えて,関係があり得ないような二つの数値をもってきて,相関係数の計算だけしてみても,意味のないことだと思います。

okada2728
質問者

お礼

早速のご回答ありがとうございます。 やはり闇雲に使っては意味がないのですね。

関連するQ&A

  • 相関係数 有意差

    レポートで二つの関係を調べるために相関分析を行いました。 そこで相関係数は弱い相関がみられたのですが、有意差がみられませんでした。 有意差がみられないとは結果にどのような影響があるのしょうか? 統計初心者のため困ってます。 どうか教えてください、よろしくお願いします。

  • AMOS 相関係数が1を超えます

    今ひとつ統計の知識が疎かなまま,AMOSを使わなければならず,ご教示いただきたくお願いします。 ある仮説による尺度を用いて,あるグループにおこなったデータを検証的因子分析で検討しようとしています。 その結果,標準化推定値を求めたところ,ある2つの因子(潜在変数)間の相関係数が1.05となり,1を超えました。 相関係数はー1≦ α ≦ 1の値を取ると思うのですが,この原因や対処法などありましたら教えていただけませんでしょうか。 データを取った集団は,35名と小規模で,無作為に抽出した集団ではなく,比較的似通った回答をしているかもしれませんが,こういったことが一因なのでしょうか。

  • 相関係数の違いについて

    はじめまして、maro77と申します。 現在、学生と社会人に関する公共政策に対する意識調査のアンケートを各1000通づつ、2000通回収し、そのデータ分析をしております。 具体的には、属性(年齢、性別、職業〔学部〕など)と各設問の関係性を分析したり、設問の回答結果同士の関係性を分析しております。 現在、相関関係をみようと思っているのですが、ちょっと調べてみたところ、いろんな分析手法があり、困っております。 そこで、相関係数について質問があります。相関係数には、ピアソンの相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数のほか、クラメールの連関係数、ファイ係数、コンティンジェンシー係数、ケンドールのタウなどいろいろあることを知りました。 ピアソンの相関係数については、2変数が、数字のもの(年齢、年収、身長、体重など)の数値ではないと、求めていけないことを知りました。 しかし、そのほかの分析方法については、あまりよく違いがわかりません。 アンケート結果で得られたカテゴリーデータと順位データがある場合は、どの分析方法を使うのが正しいのでしょうか。また、これらは、どうゆう基準で使いわければよいのでしょうか?いろいろ調べたのですが、いまいち、頭の中のモヤモヤが晴れません。 お手数ですが、ご教示頂ければ幸いです。 宜しくお願い致します。

  • 相関を求める時の、はずれ値のはずし方

    こんにちは 現在、ある2つのデータの相関関係を調べています。 そのデータを散布図にしたところ、数個はずれ値が確認できました。 これのはずし方をご質問させてください。 はずれ値のはずし方について、標準偏差を考えるやり方などがありますが、そういった統計的手法ではなく、単に『はずしてみて分析してみた』というのは、ありなのでしょうか? 私は、この2つのデータの相関があることを言いたいだけで、それ以上に詳しい分析を行うつもりはありません。 しかし、統計的におかしはことはしたくありません。 そこで、話の流れとして、 『散布図を作って、相関係数を求めてみた。相関があった。けれど、はずれ値もあった』  ↓ 『はずれ値っぽいのを外してみて、相関係数を求めてみた。やっぱり相関があった』  ↓ 『いずれにせよ、相関はある』 はずす値がはずれ値であるかどうかが、主観によってしまうので、統計的にどうなのかな?と思ったので、ご質問させていただきました。 けれど、結局、はずしても、はずさなくても相関があるのなら、統計的にも話しの流れ的にも問題はないのでしょうか……。

  • Excelでの自己相関係数の計算結果が正しくない

    1次の自己相関係数の計算方法に二つあるのですが、それらで求めた値が違います。 どうやらExcelでの自己相関係数の計算結果が正しくないようです。 どう間違えているのか教えて下さい。 今、1次の自己相関係数を計算しようとしています(今回、そのデータはお見せしません)。 ネットで検索すると、 https://ocw.nagoya-u.jp/files/71/jiko-soukan.pdf が引っ掛かり、5ページ目の「自己相関係数の定義」に載っている式で手計算してみました。それなりの値が出たので満足しました。 しかし、Excel(実際はLibreOfficeですが)でもっと簡単に計算できないものかと思って検索し、 https://www.youtube.com/watch?v=DEy_iz1pzZU が引っ掛かりました。基になるデータを一つセルをズラして貼り、Excelの統計分析で「相関…」を選びました。すると、上記の計算とは違う値が出ました。 そこで、 https://bellcurve.jp/ex/sample/ex_08_TimeSeries.xlsx の「自己相関2」の例題を用いて同じように計算しました(結果は画像として添付してあります)。その結果、前者の手計算(-0.7166)が合っており、後者のExcelでの計算(-0.8173)が間違っているようです。 しかし、Excelでの計算も考え方としては合っているように思います。なぜ違う値が出てしまったのでしょうか?(更には、Excelで正しく計算する方法はありますか?) よろしくお願いします。

  • 相関係数について教えて下さい

    算出された相関係数の見方について疑問があります。 知識のある方、教えて頂ければ幸いです。 下のようなデータがあるとします A 100→200→400→800 B 50→100→200→400 C 50→150→350→750 AとB AとC、の数列の相関について考えるとします。 *BとC の相関については考えません。 Aの数列は100からスタートして次は2倍、その次は前の数字の2倍と、倍、倍で増加します。Bの数列は、50からスタートして、次は2倍、その次は前の数字の2倍と、倍、倍で増加します。 AとBは数の増加率が同じ場合です。ここでA,Bの相関係数を 計算すると、1と算出されました。 次にCですが、Cの数列はAの数列の増加する値と同じ値を 加算していきます。Aは最初の100に対して、次は200なので、 100の増加、するとCも、最初の50に対して100増加させています。 2行目以降も同じです。このAとCの相関係数を計算しても、1と算出されました。 AとB の相関係数は1 AとC の相関係数も1 Bと、C の数の増加は明らかに違うのに、両方共に Aに対する相関係数が1と出てきてしまいました。 どのように解釈して良いのか困っています。 私が素人判断で勝手に考えていたのは、 AとBは相関が一致していて、 AとCは増加する傾向は同じであるが、変化量の割合に違いがある為、 AとBほどには相関が高くない数字が出るとばかり思っていました。 相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか?   

  • Excelで相関係数を求めた時に表示される「~E-~」(~は数値)とは

    Excelで相関係数を求めた時に表示される「~E-~」(~は数値)とは? Excelで“=correl(~,~)”を用いて相関係数をいくつか出したのですが、 そのうち数個の相関係数が「1.92639E-16」とか「9.64107E-17」などと出ました。 相関係数の値は0~±1.0の範囲だけだと思っていたのですが、 何故このような計算値が出てしまったんでしょうか? また、この値をどのように解釈したらよいのでしょうか? 統計にはあまり慣れていないので、ご存知の方がいらっしゃいましたら、 なるべく分かり易い単語での回答をよろしくお願い致します。

  • 相関係数

    相関係数を求める計算方法を教えて下さい。 使用するソフトはExcelですが、分析ツール・相関係数を求める関数は使えないというルールがあります。 例として数字を挙げさせていただきます。 A B 1 1059 2 6843 3 7548 4 2489 5 3151 6 2246 7 4832 8 2484 9 1256 10 3218 移動平均を求め、Aと移動平均のデータ間の相関係数を求めるというものです。 移動平均の区間は3とさせていただきます。 よろしくお願いします。

  • 共分散と相関係数の、単位による影響

    統計学の次のような問題について質問があります。 「ゾウの体重(トン)と体高(m)を調べ、共分散が2.56、相関係数が 0.789という数値が得られた。もし体重をkg、体高をcmで計算し直すと 共分散と相関係数はどのような値をとるか?」 といったものです。 相関係数はそのまま0.789で良いと思うのですが、共分散の計算が わかりません。2.56×1000×100 =256000で良いのでしょうか? よろしくお願いいたします。

  • 相関係数

     相関係数を求める際、特出した値を計算式に含むべきかどうかの検定法を教えてください。  特出した値がある場合、その値が全ての値を引っ張ってしまって、あたかも相関があるように思われてしまうため、特出した値の検定法が必要だと思われるのですが・・・。  宜しくお願いします。