• 締切済み

相関係数について教えて下さい

算出された相関係数の見方について疑問があります。 知識のある方、教えて頂ければ幸いです。 下のようなデータがあるとします A 100→200→400→800 B 50→100→200→400 C 50→150→350→750 AとB AとC、の数列の相関について考えるとします。 *BとC の相関については考えません。 Aの数列は100からスタートして次は2倍、その次は前の数字の2倍と、倍、倍で増加します。Bの数列は、50からスタートして、次は2倍、その次は前の数字の2倍と、倍、倍で増加します。 AとBは数の増加率が同じ場合です。ここでA,Bの相関係数を 計算すると、1と算出されました。 次にCですが、Cの数列はAの数列の増加する値と同じ値を 加算していきます。Aは最初の100に対して、次は200なので、 100の増加、するとCも、最初の50に対して100増加させています。 2行目以降も同じです。このAとCの相関係数を計算しても、1と算出されました。 AとB の相関係数は1 AとC の相関係数も1 Bと、C の数の増加は明らかに違うのに、両方共に Aに対する相関係数が1と出てきてしまいました。 どのように解釈して良いのか困っています。 私が素人判断で勝手に考えていたのは、 AとBは相関が一致していて、 AとCは増加する傾向は同じであるが、変化量の割合に違いがある為、 AとBほどには相関が高くない数字が出るとばかり思っていました。 相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか?   

みんなの回答

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.4

こんばんは。 すべてのデータが、直線 y=ax+b の上にあるとき、 相関係数rは必ず1か-1になります。 a>0であればr=1、a<負であればr=-1です。 rが正のときは「正の相関がある」と言い、xが大きくなるほどyも大きくなります。 rが負のときは「負の相関がある」と言い、xが大きくなるほどyが小さくなります。 相関係数は、一次近似の最小二乗法の産物ですが、 一次近似の最小二乗法というのは、何をやっているのかというと、 「グラフ用紙を縦か横に引き伸ばして、  直線の傾きを45度か、-45度のどちらかに規格化している」 ということをやっています。 これは、まったく合理的なことです。 このことは、そうでないことを考えれば明らかです。 45度からかけ離れた角度、たとえば、10度以下とか80度以上のグラフを描くと、 どんなデータであっても、直線の関係があるように見えてしまいます。 --------------------------------------- ちなみに、 相関係数には、というか、一次近似の最小二乗法には、大きな欠点があります。 それは、 左右対称、または、上下対称のデータの場合、r=0(相関なし)になってしまうことです。 <例1> 円の円周上の点の座標を1°刻みで、360個の(x、y)データにしたとしましょう。 半径の長さや中心の座標は、どこでもよいです。 相関係数は、ゼロになります!!! <例2> 左右対称な二次関数のデータ、たとえば、 -10 ≦ x ≦ +10 という範囲で、 y = 3x^2 + 5 の上の点の座標を、x座標を 0.1 刻みで計算して、(x、y)データにしたとしましょう。 これも、相関係数はゼロになります!!! つまり、人間の目には明らかに相関があるデータ(グラフの図形)なのに、 一次近似では、まったく相関がないことになってしまうことがあるわけです。 --------------------------------------- >>>相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか? 「変化の量も測定できるような、統計数値」 は、y=ax+b における a だけ見ればよいだけの話です。 得られた式のaやbの信頼度、つまり、aの誤差やbの誤差は、最小二乗法の結果の一つとして求まります。 これらは、数字の大きさも加味されます。 Excelの関数にもあるはずです。 ただし、r=1 の場合は、当然ながら、aの誤差もbの誤差もゼロになります。 相関係数について「変化の量も測定」というのは、 上記した「45度からかけ離れた角度」のグラフを描くことと同じですから、全く無意味です。 これに関しては、相関係数の種類を変えても同じことです。 以上、ご参考になりましたら。

  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.3

y=F(A) が、 直線上に乗るのであれば、 yが、どんな値であろうと、 相関係数は「1]になります。 要するに、 y=kA+Const になっていれば、相関係数は「1]です。 直線に乗るというのは、決定係数が「1]になるということです。 相関係数は、決定係数の平方根です。

  • 25no12
  • ベストアンサー率53% (35/66)
回答No.2

相関係数は、「各データの平均からのずれを表すベクトルのなす角の余弦」なのだそうです。 「平均からのずれ」だけが問題になるわけです。 AとCを比べると、各因子がすべて、c=a-50の関係になっています。 平均からのずれは・・・当然ぴったり一致しますね。

noname#227064
noname#227064
回答No.1

相関関係をみる場合、まず散布図を描かれることをお勧めします。

関連するQ&A

  • 相関係数

    相関係数を求める計算方法を教えて下さい。 使用するソフトはExcelですが、分析ツール・相関係数を求める関数は使えないというルールがあります。 例として数字を挙げさせていただきます。 A B 1 1059 2 6843 3 7548 4 2489 5 3151 6 2246 7 4832 8 2484 9 1256 10 3218 移動平均を求め、Aと移動平均のデータ間の相関係数を求めるというものです。 移動平均の区間は3とさせていただきます。 よろしくお願いします。

  • 相関係数が1になるのはなぜ

    データ群Aとデータ群Bの相関係数を調べようとしています。 データ群Aはy=x データ群Bはy=2x-5 0<=x<=10 このデータ群の相関係数を 共分散/(√Aの分散×√Bの分散) で計算すると相関係数が1となります。 明らかにデータ群AとBが違っているのに相関係数が1になるのはなぜなのか、また、このデータ群の相関係数の正しい求め方を教えてください。 よろしくお願いします。

  • 相関係数の特徴

    A群とB群のデータがある場合、A群の値にB群の値はどれだけ近いか示すために相関係数を用いたのですが、その後、重相関係数があることを知りました。 しかし、相関係数と重相関係数の違いがよくわかりません。 相関係数と重相関係数の違いや、用いるべき現象等について、ご存知の方がいましたら教えてください。よろしくお願いします。

  • 相関係数 却求め方

    初めてなんですけどぜひ皆様の力を貸してください。 問題が皆様にうまく伝わるかちょっと心配ですが・・・ たとえば今までは三つの数字a、b、cの相関係数がエクセルのCORRELなどの関数を使えばYになるのは分かったんですけど却に3番目の数字Cが幾つになれば相関係数がYになるかを求めたいんですがその求め方法を分かっている先生方がいらっしゃればぜひ教えで頂ければありがたいです。 ちなみに手書きではなくPCかエクセルを使っての方法であれば幸いです。 例:(1) 50,100,150の相関係数は1ですね。(CORREL関数)     50,100、?が幾つになれば相関係数が1になるんですか?   (2) 110,130,180の相関係数は0.970725ですね。(CORREL関数)    110,130、?が幾つになれば相関係数が0.970725になるんでか?という問題ですが・・・  ぜひよろしくお願い致します。

  • 相関係数 入力方法

    =CORREL(A1:A12,B1:B12)の計算式をつかって2つの相関係数はわかるのですがデータが三個以上の場合、=CORREL(A1:A12,B1:B12,C1:C12)とするとエラーになりますがどういう入力をすればABCの相関係数がわかりますか?

  • エクセルで相関係数

    『AとB』、『AとC』の相関係数を エクセルで出したいのですが、 どうしたらいいのかわかりません。 Aの数値は、0.24、0.44、0.32、0.42、0.21、0.33で、 Bの数値は、2.60、2.53、2.71、2.48、1.63、1.98で、 Cの数値は、1.79、1.56、2.13、1.98、1.37、1.37です。 ピアソンの積率相関係数というものを使って 出したいのですがさっぱりわかりません。 分かる方教えてください。 よろしくお願いします。

  • 相関係数、決定係数からの考察

    説明変数x、被説明変数a,bがあったとします。 そこで例えば xに対してaの相関係数、決定係数がそれぞれ0.5、0.6 xに対してのbの相関係数、決定係数がそれぞれ0.7,0.8 であったとします。 この場合では、xはaよりもbの方をよりよく説明していると思うのですが、その理由は何でしょうか? 相関係数、決定係数の値が高いから…というのは何となく違うというかすっきりしないです(間違ってるのかもですが) 回答の程お願いします。

  • 相関係数について

    お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

  • 相関係数

     相関係数を求める際、特出した値を計算式に含むべきかどうかの検定法を教えてください。  特出した値がある場合、その値が全ての値を引っ張ってしまって、あたかも相関があるように思われてしまうため、特出した値の検定法が必要だと思われるのですが・・・。  宜しくお願いします。

  • 相関係数から別の値を導く方法ってありますか?

    今、2つのグラフのデータが A:69,105,42,23 B:133,181,127,59 となっていて 2つのグラフA,Bの相関係数を求めたら0.93でした。 AとBのグラフが似ているので、Aに新たなデータ(数値)が追加されたときに、 Bには相関が保たれるような値が追加されるはず!」ということを前提に Bに追加される値を求める方法を知りたいんですが、 求める方法をご存知の方がいらっしゃったら教えてください。 プログラムを書いて相関係数が1に近づくまで計算させて、閾値に達したら、 その時の入力値を出力するという方法もあるようですが、 やはりそれでしか求められないでしょうか? 式変形だけでは難しいですか?