- ベストアンサー
相関係数が1になるのはなぜ
データ群Aとデータ群Bの相関係数を調べようとしています。 データ群Aはy=x データ群Bはy=2x-5 0<=x<=10 このデータ群の相関係数を 共分散/(√Aの分散×√Bの分散) で計算すると相関係数が1となります。 明らかにデータ群AとBが違っているのに相関係数が1になるのはなぜなのか、また、このデータ群の相関係数の正しい求め方を教えてください。 よろしくお願いします。
- kitakazetotaiyou
- お礼率35% (47/134)
- 数学・算数
- 回答数3
- ありがとう数1
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
リンク先あたりを読むと良いかもです。簡単に言えば「どのくらい比例関係(線形従属の関係)に近いか」を示す指標のようなものなので、比例していれば1(または-1)になります。 y=ax+bで、 xの平均値をpとすれば、yの平均値はap+bですからyの分散は √Σ(a(Xn)+b-(ap-b))^2 =√Σ(a(Xn-ap))^2 =√Σ(a・(Xn-p))^2 =a・(√Σ(Xn-p)^2) 一方、xのほうはというと √Σ(Xn-p)^2 なんで、両者を掛け算すると、 a・(√(Σ(Xn-p)^2)^2) =a・(Σ(Xn-p)^2) で、分子を見ると、 Σ(xn-p)(a(Xn)+b-(ap-b)) =Σ(xn-p)(a・(xn-p)) =a・(Σ(xn-p)^2) なーんだ、一緒ジャン・・・とな
その他の回答 (2)
- Ishiwara
- ベストアンサー率24% (462/1914)
データAとデータBが互いに関数関係で結ばれているときに相関係数を求めるのは無意味です。今回は1次式なので、あなたが間違いに気付くことができましたが、もし2次式だったら相関係数が±1にならないので、気付かないまま過ちを犯したでしょう。 相関分析とは「互いにゆるい関係で結ばれている」場合に、そのゆるさ(きつさ)を求めるものです。「一方を決めれば他方が一意に決まる」といった「100%きつい関係」の場合には、行いません。
- backs
- ベストアンサー率50% (410/818)
数式的にはNo.1さんの回答の通りなのでしょうが、コンピュータを使って確かめてみるのが一番手っ取り早いというか、わかりやすと思いますよ。 Excelでもできますが、簡単なのはRでやることです。ダウンロードしてインストールするのが面倒で嫌ならweb上で試すこともできます(http://bayes.math.montana.edu/Rweb/Rweb.general.html)。 以下のコードをそのままコピペして、[Submit]ボタンをクリックすればOKです。 # ここから x <- seq(0, 10, 0.01) groupA <- x groupB <- 2*x - 5 soukan <- cor(groupA, groupB) plot(groupA, groupB, main=soukan) # ここまで
関連するQ&A
- 統計学、共分散・相関係数です
Y=1 Y=3 X=2 2/8 1/8 X=4 3/8 2/8 という同時確率分布における共分散と相関係数なのですが…XとYの共分散は1/16、相関係数は400/289と出たのですが…合ってあるでしょうか?すごく間違ってる気がするのですが(>_<)。 間違えていましたら、正しい答えを教えて頂けたら非常に助かります;。ヒントでも結構です。お願いします!
- ベストアンサー
- 数学・算数
- 相関がないのに相関係数が1???
相関係数の意味を考えていて、理解できないことが出てきたので教えて下さい。 変数Xと変数Yの相関係数の求め方は、データ数がnの時、 1.変数X,Yの平均値を求める。ここでは、X^、Y^と書くことにします。 2.変数X,Yの標準偏差を求める。ここでは、σx、σyと書くことにします。 3.変数X,Yを基準化する。 基準化したX=(X-X^)/σx、 基準化したY=(Y-Y^)/σy 4.基準化したX,Yの積の平均が相関係数である。 r=1/n・Σ{(基準化したX)・(基準化したY)} となります。 基準化したXと基準化したYの積が全て1のデータの場合、 例えば、(1,1)、(0.5,2)、(0.4,2.5)、(0.1,10)、(0.01,100)、(-1,-1)、(-0.5,-2)、(-0.4,-2.5)、(-0.1,-10)、(-0.01,-100)‥‥‥ 双曲線になりますが、平均値と標準偏差で元のデータに戻しても、双曲線みたいなデータの散布図になります。つまりXが大きければYも大きいという関係がないにもかかわらす相関係数は1になってしまいます(というか1になるようにデータを選んだ)。 考え方に間違いがありますか。
- 締切済み
- 数学・算数
- 相関係数についての証明問題
相関係数についての問題です。 途中まで考えたのですが、分かりません。 ご協力お願いいたします。 2変数の組(x,y)があり、y=ax+b(a,bは定数)とするとき a>0のときは相関係数r=1、a<0のときは、r=-1 を証明する問題です。 r=Sxy/SxSy (Sxyは共分散) の式にあてはめて証明することと Sxy=aSx^2 Sy^2=a^2Sx^2 を使うんだろうなあ、という所までは分かるのですが ここから先どうしたらよいのか分かりません。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数
- 相関係数について教えて下さい
算出された相関係数の見方について疑問があります。 知識のある方、教えて頂ければ幸いです。 下のようなデータがあるとします A 100→200→400→800 B 50→100→200→400 C 50→150→350→750 AとB AとC、の数列の相関について考えるとします。 *BとC の相関については考えません。 Aの数列は100からスタートして次は2倍、その次は前の数字の2倍と、倍、倍で増加します。Bの数列は、50からスタートして、次は2倍、その次は前の数字の2倍と、倍、倍で増加します。 AとBは数の増加率が同じ場合です。ここでA,Bの相関係数を 計算すると、1と算出されました。 次にCですが、Cの数列はAの数列の増加する値と同じ値を 加算していきます。Aは最初の100に対して、次は200なので、 100の増加、するとCも、最初の50に対して100増加させています。 2行目以降も同じです。このAとCの相関係数を計算しても、1と算出されました。 AとB の相関係数は1 AとC の相関係数も1 Bと、C の数の増加は明らかに違うのに、両方共に Aに対する相関係数が1と出てきてしまいました。 どのように解釈して良いのか困っています。 私が素人判断で勝手に考えていたのは、 AとBは相関が一致していて、 AとCは増加する傾向は同じであるが、変化量の割合に違いがある為、 AとBほどには相関が高くない数字が出るとばかり思っていました。 相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか?
- 締切済み
- 数学・算数
- 相関係数の計算
指数関数 y = B * e^ax 式(*) で近似できるデータがあります。 その近似がどのくらい正しいかを調べたいのですが 曲線の相関係数というのが分かりません。そのために 上式の対数を取って直線関係にしました。 相関係数をエクセルで計算できるからです。 ln(y) = ax + ln(B) この場合の相関係数は、式(*) の相関係数として使えるので しょうか? 適当な方法があるのだと思いますが ご存じの方がいらっしゃいましたら教えてください。
- 締切済み
- その他(学問・教育)
お礼
ありがとうございます。 確かに比例しているから相関係数は1ですね。 では、データA群とB群がどれだけ近いかを示す指標はどのように求めるのか教えていただけませんでしょうか。 よろしくお願いします。