• ベストアンサー

【-1≦相関係数r≦+1】の証明について

【-1≦相関係数r≦+1】の証明を シュヴァルツの不等式を使わずに行なったのですが ☆の部分について、教えて頂きたいと思っております。 よろしくお願いいたします。 xiとyiについて zi=(xi-xbar)/Sx(・・・・・・xbar:xの平均値、Sx:標準偏差) wi=(yi-ybar)/Sy(・・・・・・ybar:yの平均値、Sy:標準偏差) とするとき r=(1/n)Σziwiであるので 【証明】 (1/n)Σ(zi±wi)^2=(1/n)Σ(zi^2±2ziwi+wi^2)(・・・^2=二乗) =(1/n)Σzi^2±(1/n)Σ2ziwi+(1/n)Σwi^2 ☆=1±2r+1☆ =2(1±r) 左辺は二乗なので常にプラスである。 1±r≧0よって -1≦r≦+1 と言うところまで色々あって分かったような気がします。 そこで質問なのですが ☆のところで (1/n)Σzi^2と(1/n)Σwi^2が 1に変化するのはナゼですか。 ziとwiの分散については標準化した値であることから 両方とも「1」であるのは分かるのですが (1/n)Σzi^2と(1/n)Σwi^2が分散の式とどうしてイコールなのか わかりません。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • zk43
  • ベストアンサー率53% (253/470)
回答No.5

E(X)は確率変数Xの期待値・平均という意味。 Expectationの頭文字ですかね。 これを使うと、E(X+Y)=E(X)+E(Y),E(aX)=aE(X)のように関数のように 扱えて便利。 ほかにV(X)はXの分散、D(X)はXの標準偏差を意味します。 VarianceとStandard Deviationから。 C(X,Y)あるいはCov(X,Y)はX,Yの共分散(Covariance) R(X,Y)あるいはρ(X,Y)はX,Yの相関係数(Correlation Coefficient) も良く使います。 確率・統計では一般的に使う記号です。 小文字のsxとか使うときは定数として使うとき、Eとか使うときは関数 として扱うとき、のような感じですかね。厳密な使い分けはないですけ ども。場面によって使いやすい方を使うということで。

anteater
質問者

お礼

ありがとうございます。とても分かりやすいです。 これでぜんぶ分かったと思います。

その他の回答 (4)

  • zk43
  • ベストアンサー率53% (253/470)
回答No.4

E[(X-mx)^2]=sx^2 E[(Y-my)^2]=sy^2 E[(X-mx)(Y-my)]=sxy であり、nは掛かりません。 そもそも、分散というのは確率変数の平均からのずれの2乗の平均、 共分散というのは2つの確率変数の平均からのずれの積の平均です。 離散型ならば、E[(X-mx)^2]=Σ(xi-mx)^2/nのようになっているので、 E[(X-mx)^2]のほうに1/nが含まれているということです。 Σ(xi-mx)^2だけでは、単に確率変数の平均からのずれの2乗和を取っ ていることになり、平均ではありません。これをnで割って初めて 平均になります。 定義そのものの理解が怪しい印象を受けるので、相関係数の前にもう一 度、平均、分散、標準偏差、共分散を復習された方が良いような印象を 受けます。

anteater
質問者

お礼

ご回答ありがとうございます。 お恥ずかしいかぎりです。 すみません、「E=Σ」だと誤解していました・・・。 この「E」を見たことが無いのですがどういう意味でしょうか。 検索したのですが分かりませんでした。 再度本当にお手数ですがよろしくお願いいたします。

  • zk43
  • ベストアンサー率53% (253/470)
回答No.3

ご質問の証明は離散型の確率変数の場合なので、一般的な証明として、 確率変数X,Yに対して、Z=(X-mx)/sx±(Y-my)/sy という確率変数の2乗の平均を考えれば良いと思います。 ここに、mx,myはそれぞれX,Yの平均、sx,syはそれぞれX,Yの標準偏差。 0≦E(Z^2)=E[(X-mx)^2/sx^2±2(X-mx)(Y-my)/sxsy+(Y-my)^2/sy^2] =E[(X-mx)^2]/sx^2±2E[(X-mx)(Y-my)]/sxsy+E[(Y-my)^2]/sy^2 =sx^2/sx^2±2sxy/sxsy+sy^2/sy^2 =1±2rxy+1 =2(1±rxy) ここに、sxyはX,Yの共分散、rxyはX,Yの相関係数。 よって、-1≦rxy≦1 (1/n)Σzi^2が1になるのは、 E[(X-mx)^2/sx^2]=E[(X-mx)^2]/sx^2=sx^2/sx^2=1 が対応しています。

anteater
質問者

お礼

ありがとうございます。よく分かりました! 離散的な確率変数の話でしたか・・・。 一点、質問をお願いいたします。 E[(X-mx)^2]/sx^2=sx^2/sx^2 なのはこのひとつ手前の式が E[(X-mx)^2]=nSx^2 2E[(X-mx)(Y-my)]/sxsy=nsxy/sxsy E[(Y-my)^2]=nSy^2 で すべての項にあったnを消しているから、という解釈でよかったのでしょうか。 よろしくお願いいたします。

noname#101087
noname#101087
回答No.2

>(1/n)Σzi^2と(1/n)Σwi^2が分散の式とどうしてイコールなのか.... 標準偏差(Sx)の定義を見なおしてください。 たとえば、   Sx^2 = (1/n)Σ(xi-xbar)^2 ですね。 一方、   zi^2 = (xi-xbar)^2/Sx^2 ですから、その総和をとって n で割ると、   (1/n)Σ(xi-xbar)^2/Sx^2 = Sx^2/Sx^2 =1 になる、ということじゃないのでしょうか。

anteater
質問者

お礼

ありがとうございます。 すみません(><)統計あんまり得意じゃないもので ちょっと分からないのですが >総和をとって n で割ると、 とありますがこの場合、式のほかの部分についても 総和をとってnで割っているのでOKという解釈でよかったでしょうか。

  • Mr_Holland
  • ベストアンサー率56% (890/1576)
回答No.1

 (1/n)Σzi^2 =(1/n)Σ{(xi-xbar)/Sx}^2 =(1/Sx^2)(1/n)Σ(xi-xbar)^2 =(1/Sx^2)Sx^2      (∵ 分散の定義より、(1/n)Σ(xi-xbar)^2=Sx^2 ) =1  wiについても同様に、  (1/n)Σwi^2 =(1/n)Σ{(yi-xbar)/Sy}^2 =(1/Sy^2)(1/n)Σ(yi-ybar)^2 =(1/Sy^2)Sy^2 =1

anteater
質問者

お礼

早い回答をありがとうございます! そうかーそこからSxが出てくるんですね。 よくわかりました。

関連するQ&A