• ベストアンサー

共分散で分かること

文系ですが、今ゼロからシリーズの統計確率を読んでいます。その中で共分散という言葉がでてきます。その式は  C(X,Y)=E(XY)-E(X)E(Y) というもので、その解説の前の問題で  赤球3個、白球2個、青球1個 計6個より無作為に2個取り出すとき、赤球の個数をX、白球の個数をYとして ちょうど 、上の式 共分散の式で、値が、-4/15 とでています。 これで何が分かるのでしょう その前の問題では、同時確率分布、周辺分布ほ求めていますが、これは、理解できます。

質問者が選んだベストアンサー

  • ベストアンサー
  • shkwta
  • ベストアンサー率52% (966/1825)
回答No.2

x=X-E(X) y=Y-E(Y) とおくと、xとyは平均が0の分布になります。 E(xy)=E(XY)-E(YE(X))-E(XE(Y))-E(E(X)E(Y)) =E(XY)-E(X)E(Y)=C(X,Y) ということで、E(xy)は共分散です。 E(xy)が正だということは、x>0 and y>0 であったり、x<0, y<0であることが多いことを意味します。xy座標でいうと、第1象限、第3象限の点が、共分散を大きくするのに寄与します。それも、原点から遠い点ほど寄与が大きくなります。 E(xy)が負だということは、x>0 and y<0 であったり、x<0, y>0であることが多いことを意味します。xy座標でいうと、第2象限、第4象限の点が、共分散を小さくするのに寄与します。それも、原点から遠い点ほど寄与が大きくなります。 ということで、共分散が正であることは、Xが大きくなるとYも大きくなる傾向があることを示します。共分散が負であることは、Xが大きくなるとYが小さくなる傾向があることを示します。 ご質問の例では、取り出す球の個数は2個と限られていますので、当然ながら、赤が増えれば白が減る、白が増えれば赤が減るという傾向があります。共分散が負であることは、この傾向を反映しています。 共分散を、Xの標準偏差とYの標準偏差で割ったものを相関係数といい、X・Yのスケールに影響されないので、XとYの関係を把握するのに便利です。

rinri503
質問者

お礼

分散の1種であることは、なんとなく想像していたのですが、たとえで、負の傾向の意味が分かりました。そういえば、正の相関、負の相関というのが、ありましたが、すっかり、忘れていました。最後まで読めば、意味がつながるのかも、しれませんか。ありがとうございます

その他の回答 (2)

  • shkwta
  • ベストアンサー率52% (966/1825)
回答No.3

No.2です。 訂正します。 4行目の最後の符号はプラスです。 E(xy)=E(XY)-E(YE(X))-E(XE(Y))+E(E(X)E(Y))

  • sunasearch
  • ベストアンサー率35% (632/1788)
回答No.1

簡単に言うと、 E(XY)が大きくなると、C(X,Y)も大きくなりますので、 XとYが同時に大きな値を取るほど、その平均であるE(XY)ならびに共分散C(X,Y)が大きくなります。 そのため、二つの変量X,Yの間の相関関係を調べることができます。

参考URL:
http://akimichi.homeunix.net/~emile/aki/medical/Stat/#***%20共分散
rinri503
質問者

お礼

参考ページありがとうございます。意味するところ、わかったような気がします。なにしろ、難しいですね

関連するQ&A

  • 袋の中に赤球2個、白球3個が入っている。この中から

    袋の中に赤球2個、白球3個が入っている。この中から2個取り出し、次にそれらを戻してから再び2個取り出す。はじめに取りだしたときの赤球の個数をX、次に取り出した時の赤球の個数をYとする。このときX+Y,XY それぞ れの平均を求めよ。 この問題の答えを教えてください。

  • 共分散の求め方。

    2社の株価の予想変化率に関する確率分布は以下の様に与えられています。 A社の予想株化上昇率をXという確率変数で表し、B社についてはYとする。 表:2社の株化の変化率に関する確率分布      |  A社の株化上昇率(%)      |  -10  0  10 ――――|―――――――――――――― B -20| 0.10  0.05  0.10 社   5| 0.10  0.20  0.05 の  30| 0.20  0.15  0.05 上 昇 率 このときに、XとYに関する共分散を求めたいのですが XとYが独立でない時、 Cov(X,Y)=E(XY)-E(X)E(Y) となるのは分かるのですが E(XY)の計算の仕方がわかりません。 ノートには、 E(XY)=E{Y・E(X|Y)} と書いているのですが これってどうやって計算するのですか? 教えてください。お願いします。 できればテストのある月曜までに ご回答よろしくお願いします。。 正確な解答はなくてもE{Y・E(X|Y)}の 計算方法だけでもけっこうです。

  • 分散について

    以下のような問題があります。 問題 「正規分布(μ1,σ1^2)に従う確率変数x1と、 正規分布(μ2,σ2^2)に従う確率変数x2の積 y=x1・x2の分散V(y)をμ1,μ2,σ1,σ2で表せ」 この問題を解きたいのですが、つまってしまいました。 とりあえず、 V(y)=V(x1・x2) =E((x1・x2)^2)+E(x1・x2)^2 とすすめていくと思うのですが…。 答えの導き方を教えてくださいm(_ _)m

  • 【緊急です】期待値、分散について

    【緊急です】期待値、分散について 今日の統計学の試験勉強をしていたら以下の質問がわからなくなり、困っています。 平均E(x)=5、E(x^2)=30のとき分散Var(x)=??となる。さらにE(y)=1,E(xy)=-1ならば、共分散Cov(x,y)=-6である。n-3のとき平均u、分散σ^2=1の正規母集団から無作為抽出された標本(x1,x2,x3)について、Σi=1 n(xi―標本平均値xバー)^2の期待値E(Σ(xi―標本平均値xバー)=???である。またE(Σ(xi-u)^2=???となる。 以上3点の問題がわかりません。噛み砕いて説明していただけると幸いです。

  • 分散と共分散の導出(証明問題)

    統計学の問題で困っています。 どなたか解ける方おられましたら、是非教えていただきたいです。 よろしくお願いします。 ---------- 確率変数X,Yの平均が0、分散が1、共分散がρならば、Z=X-ρYとしたとき E(Z)=0 Var(Z)=1-ρ^2 Cov(Z,Y)=0 となることを示せ。

  • 分散の証明中

    var(X+Y)=var(X)+var(Y)の証明の解答を見ていたときにXYが独立である時共分散は以下のようになると書かれていました・・・ E[XY-XE(Y)-YE(X)+E(X)E(Y)]=E(XY)-E(X)E(Y)=0 しかしなぜ左の式から真ん中の式に変換できたのか分かりません。どなたか教えてください。。

  • 分散・共分散

    確率変数Xの分布が0を境に対称であるとき、XとY=X^2の共分散が0であることを示すのと、またXとZ=X^3の共分散がどのようになるのかわかりません。教えてください。

  • 確率変数の商の分散

    ポートフォリオ運用におけるリスクのコントロールの観点から、確率変数の商の分散を定式化する必要に迫られています。具体的には、XとYの二つの確率変数の商(X/Y)の分散をどう求めるかということです。X,Yともに正規分布するものと仮定し、それぞれN(μ1,σ1^2)とN(μ2,σ2^2)という平均と分散を持つものとします。加えて、XとYの共分散cov(X,Y)も考えるものとします。 XとYが独立でともにN(0,1)の標準正規分布になる場合は、X/Yはコーシー分布となり、分散がないということまではわかりましたが、そうでない場合の式の展開について、アドバイスをいただけると大変助かります。

  • 共分散について

    分散が 1 の確率変数 X,Y の共分散を Cov[X, Y] とするとき、 Cov[aX + Y, X - aY] = 0 となる条件を求めよ。 という問題があるのですが・・・・これは Cov[X, Y] に関して X,Y が独立の場合は Cov[X, Y] = E[X, Y] - E[X]E[Y] = 0 ---- (*) となることを用いて、与式の (aX + Y) と (X - aY) が独立であるということを示せばよいのでしょうか? また、結局 a の値が 0 のときは (*) と等しくなるので、 a = 0 というのも条件となるのでしょうか? そのほか、別の解法もあるかもしれませんが・・・・回答よろしくお願いしますm(__)m

  • 統計学 分散の加法性と正規分布の一次結合

    分散の加法性と正規分布の一次結合って矛盾していませんか? 正規分布に従う確率変数X1,X2がそれぞれ統計的に独立である場合、それぞれの母分散σ1^2,σ2^2の和σ^2を考えます。 正規分布の式に直接あてはめ一次結合を考えると以下の式が成り立ちます。 σ^2=σ1^2+σ2^2 しかし、母分散の定義式に従って計算すると以下の結果になります。 σ^2=σ1^2+σ2^2+2*σ12 ここで、σ12の共分散です。統計的に独立であっても共分散が0である保証はないので、下の式のほうが厳密であるように思います。しかし、QC(品質管理)検定の問題では無視されており、一次結合に至っては0です。なぜこのような矛盾が生じるのでしょうか?