• ベストアンサー

二つの確率ベクトルの共分散行列

n次元確率ベクトルXについての分散共分散行列 Cov(Xi, Xj)の説明は多くの教科書にあり理解しているのですが,p次元確率ベクトルPとq次元確率ベクトルQについての共分散行列 Cov(Pi, Qj) が何の指標になっているのかがわかりません.行列の各成分は何を表しているのでしょうか.直感的・幾何学的なイメージがつかめないのですが...

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

 No.1に対するコメントでは > Cov(Xi, Xj)は,直感的には2変数の相関関係の指標であり,幾何学的には分布上での直線回帰の程度をあらわしていると考えられます と仰っていて、No.2に対するコメントに > どのような場面で必要とされる指標なのか,どうにもイメージがつかめないのですが... とある。ひょっとして、「イメージ」ってのは図形的イメージじゃなくて、用途のことでしょうか。そして、Cov(X,X)なら分かるけれど、Cov(P,Q)の用途が分からない、ということでしょうか。  確率変数のベクトルP, Qがあるとき、ベクトルXを、PとQを繋いでできる(p+q)次元のベクトルとします。そしてCov(X,X)を考えます。すると、Cov(P,Q)も、Cov(X,X)の一部として含まれています。Cov(X,X)の行列の左下隅、および右上隅を占めているわけです。  で、Cov(P,Q)の部分だけを取り出して考えるのはどういう意味があるか、というのがご質問の真意ではないか、と考えました。もしそうだとすると…  共分散は、二つの確率変数Pi, Qjの間の相関を表しますが、これは両者が無関係ではないという現象を言っているだけであって、どちらが原因でどちらが結果か、あるいは両方とも何か共通の原因で変動するのか、ということは分かりません。  しかし、アプリオリに原因と結果が想定できている場合もあります。Pが原因となるものを集めたベクトル、Qが結果を集めたベクトルとすると、因果関係の強さを調べたければCov(P,Q)だけ見れば良い、と考えられます。もっと具体的に言うと、例えば ● PはP1 = 昨年の開発費、P2 = 昨年の宣伝費、…など、先行する施策。 ● QはQ1 =今年の売り上げ、Q2 = 今年の利益、…など、後から生じる成績。 という場合です。  ただし、Cov(P,P)の部分の相関が強い場合(P1が小さいときにはP2が大きい、などの関係が強いとき)には、どれが主要な原因、ということがはっきりしなくなってしまいますから、それを知るにはもっと他の分析手法が必要になります。  ところで、相関関係と因果関係は混同されやすいもので、「兎を追いかけているとき以外に犬を見たことのない者が、兎は犬の原因だと断じるような」(by アンブローズ・ビアス「悪魔の辞典」)誤りが現実にしばしば目につきます。いやそれどころか、統計で人を騙すのにもっともよく使われるトリックである、とすら言えます。

doumotokouichi
質問者

お礼

御回答いただきありがとうございます.PikとQjk (k=1...m) が同時に測定された値であるならば,一般的にはそれらは,XikとX_{(p+j)k}と表記されて,n(=p+q)次元のひとつの確率ベクトルXとして扱われるものと思われます.しかし,ここでXを,あえて,PとQに分けて扱い,Cov(Xi, Xj)の一部を抜き出したものがCov(Pi,Qj)と考えればいいわけですね. これが有用な場合というのは,「Cov(P,Q)には特別な興味があるが,Cov(P,P)やCov(Q,Q)にはまったく興味がない」という場合ということになるかと思います.例えば,「X_{1~p}はそれぞれがある同一の確率関数に従う確率変数で,X_{p+1~n} は,別の確率関数に従っている可能性が高い」といった確率ベクトルの解析であれば,これが有用になる場合もあると納得できます. そうであるならば,直感的・幾何学的イメージも,Cov(Xi, Xj)の場合とまったく同じように解釈すればよいということになりますね. だいぶ,理解が進んだように思います.御教授にお礼申し上げます.

その他の回答 (3)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.3

 確率変数は、普通の変数と違って値が定まらない。何かある分布に従うということしか決まっていません。それで、測定すると毎回値が違う、そういうモノなのです。  次に共分散、すなわち(X-mx)(Y-my)の期待値(ここにmxはXの期待値、myはYの期待値です)。二つの確率変数XとYの共分散は、両者それぞれが従う分布を決めただけでは決まらず、「XとYの同時分布(2次元の分布)」が与えられて初めて定義されます。この2次元の分布が理論的に分かっているときには、これで話はおしまいです。(ですから、確率変数が何であるかワカッテル人向けには以下の話は省略できるわけで、辞典なら当然そうするでしょう。)  この2次元の分布が未知の場合には、実際に測定したデータに基づいて計算を行うしかありません。回答No.2はこの場合の話をしています。  そもそも何の為に共分散を計算するかといえば、たとえば「Xが大きい値になった時にはYの値も大きくなる」というような相関関係がどれほどあるかを調べるためです。  しかし、XもYもどんな分布に従っているかは未知。そこで、何度もXとYの値を測って得たデータを列 <x[1], y[1]>, <x[2], y[2]>, … , <x[m], y[m]> で表すことにして、これを使って共分散を計算します。  が、その前に、ヨコ軸をx、縦軸をyにして<x[k],y[k]> (k=1,2,…,m)をプロットしたグラフが「散布図」です。<x[k], y[k]>がペアになるのは、これらが「同時に測ったデータ」であるということを表しています。  Xの期待値mxはx[k](k=1,2,…,m)の平均値axで代用し、myもy[k]の平均値ayで代用します。そして、  「(X-mx)(Y-my)の期待値」は(x[i]-ax)(y[i]-ay)の平均値 で代用します。これが実際にデータを使って行う共分散の計算です。  ところで、ご質問にあるPは確率変数がp個並んで出来ているベクトルです。その中のひとつの要素、つまり確率変数Piを取り出してみると、m個のデータが対応している。Qも確率変数q個からなるベクトルで、その中の一つの要素Qjを取り出してみると、m個のデータが対応している。ですから、PiとQjの共分散Cov(Pi,Qi)を計算するには、上記の式でXをPiに、YをQjに置き換えるだけのことです。で、ご質問はまさしくこの共分散Cov(Pi,Qi)の話ですね。  さて、この計算をi=1,2,…,pおよびj=1,2,…,qの全部の組み合わせについて行ったものが共分散行列Cov(P,Q)です。共分散自体はあくまでも2個の確率変数の間の関係だけを扱います。それを並べた行列が共分散行列。別物です。  一方、イメージなさっているのはおそらく「多次元の散布図」のようなものではないでしょうか。その散布図に散らばっている各点は、沢山の確率変数Si (i=1,2,…,n)について「同時に測定した値」<s1[k], s2[k],…,sn[k]>です。そういう点がk=1,2,…,mのm個ある。これは因子分析(のような多変量解析)におけるデータの捉え方です。このとき、共分散の代わりの役目を果たすのが共分散行列Cov(R,R)です。  また、共分散行列Cov(P,Q)においてp=1, q=1の場合を考えれば、共分散が共分散行列の特別な場合になっている、とも言えることがお分かりになるでしょう。  お急ぎとのことですから長々と書きましたが、教科書は幾らでもあります。

doumotokouichi
質問者

お礼

御回答いただきありがとうございます.No.4にてお礼を述べさせていただきます.

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 「n次元確率ベクトルX」は、n個の確率変数を並べてできているベクトルのことです。だからXiとXjは別の確率変数である。そして、両者の共分散Cov(Xi, Xj)が計算できます。「直感的には2変数の相関関係の指標であり,幾何学的には分布上での直線回帰の程度をあらわしていると考えられます」と仰る通りです。  全く同様に、PiとQjは別の確率変数である。そして、両者の共分散Cov(Pi, Qj)が計算できます。それを(i,j)要素とする行列が共分散行列。 Cov(Pi, Qj)もやはり「直感的には2変数の相関関係の指標であり,幾何学的には分布上での直線回帰の程度をあらわしていると考えられます」と仰る通りです。Xの話と何の違いもありません。  また別の方面から説明してみましょう。  実際の計算では、Piとして、たとえばm回サイコロを振って出た目を(1,6,3,5,…,3)てな風に記録してデータをとったとします。1個の確率変数がこのデータの列と対応している訳です。つまり、Pikをデータの数値として、 Pi = (Pi1, Pi2, …, Pim) という感じになります。  Cov(Pi, Qj)を計算するには データ(Pi1, Pi2, …, Pim)と別のデータ(Qj1, Qj2, …, Qjm)を使う。このとき、両者のデータの個数mが一致していないと具合が悪い。ですが、ベクトルPとQが含む確率変数の個数p, qが一致しているかどうかはまるで関係ありません。  mとp,qとを混同なさってるんじゃないか、と思う訳です。

doumotokouichi
質問者

お礼

ご回答いただきありがとうございます.質問のCov(Pi, Qi)は,「竹内啓:統計学辞典,東洋経済 (1989)」のp.1004r に数行でさらっと記述されているものです(辞典中の表記ではCov(X,Y)).辞典中には,御説明いただいたサイコロの例のmに該当するものについては何も説明がありません.どのような場面で必要とされる指標なのか,どうにもイメージがつかめないのですが...

  • F_P_E
  • ベストアンサー率43% (26/60)
回答No.1

はじめまして。 確率行列なるものを私は初めて耳にしましたが。。。それに私も確率行列の要素が何を示しているのかよくつかめません。しかし、恐らく確率行列の要素は確率変数であるのだろうと推測はしていますが・・・。 こんな状態ですが、回答したいと思います。 >p次元確率ベクトルPとq次元確率ベクトルQについての共分散行列 Cov(Pi, Qj) が何の指標に とありますが、所詮はCorrelationです。PiとQjがどの程度の”関係”があるかを示しているのだと思います。 直感的なイメージと挙げるには、やはり確率行列の要素が何であるか、何を示しているのかがわからないと何も言えません。。。 あまりお役に立てずに申し訳ないです。

doumotokouichi
質問者

お礼

ご回答いただきありがとうございます.Cov(Xi, Xj)は,直感的には2変数の相関関係の指標であり,幾何学的には分布上での直線回帰の程度をあらわしていると考えられます.しかし,Cov(Pi, Qj)についてはうまくイメージできませんでした.もう少し専門書をあたってみます.

関連するQ&A

  • 多次元正規分布の分散共分散行列について

    p次元確率変数ベクトル X(i) が p次元正規分布 N(0,Σ) に従っているとき p次正方行列 A で X を一次変換した Y (Y=AX) が従う多次元正規分布の分散共分散行列はどうやって求めればよいでしょうか? 考え方だけでも良いのでおしえてください。 お願いします。

  • 共分散行列の固有値・固有ベクトルの行列

    以下のようなデータを用いて、共分散行列を生成するとします。 (各No.にはそれぞれx1~x5の5つのデータ) x1 x2 x3 x4 x5 No.1 [2 4 5 2 1] No.2 [3 10 8 7 9] No.3 [11 3 2 1 6] すると、共分散行列は3×3の正方行列になり、その固有値も3つ求まりますよね。 しかし、固有ベクトルに関してはデータがx1,x2,..,x5と5次元で考えているので、 ひとつの固有値に対して5つの成分を持つ固有ベクトルが求まりますよね。 よって、共分散行列の固有値行列は必ず正方行列になりますが、固有ベクトルの 行列は上の例の場合なら5×3行列(列は対応する固有値の数、行はベクトルの成分の数)となり、 必ずしも正方行列にはなりませんよね?そのあたりを教えて頂きたいと思います。 よろしくお願いします。

  • 確率変数 確率統計

    確率・統計の証明問題です。 離散型確率変数X,Yの分布は P(X=xi)=pi(i=1,2),P(Y=yj)=qj(j=1,2)である。 P(X=xi,Y=yj)=rij(i,j=1,2)とするとき ri1+ri2=pi,r1j+r2j=qj(i,j=1,2)が成立する事を 確率の公理を用いて示せ。 ★(X=x1)∪(X=x2)=(Y=y1)∪(Y=y2)=Ω  (X=x1)∩(X=x2)=(Y=y1)∩(Y=y2)=φ  (X=xi)=(X=xi)∩Ω,(Y=yj)=(Y=yj)∩Ω等を用いよ。 ポイント P((X=xi)∩(X=y2))+P((X=xi)∩(X=y2))の式を導き、A=(X=xi)∩(X=y2)、B=(X=xi)∩(X=y2)とし、 A∩B=...=φであるから、確率の公理P(A)+P(B)=P(A∪B)を使用する証明が必要とのアドバイスを以前いただきました。

  • 共分散について

    確率変数X1,X2,X3,X4があり、独立でないとき V(X1+X2+X3+X4)=V(X1)+V(X2)+V(X3)+V(X4)+2COV(X1,X2)+         2COV(X1,X3)+2COV(X1,X4)+2COV(X2,X3) +2COV(X2,X4)+2COV(X3,X4) で よろしいでしょうか??共分散の扱いがわかりません。一般に 確率変数Xi(i=1,2、・・・・n)のとき V(X1+X2+X3+・・・・+Xn)=どうなるのでしょうか??

  • 統計学

    どうしても分からないので教えて欲しいと思います。 問題は、 「離散型確率変数X,Yの分布はP(X=xi)=pi(i=1,2)   P(Y=yi)=qi(i=1,2)である。(1)P(X=xi,Y=yj)=rij(i,j=1,2)とするとき、 ri1+ri2=pi(i=1,2) r1j+r2j=qj (j=1,2) が成立することを示せ。」です。 再提出となった自分のレポートは、  まず、x1とx2の確率(p1, p2とする)の合計が1になる表と、同様にy1とy2の確率(q1,q2とする)の合計が1となる表をかきました。  次に、iとjの組み合わせについて、(xi, yi)とrijとの対応する表をかき、 r11+r12=p1 ((1)とする) r21+r22=p2 ((2)とする) r11+r21=q1 ((3)とする) r12+r22=q2 ((4)とする)を導き、 (1)、(2)より、ri1+ri2=pi (i=1,2) (3)、(4)より、r1j+r2j=qj (j=1,2) したがって、ri1+ri2=pi (i=1,2) r1j+r2j=qj (j=1,2) が示せた。 と書いて出した所、 「文中の表は(ⅰ)P(X=xi,Y=y1)+P(X=xi,Y=y2)=pi(i=1,2) (ⅱ)P(X=x1,Y=yj)+P(X=x2,Y=yj)=qj (j=1,2) が成立することを前提にして作った表です。(ⅰ)、(ⅱ)の等式の成立を証明して下さい。」   と書かれて再提出でした。(ⅰ)、(ⅱ)の等式の成立の証明なんですが、いくら考えても出来ません。どなたかアドバイスお願いします。

  • 確率の問題です!

    X1,X2は独立な確率変数で、P(Xi=k)=(1-pi)pi^k-1 (i=1,2 k=1,2,…) (1)E(X1) (2)E(X1X2) (3)P(X1 < X2) (1)はΣk(1-p1)p1^k-1を計算して1/(1-p1) (2)は1/{(1-p1)(1-p2)}となるのは分かったのですが(3)が分かりません。教えてください。 あと、確率変数XとYは互いに独立で、それぞれパラメーターλ,ν(0<λ,ν<1)の幾何分布に従うとする。Z=min{X,Y}とおくときP(Z=N)(n=1,2,…)を求めよ。 この問題はさっぱり言ってる意味が分かりません。分かる方是非教えてください。

  • 確率変数の和の平均値と分散と確率分布

    確率の問題でどうしても解けない物があります。どなたか解き方を教えて貰えませんでしょうか。お願いします。 問題) 確率変数 Xi(i=1,2,…,N) は互いに独立であるが, それぞれ平均値i (E(Xi)=i) のポアソン分布に従う. この確率変数の和 Y= (N Σ i=1) Xi の平均値と分散を, Nの関数として求めよ. さらに,Yの確率分布 P(Y=n) を求めよ.

  • 正規行列の異なる固有値の固有ベクトルは直交する?

    Aを正規行列とすると適当な対角行列Λと適当なユニタリ行列Uが存在してU^*・A・U=Λである λとμを異なる固有値として Uの列ベクトルでありλの固有ベクトルであるベクトルが張るベクトル空間をPとし Uの列ベクトルでありμの固有ベクトルであるベクトルが張るベクトル空間をQとしたとき PとQは直交しλの固有ベクトルはPの元でありμの固有ベクトルはQの元であるから「λの固有ベクトルとμの固有ベクトルは直交する」 上の証明について質問します (1)結論は正しいですか? 正しければ (2)証明に穴はありますか? あれば (3)どのように証明したらいいでしょうか?

  • 統計学(離散型確率変数)の問題文の意味

    独学で数学を勉強しています。 問題が解けないというより、問題の意味が読み取れなくて困っています。問題の意味を解説していただけないでしょうか。 離散型確率変数X,Yの分布はP(X=xi)=pi(i=1,2), P(Y=yj)=qj(j=1,2)である。 ※ここまでは理解できてます。 P(X=xi,Y=yj)=rij(i,j=1,2)とするとき、 ri1+ri2=pi, r1j+r2j=qj(i,j=1,2)が成立することを示せ。 ※バカな質問かもしれませんが、このときの"r"って相関係数のrとは違いますよね? このri1,ri2,r1j,r2jというのが何を表しているのか理解できません。 どなたか、解説していただけないでしょうか。 よろしくお願いします。

  • 確立変数

    統計学の分野での疑問です。 問:離散型確率変数X,Yの分布をP(X=xi) = pi (i=1,2) , P(Y=yj) = qj (j=1,2)とする。 P(X=xi,Y=yj) = rij (i,j=1,2)とすると  ri1 + ri2 = pi (i=1,2)  r1j + r2j = qj (j=1,2) が成立することを確立の公理「A∩B=φならばP(A∪B)=P(A)+P(B)」を用いて示せ。 i=1として考えてみて q1∩q2 = φ なので r11∩r12 = φ となり r11∪r12 = r11 + r12 にはなるのですが r11 + r12 = p1 にはたどり着けません。 根本的なところから勘違いしている気がするのですが どのように考えていけば確率の公理を使って説明することができるのでしょうか。