多次元正規分布のパラメータΣ(シグマ)の仮定について

このQ&Aのポイント
  • 多次元正規分布のパラメータΣ(シグマ)は正値対称行列であるかどうかを知りたい
  • シグマの行列式が正であれば、結果として正値対称であることが示せるのかがわからない
  • 多次元正規分布のモーメント母関数を求め、分散を求める方法もあるが時間がかかる可能性がある
回答を見る
  • ベストアンサー

多次元正規分布のパラメータに対する仮定(条件)

1点お聞きしたいことがあります。 多次元正規分布のパラメータΣ(シグマ)は、 正値対称行列だという仮定が 初めからあるかどうかを知りたいです。 シグマの行列式が正であれば、 結果として正値対称であることが示せるのか、 そうでないのかがわからず困っております。 本を読むと、多くの本には正値であるという条件が ついているような気がします。 この問題の解法の1つとしては、 多次元正規分布のモーメント母関数を求め、 そこから分散を求めたらシグマに一致したので、 シグマは正値対称である、という方法があると思いますが、 この方法ではおそらく何十時間かかるか予想もつかないので ご質問いたしました。

質問者が選んだベストアンサー

  • ベストアンサー
  • adinat
  • ベストアンサー率64% (269/414)
回答No.2

はっきりいって何が疑問なのか分からない。問題点をもっと明確にせよ。 正規分布を密度から定義するとして、 f(x)=1/{√{(2π)^n|Σ|}}exp{-(x-μ)^tΣ^{-1}(x-μ)/2} と書いたとする。 まずΣが正定値である必要性について。適当な基底の取り替えによって、Σは対角行列と仮定してよいけれども、そうするとexpの部分は、 Πexp(-1/λ_i(x_i-μ_i)^2) となる。λ_iはΣの固有値。だから負の固有値があれば、f(x)は可積分にならない。つまりR^n上で積分すると無限大になる。これはf(x)が確率密度関数であること(R^n上で可積分で、積分値が1)に矛盾する。したがって、Σが対称行列のとき、f(x)が確率密度関数になるためには、Σは正定値であることが必要。このことはもう少し直感的にいうと、基底の取替え(1次の変数変換)によって、確率密度関数が各成分に分離されるが、この各成分がそれぞれ分散λ_iの正規分布になるのです。したがってすべての固有値は正でないと困るというわけ。 次にΣを対称行列にする必然性について。expの中身は、x=(x_1,…,x_n)の2次形式だから、Σ^{-1}が対称行列でないと仮定しても、ある対称行列A^{-1}が存在して、 -(x-μ)^tΣ^{-1}(x-μ)/2=-(x-μ)^tA^{-1}(x-μ)/2 とかける。一般にΣが対称行列でないとき、|Σ|≠|A|であることに注意せよ。そうするとexpの中身をAに置き換えてf(x)をR^n上で積分すると、一般には1にならない。したがって、Σは対称行列と仮定する必要がある。別に対称にしなくても、係数を1/{√{(2π)^n|A|}}に変えれば密度関数になりうるけれども、この場合は、ΣそのものをAにとりかえてもf(x)はまったく同じ分布を定めるから、対称行列に取らなければ新しい分布が出てくる、というわけでもない。 結局、Σを正値対称に取れば、ただひとつの正規分布を定めることが出来るというわけ。

wakabayashiryou
質問者

お礼

本日やっと理解できました。 私の不出来に辛抱強くお付き合い下さり 誠にありがとうございました。 またいつかお目にかかれれば幸いです。 失礼します。

その他の回答 (1)

  • adinat
  • ベストアンサー率64% (269/414)
回答No.1

1次元の正規分布なら、平均mと分散σ^2で分布が決定されます。分散の定義からσ^2≧0(つまり分散は正値)です。 これとまったく同様のことが多次元正規分布にも言えます。つまり平均ベクトルMと分散共分散行列Σで分布が完全に決定します。Σの定義は、第i,j成分がCOV(X_i,X_j)=E[(X_i-E[X_i])(X_j-E[X_j])]で与えられる行列です。定義から対称行列であることは明らかでしょう。さらに分散が非負であるのと同様に、これが正値であることもすぐに分かります。次のようにやるのが普通です。 対称行列A=(a_{ij})が正値であるとは、任意のベクトルvに対して、Σa_{ij}v_iv_j≧0となることです。内積でかけば、(Av,v)≧0と言っても同じです。さて、共分散の性質から、 ΣCOV(X_i,X_j)v_iv_j=COV(v_1X_1+…+v_nX_n,v_1X_1+…+v_nX_n) ですが、この右辺はv_1X_1+…+v_nX_nの分散ですから、常に非負です。これで証明が終わっています。なお、和はi,jについて、1からnまで取るものとします。 正規分布のパラメータΣとは、分散共分散行列のことなので、これは特に明記しなくても常に正値対称になるというわけですね。

wakabayashiryou
質問者

お礼

ご回答ありがとうございます。

wakabayashiryou
質問者

補足

関連するQ&A

  • 3次元混合正規分布のパラメータ推定

    3次元混合正規分布のパラメータ推定 標本(X,Y,Z,値)が大量にあり、これを3次元の混合正規分布で近似しようとしています。 現在、平均や分散などのパラメータの算出をEMアルゴリズムを用いて行おうと考えています。 いろいろ調べて勉強してみましたが、標本をどのように使えばいいか理解することができません。 この標本はどのような形で式につかえばよいでしょうか? そもそもEMアルゴリズムを用いてこの問題を解くことができるのでしょうか? また、この標本をもとにパラメータを決定する代替方法があれば、教えていただけると助かります。 説明不足な点があるかもしれませんが、よろしくお願いします。

  • 多次元正規分布の分散共分散行列について

    p次元確率変数ベクトル X(i) が p次元正規分布 N(0,Σ) に従っているとき p次正方行列 A で X を一次変換した Y (Y=AX) が従う多次元正規分布の分散共分散行列はどうやって求めればよいでしょうか? 考え方だけでも良いのでおしえてください。 お願いします。

  • 多次元正規分布に関する質問

    多次元正規分布についてのシミュレーションをする課題を持っているのですが 少しわからないところがあります。 m次元正規分布の式はwikipediaにあるように http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83 N(u,S)=exp(-(x-u)'invS(x-u)/2) / (2PI)^(m/2)sqrt(detS) です。ですが分散共分散行列Sを使わず分散をスカラーとしてつまり σで書きたいのです。 (なのでm次元のどの方向においても分散はσ^2でいいです。 そういう簡単な状況でのシミュレーションをしようとしています。) この場合、m次元正規分布のしきはどうなるのでしょうか。 よろしくお願いいたします。

  • コンピュータによる(混合)多変量正規分布の計算

    混合正規分布のパラメータ計算で多変量正規分布の確率値を 使うのですが、多変量正規分布(共分散行列はσ^2I)において、 ベクトルが高次元の場合、コンピュータで計算すると、 確率値が0になってしまいます。 これは、どこかが間違っているのでしょうか? 何か良い計算方法(資料)はありませんでしょうか? どうかよろしくお願い致します。

  • 正規分布

    研究を行っておりますが統計が難しくいつも悩みます。 2群間の比較を良く行いますが,基本的にはt検定を用います。 t検定を用いるには様々な条件が必要ですが,データが連続変数であり,正規分布であり,分散が等しいなどがあるようです。 そこでいつも悩む点が,正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか,本によって書き方が難解で解りません。 また,サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか。 教えてください。

  • 正規分布ではない分布について

    確率・統計の質問です。 正規分布を仮定すると平均値-2σくらいで 物理的にはありえない負の数をとる場合 (例えば含有率や面積率など) どういった分布を仮定すれば良いのでしょうか? なにか良い方法があれば教えてください。 β分布やΓ分布を使うのでしょうか?

  • 正規分布へのfitting

    ある実験データがあり、正規分布に近い形をしています。しかし近いとはいえ、少々ズレているため分散と平均値を求め正規分布の曲線を実験データに重ねて描くと、、、なぜか大幅にずれてます。原因は、平均から大きく離れたところにデータが少ないとはいえポツポツとあり、分散が大きくなるからです(平均値はほぼ正しい値と思われます)。 分散を求める際に正規分布おかまいなく求めるため過大になるのかと思い、正規分布にfittingしようと考えました。つまり最小二乗法により実験データに近い正規分布を求め、分散を求めるのです。 この方法は意味ありますか?おそらく太古の昔から用いられてるような誰でも思い付く方法と思いますが。。。また、実際に計算する場合、エクセル等で関数は用意されてますか?それともlogを取り2次関数に展開しfittingする必要がありますか?

  • 標準正規分布について

    1)標準正規分布に従う乱数を、平均μ、分散σ^2の正規乱数に変換したい。どのようにしたらいいか。その理由も考えよ。 という問題についてですが 乱数をXとした時 Y = X・σ + μ とする。 というのはわかるのですが(ほぼ公式なので。。。) 理由についてはどう書けばいいのでしょうか? また 2)確率変数Xが(0,1)の範囲で一様分布に従う時、Y=1-Xと変換すれば、Yはまた一様分布となることを示せ。 という問題なのですが Xの密度関数から1-Xの密度関数を求めるということは以前こちらで教えていただいたのですがヘビサイド関数というのが用いられていて解法をよく理解できませんでした。 実際の解法手順等含めまして丁寧に教えていただけませんでしょうか?よろしくお願いいたします。

  • 正規分布に従うときの母平均と母分散の求め方

    今、数千件のデータを解析しています。 ヒストグラムから、それぞれの時点のデータが正規分布に従うことが分かりましたので、母集団も正規分布に従う、という仮定の下で話を進めます。 各時点での平均と標準偏差をプロットしたところ、右上がりの一次関数になり、一定の値にはなりませんでした。 そこで、このような場合(標本平均も標本分散も一定の値にならない)、どうやって全体の母集団のパラメータを推定するのでしょうか。 教えてください。

  • 正規分布の歪度

    標準正規分布だけでなく、正規分布一般に、左右対称なので、歪度=0ですよね? モーメント母関数の3回微分にt=0を代入すると、m_3= 3mu*sigma^2+mu^3となります。 歪度はm_3/sigma^3で求められるとのことですが、このままいくと歪度=(3mu*sigma^2+mu^3)/sigma^2となってしまい、0にはなりません。 どこが間違っているのでしょうか。お教えください。