• 締切済み

マルコフ過程の時間平均?

「マルコフ過程の時間平均は、固有値=1の 固有ベクトルと一致する」 と言ってしまってよいのでしょうか? マルコフ過程を勉強する必要が出てきたのですが、 とりあえず、   x(t+1) = x(t) P (x は確率ベクトル、Pは行列) で、   定常分布が存在したら、その確率ベクトルは、   固有値が1のときの固有ベクトルになる というのは、理解できました。 ところで、2つ質問があります。 (1) この定常分布にx(t)が収束するかどうか、は   何か知る方法があるのでしょうか? また、(特にこちらが知りたいのですが) 収束しない場合でも (2) x(0), X(1), ..., x(∞) と無限の時間の平均は、   この固有ベクトルに一致する、と言っていいのでしょうか?  (シミュレーションをしていると、なんとなくそんな   感じがするのですが・・) よろしくおねがいします。

みんなの回答

  • Umada
  • ベストアンサー率83% (1169/1405)
回答No.1

以下の説明は既にwhite-tigerさんがご存じの部分と重なることもあるかと思いますが、その節はご容赦ください。 まず一般的な見地から、行列A、固有値λ、固有ベクトルxの意味を考えてみます。 Ax=λx  (1) が行列Aについての固有値λ、固有ベクトルxの関係です。 あるベクトルを行列で一次変換したとき、その向きが不変であることは一般には保証されません。 例えば行列B  1 2 (   ) -1 4 で、ベクトルy  1 (  )  3 を変換すると、結果は当然  7 (  )  11 となり、元のベクトルyとは方向が異なります。 ところがベクトルz  2 (  )  1 をBで変換すると、  4 (  )  2 となり元のベクトルzのちょうど2倍になっています。これはベクトルzは固有ベクトルの一つであり、固有値は2ということを意味します。 固有ベクトルとは、行列Aによる一次変換でその方向が不変であり、その大きさが|λ|倍になるような特別なベクトルです。(λが負なら向きは当然逆になります) ここから本題に入ります。 与えられた遷移確率行列Pの固有ベクトルをe1, e2, e3,..., ekとします。またそれぞれに対応する固有値をλ1, λ2, λ3,....., λkとします。固有値は実数であるとします。 さていま初期値としてベクトルx[0]が与えられたなら、それは固有ベクトルの線形結合として一意に表現できます(固有ベクトルへの分解)。具体的には実数係数a1, a2, a3,..., akを用いて x[0]= a1 e1 + a2 e2 + a3 e3 +..... ak ek といった具合です。これを行列Pで変換すると、固有ベクトルの定義から各項は固有値倍され P x[0]=x[1]= λ1 a1 e1 + λ2 a2 e2 + λ3 a3 e3 +..... λk ak ek となります。さらに続ければ x[2]= λ1^2 a1 e1 + λ2^2 a2 e2 + λ3^2 a3 e3 +..... λk^2 ak ek .... x[n]= λ1^n a1 e1 + λ2^n a2 e2 + λ3^n a3 e3 +..... λk^n ak ek となることはお分かり頂けるかと思います。^はべき乗を表します。 もし固有値λ1~λkの中に絶対値が1を超えるものが一つでもあれば、それに対応する項はlim x[n] (n→∞)で発散します。 絶対値が1に満たない固有値に対応する固有ベクトルの項は、n→∞で0になります。 固有値が-1の場合は、それに対応する項はn→∞で振動します。 固有値が1の場合だけ、それに対応する項は最初から最後まで不変です。 となると(1)に対する答えは「行列Pで、絶対値が1を超える固有値のないこと」かつ「固有値の一つが1であること」になると思います。これならば収束しますし、その時の極限値が「固有値=1に対応する固有ベクトル」になることも自明です。 一般に固有ベクトルは大きさについてだけ不定性がありますが、今回の場合は確率のお話ですから「ベクトルの各成分の和は1になる」はずで一意に決まると考えてよいと思います。すなわち「固有値=1に対応する固有ベクトルで、各成分の和が1になるものに収束」ということになりそうです。 (2)の無限時間の間の平均ですが、 x[0]= a1 e1 + a2 e2 + a3 e3 +..... ak ek x[1]= λ1 a1 e1 + λ2 a2 e2 + λ3 a3 e3 +..... λk ak ek x[2]= λ1^2 a1 e1 + λ2^2 a2 e2 + λ3^2 a3 e3 +..... λk^2 ak ek .... x[n]= λ1^n a1 e1 + λ2^n a2 e2 + λ3^n a3 e3 +..... λk^n ak ek を項ごとに縦に足し合わせれば明らかかと思います。収束する場合には無限時間の間の平均は固有値=1に対応する固有ベクトルに一致します。 収束しない場合ですが (a)絶対値が1を超える固有値があって収束しない場合: 平均も発散する(固有値=1の固有ベクトルには一致しない) (b)絶対値が1を超える固有値はないが、固有値の一つに-1があって収束しない(振動する)場合: 平均であれば収束し、無限時間の間の平均は固有値=1に対応する固有ベクトルと一致する でよいと思います。 (b)については必要もないと思いますが念のため説明しておくと、例えば固有値=-1に対応する固有ベクトルがem、x[0]でのその係数がamであるとすると、x[0]~x[n]までその項を足し合わせた時の合計は am emか 0×em(零ベクトル)のどちらかになります(nの偶奇による)。(n+1)で割って平均にし、さらにn→∞の極限をとればどのみちゼロです。ですから固有値=-1に対応する項は平均では消え、固有値=1に対応する項だけが生き残り平均はそれに対応する固有ベクトルに一致します。 固有値に重根があったりするとややこしいのですが、とりあえず大筋だけ回答申し上げました。自信はあまりありませんので、white-tigerさんご自身でも確認しながら読んで頂けると幸いです。

white-tiger
質問者

お礼

分かりやすいご説明をありがとうございます。 お話をまとめると、 (1) 収束するのは以下のケース  ・固有値の中に「1」が存在する  かつ  ・それ以外の固有値は絶対値が1より小さい (2) 時間平均は、1を超える固有値がない場合は、固有値1のベクトルに収束、と言える。 ということ、でいいでしょうか。

white-tiger
質問者

補足

すみません。下にお礼を書いていながら、自分でもよく分からなくなってきたのですが、一般に、 マルコフ過程の行列Pで: (1)固有値が負になったり (2)固有値が1より大きくなったり する可能性はあるのでしょうか? もしそうなら、対応する固有ベクトルを確率分布の初期条件に取ると、負の確率が現れたり、足して1を超える確率が現れてしまったりするような気がします。 あるいは、マルコフ過程の行列Pは固有値が[0,1]になる、といえるのでしょうか? ちょっと頭が混乱してきました。。。

関連するQ&A

  • マルコフ過程(確率過程)に関する質問です!

    マルコフ連鎖に関する質問です。 下のマルコフ連鎖について 1、定常分布 2、既約になるための必要十分条件 3、p1=p2=1/2、q1=0、q2=1のとき(1)、(3)の再帰性を調べよ という3問がわからず困ってます。 <マルコフ連鎖> r:(1)から(1)に戻る確率 (r=1-p1-q1) p1:(1)から(2)へ移る確率 p2:(2)から(3)へ移る確率 q1:(1)から(3)へ移る確率 q2:(3)から(2) 1-p2:(2)から(1) 1ーq2:(3)から(1) 説明がわかりにくくて申し訳ありません。 かなり困っているので、よろしくお願い致します。

  • マルコフ連鎖(確率過程)に関する問題です!

    マルコフ連鎖に関する質問です。 下のマルコフ連鎖について 1、定常分布 2、既約になるための必要十分条件 3、p1=p2=1/2、q1=0、q2=1のとき(1)、(3)の再帰性を調べよ という3問がわからず困ってます。 <マルコフ連鎖> r:(1)から(1)に戻る確率 (r=1-p1-q1) p1:(1)から(2)へ移る確率 p2:(2)から(3)へ移る確率 q1:(1)から(3)へ移る確率 q2:(3)から(2) 1-p2:(2)から(1) 1ーq2:(3)から(1) 説明がわかりにくくて申し訳ありません。 かなり困っているので、よろしくお願い致します

  • 平均が正規分布になる確率過程

    同じ分布に従う独立でない確率変数、X1,X2,・・・,Xn があるとします。この平均が正規分布に従うための十分条件、あるいは、必要十分条件には、どんなものがあるのでしょうか。もちろん n は、十分大きな値であるとします。 また、時間が連続の過程X(t)においては、平均が正規分布に従う十分条件、あるいは、必要十分条件はなんでしょうか。平均については十分長い時間の平均とします。 どちらの問題でも、とりうる値は離散的とします。(連続の場合もわかると嬉しいです) 定常状態を想定しています。

  • マルコフ連鎖の質問です

    至急解答をお願いいたします!!! マルコフ連鎖に関する問題です 下のマルコフ連鎖について 1、定常分布 2、既約になるための必要十分条件 3、p1=p2=1/2、q1=0、q2=1のとき(1)、(3)の再帰性を調べよ という3問がわからず困ってます。 <マルコフ連鎖> r:(1)から(1)に戻る確率 (r=1-p1-q1) p1:(1)から(2)へ移る確率 p2:(2)から(3)へ移る確率 q1:(1)から(3)へ移る確率 q2:(3)から(2) 1-p2:(2)から(1) 1ーq2:(3)から(1) 説明がわかりにくくて申し訳ありません。 かなり困っているので、よろしくお願い致します。

  • マルコフ連鎖の問題

    マルコフ連鎖に関する問題が分からなく困っています。 状態空間 S={1,2,3} で推移確率行列      |1/4 1/2 1/4| P=|2/5 1/5 2/5|   |1/3 1/3 1/3| をもつ定常なマルコフ連鎖{Xn}に対して次の問いに答えよ。 (1)確率P( X2=2,X3=1 | X0=3,X1=2 )を求めよ (2)確率P( X2=1 | X0=1 )を求めよ。 (3)lim【n→∞】P( Xn=2 | X=1 )を求めよ。 (1)のみ解答の目処が立っています。 まず(2)がよく分からないので、苦し紛れに状態遷移図を書いて考えてみたところ、(1/4)*(1/4)+(1/2)*(2/5)+(1/4)*(1/3)となるかなと考えてみたのですがどうでしょうか? (3)についてはどう解いていったらいいのか分かりません。 よろしくお願いします。

  • 強マルコフ性について

    今、ゲーム理論の勉強の中でマルコフ過程について勉強する必要が出てきて、時間的に一様な離散時間マルコフ連鎖について勉強しています。 そこで質問なのですが、強マルコフ性という性質についてです。 いまひとつ、マルコフ性との違いが分からないのです。 また、それ以前に、Tをマルコフ時刻としたとき、{X(n):T≧n≧0}で決定される事象など、どういうことなのかが分かりません。 使っている参考書では、 事象Aが{X(n):T≧n≧0}で決定される事象であるとは A∩{T=m}が{X(n):m≧n≧0}で決定される事象であるときに言う とだけ書いてあるのですが… 参照するといい教科書などがあればそれだけでも教えていただけるとうれしいです。 よろしくお願いします。

  • ポアソン過程のジャンプは必ず1であることの証明

    母数λのポアソン過程N(t)(N(t)が平均λtのポアソン分布に従うLevy過程、別の言葉で言えば法則の意味の加法過程、定義をはっきり述べると、定常増分、独立増分で、確率連続な確率過程)のサンプルパス(標本路=見本路)はジャンプを持ちますが、そのジャンプの幅が1であることを証明することはできますか?あるいはその記述のある書物をご存知あらば教えてください。 ポアソン過程を指数分布(待ち時間の分布)から具体的に構成してやればこのことは自明ですが、上は法則による定義です。したがってサンプルパスに制限がかかっていないので、直接証明をすることができずにいます。法則同値を言うだけで結論は従うものなのでしょうか...

  • マルコフ過程の定常状態を利用しての確率問題について

    1匹のハツカネズミがリング形の円形籠内に入れられている。籠は通路で連結された3つの仕切り1,2,3をもっている。ハツカネズミは1時間に2回、仕切り1から仕切り2へ行き、1から3へ4回行く。また、2から1へ6回、2から3へ4回行く、最後に3から1へ3回、3から2へ1回行くことが実験的に長期にわたり観察されている。ハツカネズミはt=0で仕切り1にいることが観察された。15分の終りに、ハツカネズミが仕切り1にいる確率はいくらか。 連続マルコフ過程に対する微分方程式は dP1/dt=-6P1+6P2+3P3, dP2/dt=2P1-10P2+P3, dP3/dt=4P1+4P2-4P3 で、 定常状態確率は平衡方程式をといて、P1(∞)=3/8,P2(∞)=1/8,およびP3(∞)=1/2となる。 ここまでは理解できますが、これから先が良く解りません。 係数行列の特性根はつぎの方程式を満たす: {{-6 - r, 2, 4},{6, -10 - r, 4},{3, 1, -4 - r}} = 0  これよりr=0,-8,および-12が得られる。 この辺りの計算の仕方は出来ますが、以降不明な事ばかりです。 それゆえ、過程に対する微分方程式の解はつぎの形をとる: P1(t)=3/8+A1e^-8t +A2e^-12t P2(t)=1/8+B1e^-8t +B2e^-12t P3(t)=1/2+(-A1-B1)e^-8t +(-A2-B2)e^-12t この式はどの様な導出過程から現れるのかお教え下さい。 第3方程式の係数は、すべてのtの値に対し、P1(t)+P2(t)+P3(t)=1を満たすようでなければならないことに注意せよ。 もし、P1(t),P2(t),およびP3(t)に対するこの解を、いま3微分方程式のどれかの1つに代入する、たとえば、初めの式に代入すれば、定数間のつぎの関係式が得られる: -8A1e^-8t -12A2e^-12t = -6A1e^-8t -6A2e^-12t +6B1e^-8t +6B2e^-12t +3(-A1-B1)e^-8t +3(-A2-B2)e^-12t この関係式の具体的な導出過程をお教え下さい。 それゆえ、e^-8tとe^-12tとの係数を等しく置くと、つぎの2つの方程式が展開される: -8A1=-6A1+6B1-3A1-3B1 -12A2=-6A2+6B2-3A2-3B2 そこで、B1=A1/3およびB2=-A2が得られる。 何故e^-8tとe^-12tとの係数を等しく置くと2つの方程式に出来るのか具体的な導出過程をお教え下さい。また、何故e^-8tとe^-12tとの係数を等しく置く事が良いのかお教え下さい。 他の2方程式に代入しなくて、1つの微分方程式に代入するだけで十分である。これは理論から示唆されていた。もちろん、その理由は、3定数がすでに定常状態値として決定されているということである。そして、これらの値は系を満たす。 そこで、この特殊なマルコフ過程の微分方程式の解は、 P1(t)=3/8+A1e^-8t +A2e^-12t P2(t)=1/8+A1/3 e^-8t -A2e^-12t P3(t)=1/2-4A1/3 e^-8t である。 任意の定数の正しい個数がいま存在し、これらの定数は、初期条件P1(0)=1,P2(0)=0,P3(0)=0から、1=3/8 +A1+A2,および0=1/8 +A1/3 -A2を満たすように、決定されなければならない。これらより、A1=3/8およびA2=2/8が得られる。 A1=3/8、A2=2/8は式を計算して求める事は出来ますが、どの様な事を言っているのか解りません。お教え下さい。(この初期条件を代入するなりした?その導出過程を丁寧に示して下さい。) 微分方程式と境界条件を満たす最終解は P1(t)=3/8+(3/8)e^-8t +(2/8)e^-12t P2(t)=1/8+(1/8) e^-8t -(2/8)e^-12t P3(t)=1/2-(1/2) e^-8t である。そこで、ハツカネズミが、t=1/4において1にいる確率は P1(1/4)=3/8+(3/8)e^-2 +(2/8)e^-3 =(1/8)3e^3+3e+2/e^3で約0.44である。 最後は単に数値を代入しているだけのようなので解ります。

  • 正規マルコフ情報源のエントロピーについて

    次の行列であらわされる正規マルコフ情報源のエントロピーを計算せよ、という課題を出されました (すでに回収も終わっているのでカンニングにはなりません、念のため) P=| 0.2 0 0.8 |   | 0.4 0.6 0 | | 0 0.3 0.7 | まず定常確率を求めたのですが求まった定常確率が間違っていたようなのです。 以下に求める際に用いた式を載せますので間違っている点があればご教授ください。 また、その後のエントロピーの計算に関しても経過と答えを載せてほしいです。 P(0)=0.2P(0)+0.8P(2) P(1)=0.6P(1)+0.4P(0) P(2)=0.7P(2)+0.3P(1) P(0)+P(1)+P(2)=1 この式を解くと各値が1/3となりました。 最後に私はこの辺をあまり理解できていないため質問文にも至らないところが多々あると思います。 そのようなことがあれば補足欄で説明したいと思います。

  • マルコフ情報源のエントロピーレートの導出方法について教えて下さい。

    マルコフ情報源のエントロピーレートの導出方法について教えて下さい。 大学の過去問です。 解答が無いので自力で解かなければならないのですが、行き詰まってしまいました。 もし助けて頂ければ助かります。 状態A,B,Cを行き来する定常的マルコフ情報源のエントロピーレートを求める問題です。 状態遷移確立がそれぞれ P(A|A)=0.4 P(B|B)=0.5 P(C|C)=0.8 P(A|B)=0.25 P(B|A)=0.3 P(C|B)=0.25 P(A|C)=0.1 P(B|C)=0.1 P(C|A)=0.3 で与えられています。 自分の考える解き方の大筋としては (1) 定常分布の式を立てる (2) (1)よりそれぞれの定常確率を求める (3) 系のエントロピーを求める (4) (2)、(3)とマルコフ情報源のエントロピーレート導出の   公式により解を求める という感じです。 (1)において P(A)=P(A)*0.4+P(B)*0.25+P(C)*0.1 P(B)=P(A)*0.3+P(B)*0.5+P(C)*0.1 P(C)=P(A)*0.3+P(B)*0.25+P(C)*0.8 P(A)+P(B)+P(C)=1 の連立方程式を立て、解こうと試みたのですが。 解を得る事が出来ません。 http://www.usamimi.info/~geko/arch_acade/elf001_simult/index.html のプログラムでの演算も試してみましたがやはり解を得られませんでした。 自分の計算式に何か間違いがあるのでしょうか? また自分の解法自体にも問題がありましたらご指摘をお願い致します。 今回、情報理論を初めて勉強しているもので、もしかして全く見当違いの質問かも しれませんが、宜しくお願い致します。