• ベストアンサー

同時確率関数

次の問題が分からなくて困っています。 ある企業には、3種類のグループ(第1、第2、第3グループ)の労働者がいます。そして、勤務する全労働者に占める各グループの割合はp1、p2、p3(p1=p2=p3=1)であるとします。この割合が明確でないので、Aさんは次のように考えました。企業からn人の労働者を独立に選び、労働者がどのグループに属するかを調べる。そして、第1、第2、第3グループに属する労働者がX1、X2、X3人(n=X1+X2+X3)いるとする。このとき分からない値piとしてYi=Xi/n(i=1,2,3)の値を採用する。 このとき、確率変数Y1,Y2,Y3の同時確率関数を求めなさい。 問題は上記のようになっています。 いろいろな図書を調べて考えてみたところ、三項分布なのではないか?思ったのですが、それでもよく分かりません。また、単なる確率関数ではなく同時確率関数を求めなさいとなっているために、さらに理解しづらくなっています。 どなたか考え方をご教示いただけないでしょうか?お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • tinantum
  • ベストアンサー率56% (26/46)
回答No.2

確率変数Y1,Y2,Y3の同時確率関数とは、 Y1=y1,Y2=y2,Y3=y3となる確率 P(Y1=y1,Y2=y2,Y3=y3)のことです。 仰るとおり3項分布でよく、この問題では P(Y1=y1,Y2=y2,Y3=y3) =(n y1+n y2+n y3)!/((n y1)!(n y2)!(n y3)!) p1^{n y1} p2^{n y2} p3^{n y3} δ_{1,y1+y2+y3} … (1) となります。ここで、y1,y2,y3は0,1/n,2/n,…,1の値をとるとして、n=X1+X2+X3の条件を入れるために、δ_{1,y1+y2+y3}(クロネッカーデルタ記号)をかける必要があります(つまり、1 ≠ y1+y2+y3での確率はゼロとすればよい)。 (1)の求め方は、(1)式を見て少し考えてみてください。 わからなければ説明します。 重要な発展として、 同時確率関数 P(Y1=y1,Y2=y2,Y3=y3) から、Y1のみに着目し、Y1の確率を求めると P(Y1=y1) =Σ_{y2,y3} P(Y1=y1,Y2=y2,Y3=y3) となりますが、これの平均値はp1で、分散はnを無限大の極限を取ると0になることを確認してみてください。

bsn
質問者

お礼

ご回答有り難うございました。 (1)についてはよく理解できました。わざわざ確率関数も示していただき大変助かりました。 追記として書いていただいたP(Y1=y1)=Σ_{y2,y3} P(Y1=y1,Y2=y2,Y3=y3)は、Y1の周辺確率関数を導出していると考えてよろしいのでしょうか?もしそうであれば、Y1=y1を所与としているもとでの確率関数Y2,Y3の条件付確率関数を求めることができますよね? 一応、計算してみたところ、P(Y1=y1) = nCny1 * y1^(ny1)*(1-y1)^(n-ny1)という二項分布になりました。また、条件付確率関数はP(Y2,Y3|Y1=y1)=(ny2+ny3)!/(ny2)!(ny3)!*{y2/(y2+y3)}^(ny2)*{y2/(y2+y3)}^(ny3)と、こちらも二項分布になりました。 計算が少々複雑だったうえに、双方が二項分布という結果になり、これに自信を持てないのですが、この計算結果で合っているかを教えていただけないでしょうか? さらに、勉強のためにこの条件付確率関数の平均値(条件付平均値)の導出方法も一緒に教えていただけると幸いです。宜しくお願い致します。

その他の回答 (2)

  • tinantum
  • ベストアンサー率56% (26/46)
回答No.3

>追記として書いていただいたP(Y1=y1)=Σ_{y2,y3} P(Y1=y1,Y2=y2,Y3=y3)は、Y1の周辺確率関数を導出していると考えてよろしいのでしょうか? そうですね。 >P(Y1=y1) = nCny1 * y1^(ny1)*(1-y1)^(n-ny1)という二項分布になりました。また、条件付確率関数はP(Y2,Y3|Y1=y1)=(ny2+ny3)!/(ny2)!(ny3)!*{y2/(y2+y3)}^(ny2)*{y2/(y2+y3)}^(ny3) 私の計算でも一致しました。(いくつかのy1,y2,y3がp1,p2,p3の間違えであることを除いて。) ただし正確に書くと、 P(Y1=y1) = nCny1 * p1^(ny1)*(1-p1)^(n-ny1) はいいですが P(Y2,Y3|Y1=y1)=(ny2+ny3)!/(ny2)!(ny3)!*{y2/(y2+y3)}^(ny2)*{y2/(y2+y3)}^(ny3)δ_{n-ny1,ny2+ny3} のように、クロネッカーデルタをつける必要があると思います。 > さらに、勉強のためにこの条件付確率関数の平均値(条件付平均値)の導出方法も一緒に教えていただけると幸いです。宜しくお願い致します。 条件付確率関数を用いて何の平均値を求めたいのでしょうか? 例えば、私が追記に書いた 「これの平均値はp1で、分散はnを無限大の極限を取ると0になることを確認してみてください。」 というのは、Y1に関する平均値と分散という意味で略して書いてしまいましたが、今の条件付確率関数は、Y2,Y3の(条件付)同時確率関数ですので、平均値というときは、何の平均値か書いていただけるとわかると思います。

bsn
質問者

お礼

再度ご回答いただき有り難うございます。 言葉足らずで申し訳ございません。 私が求めたいのは、Y2の平均値、Y3の平均値です。 さらに、疑問に思ったことがあります。 P(Y2,Y3|Y1=y1)=(ny2+ny3)!/(ny2)!(ny3)!*{y2/(y2+y3)}^(ny2)*{y2/(y2+y3)}^(ny3)δ_{n-ny1,ny2+ny3} 上記の式は、Y1を所与としたときのY2とY3の条件付同時(結合?)確率関数ですよね?ところで、Y1を所与としたときのY2の確率関数、Y3の確率関数と別個に求めることは可能なのでしょうか? ずっと問題と向き合っていて頭の中が混乱して、またまた言葉足らずで質問の意図が分からないかもしれませんが、そのときはお手数ですが再度補足要求してくださいますと助かります。 よろしくお願い致します。

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

多分、問題的には、仰るとおり多項分布でいいんだと思います。 ※その企業にいる全労働者数は有限でしょうから、非復元抽出すると、厳密には多項分布にはなりませんが。

bsn
質問者

お礼

ご回答ありがとうございます。 早速、昨晩回答をいただいたので、すぐに再度考えて#2さんが示していただいた確率関数を求めることができました。 #2さんが発展を書いていただいたので、それを考えていると様々な疑問が出てきました。#2さんの御礼の欄に合わせて記していますので、もし宜しければご回答くださいますようお願い致します。

関連するQ&A