• 締切済み

ベイズ推定についての質問です

ベイズ推定に関する質問です。 ある料理店のコース料理のコースがnコース(ここでは5コース)あったとして、1品1品の料理が運ばれてくる中で、「今日は○コースである確率」を更新したいと考えています。 (例) 運ばれてくる料理の順番はランダム ・Aコース ピザ、パスタ、サラダ、アイス ・Bコース ピザ、パスタ、ラザニア、アイス ・Cコース ピザ、ラザニア、サラダ、アイス ・Dコース パスタ、ラザニア、サラダ、アイス ・Eコース パスタ、ラザニア、サラダ、ケーキ それぞれのコースが出やすい確率(事前分布?)はAコースから(0.3,0.3,0.2,0.1,0.1)とします。 【求めたいことをおさらいします】 たとえば今日のコースがAコースとし サラダ→アイス→ピザ→パスタ と1品ずつランダムにでてくると仮定します。 そのときのそれぞれのコースである可能性(確率)の推移を求めたいのです。 1品目(サラダが出された)の時点ではBコースである確率は○%、Eコースである確率は○%など・・・ ここでいくつか質問なのですが (1)コースは多項分布にあたるのでしょうか?または違う分布なのならば教えて頂きたいです。 (2)皆様ならどのような形で推定しますか?ベイズは用いて欲しいです。 例を用いてくださっても結構ですし、運ばれてきた料理を勝手に仮定して更新されていく様子を表してくださっても構いません。 質問の意味が伝わっているか分かりませんが、よろしくお願い致します。 皆様からの質問には返信で対応致します。 皆様の力を貸してください。

みんなの回答

  • f272
  • ベストアンサー率46% (8012/17124)
回答No.3

事前確率が(0.3, 0.3, 0.2, 0.1, 0.1)のとき Aコースであってサラダが出る確率=0.3/4 Bコースであってサラダが出る確率=0.3*0 Cコースであってサラダが出る確率=0.2/4 Dコースであってサラダが出る確率=0.1/4 Eコースであってサラダが出る確率=0.1/4 全部加えると0.175です。 したがって 事後確率は Aコースである確率0.3/4/0.175=0.428571 Bコースである確率0.3*0/0.175=0 Cコースである確率0.2/4/0.175=0.285714 Dコースである確率0.1/4/0.175=0.142857 Eコースである確率0.1/4/0.175=0.142857

  • f272
  • ベストアンサー率46% (8012/17124)
回答No.2

(1) 多項分布じゃないでしょ。 > サラダ→アイス→ピザ→パスタ と1品ずつランダムにでてくると仮定します。 もしAコースなら最初にサラダが出るのは確率1/4で, サラダが出た後にアイスが出るのは確率1/3で, サラダとアイスが出た後にピザが出るのは確率1/2で, サラダとアイスとピザが出た後にパスタ出るのは確率1だと思う。 (2) 事前確率=(0.3, 0.3, 0.2, 0.1, 0.1) サラダが出たら確率=(0.429, 0, 0.286, 0.143, 0.143) アイスが出たら確率=(0.5, 0, 0.333, 0.167, 0) ピザが出たら確率=(0.6, 0, 0.4, 0, 0) パスタが出たら確率=(1, 0, 0, 0, 0)

saradamakida
質問者

補足

回答ありがとうございます。 (1)について説明不足でした。 「○コースである確率」は多項分布であるかということをお尋ねしたかったのです。 回答者様の(2)のようにそれぞれのコースである可能性(確率)は0~1で推移しているため、連続的で多項分布と理解してもよろしいのでしょうか? 多項分布ならば事前分布にディリクレ分布を用いたかったのですが・・・ 理解を深めるために、事前確率からサラダが出たときの確率の更新の式を書いていただけるとありがたいです。 勉強したてなのでご迷惑をかけます。

  • tknkk7
  • ベストアンサー率11% (378/3311)
回答No.1

<1>

saradamakida
質問者

補足

押し間違いでしょうか? 気付いておられないかもしれないので、回答者様に一応通知させていただきます。

関連するQ&A

  • ガウス分布に対するベイズ推定

    計算・演算が苦手で嫌いな理系大学生です. 質題にもありますが,ガウス分布に対するベイズ推定の計算がほとんど分らない状態で困っているので,この場をお借りして質問させていただきました. 問題は以下の通りです. p(x|u)=N(x|u,b^-1) D={x_1,x_2,・・・,x_N} :観測データ集合 p(u)=N(u|m,a^-1) :uの事前分布 uは未知パラメータ,b,aは精度,m,uは平均,Nはガウス分布とする. このときのベイズ推定でパラメータ推定分布p(u|D)と推定分布p(x|D)を求めよ というものですが,計算が複雑で計算力もないため答えが求まりません. ちなみに答えは p(u|D)=N(u|Um,g^-1) Um=1/(N+λ)*(Σ^N_n=1*x_n+λ*m) g=a+N*b p(x|D)=N(x|Um,a^-1+b^-1) となるらしいです. この計算ができる方にご回答いただけたら幸いです. 詳細な説明もできるだけ含みで,ご回答よろしくお願い致します.

  • ベイズ統計学の利用法について

    頻度論的な統計手法では,確率分布の推定誤差を母数の区間推定という方法で表現します. この場合,標本数が大きくなるとその区間は狭まり,無限になれば区間は限りなく狭くなります. しかし,現実の標本数は有限ですから,区間の上限と下限があります. 実務上は,上限値あるいは下限値を母数の推定値にして,安全側の判断をします. さて,ベイズ統計手法の場合,予測した確率分布の推定誤差はどのように表現するべきなのでしょうか? 実務上でベイズ統計学を利用したいのですが,この部分で悩んでおります. どなたか,よいアドバイスをお願いいたします.

  • 確率統計:全体数の推定方法について

    一部のサンプリングにより全体数を推定する方法を教えて下さい。 例えば、100m2の砂浜にランダムに大量のビー玉が散乱しているとします。 全部の個数を数えることは困難なので、1m2四方の枠を作って、任意の5箇所のみで数を数えます。 その結果が、 (1)100個 (2) 50個 (3)  5個 (4) 70個 (5)125個 だったとします。 単純計算すると1m2あたり71個になるので、それを100倍すると、全体で7100個のビー玉があると推定できます。 しかしながら、5箇所の数には大きくバラツキがありますから、別の5箇所で数を数えると全く違った答えになりそうです。 この場合、5箇所のバラツキ(標準偏差)を求めて、○%の確率で●●個~●●個と推定して良いのでしょうか? つまり、サンプルが正規分布していると仮定して良いのでしょうか? それとも、このような場合は正規分布していると仮定せずに他の方法で計算すべきなのでしょうか? わかりにくい質問で申し訳ありませんが、よろしくお願いいたします。

  • ベイズの定理の問題

    3種のコイン』ケーススタディの実験条件は、 表の出る確率 p が 0.4, 0.5, 0.6 の3種類のコインがある。 あるコインを選び、観測事象を 「A:そのコインを10回投げたら10回表が出た」 と設定。また完全系を { B1: (p=0.4) , B2: (p=0.5) , B3: (p=0.6) } と設定する。なお、先験確率: P(B_1) = 0.2, P(B_2) = 0.6, P(B_3) = 0.2 と仮定」 [ 選んだコインが、コイン1,2,3である(離散型) 事後確率分布を求めて欲しいです この問題をベイズの定理で求めて欲しいです 計算過程だけでもかまいません P(B_1|A)= P(B_2|A)= P(B_3|A)= のような形で求めて欲しいです お手数をおかけしますがよろしくお願いします

  • ベイズの定理の問題

    3種のコイン』ケーススタディの実験条件は、 表の出る確率 p が 0.4, 0.5, 0.6 の3種類のコインがある。 あるコインを選び、観測事象を 「A:そのコインを10回投げたら5回表が出た」 と設定。また完全系を { B1: (p=0.4) , B2: (p=0.5) , B3: (p=0.6) } と設定する。なお、先験確率は一様 ( P(B1) = P(B2) = P(B3) = 1/3 ) と仮定する [ 選んだコインが、コイン1,2,3である(離散型) 事後確率分布を求めて欲しいです ベイズの定理で求めて欲しいです 計算過程だけでも構いません P(B_1|A)= P(B_2|A)= P(B_3|A)= のような形で求めて欲しいです お手数をおかけしますがよろしくお願いします

  • 確率分布の推定方法

    はじめまして。  さて,標記の件ですが,サンプル群が標準正規分布に従うと仮定して点数付けをしているのですが,どうもそのサンプル群が標準正規分布に従っていないため,いびつな点数付けになって困っています。  そうなると,他の確率分布(カイ2乗分布やt分布など)に従うと思うのですが,サンプル群がどの確率分布に当てはまりが良いかを推定する方法を教えて頂けないでしょうか。また,それが掲載されている本,ホームページ,解析ツールがあれば教えて頂けないでしょうか。  よろしくお願いします。

  • ベイズ統計の練習問題について

    ベイズ統計の練習問題のについてお尋ねします。 問題:1袋100g表示の袋が数多くあり、3つのサンプルを取り出して計測すると100,102,104gだったとします。 この袋の重さは分散1の正規分布であることが分かっている場合、袋の重さの事後分布を求めなさい。 ベイズの式は事後分布∝尤度×事前分布ということで、尤度と事前分布を求めて式を変形するようです。 回答によると 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 事前分布:値100に対する正規分布(平均=μ,分散1)の値(表示式) として進めていきます。 ここで質問ですが、正規分布(確率密度関数)の式の値に積極的な意味があるのかなという気がして、どういうことなのだろうと思います。 確率密度関数はそれを積分したときに確率が表示されるものであり、積分しないと物理的な意味がないような気がするのですが。 さらに回答を読むと、事前分布について分散1に限定かと思ったら事前分布は未知なので(←いつもそう言われますが)分散を3にして計算してみる、ということになっています。これはなぜでしょうか。 3にしてみるという試行の結果を示すだけで回答が成立するものなのでしょうか。定期試験などで。3でないといけない理由が見出だせないのですが。 よろしくお願いします。

  • ベイズ統計に関する尤度について

    ベイズ統計を展開していく際に尤度が分かっているということが前提となります。 その尤度について表のようなものを作成するわけですが、例えば、迷惑メール、非迷惑メールに”アイドル”と言う言葉が含まれるかどうかを考えます。迷惑メールの中で”アイドル”が含まれる確率A、非迷惑メールの中で”アイドル”が含まれる確率Bがそれぞれ分かっていると仮定するわけですが、一方でアイドルという単語を含むメールに関して迷惑メールである確率C、非迷惑メールである確率Dも定義可能ですね。 この場合、A+B≠1(これは当然), C+D=1(迷惑か非迷惑かしかないから)という違いがあります。実際にある練習問題ではA,Bの方を使っているのですが、C,Dのように確率が足して1になるという風にして尤度を考えることもできるように思うのです。尤度表の縦、横方向に足して1になるという風にして表を作る必要は必ずしもないのでしょうか。 尤度表を作るところこそがベイズ統計の肝というか個性が出るところだと思うのですが。よろしくお願いします。

  • ベイズの定理連続型

    .表の出る確率が様々な無数のコインがある。 あるコインを選び、観測事象を 「A:そのコインを n 回投げたら k 回表が出た」 と設定。また完全系を { B(p) }:表の出る確率は 0≦p≦1の範囲 と設定する。なお、先験確率 ( p(B(p)) )には一様分布を仮定する n=4, k=0 に対し、選んだコインの表の出る確率 p に対する (連続型)事後確率分布を計算して欲しいです P(B(p)|A)=の形式で解答をお願いします お手数をおかけしますがよろしくお願いします

  • 母平均の推定(?)

    ある被験者集団のテストスコアが正規分布になると仮定します。 このうち、上位a%の被験者の平均値がxである場合、全体の平均値がいくつになるかを推定したいのですが、どのような計算をすればいいでしょうか?