• 締切済み

ベイズ統計の練習問題について

ベイズ統計の練習問題のについてお尋ねします。 問題:1袋100g表示の袋が数多くあり、3つのサンプルを取り出して計測すると100,102,104gだったとします。 この袋の重さは分散1の正規分布であることが分かっている場合、袋の重さの事後分布を求めなさい。 ベイズの式は事後分布∝尤度×事前分布ということで、尤度と事前分布を求めて式を変形するようです。 回答によると 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 事前分布:値100に対する正規分布(平均=μ,分散1)の値(表示式) として進めていきます。 ここで質問ですが、正規分布(確率密度関数)の式の値に積極的な意味があるのかなという気がして、どういうことなのだろうと思います。 確率密度関数はそれを積分したときに確率が表示されるものであり、積分しないと物理的な意味がないような気がするのですが。 さらに回答を読むと、事前分布について分散1に限定かと思ったら事前分布は未知なので(←いつもそう言われますが)分散を3にして計算してみる、ということになっています。これはなぜでしょうか。 3にしてみるという試行の結果を示すだけで回答が成立するものなのでしょうか。定期試験などで。3でないといけない理由が見出だせないのですが。 よろしくお願いします。

みんなの回答

  • f272
  • ベストアンサー率46% (8013/17127)
回答No.4

確率分布(すなわち確率)は... と書いていますが,連続値を取る確率変数の分布は,確率密度関数で表します。 f(x1,μ)dx1*f(x2,μ)dx2*f(x3,μ)dx3ではないかと思うのです というのは,もちろん確率で表せば ∫f(x1,μ)dx1*∫f(x2,μ)dx2*∫f(x3,μ)dx3=∫∫∫f(x1,μ)*(x2,μ)*f(x3,μ)dx1dx2dx3 (積分はある区間での定積分) ですが,積分区間をうまく考えるのが困難ですから,通常通り確率密度関数で表すとf(x1,μ)*f(x2,μ)*f(x3,μ)です。

  • f272
  • ベストアンサー率46% (8013/17127)
回答No.3

> 確率密度関数の関数値ってどういう意味になるものでしょうか。 3つのサンプルは分散1の正規分布N(μ,1)に従い,その密度関数はそれぞれf(x,μ)=1/√(2π)*exp(-(x-μ)^2/2)であらわされます。3つのサンプルの同時確率分布であればg(x1,x2,x3,μ)のようになりますが,ここではサンプルを取り出す試行は独立ですから,同時確率分布はg(x1,x2,x3,μ)=f(x1,μ)*f(x2,μ)*f(x3,μ)です。ここまではμは定数,x1,x2,x3は確率変数だと思っています。 サンプルを取り出した後はx1,x2,x3は実現値となっていますから定数と考え,逆にμを変数だと思えば,f(x1,μ)*f(x2,μ)*f(x3,μ)はμを変数とする関数です。これを尤度関数と考えます。 確率密度関数の関数値とはこの尤度関数のことを意味しているのでしょう。 > 尤度をそうでないもの(確率密度関数ではないもの)として進めていくことはできないのでしょうか。 形式的にはできるでしょうが,ベイズ推定とは呼べないものになりますから,それにどんな意味があるのかは別論です。

skmsk1941093
質問者

お礼

回答ありがとうございます。私が細かいことに拘っているのが問題なのかも知れませんが、確率分布(すなわち確率)はf(x1,μ)*f(x2,μ)*f(x3,μ)ではなく、f(x1,μ)dx1*f(x2,μ)dx2*f(x3,μ)dx3ではないかと思うのです。dx1=dx2=dx3=dxとしてdx^3をかけるということですが。確率密度関数fにdxをかけて幅dxの短冊の確率になるわけですね。ここで何をやるにしてもdxは一定であるとしたら結局dxを掛ける必要もなくなるから拘る必要はない、と考えるのでしょうか。こだわり過ぎているかもですが。

  • f272
  • ベストアンサー率46% (8013/17127)
回答No.2

> ベイズ定理を構成する事前分布、尤度について評価法に幅があるということになるのでしょうか。 評価法に幅があるのではありません。評価法は決まっていますが,その評価で使う事前分布は客観的に決められるものではなく,事前分布は主観的に決める,ということです。 尤度については数式的には同時確率と同じものです。あなたも 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 というように書いていますね。

skmsk1941093
質問者

お礼

回答ありがとうございます。事前分布に関しては主観的に決めるとか、何も情報がないからすべてイーブンにするとかいうことをしますね。任意の初期条件のようにも見えます。 尤度に関してはどうかなというのがもともとの質問の趣旨です。 --- 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 --- これはテキストに書いてあったのでそういうものかな?という疑問がこのスレの発端です。確率密度関数の関数値ってどういう意味になるものでしょうか。かつその積ですね。確率密度関数は確率ではないですね。確率だったら独立の現象での発生確率が積になるわけですが。 ただ、確率密度関数が高いほうが発生確率は高くなることも間違いないわけですが。尤度をそうでないもの(確率密度関数ではないもの)として進めていくことはできないのでしょうか。

  • f272
  • ベストアンサー率46% (8013/17127)
回答No.1

> 確率密度関数はそれを積分したときに確率が表示されるものであり、積分しないと物理的な意味がないような気がするのですが。 連続型確率変数の場合には,確率密度関数を使って議論するのが簡単になります。わざわざ積分をした確率で議論をするのは煩雑になるのです。確率密度関数の値が大きいのは(その点ではなく)その周辺での確率が大きいという意味があります。 > 3にしてみるという試行の結果を示すだけで回答が成立するものなのでしょうか。 事前分布は未知でしょうが,「この袋の重さは分散1の正規分布であることが分かっている」のであれば,それを使って事前分布を作るのが自然です。もちろんこうしなければいけないというわけではありませんので,主観的に決めた事前分布を使っても議論は可能です。それが「分散を3にして計算してみる」ということに対応しています。

skmsk1941093
質問者

お礼

回答ありがとうございます。ある程度、幅を持たせた解釈になるのでしょうか。ベイズの定理のあの式を使って評価するわけですが、ベイズ定理を構成する事前分布、尤度について評価法に幅があるということになるのでしょうか。

関連するQ&A

  • ベイズ統計入門書の例題の尤度について

    ベイズ統計の入門書を読んでいるのですが、いろんな適用方法があるのだとは思いますが、簡単に言うと以下のように見えます。 あのベイズの式があり、尤度が既知で、事前分布を与えると、データに依存して事後確率が変化するということをやっている、ということです。で、その事後確率を次の事前確率として次のデータでさらに次の事後確率を求めるという流れです。漸化式の計算と同じです 確率が事前から事後に流れることが時間発展のような形式となり、データに依存したシミュレーション的なアルゴリズムができそうです。 ここでやや疑問に思えるのが尤度です。尤度とは発展方程式の定数係数のような位置づけのように見てきます。尤度はこのベイズ統計で揺るぎのない確立した数値ということになるのでしょうか。尤度が時間的に変化することもありうるのでしょうか。そうなると未知数の積が出てくるので非線形という印象になるのですが。 ベイズ統計の初等的な事例で、異性が自分に好意を持つ、というようなものが紹介されています。好意を持っている異性の態度が”今日は、いい、普通、悪い”の3種であり、その確率(これが尤度表らしいですが)を既知として保持し、それとデータ(あしたの態度3種)に従って確率が変化するというような事例がありますが、尤度自体が簡単にはわからないものなのではないかと思うのですが。ただ単に興味を引く題材にした事例なのかもしれませんが。尤度についてどのように考えるのでしょうか。 異性の問題では結局、そこが難しいんじゃないか、と聞きたくなるわけですが。よろしくお願いします。

  • ベイズ統計の用語についてお尋ねします。

    ベイズ統計において事前確率、事後確率というものが出てきます(有名なので、式は書きませんが)。私が読んでいる本では事前、事後、という言葉の語感と定義が一致していません。ただ、そのような名前で呼ばれるということのようです。 推測ですが、条件なしで単純に全データから発生事象の数を除したものが事前、条件付き確率が事後、すなわち、ベイズの式は単純な確率(事前)から条件付き確率(事後)を陽形式で表示できるということで、後で条件を付けたらどうなるかが分かるということなのでしょうか。 用語の語源を理解すると頭に入りやすいと思うのです。 よろしくお願いします。

  • ベイズ統計の公式と積分について

    涌井さんの「道具としてのベイズ統計」という本で、勉強をしているのですが、理解できない点があります。 下記のベイズの公式 π(θ|D) = k f(D|θ) × π(θ) ( k = 1/p(D) ) …(1) π(θ| D) ∝ f (D | θ) × π(θ)…(2) より、比例定数kの計算方法がわかりません。 本では、kは確率の総和が1、すなわちθのすべてについて和が1になる性質を利用する と記載されていますが、いまいちピンときません。 例えば、 表が出る確率がθのコインがあり、表・表・裏・裏の順に結果が出た、という問題があります。 そこで1回目の事後分布を求める際、 理由不十分の原則で事前分布はπ(θ)=1、尤度はf(表|θ)=θ よって、事後分布π(θ|D1) ∝ θ × 1 …(3) 0≦θ≦1で確率の総和が1という条件から比例定数が求められます。 よって、1回目の事後分布π(θ|D1) = 2θ …(4) ・・・・以下省略 ここの(3)から(4)を導き出す、計算がわかりません。 どなたか、やさしく教えていただけると大変助かります。 よろしくお願いいたします。

  • ベイズ更新について

    ベイズ統計に詳しい人に教えてもらいたいのですが、念の為に確認させてください。 ------ | A _| B 確率  | 0.6 | 0.4 --------------------- 項目1 | 0.7 | 0.1 項目2 | 0.5 | 0.3 項目3 | 0.2 | 0.5 --------------------- 尤度  | 0.07 | 0.015 の場合、項目の掛け算が尤度で、Aの事後確率は、 0.875=( 0.07*0.6 ) / ( (0.07*0.6) + (0.015*0.4) ) で、良いですか? 違っていたら、訂正おねがいします。 もし、良いのなら、ベイズ更新で事前確率になるのが、0.875になるのですよね? ------ | A _| B 確率  | 0.875| 0.125 --------------------- 項目1 | 0.7 | 0.1 項目2 | 0.5 | 0.3 項目3 | 0.2 | 0.5 --------------------- 尤度  | 0.07 | 0.015 それを計算すると、 0.970=( 0.07*0.875 ) / ( (0.07*0.875) + (0.015*0.125) ) になり、何度か更新すると、1か0になる結果になります。 そうならないために、ベイズ更新というのは、どのタイミングですればよいのでしょうか?

  • ベイズ定理の式の展開と意味について

    P(A|B)=P(B|A)P(A)/P(B) はよく見るベイズ定理です。 左辺P(A|B)は条件付き確率で事後分布で、P(A)を事前分布、P(B|A)を”Aの条件での尤度”となるそうです。 ここで質問ですが、P(B|A)は見方によっては条件付き確率ということにも見えますが、尤度とのことです。これを尤度というのはなぜなのでしょうか。そも尤度の定義もよくわからない面があります。定義ですから盲目的に覚えるだけなのかもですが、定義の仕方がいろいろあるようにも見えるのですが。 また、P(A|B)=P(B|A)P(A)/P(B)の分母を表記せず、P(A|B)~P(B|A)P(A)のような表記が可能になるようです。これがなぜなのか教えて頂きたいのですが。これは目的依存なのだろうと思いますが、テキストにこのような表記がありました。 よろしくお願いします。

  • 基礎統計の問題なんですが・・・。

    基礎統計の問題で、参考書を読んでもなかなかできない問題があって 苦しんでいます。 もしわかるかたがいたら、おしえていただけませんか? 正規分布N(50,10)を表す(確率密度関数の)グラフと 正規分布N(50,20)のグラフを書き、分布形の特徴の違いを示し 分散の意味を簡単に説明せよ。 こんな問題なんですが、 応えていただける範囲で教えていただけないでしょうか? よろしくお願いします><

  • 確率・統計の問題についての質問です。

    問題:「確率変数Xは、平均50、分散9の正規分布に 従うとする。次の条件を満たすCを求めよ。」 ・P(50-C<X<50+C)=99.7% 手持ちの回答では、「Xを標準化した確率変数をZとすると、 Zは標準正規分布に従う、そして今、標準正規分布において 確率が99.7%になるのはZが+-3σの範囲である。 よって、C/σ=3からC=9となる」(σ:標準偏差) ここで私が疑問に持ったのはなぜ?Zの範囲+-3にσを かけるのでしょうか?いま分散が9ということはσは3ですよね? しかし、3のままで式を変形していくと、C=9にはならない と思います。なぜσをつけるのでしょうか? そこのところがわかりません。 どなたか教えてください。 よろしくお願いします<(_ _)>。

  • 自由意志、自由選択とベイズ統計について。

    人の行動、自由意志、自由選択は、フィジカルに依存するが、本質的にはベイズ統計的なものですか? つまり、「自由選択ができたはずだ」というのは、事後確率からみた幻想であって、事後確率が出力される前の事前確率において、一番高い可能性が、選択されたにほかなりませんか?

  • 統計学の問題

    あるスタジアムに弁当を納入している業者が、過去の弁当売り上げ数の分布を調べたところ、その分布は平均500、分散10000の正規分布に従うことを見いだした。この場合、売り切れが起こる確率を0.2(20%: 5回に1回)以下に抑えるためには、最低何個の弁当を納入すればよいか。 という問題が解けません。 回答よろしくお願いします。

  • ベイズの定理とオッズ・尤度比の関係

    ベイズの定理「P(Y|X)=P(Y)P(X|Y) / P(X)」が なんで「事後オッズ=尤度比×事前オッズ」であらわせられるのかがよくわかりません。