- 締切済み
ベイズ統計の練習問題について
ベイズ統計の練習問題のについてお尋ねします。 問題:1袋100g表示の袋が数多くあり、3つのサンプルを取り出して計測すると100,102,104gだったとします。 この袋の重さは分散1の正規分布であることが分かっている場合、袋の重さの事後分布を求めなさい。 ベイズの式は事後分布∝尤度×事前分布ということで、尤度と事前分布を求めて式を変形するようです。 回答によると 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 事前分布:値100に対する正規分布(平均=μ,分散1)の値(表示式) として進めていきます。 ここで質問ですが、正規分布(確率密度関数)の式の値に積極的な意味があるのかなという気がして、どういうことなのだろうと思います。 確率密度関数はそれを積分したときに確率が表示されるものであり、積分しないと物理的な意味がないような気がするのですが。 さらに回答を読むと、事前分布について分散1に限定かと思ったら事前分布は未知なので(←いつもそう言われますが)分散を3にして計算してみる、ということになっています。これはなぜでしょうか。 3にしてみるという試行の結果を示すだけで回答が成立するものなのでしょうか。定期試験などで。3でないといけない理由が見出だせないのですが。 よろしくお願いします。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- f272
- ベストアンサー率46% (8530/18260)
確率分布(すなわち確率)は... と書いていますが,連続値を取る確率変数の分布は,確率密度関数で表します。 f(x1,μ)dx1*f(x2,μ)dx2*f(x3,μ)dx3ではないかと思うのです というのは,もちろん確率で表せば ∫f(x1,μ)dx1*∫f(x2,μ)dx2*∫f(x3,μ)dx3=∫∫∫f(x1,μ)*(x2,μ)*f(x3,μ)dx1dx2dx3 (積分はある区間での定積分) ですが,積分区間をうまく考えるのが困難ですから,通常通り確率密度関数で表すとf(x1,μ)*f(x2,μ)*f(x3,μ)です。
- f272
- ベストアンサー率46% (8530/18260)
> 確率密度関数の関数値ってどういう意味になるものでしょうか。 3つのサンプルは分散1の正規分布N(μ,1)に従い,その密度関数はそれぞれf(x,μ)=1/√(2π)*exp(-(x-μ)^2/2)であらわされます。3つのサンプルの同時確率分布であればg(x1,x2,x3,μ)のようになりますが,ここではサンプルを取り出す試行は独立ですから,同時確率分布はg(x1,x2,x3,μ)=f(x1,μ)*f(x2,μ)*f(x3,μ)です。ここまではμは定数,x1,x2,x3は確率変数だと思っています。 サンプルを取り出した後はx1,x2,x3は実現値となっていますから定数と考え,逆にμを変数だと思えば,f(x1,μ)*f(x2,μ)*f(x3,μ)はμを変数とする関数です。これを尤度関数と考えます。 確率密度関数の関数値とはこの尤度関数のことを意味しているのでしょう。 > 尤度をそうでないもの(確率密度関数ではないもの)として進めていくことはできないのでしょうか。 形式的にはできるでしょうが,ベイズ推定とは呼べないものになりますから,それにどんな意味があるのかは別論です。
- f272
- ベストアンサー率46% (8530/18260)
> ベイズ定理を構成する事前分布、尤度について評価法に幅があるということになるのでしょうか。 評価法に幅があるのではありません。評価法は決まっていますが,その評価で使う事前分布は客観的に決められるものではなく,事前分布は主観的に決める,ということです。 尤度については数式的には同時確率と同じものです。あなたも 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 というように書いていますね。
お礼
回答ありがとうございます。事前分布に関しては主観的に決めるとか、何も情報がないからすべてイーブンにするとかいうことをしますね。任意の初期条件のようにも見えます。 尤度に関してはどうかなというのがもともとの質問の趣旨です。 --- 尤度:正規分布の式(平均=μ,分散1)に100,102,104のそれぞれを代入して得た表示式の積を取る。 --- これはテキストに書いてあったのでそういうものかな?という疑問がこのスレの発端です。確率密度関数の関数値ってどういう意味になるものでしょうか。かつその積ですね。確率密度関数は確率ではないですね。確率だったら独立の現象での発生確率が積になるわけですが。 ただ、確率密度関数が高いほうが発生確率は高くなることも間違いないわけですが。尤度をそうでないもの(確率密度関数ではないもの)として進めていくことはできないのでしょうか。
- f272
- ベストアンサー率46% (8530/18260)
> 確率密度関数はそれを積分したときに確率が表示されるものであり、積分しないと物理的な意味がないような気がするのですが。 連続型確率変数の場合には,確率密度関数を使って議論するのが簡単になります。わざわざ積分をした確率で議論をするのは煩雑になるのです。確率密度関数の値が大きいのは(その点ではなく)その周辺での確率が大きいという意味があります。 > 3にしてみるという試行の結果を示すだけで回答が成立するものなのでしょうか。 事前分布は未知でしょうが,「この袋の重さは分散1の正規分布であることが分かっている」のであれば,それを使って事前分布を作るのが自然です。もちろんこうしなければいけないというわけではありませんので,主観的に決めた事前分布を使っても議論は可能です。それが「分散を3にして計算してみる」ということに対応しています。
お礼
回答ありがとうございます。ある程度、幅を持たせた解釈になるのでしょうか。ベイズの定理のあの式を使って評価するわけですが、ベイズ定理を構成する事前分布、尤度について評価法に幅があるということになるのでしょうか。
お礼
回答ありがとうございます。私が細かいことに拘っているのが問題なのかも知れませんが、確率分布(すなわち確率)はf(x1,μ)*f(x2,μ)*f(x3,μ)ではなく、f(x1,μ)dx1*f(x2,μ)dx2*f(x3,μ)dx3ではないかと思うのです。dx1=dx2=dx3=dxとしてdx^3をかけるということですが。確率密度関数fにdxをかけて幅dxの短冊の確率になるわけですね。ここで何をやるにしてもdxは一定であるとしたら結局dxを掛ける必要もなくなるから拘る必要はない、と考えるのでしょうか。こだわり過ぎているかもですが。