- ベストアンサー
ベイズ推定とMAP検定による統計学の理解についての質問
- 統計学を勉強している者です。回帰分析を多少学習し、現在ベイズの定理について解説書で学習しています。
- マラソン大会を実施するかしないかの確率を算出する問題について疑問があります。晴雨の項目が最も実施中止に影響するか、各判断基準の相関が結果に影響するかについて検討しています。
- 尤度の算出や事前確率の設定方法についても詳細な説明を求めています。また、直近の結果を重要視する条件を付けて算出する方法についても知りたいです。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
マラソン大会を実施する確率 = f(晴雨, 温度, 湿度, 風) というような関数を推定した方が良いのではないかとは思いますが、まあ、それは横に置いておきましょう。 > 尤度の算出は、当日の天候を元に、それぞれの実施確率、中止確率を算出し、 実施確率、中止確率ではありません。 実施(又は中止)したときの天気が雨である確率を求めているのです。 > (2)各判断基準に、互いに相関がある場合は、結果の数値に影響するのでしょうか?(本問題では互いに独立と仮定されています) 影響しますが、その場合推定できないこともあります。 ご質問の例ですと、 P(晴雨=雨,温度=暖,湿度=高,風=弱|実施=x) = P(晴雨=雨|実施=x)P(温度=暖|実施=x)P(湿度=高|実施=x)P(風=弱|実施=x) (x = Y or N) として計算していますが、相関があるということはこの計算ができないということです。 相関について何らかの仮定を置かないといけなくなります。 > (3)この問題に、「より直近の結果を重要視するものとする」といったような条件を付けて、算出することはできるのでしょうか?もしできる場合、どのような考え方で、計算をすればよいでしょうか? 重み付けして尤度を算出すれば良いのでは? 例えば、事例1~7の順に実施されたものとし、それぞれ重みを 1/7, 2/7, 3/7, 4/7, 5/7, 6/7, 7/7(=1) とします。 実施で雨の確率は重み付けなしですと 2/4 = 1/2 ですが、重み付けありでは (0*3/7+1*4/7+1*5/7+0*7/7)/(3/7+4/7+5/7+7/7) = 9/19 となります。
その他の回答 (3)
回答No.3お礼 > 温度が暖かいという情報だけ、公開されていることがいまいちわかりませんでした。 混乱させてしまい、すみません。 そこは消し忘れです。 正しくは、 P(晴雨,温度|実施=x) = P(晴雨|実施=x)P(温度|実施=x) です。
回答No.2お礼 > 知識不足で大変申し訳ございませんが、計算ができないとはどういう意味でしょうか? 話を簡単にするために、晴雨と温度のみに限定します。 [実施] 温度 晴雨 暖 適 冷 計 晴 0 0 0 0 曇 1 0 1 2 雨 0 1 1 2 計 1 1 2 4 [中止] 温度 晴雨 暖 適 冷 計 晴 2 0 0 2 曇 0 0 0 0 雨 0 0 1 1 計 2 0 1 3 という情報が既に得られています。 P(晴雨,温度|実施=x) = P(晴雨|実施=x)P(温度=暖|実施=x) として良い場合、先の情報からそれぞれの尤度は次のように計算されます。 [実施] 温度 晴雨 暖 適 冷 計 晴 0 0 0 0 曇 1/8 1/8 1/4 1/2 雨 1/8 1/8 1/4 1/2 計 1/4 1/4 1/2 1 [中止] 温度 晴雨 暖 適 冷 計 晴 4/9 0 2/9 2/3 曇 0 0 0 0 雨 2/9 0 1/9 1/3 計 2/3 0 1/3 1 しかし、 P(晴雨,温度|実施=x) = P(晴雨|実施=x)P(温度=暖|実施=x) が成り立たなければ、 [実施] 温度 晴雨 暖 適 冷 計 晴 0 0 0 0 曇 a b 1/2-a-b 1/2 雨 1/4-a 1/4-b a+b 1/2 計 1/4 1/4 1/2 1 [中止] 温度 晴雨 暖 適 冷 計 晴 c 0 2/3-c 2/3 曇 0 0 0 0 雨 2/3-c 0 c-1/3 1/3 計 2/3 0 1/3 1 となり、a,b,cは0≦a,b≦1/4、0≦c≦2/3を満たす組み合わせから選ぶことになりますが、どの値が最適と思われますか? (これが何らかの仮定が必要ということです) 十分な情報が得られていれば、それぞれの頻度を使うという手もあるでしょう。 [実施] 温度 晴雨 暖 適 冷 計 晴 0 0 0 0 曇 1/4 0 1/4 1/2 雨 0 1/4 1/4 1/2 計 1/4 1/4 1/2 1 [中止] 温度 晴雨 暖 適 冷 計 晴 2/3 0 0 2/3 曇 0 0 0 0 雨 0 0 1/3 1/3 計 2/3 0 1/3 1 さて、この場合事後確率を計算できますか?
お礼
ありがとうございます。 お礼が遅くなり申し訳ありません。 正直に申し上げますと、なかなか理解することが出来ませんでした。(汗) >P(晴雨,温度|実施=x) = P(晴雨|実施=x)P(温度=暖|実施=x) この式が、仮定を意味しているのでしょうか? 温度が暖かいという情報だけ、公開されていることがいまいちわかりませんでした。 尤度の算出については、理解できたものの、その後のa,b,c 等についてもいまいち理解できず、、、、 まだまだ知識が足りないようなので、もう一度体系的に学習して、振り返ってみることにします。 ご親切にご回答を下さり、ありがとうございました。
- kamiyasiro
- ベストアンサー率54% (222/411)
企業でsqcを推進する立場にある統計家です。 興味深い問題で、今、取り組んでいるところです。 (1)重みを考慮することはあります。 (2)当然、相関があれば、出現しない(低頻度の)事象が出てきますので、 起こりうる事象の確率は上がります。 でもこれは、学習の結果出てくる分布として考慮されていると思います。 あるいは、空間を直交でなく角度を付けるのかなあ? それが分かりません。 (1)(2)は、多項のディリクレ分布を使って解く問題でしょうが、 (3)は違うと思います。 ここが分からない点です。 ところで、map検定って聞いたことが無い検定法ですが、 どんな検定統計量を用いるのですか? それとも、地図の知識を問う、趣味の話? だとしたら、数学のカテで紛らわしい言葉使わないで下さいね。
お礼
ご回答ありがとうございます。 >学習の結果出てくる分布として考慮されていると思います。 私もこの周辺の内容が、非常にあいまいで、腑に落ちない状況でいます。 >3)は違うと思います。ここが分からない点です。 quaestioさんから頂いた、ご回答のように、(3)も重みづけの考え方で、うまくいきそうな気がします。 >map検定って聞いたことが無い検定法ですが、 正確には、MAP決定、MAP推定でした。最大事後確率推定法(Maximum a posteriori estimation method) とうものらしいです。 ご回答ありがとうございます。
お礼
ご回答ありがとうございます。 >実施確率、中止確率ではありません。 実施(又は中止)したときの天気が雨である確率を求めているのです。 ベイズで最も重要な、事後確率、尤度、事前確率の定義づけの説明が足りていませんでした。申し訳ございません。 ご指摘の通り、尤度は、実施(又は中止)したときの各天候である確率です。 > (2) >相関があるということはこの計算ができないということです。 >相関について何らかの仮定を置かないといけなくなります 知識不足で大変申し訳ございませんが、計算ができないとはどういう意味でしょうか? よろしければ、ご教授お願いいたします。 本問題では、各天候条件が同時確率のため乗算で尤度を算出しているみたいです。 > (3) >重み付けして尤度を算出すれば良いのでは? 大変勉強になりました。重みづけの考え方は、試していきます。 ありがとうございました。