• ベストアンサー

ベイズ統計に興味があり、ベイズフィルタを作ってみた

ベイズ統計に興味があり、ベイズフィルタを作ってみたいと思ったのですが、サイトを調べてみてもよくわかりません。 誰か初心者でもわかるように説明してもらえないでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • tac351115
  • ベストアンサー率66% (109/164)
回答No.1

関連するQ&A

  • ベイズ統計学につきまして。

    ベイズ統計学による、主観的確率に基づく推計で、100%間違いない結論を出せるのは、どんな場合でしょうか。

  • ベイズフィルターを全て自分の手で実装したいと思うの

    ベイズフィルターを全て自分の手で実装したいと思うのですが、プログラミングなどの知識が全くありません。果たして全て自分の手でオリジナルのものを作ることができるのでしょうか? あと初心者からでも始められて、最終的にベイズフィルターを作ることができる言語を教えてください。

  • ベイズ統計学(ベイズ決定理論)を学びたい

    高卒社会人です。 統計的推論手法を身につけたいと思うに至りました。 書店で色々入門書を漁ったのですが、自分に数学的素養が 足りないためかチンプンカンプンです。 ベイズ統計学を独学で学ぶためにはどのような前提知識が 必要となるのでしょうか? お勧めの自習書、学習pathなど、併せてご紹介頂け るとうれしいです。 よろしくお願いいたします。

  • ベイズ統計学の利用法について

    頻度論的な統計手法では,確率分布の推定誤差を母数の区間推定という方法で表現します. この場合,標本数が大きくなるとその区間は狭まり,無限になれば区間は限りなく狭くなります. しかし,現実の標本数は有限ですから,区間の上限と下限があります. 実務上は,上限値あるいは下限値を母数の推定値にして,安全側の判断をします. さて,ベイズ統計手法の場合,予測した確率分布の推定誤差はどのように表現するべきなのでしょうか? 実務上でベイズ統計学を利用したいのですが,この部分で悩んでおります. どなたか,よいアドバイスをお願いいたします.

  • ベイズ統計入門書の例題の尤度について

    ベイズ統計の入門書を読んでいるのですが、いろんな適用方法があるのだとは思いますが、簡単に言うと以下のように見えます。 あのベイズの式があり、尤度が既知で、事前分布を与えると、データに依存して事後確率が変化するということをやっている、ということです。で、その事後確率を次の事前確率として次のデータでさらに次の事後確率を求めるという流れです。漸化式の計算と同じです 確率が事前から事後に流れることが時間発展のような形式となり、データに依存したシミュレーション的なアルゴリズムができそうです。 ここでやや疑問に思えるのが尤度です。尤度とは発展方程式の定数係数のような位置づけのように見てきます。尤度はこのベイズ統計で揺るぎのない確立した数値ということになるのでしょうか。尤度が時間的に変化することもありうるのでしょうか。そうなると未知数の積が出てくるので非線形という印象になるのですが。 ベイズ統計の初等的な事例で、異性が自分に好意を持つ、というようなものが紹介されています。好意を持っている異性の態度が”今日は、いい、普通、悪い”の3種であり、その確率(これが尤度表らしいですが)を既知として保持し、それとデータ(あしたの態度3種)に従って確率が変化するというような事例がありますが、尤度自体が簡単にはわからないものなのではないかと思うのですが。ただ単に興味を引く題材にした事例なのかもしれませんが。尤度についてどのように考えるのでしょうか。 異性の問題では結局、そこが難しいんじゃないか、と聞きたくなるわけですが。よろしくお願いします。

  • ベイズ統計の用語についてお尋ねします。

    ベイズ統計において事前確率、事後確率というものが出てきます(有名なので、式は書きませんが)。私が読んでいる本では事前、事後、という言葉の語感と定義が一致していません。ただ、そのような名前で呼ばれるということのようです。 推測ですが、条件なしで単純に全データから発生事象の数を除したものが事前、条件付き確率が事後、すなわち、ベイズの式は単純な確率(事前)から条件付き確率(事後)を陽形式で表示できるということで、後で条件を付けたらどうなるかが分かるということなのでしょうか。 用語の語源を理解すると頭に入りやすいと思うのです。 よろしくお願いします。

  • ベイズ統計に関する尤度について

    ベイズ統計を展開していく際に尤度が分かっているということが前提となります。 その尤度について表のようなものを作成するわけですが、例えば、迷惑メール、非迷惑メールに”アイドル”と言う言葉が含まれるかどうかを考えます。迷惑メールの中で”アイドル”が含まれる確率A、非迷惑メールの中で”アイドル”が含まれる確率Bがそれぞれ分かっていると仮定するわけですが、一方でアイドルという単語を含むメールに関して迷惑メールである確率C、非迷惑メールである確率Dも定義可能ですね。 この場合、A+B≠1(これは当然), C+D=1(迷惑か非迷惑かしかないから)という違いがあります。実際にある練習問題ではA,Bの方を使っているのですが、C,Dのように確率が足して1になるという風にして尤度を考えることもできるように思うのです。尤度表の縦、横方向に足して1になるという風にして表を作る必要は必ずしもないのでしょうか。 尤度表を作るところこそがベイズ統計の肝というか個性が出るところだと思うのですが。よろしくお願いします。

  • ベイズ統計で、私に非が無かったと証明できますか?

    従業員が30人の会社に勤めています。 物置にあった、段ボールが紛失してしまいました。 誰かが「私が捨てているのを見た気がする」と上司に言いました。 それで、私のせいにされてしまいました。 しかし、私は全く覚えがないのです。 私に非がない確率を、数学的に証明するにはどうすれば良いですか? ベイズ統計で証明できますか?

  • 数学のベイズ統計についてお尋ねします。

    ベイズ統計における数学表記についてお尋ねします。事象A, B, Cについてベイズ統計の表記として以下のものがあります(テキストに載っていた)。 P(A|B,C)=P(A,B,C)/P(B,C) P(A,B|C)=P(A,B,C)/P(C) 左辺に出てくる表記でA|B,CというようなものはA|(B,C)というものではないかと思いますが、どうでしょうか。それとも(A|B),Cでしょうか。 A|(B,C) だと事象B,Cが成り立つという条件の下でAが成り立つという意味であり、 (A|B),C だと事象Bが成り立つという条件の下でAが成り立ち、そして(かつ)Cが成り立つ ですね。 表記として解釈が2つ成り立つように思うのですが、どのように整理されるのでしょうか。 あるいはそのどちらでもない、としたらどういう処理になるでしょうか。 また、Pというものを関数と考えたとき、表記上、1,2,3変数どれにも対応しているというところが融通無碍という感じでそれでいいのだろうかという気持ちになります。関数と考えてはいけないのでしょうか。 ベイズ統計の理論は数学的表記に従って式が展開されるので式の表現によって時間を遡ることも許していると思います(逆確率とか)。そのため数式計算としての厳密性(四則演算とかの導入)が必要だと思うのですが。P(様々な事象)ということになるとこんな式の展開はアリか?という疑問も出てきます。どのように整理するのでしょうか。 例えば”|の左右はカッコでまとめることになっている”とかの規則があるとかですが。 よろしくお願いします。

  • ベイズ統計について教えてください

    「目の前にツボが1つあり、AのツボかBのツボのどちらかである。Aのツボには9個の白球と1個の黒球が、Bのツボには2個の白球と8個の黒球が入っている。目の前のツボから1個取り出し色を確認してからツボに戻し、再び1個取り出し色を確認するものとする。 20回球を観測した時、黒球が出た回数に対応して、ツボがBである事後確率について表にしたのである」(小島寛之著「ベイズ統計学入門」pp.157)の表中の数値の求め方が分かりません。 黒の回数 0 1 2   … 事後確率 8,62×(1/10)^14 3.10×(1/10)^12 1.12×(1/10)^10  … 生起確率 1.05×(1/10)^14 8.39×(1/10)^12 3.19×(1/10)^10  … 計算の仕方が分れば、黒の回数3以降は、類推できると思います。よろしくお願いします。