• ベストアンサー

二項分布の成功確率を求める方法(再々)

度々、お世話になっております。 先日、以下のような2項分布において成功確率が未知である時の求め方を教えていただきました。 成功確率:0.01 試行回数:200回 以上の二項分布は以下のようになります。 試行  0 1 2 3 4 5 ... 分布 0.1340 0.2707 0.2720 0.1814 0.0902 0.03572 ... 今回は前回の派生になるかと思います。 試行5回における分布の累積は上記結果から0.983977です。 あるいは期待値は1.898284です。 それでは逆に、この結果、すなわち試行5回までの分布情報から成功確率を求めることが可能でしょうか(成功確率が未知と言うことです)? 最終的に何をしたいのかと言うと試行5回においてある基準値(累積値)を設定した場合の成功確率を求めたいのです。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.4

> ”p=”の式に変換できるでしょうか? コンピュータで数値計算を行って求めるしかないと思います。 ご質問の例についてNo.3の求め方で成功確率を実際に計算してみます。 ソフトウェアは色々あると思いますが、以下は統計ソフトR(Rについては参考URLを参照)での計算例です。 > r <- c(0.1340, 0.2707, 0.2720, 0.1814, 0.0902, 0.03572) # 相対度数 > L <- function(p) prod((dbinom(0:5, 200, p))^r)*(1-pbinom(5, 200, p))^(1-sum(r)) # 尤度関数 > optimize(f = L, interval = c(0, 1), maximum = TRUE) # 最大化 $maximum [1] 0.009988102 $objective [1] 0.1847092 となり、成功確率は0.009988102と計算されました。

参考URL:
http://www.r-project.org/, http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
sano018463
質問者

お礼

どうもありがとうございました。 おかげで助かりました。 まだ統計ソフトRの使い方を十分に習得できていませんがいろいろ試してみます。 ありがとございました。

その他の回答 (3)

noname#227064
noname#227064
回答No.3

「試行5回・・・」という書き方をされていますが、これは「成功回数」のことで、5回だけデータをとるということではないですよね? 成功回数が6回以上のデータは、値がわからない或いは用いたくないので、5回までのデータから成功確率を求めたいのですよね? そうだとして回答します。 > すなわち少ない試行で判断をするためには統計的(不偏が成立している)には実際の値(ここだと成功確率=0.01)より必然的に小さい値になると言うことですね? 当然、大きい値を捨てているのですから、小さい値になります。 最尤推定法による求め方を書いておきます。 成功確率p、試行回数200回の二項分布からn個の標本を得た。 成功回数0~mまでの度数がf0~fmで、m+1以上の度数はわからないとします。 このときの尤度関数は、 L = nC(Σfi)*{1-F(m,200,p)}^(n-Σfi)*Π{200Ck*p^k*(1-p)^(200-k)}^fk となります。ここで、Cはコンビネーション、F(m,200,p)は成功回数mまでの分布関数です。 このLを最大にするpが、求める成功確率の最尤推定量となります。 nやfiがわからず、相対度数r0~rmしかわかっていないのならば、 {1-F(m,200,p)}^(1-Σri)*Π{p^k*(1-p)^(200-k)}^rk が最大になるようなpを求めれば良いでしょう。

sano018463
質問者

補足

解答ありがとうございます。 ここ数日、考え込んでいたので返信が遅くなりました。 頂いた解答についての考え方は理解できるのですがここをどう解いていくとpが求められるのかと言う解法が出てきません。 ”p=”の式に変換できるでしょうか? 改めてお教え願えますか?

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

#1です。 > 少ない試行で判断をするためには‥‥実際の値より必然的に小さい値になると言うことですね? そんなことはありません。「不偏」という以上、1個のデータを採る時の推定値は、分布の平均そのものであって、大小の偏りはありません。 ただし(だまされやすいのは)分布の形が非対称である場合です。結果の「回数」を考えると、平均よりも小さいデータが出てくる確率が高いと言えます。また、非対称でなくても「平均より込んでいるバスに乗る確率」のほうが「平均よりすいているバスに乗る確率」よりも大きい、というパラドックスもあります。 99本のハズレくじと、1本の当たりくじ(賞金100万円)があるとき、賞金の不偏推定値(期待値)は1万円です。しかし、現実に「人数に注目すれば」ハズレを引く人が圧倒的に多いわけです。 だからと言って「少数サンプルでは値が低く出やすい」とは、言えません。運良く1本目で100万円を当てる確率が厳然としてあるわけですから、数学上の不偏推定値は、あくまで1万円です。 ただし、このような例は、行動科学や計量心理学の研究対象ともなっており、数理統計学や確率論だけが人間を支配しているとも言えません。「聖ペテルブルグのパラドックス」なども研究されてはいかがでしょうか。

sano018463
質問者

お礼

どうもありがとうございます。 なかなか統計は奥深いものですね。 正確には工程管理のために活用しようとしていますが理論を理解していないと意味が通じなくなる可能性があることを思い知らされました。 もう少し勉強してみます。

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.1

平均値(1.898284)を200で割った値(0.00949142)が成功確率の「不偏推定値」です。

sano018463
質問者

補足

どうもありがとうございます。 もう少し確認させてください。 すなわち少ない試行で判断をするためには統計的(不偏が成立している)には実際の値(ここだと成功確率=0.01)より必然的に小さい値になると言うことですね? 単純な逆算ではいけないと言うことですね?

関連するQ&A

  • 二項分布の成功確率を求める方法(再)

    先日、同じ内容で質問しましたが質問の仕方が良くなかったので改めて質問させてもらいます。 先日、助言をいただいた方にはお礼を申し上げます。 目的は二項分布の成功確率を求めると言うことです。 具体的な例で考えたいと思います。 成功確率:0.01 試行回数:200回 以上の二項分布は以下のようになります。 試行  0 1 2 3 4 ... 分布 0.1340 0.2707 0.2720 0.1814 0.0902 ... それでは逆に以上の分布が得られている(試行回数含む)が成功確率が未知である時この分布から成功確率を求めることがでますか? よろしくお願いします。

  • 二項分布の成功確率を求める方法

    よろしくお願いします。 二項分布はある成功確率の事象を任意の回数、試行した際の確率分布ですね。 これは公式やexcelで解ける内容ですね。 逆に既にある確率分布の結果から簡単に成功確率を求める方法はあるでしょうか? 試行毎の式をいくつか作成して最終的な確率分布の結果(累積和)に合うように無理やり数値を代入していっておおよその値を求めることはできるのですがどうも格好良くありません。 ちょっと数学に弱いものですからなかなか妙案が浮かびません。 どうぞよろしくお願いします。

  • 確率分布の無記憶性についてお尋ねします。

    確率分布の無記憶性という言葉があり、以下のように定義されるようです。 「成功か失敗のどちらかしかない独立な試行」を繰り返す場合に、次の両者の確率が一致することを意味する。90回失敗し続けた人が、次の10回の間で初めて成功する確率。 まだ1回もやっていない人が、10回の間で初めて成功する確率。 そして、ある確率分布関数には無記憶性がある・なしという言い方をするようです。 しかし、独立な試行だったら、確率分布の関数形とは無関係に、独立という条件だけで両者は一致しそうな気がするのですが。独立か独立ではないかというのは確率分布とは関係ないですね。試行のやり方のことなのだからです。例えばサイコロでいうと、目を1回出して、その次に目を出す前に十分振っておくわけで、それが十分かどうかというようなことではないかと思います。 このあたりをどのように考えるのか教えて頂きたいのですが。 よろしくお願いします。

  • 2項分布に関する問題

    サイコロをN回投げたとき、確率変数Xiを、i回目に6の目が出れば1、その他の目ならば0とする。 またYi=X1+X2+・・・・+Xi(iは変数)とするとき、Y3の確率分布がY3~B(3、1/6)になる理由がいまいちピンときません・・・・。 YiはX1からスタートしているのになぜX0、成功回数が0回の値がYiに含まれて二項分布の形をとるのでしょうか? おそらく根本的になにかを勘違いしていると思うのですが、ご指導お願いします。

  • 確率分布について教えてください!

    統計学の授業で出された以下の問題が分からなくて困っています。 問1 コインを4回トスしたときの表の出る回数の確率分布と平均を求めよ.ただし,表の出る確率は1/5で表が出にくいとする. 問2 大雨を想定した実験場で車を走らせ、あるラインで車を止める試行をする.ライン上の値を0とし,ある人の停止位置のラインからのずれの長さの確率分布は図2のように与えられた.このときの確率密度関数f₍x₎を求め,さらに以下の値を求めよ. 問1はとりあえず確率分布と平均は求めたのですが、1/5の意味がよく分かりません。 問2に関しては教科書を見ても全く理解できません。 是非、説き方を教えてください!

  • 二項分布について

    二項分布について 10回コインを投げて8回以上表が出る確率を二項分布で求めたいのですが、うまくいきません。 解き方として公式から、(10C8 × (1/2)^8)+、(10C9 × (1/2)^9)+、(10C10 × (1/2)^10)になると思うのですが、答えは(10C8+10C9+10c10)×(1/2)^10となります。 よくわからないのでお願いいたします。

  • 二項分布とポアソン分布、それぞれで求まる確率が2倍も異なるのですが

     こちらに計算ミスがあれば、誠に申し訳ありません。  二項分布とポアソン分布、それぞれで求まる確率が2倍も異なるので、困っています。  次のような問いがあるのです。 「くじが当たる確率は1%であり、5回くじを引くとする。当たりが3回出る確率を、ポアソン分布を用いて近似的に計算せよ。」  二項分布でも解けなくはない問いです。  5C3×1%×1%×1%×99%×99%=0.000009801  ところがこれを、ポアソン分布を用いて計算せよとのことですので、  ポアソン分布の確率関数p(x)は、λ(ラムダ)を用いれば、  自然対数の底eのマイナスλ乗と、λのx乗との積を、xの階乗で除した式で表されますので、  (あえて関数式を書けば p(x)=(λ^x)*exp(-λ)÷x! )  λ=0.05を代入し、p(3)を求めればよいわけですから、  p(3)= 0.05^3 × exp(-0.05) ÷ 3!    ≒ 0.000125 × 0.9512 × 6    ≒ 0.0000198  と求まります。  これでは、ポアソン分布を用いて近似的に計算せよと言いながら、求まる確率が2倍も違う点で、とても近似的に計算しているとは思えません。  ポアソン分布の関数式を覚えていないもしくは度忘れした解答者がとりあえず二項分布で解いてみても採点者は一発で間違いと分かるように数値を設定したと考えることもできますが、ポアソン分布の精度が疑わしくなります。  あるいは、こちらの計算ミスがあれば、気づかずにいるミスを直ちに改めたいと思いますので、どなたかお答えを願います。

  • 確率分布について

    離散分布である幾何分布やポアソン分布は、各試行の実現確率が独立である(独立ベルヌーイ確率?)であることが仮定されていますが、有限の集団にたいして各試行をおこない選択された要素を除外していくといった場合に、幾何分布に対応するような確率分布が数学的に定義されていますか。 たとえばN人の集団から、ランダムに1人づつ除外していく場合に、k回目に初めて男性を除外する場合のような確率分布です。

  • ポアソン分布の下側累積確率の求め方?

    ポアソン分布の問題で、 【月曜から金曜までに、スキー事故の起こる確率は、平均で1日あたり2.2回である。  このとき、月曜から金曜までの事故回数合計が12以下になる確率を求めよ】 というのがあります。 私の考えでは、”下側累積確率”というものを使って計算します。 ●月~金の6日間の話をしているのだから、2.2×6=13.2回が期待値λ。 ●そしてパーセント点xは、12 この2つの数字を…あとは http://keisan.casio.jp/exec/system/1161228830 のサイトを使って計算してもらえば答えは出る。 ・・というものです。 まず、この考え方で合っているのかが、確かめたいということと、 もう一つは、この”下側累積確率”というものを、求める際の、計算式を知りたいです。 「事故が12以下である確率を求める」場合は、 0の場合 1の場合 2の場合 ・・・ 12の場合 を、一つ一つ計算して、これを合計する以外に、方法はないものでしょうか? どうぞよろしくお願いいたします。  

  • 二項分布について

    二項分布についてよくわかりませんので教えて頂けないでしょうか? 試行回数nの内、定率pがx個現れる確率を求める数式だと思うのですが、下記数式にあるnCxがまずわかりません。 nCx * p^x *q^(n-x) nCx=nの内x個現れる組合わせ というのは分かるのですが、Cはなにを示す記号なのでしょうか? n=1000でx=2の場合、何通りかを計算すると nCx=1000*(1000-1)/(1*2)=499500 となるようなのですが、 nCxを求める場合は nCx=n*(n-1)/(1*x) という数式で合っているでしょうか? それと1000マス中、金のマスが3マス、銀のマスが4マスあるルーレットで1000回球を投げた場合に金に2回、銀に3回入る確率は? というように複合する場合はどのように計算するのでしょうか? 説明がわかりにくくて申し訳ないのですが、宜しくお願いします。