• ベストアンサー

ポアソン分布において、各事象の和の分布は?

ある事象がポアソン分布に従って分布しているとします。 ポアソン分布の中心は x =λ とします。 よって確立分布 f(x)は√λ 程度の広がりを持ちます。 すなわち、x がλ±√λの範囲に収まる確率はほぼ68%。---(1) この事象がN回おきたとき、その和Σf(x) は、 どの程度の広がりを持ちますか? (1)のような意味での広がりです。 それから、Nは10か20か程度の数という前提です。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

もし仕様表にある「誤差範囲0~3%」の意味が仮に「標本値xの取る値が平均μに対して |x/μ| < 1.03 となる確率が0.90」と解釈したとしてみると,正規分布を仮定すれば 0.90 = ∫[|x/μ| < 1.03]dx exp(-(x - μ)^2/(2σ^2))/√(2πσ^2)) となるので分散σ^2が求まるかもしれませんね. どうやって上の式を解くのかはわかりませんが,きっちり解くのはたぶん無理なので具体的なμの値を代入したあとに数値計算でなんとかするんでしょうね.

maidara
質問者

補足

どうも、誤差が3%になる点が正規分布上のどの点であるかを決定する必要は無いようです。 正規分布上で、横軸の0から、(任意の、ある)z(に対応するx)までの区間に、誤差0~0.03μが収まるとします。 たとえばz=1としたら、抽出サンプルの68.27%が誤差0~0.03μの範囲内です。 N個の場合について考えると、抽出サンプルの68.27%が誤差0~0.03μ√N の範囲内です。 従って、N個に対する誤差は0~0.03μ√N と評価できます。 要は、N個の場合に拡張すると、3%の点が追跡してくるので、具体的な点を求めなくていいんですね。

その他の回答 (3)

回答No.3

<補足 > 「キャンディー1個の質量が、期待値の1.03倍である確率」 > (適切な用語が不明なので確率と言っておきます)が有意である、 > という情報のみをヒントに、標準偏差を求める必要があります。 これが本当に可能なのかどうか僕は懐疑的です.少なくとも > すると、標準正規分布表より、50-0.5=49.5(%)である点 z=2.58 を用いて の部分で何をやったのか僕にはよくわかりませんでした. ここで少し一般論を書きます.n個の独立に同一の正規分布N(μ, σ^2)に従う確率変数X[1], …, X[n]があるとします.このとき再生性よりこれらの和X = X[1] + … + X[n]は正規分布N(nμ, nσ^2)に従います.また未知の母数μ, σ^2は実験データx[1], …, x[k]から推定できます.最尤法から 平均を ν = (x[1] + … + x[k])/k, 分散を τ^2 = ((x[1] - ν)^2 + … + (x[k] - ν)^2)/k で点推定するのが普通です. 上に書いたような計算をしておけば,確率変数Xは正規分布N(nν, nτ^2)に従うものとして,どんな確率でも理論的には計算できます.たとえば質量が平均nνの1.03倍より大きなキャンディーが現れる確率は積分 ∫[1.03nν, +∞]dx exp(-(x - nν)^2/(2nτ^2))/√(2πnτ^2)) で計算できます.(実際は標準正規分布に変換して数表を見るのでしょうが.)計算結果をあらかじめ決めておいた閾値と比べれば仮設検定ができるでしょう. 問題を解決するというよりは問題を完全に書き換えていますが,こうするのが普通かと.

maidara
質問者

補足

何度もありがとうございます。 ---指摘について--- はい。そうやって標準偏差を求めたかったのですが、 実験データの類のものが手元にない状況ですので (某仕様表に誤差範囲0~3%と書いてあるのみ)、 先のような計算をして求めました。 正規分布は横軸方向の端点がないので、このような 問題に使うにはやや無理があるのかもしれません。 もっと良いモデルをほかに知っていればよかったのですが。 >> すると、標準正規分布表より、50-0.5=49.5(%)である点 z=2.58 を用いて > の部分で何をやったのか僕にはよくわかりませんでした. 標準正規分布において、(グラフ上で)そこより右の値となる確率が1%であるzの値を求めました。 0<=z<=50 の範囲で載っている表でです。 しかし今考えると自分がやりたかったことと違っていたようです。考えていたのは、 「z=2.58(すなわち、あとで1.03%点に設定する点)において全体の1%存在するならば 有意である」と考えていたのですが、この点があらわすのはz=2.58より右に1%分布するということであって、この点に全体の1%があるわけではありませんでした。 全体の1%が分布する点dを見つけるには、面積を持たせるために 標準正規分布をM個に分割しなければならないのでしょうが、その時 面積は、(d/M)*exp(-d^2/2)/sqrt(2pi) これが0.005に一致する必要があり、 しかしMが決まらないのでdは求められません。 こうしてみると、どうやら正規分布では解けない問題のようです。

回答No.2

<補足 まずは言葉づかいについて.実務的な利用についてはよく知らないのですが,数学における標準的な用語を使ってくださった方が意思疎通が楽です.恐らくあなたの使っている言葉は 中心 → 期待値 確率分布 f(x) → 期待値λのポアソン分布に従う確率変数x 広がり → 標準偏差 のことを指していると思って,先の回答をしました.それで補足の件ですが,「ばらつき」が何を指しているのかよくわかりません.実際に観測される数値がポアソン分布に従うなら,そのパラメータλひとつで説明できるでしょうから,なぜ他の数値が必要なのでしょうか. また結論の式だけを見た直感的な感想を述べさせてもらうと± sqrt( f(λ)*N*0.03 )/2 はその絶対値が小さすぎると思います.0.03倍して平方根を取ったらほとんど無いようなものですし,どうして半分にしたのかもわかりません.きっとこの式がおかしいことはキャンディーを1袋買ってきて重さを測ってみればわかると思います. ## ついでに言うとポアソン分布に従うという問題の設定も気になります.キャンディーの質量のようなものならば正規分布のほうが適切な気がします.ポアソン分布と似ているならば正規分布 N(λ, √λ) ぐらい?問題の68%がなんとなく正規分布でよく見かける68.27%を連想させますし.

maidara
質問者

お礼

ご指摘が参考になりました。より適切な正規分布を使って、なんとか解けたと思います。 まず用語についてはその通りです。 あと、正規分布と混同していました。正規分布について調べなおしたところ、 正規分布では標準偏差が与えられる必要があると分かりました。 しかしながら、今回の問題では、標準偏差は与えられていません。 「キャンディー1個の質量が、期待値の1.03倍である確率」 (適切な用語が不明なので確率と言っておきます)が有意である、 という情報のみをヒントに、標準偏差を求める必要があります。 以下では、期待値から正の方向(1~1.03倍)のみで考えました。 恣意的になりますが、「キャンディーを1個取得するとき、期待値の1.03倍の質量のキャンディーが 引き当てられる確率」が 1%(以上)であるならば 1.03倍のキャンディーの存在する確率が 有意であると設定します。これで、質量は1~1.03倍の範囲で分布することになります。 すると、標準正規分布表より、50-0.5=49.5(%)である点 z=2.58 を用いて x=2.58σ+μ (標準正規分布への変換の式) これが1.03倍のキャンディーの質量ですから、質量の期待値を m_average とおいて、 2.58σ = 0.03*m_average が成り立ちます。 これよりσ = 0.03*m_average/2.58 これで、標準偏差が求められました。 これはキャンディーが1個の場合ですから、N個の場合について考えると標準偏差は σ√N (∵ N個についての標準偏差 = sqrt( Σσ_i^2 ) ,さらに、 ()内= N(1/n)Σ(x_average - x_j)^2 = Nσ^2 ) 結論として、質量の和の分布について、全体の68.27%の範囲にあるのはm_averageから m_average + (0.03*m_average*√N )/2.58 まで です。 N=1 の時の標準偏差は m_average*0.03 の43%と、感覚的に小さくない値ですし こんなものではないでしょうか。 依然不完全かもしれませんし、なにかご指摘・ご感想などあればぜひお願いします。

回答No.1

ポアソン分布は再生性を持つので期待値λのポアソン分布に従うN個の独立な確率変数の和は期待値Nλのポアソン分布に従います.よって,その標準偏差(=広がり)は√(Nλ)です.

参考URL:
http://ja.wikipedia.org/wiki/ポアソン分布
maidara
質問者

補足

回答ありがとうございます。 以下の具体的な問題に適用してみました。 解きたかった問題は具体的には、 「1個 f(λ)グラムのキャンディーがあります。(λ は定数) キャンディーの質量はポアソン分布に従ってf(λ)を中心に最大で±3%ばらつきます。 キャンディーをN個集めて質量の和Σf(x)を量ったとき、 Σf(x)は中心の値 N*f(λ)に対してどれだけばらつきますか?」 というものです。 答えはf(λ)*N ± sqrt( f(λ)*N*0.03 )/2 こんな感じでしょうか? それから、キャンディーの質量が0~3%までばらつく場合 (ポアソン分布の中心は0%の点であり、マイナス側が消える以外にグラフの形状は変更なし) の答えは、± が + に変わるだけで、 f(λ)*N + sqrt( f(λ)*N*0.03 )/2 となりますよね?

関連するQ&A

  • ポアソン分布

    {Xj}を同一分布をなす互いに独立なベルヌーイ確率変数列とする(ここで、P[Xj=1]=p, P[Xj=0]=1-p)。SN=X1+X2+・・・+XNを確率変数Xjのランダムな個数N個の和とする。ここで、Nは平均λのポアソン分布をなすものとする。このとき、SNは平均λpのポアソン分布をなすことを証明せよ。という問いに対してなのですが、 Xj の和をとる個数 N がポアソン分布に従って変化するとき、Xj の和の分布を考えればよいことはわかりました。 N 個の確率変数の和が n になる確率は N C n p^n (1-p)^(N-n) であり、和を取る確率変数の数が N である確率はポアソン分布なので e^(-λ) λ^N / (N !) 和が n になる確率は、 確率変数が N=n 個でかつ和が n 確率変数が N=n+1 個でかつ和が n 確率変数が N=n+2 個でかつ和が n ・・・・ で N が無限個まで確率の和を取ればよいので、 Σ(k=0→∞)の{ (n+k) p^n (1-p)^k } と考えたのですが、ここから先に進めません。 おそらく途中で間違えてしまったと思うのですが、ご指摘いただけないでしょうか。

  • ポアソン分布について

    ※長文です。すべてに解答できない場合は,特に★★★★★より後の部分についてだけでも教えてください。よろしくお願いします。 テキストでは二項分布からポアソン分布を導いています。 二項分布は, ・各試行の結果,Aかその余事象aのいずれかが必ず起こる ・各試行は独立である ・各試行におけるAの生起確率Pr{A}は常に一定でpである を満たす試行をN回行った時,Aの発生回数Xの確率分布です。 ここからNp=λ(=const.)を維持しながらN→∞の極限を考えることで,ポアソン分布を導いています。これは次のような理解でよろしいでしょうか。すなわち, 箱の中にN個の玉が入っていて,赤が1個,黒がN-1個の内訳になっています。ここから1個取り出したとき,それが赤である事象をAとすると,Pr{A}=1/Nです。そして取り出した玉を戻して,何度も同じ試行を行うと, ・各試行で必ずA(赤が出る)かa(黒が出る)が起こる ・各試行は明らかに独立である ・各試行においてPr{A}=1/N=p(一定)である を満たし,ベルヌーイ試行列を成します。ここでpNを一定値1に保つ場合を考えると,任意のNに対して,p=1/Nでなければならないので,結局,Nをnだけ増すとき,赤玉は1個のままで黒玉をn個増せば,p=1/(N+n)となり,pN=1を維持します。よって,pN=1を保ちつつN→∞とすることは,書き方は不正確かもしれませんが,感覚的には赤玉1個,黒玉無限個,試行回数無限回ということでいいでしょうか。そして, 『この試行で赤を3回取り出す確率を求めよ。』は,Pr{X=3}=exp(-1)×1^3/3!=1/6eということですか? 逆に,以上の問題において,Aは赤が出る事象ですし,pは赤が出る確率です。では,以下の問題はポアソン分布と関係があるそうなのですが,事象Aと確率pが何に相当するのかがわかりません。 ★★★★★ ペトリ板の細菌の集落を顕微鏡により観察し,円形の視野に正方形の網の目をかけ,各正方形の区画内の細菌集落数kを数える。その結果を以下に示す。各kに対する正方形の数が観測度数である。 k:=正方形内の細菌集落数 f:=観測度数 Np:=理論度数 k f Np 0 5  6.1 1 19 18.0 2 26 26.7 3 26 26.4 4 21 19.6 5 13 11.7 6 8  9.5 各区画内を順番に検査することを試行ととらえて,そこに集落がある事象をA,その確率をpとすると考えると,集落がたくさんある区画の説明がつきません。集落がない事象をA,1個ある事象をB,2個ある事象をC,…としていくとこれはベルヌーイ試行列ではありません。この問題において, ・そもそも何を試行としているのか ・そしてその試行のもとで必ず起こるA,aはそれぞれ何か という点が全く分かりません。どのように解釈すればこの問題はポアソン分布と関係する問題なのでしょうか。 長くなってしまいましたが,よろしくお願いします。

  • 水中の微粒子分布はポアソン分布になるのでしょうか?

    「100mlの水に500個の微粒子を入れ、均一になるように良く撹拌してあります。ここから10mlすくい取ったとき、x個の微粒子が存在する確率を求めたい」という場合、ポアソン分布になっているのでしょうか。 100ml中に500個では微粒子数が多すぎてポアソン分布になっていないような気がするのですが、10^5μl中に500個あると考えるとポアソン分布でいいような気もします。 私は、ポアソン分布の確率関数 f(x)=e^(-λ)*λ^x/x! において、 n:サンプル量(μl) p:微粒子濃度(個/μl) λ=np とし、n=10^4、 p=5*10^(-3)、 λ=50 より f(x)=e^(-50)*50^x/x! と考えたのですが、合っているでしょうか? 容量の単位を変えると微粒子濃度が大きくなったり小さくなったり感じられ、ポアソン分布の適用基準がわかりません。 本などで調べたのですが類似の例がなく、良くわかりません。宜しくお願いいたします。

  • ポアソン分布

    ポアソン分布 ポアソン分布が発生確率が低い事象の記述に適しているという理由がいまいち分かりません。 導出の過程で n→∞, p→0, np→λ としたから、 n≒∞、p≒0のような事象に適しているという認識であっていますか? 発生が稀でないものに適用したら二項分布での結果とは全然近似しないのですよね?

  • ポアソン分布の問題です。よくわかりません

    ポアソン分布の問題です。よくわかりません。 ある都市における1日あたりの交通事故による死者の数は、平均1.8人のポアソン分布に従うという。 (1)ある日の交通事故による死者の数が0人である確率をもとめよ (2)ある日の交通事故による死者の数が3人を超える確立を求めよ よろしくおねがいします。

  • 確率変数XがP(X=1)=P(X=2)なるポアソン分布を持つならばP(X=4)を

    もし確率変数XがP(X=1)=P(X=2)なるポアソン分布を持つならばP(X=4)を求めよ。 という類の問題なのですがどなたか解き方をご教示ください。 ポアソン分布とは 「ポアソン分布 特定の事象が起こる確率pはきわめて小さいが、試行回数nが非常に多いためにその 事象が何回かは起こるときその生起回数の分布として表れる。 パラメータλのポアソン分布の確率密度関数は p_λ(k)=(λ^k)e^-λ/k!である。ポアソン分布の平均、分散はともにλである」 といったものです。

  • ポアソン分布の標準偏差

    ポアソン分布の標準偏差についてわからない問題があります。 x=(x1,x2...xn)とし、ポアソン分布の同時確率関数をf(x,λ)、確率分布関数をFn(x)としたとき、期待値E(Fn)を求め、そこからFnの標準偏差σを求めなさい。 という問題です。どなたかよろしくお願いします。

  • べき分布とポアソン分布の違い

    べき分布とポアソン分布の違いについて悩んでいます。 例えば楽天とかから送られてくるDMメールのクリック率について考えた場合、大多数はクリック0で、クリック数1, 2,...と段々減ってくると思いますが、この場合、これはべき分布とポアソン分布のどちら(に近しい)でしょうか? 地震の発生回数のように、確率が明らかに横軸のべき乗で減っていくのであればべき分布なのでしょうが、そうでない場合、べき分布とポアソン分布は結局同じものな気がするんですが。。。 結局、確率の増減がべき乗になっていればべき分布、そうでなければポアソン分布、と考えてもいいものでしょうか?

  • Xはポアソン分布をμ=100で持つとせよ。P(75<X<125)における下界を決定する為にチャビシェフの不等式を使え

    皆様,こんにちは。確率の問題なのですがどうぞ宜しくお願い致します。 [問題]Xはポアソン分布をμ=100で持つとせよ。P(75<X<125)における下界を決定する為にチャビシェフの不等式を使え。  なのですがどのようにして解けば宜しいのでしょうか? ググってみましたら ポアソン分布とは 「ポアソン分布 特定の事象が起こる確率pはきわめて小さいが、試行回数nが非常に多いためにその 事象が何回かは起こるときその生起回数の分布として表れる。 パラメータλのポアソン分布の確率密度関数は p_λ(k)=(λ^k)e^-λ/k!である。ポアソン分布の平均、分散はともにλである」 といったものです。 チェビシェフの不等式とは 「確率変数Xの平均E[X]=μ,分散V[X]=σ^2が共に有限ならば任意のk(>0) 対して,P(|X-μ|≧kσ)≦1/k^2 ※離散の分布,連続の分布問わずこの不等式成立する」

  • ポアソン分布を示す事象の生起確率の検定

    ポアソン分布を示す事象の生起確率の検定 飛行機事故のように、めったに起こらない事象の生起確率の検定について質問します。 ポアソン分布をしている事象の生起確率について、1要因2水準、及び3水準以上の対応ありの検定を行いたいです。 たとえば、全航空会社(A社、B社、C社・・・)の飛行機事故の生起確率を、1~6月まで月ごとに算出し、月間で有意差があるか調べたい、ということです。 これまでは、「正規分布はしていないけど、大小関係はある」という認識で、順序尺度とみなして、 航空会社ごとに毎月の生起率を算出→毎月の中央値を算出→フリードマン検定とウィルコクソン検定を行う、としていました。(中央値もほとんどが0になりますが) 名義尺度としてコクランのQ検定などにした方がいいのでしょうか? 色々な統計の本を見ても、「ポアソン分布をしていて、6月は100回中1回事故が起こった。では7月の生起確率は?」といった例題は見つけるのですが、生起確率の水準間の比較をした例題は見つけられなかったので、こちらで質問させていただきました。 詳しい方ご教授よろしくお願いします。