• 締切済み

ポアソン分布

エクセル、統計学初心者なのでわかりやすく教えていただけたら嬉しいです。 ポアソン分布について、以下の度数分布からpoisson関数(関数形式はfalse)を用いて理論度数と比べるという事をしたいのですが、この関数の使い方や出てきた値の意味する事が調べてもよく理解できません。 「ポアソン分布のパラメータを決める」 「そしてpoisson関数により理論度数と比べる」とはどういう意味でしょうか。 階級 度数 1  0 2  0 3  4 4  10 5  20 6  8 7  7 8  0 9  1 10  0 ちなみに上記は、 (1)-Ln(rand())で20個の乱数を出したものを昇順に並べ、最小のものから累計していき、累計が1を超えるまでの乱数の個数を記録。 (2)これを50回分記録し、上の個数を1,2,・・・で度数をfrequency関数で出したもの。

みんなの回答

回答No.4

自分でやってみました。 数学的な証明が出来たわけではありませんが、結論を言うと、 昇順に並べてしまうとポアソン分布にはならないようですね。 昇順に並べるとn=0,1,2あたりの小さいところが壊滅的に出ないので、 分布はポアソン分布よりもずっと狭くなります。 この実習課題を出題した人に問いあわせたほうがよいと思います。 ポアソン分布と合わせるなら、並べ替えをせずに度数分布を作成し、 相対度数(度数を全データ数(この場合は50)で割ったもの)とpoisson(n,1.0,0)を比較してください。

mmammamma
質問者

お礼

確かに、相対度数(度数÷50)をしたものとパラメータ5のポアソン分布をグラフにして比較してみると、凸の具合が階級5の辺りで、相対度数の方が倍以上の偏りが出ています。 ポアソン分布のグラフの方が断然滑らかです。 並べ替えずにした場合のパラメータ1のポアソン分布と相対度数のグラフならほぼ一致しますね・・・。 出題者の先生が非常勤のため直接質問する術がなくこの実習課題のレポート提出が明日なので、 昇順にした場合と昇順にしなかった場合を比較して、その旨を両者のデータを用いて記述したレポートを提出して、 改めて講義前後に先生に質問することにします。 丁寧に考察して回答してくださって感謝します。

回答No.3

問題はこの部分なのですが、 >昇順に並べ、最小のものから累計していき 本当に『昇順に並べ』ると何かに書いてあったのでしょうか? 『昇順に並べ』てなければ、 >累計が1を超えるまで なら平均1のポアソン分布になります。 (累計がλを超えるまでなら平均λのポアソン分布)

参考URL:
http://econom01.cc.sophia.ac.jp/sda/poisson.htm
mmammamma
質問者

お礼

実習の課題にはこう記述されていました。 「0<x<1の一様乱数から-Ln(rand())を20個作り、これらの乱数を昇順に並べる。これを最小のものから累計する。累計が1を超えるまでの乱数の個数を記録する。これを50個作る。 ・・・以下度数分布作成など後略」 0.216141721 0.268651188 0.272717171 0.385325535 0.462069403 0.569352782 0.578784859 0.583251223 0.598329472 0.642291509 0.733809383 0.875938805 0.995965379 1.205904589 1.425505176 1.631122524 1.789175067 2.782743441 3.229957441 3.271096212 これがその通りにしたもののつもりなのですが、 何故平均が1になるのでしょうか? 1になるまでの乱数の個数を数えた結果、上の20個の乱数では3で、同じことを50回分記録してみると平均は5程度になるのですが…自分が何か勘違いをしているのでしょうか。

mmammamma
質問者

補足

(※実際にエクセルで発生させた-Ln(rand())の乱数20個をお礼分に貼り付けたものが個人情報の公開と誤認されたのかサポート側のチェックが通らなければ公開されなくなったため、エクセルの乱数の部分を抜いて再度同じお返事を補足欄で返させていただきます。 サポートが迅速な対応をしてくれればと思うのですが^^;) ::::::::::本題::::::::: 実習の課題にはこう記述されていました。 「0<x<1の一様乱数から-Ln(rand())を20個作り、これらの乱数を昇順に並べる。これを最小のものから累計する。累計が1を超えるまでの乱数の個数を記録する。これを50個作る。 ・・・以下度数分布作成など後略」 1になるまでの乱数の個数を数えた結果、上の20個の乱数では3で、同じことを50回分記録してみると平均は5程度になるのですが…自分が何か勘違いをしているのでしょうか。

回答No.2

>(1)-Ln(rand())で20個の乱数を出したものを昇順に並べ、最小のものから累計していき、累計が1を超えるまでの乱数の個数を記録。 この操作については http://econom01.cc.sophia.ac.jp/sda/poisson.htm のポアソン乱数の項をご参照ください。このページの式の両辺の対数を取った形です。 昇順に並べてしまっていいのかどうか、ちょっと分からないのですけども。

mmammamma
質問者

お礼

ありがとうございます。 VBA関数は使わず地道に(1)(2)の作業はしてしまったのですが、URL参考になりました。 一応、パラメータは5.16でした。 ポアソン分布の値は出すことが出来たようなのですが、理論度数がわからず詰まってしまいました・・・。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.1

こんばんは。 その問題は、基礎を理解するための実習ですね。 まずは、平均と分散を計算することから始まります。 平均と分散の求め方はわかりますよね? そして、これの「性質」の章を見てください。 (教科書にも書いてあると思いますが) http://ja.wikipedia.org/wiki/%E3%83%9D%E3%83%AF%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83 ご参考になりましたら幸いです。

mmammamma
質問者

お礼

ありがとうございます。 平均と分散は求められ、Poisson関数の使い方も色々と調べた結果それらしい結果が出ました。 しかし「理論度数と比較する」、という部分が理解できず・・・>< 理論度数とはどれの事を言っているのかで詰まってしまいました。 観測度数とは違うものですよね。 ポアソン分布の実習をこなすにはまずポアソン分布についての性質など理解する必要がありますよね。 とても身につく問題だと実感しました^^;

関連するQ&A

  • 「ポアソン分布」とは?

    教えてください。 一般に電話応対などの現象は待ち行列理論として研究されているが、その中でポアソン分布という言葉があるがこれは何を意味しますか?

  • 統計学のアーラン分布について

    統計学のアーラン分布について質問です。 待ち行列理論のシュミレーションをC言語で作っていて ポアソン分布の式は分かったのですが アーラン分布の式が分かりません。 確立密度関数f(x)は平均が1/aの時に  f(x)={(at)^(k-1)/(k-1)!}*a*e^(-at)  となることまでは分かっているのですが この分布に従う値をいくつか出す方法が 分からなくなってしまいました。 文章が分かりにくくてすみません。 例えばポアソン分布なら平均1/aとして  -log(1-(random))/a (randomは0~1の乱数) として乱数の値を変えていくと できた数は全体としてポアソン分布に従っているのですが これがアーラン分布ではどのような式になるか知りたいです。 どなたか分かる方、教えてください よろしくお願いします。

  • EXCELで確率分布に従う乱数を発生させたい

    EXCELにて指数分布や正規分布、ポアソン分布などに従う 乱数を発生させたいのですがどうすればいいでしょうか? できれば、それらともとの分布関数とをヒストグラムで比較して意図した乱数が発生できているかを検討したいのですが・・・。

  • ポアソン分布について

    ※長文です。すべてに解答できない場合は,特に★★★★★より後の部分についてだけでも教えてください。よろしくお願いします。 テキストでは二項分布からポアソン分布を導いています。 二項分布は, ・各試行の結果,Aかその余事象aのいずれかが必ず起こる ・各試行は独立である ・各試行におけるAの生起確率Pr{A}は常に一定でpである を満たす試行をN回行った時,Aの発生回数Xの確率分布です。 ここからNp=λ(=const.)を維持しながらN→∞の極限を考えることで,ポアソン分布を導いています。これは次のような理解でよろしいでしょうか。すなわち, 箱の中にN個の玉が入っていて,赤が1個,黒がN-1個の内訳になっています。ここから1個取り出したとき,それが赤である事象をAとすると,Pr{A}=1/Nです。そして取り出した玉を戻して,何度も同じ試行を行うと, ・各試行で必ずA(赤が出る)かa(黒が出る)が起こる ・各試行は明らかに独立である ・各試行においてPr{A}=1/N=p(一定)である を満たし,ベルヌーイ試行列を成します。ここでpNを一定値1に保つ場合を考えると,任意のNに対して,p=1/Nでなければならないので,結局,Nをnだけ増すとき,赤玉は1個のままで黒玉をn個増せば,p=1/(N+n)となり,pN=1を維持します。よって,pN=1を保ちつつN→∞とすることは,書き方は不正確かもしれませんが,感覚的には赤玉1個,黒玉無限個,試行回数無限回ということでいいでしょうか。そして, 『この試行で赤を3回取り出す確率を求めよ。』は,Pr{X=3}=exp(-1)×1^3/3!=1/6eということですか? 逆に,以上の問題において,Aは赤が出る事象ですし,pは赤が出る確率です。では,以下の問題はポアソン分布と関係があるそうなのですが,事象Aと確率pが何に相当するのかがわかりません。 ★★★★★ ペトリ板の細菌の集落を顕微鏡により観察し,円形の視野に正方形の網の目をかけ,各正方形の区画内の細菌集落数kを数える。その結果を以下に示す。各kに対する正方形の数が観測度数である。 k:=正方形内の細菌集落数 f:=観測度数 Np:=理論度数 k f Np 0 5  6.1 1 19 18.0 2 26 26.7 3 26 26.4 4 21 19.6 5 13 11.7 6 8  9.5 各区画内を順番に検査することを試行ととらえて,そこに集落がある事象をA,その確率をpとすると考えると,集落がたくさんある区画の説明がつきません。集落がない事象をA,1個ある事象をB,2個ある事象をC,…としていくとこれはベルヌーイ試行列ではありません。この問題において, ・そもそも何を試行としているのか ・そしてその試行のもとで必ず起こるA,aはそれぞれ何か という点が全く分かりません。どのように解釈すればこの問題はポアソン分布と関係する問題なのでしょうか。 長くなってしまいましたが,よろしくお願いします。

  • エクセル 一様乱数を昇順に

    エクセルで一様乱数 -Ln(rand()) を20個程作り、それを昇順にしようとすると上手く昇順に並ばない問題はどのようにして解決すればよいのでしょうか? よろしくお願いします。

  • エクセルで度数分布グラフを書く方法教えて

    エクセル上に170個のデータが10列17行の形で配列してあります。このデータの分布を表したいのですが、度数分布グラフの書き方を教えてください。=FREQUENCY()関数を使うのかとも思いますが、使い方がよく解りません。

  • 標準正規分布の乱数

    RAND()関数は ((double)rand() / (1.0 + RAND_MAX))と定義します。 中心極限定理により、一様乱数を足し合わせると正規分布に近づくことから、 x = 分散 * (Σ[1~12]RAND() - 6) + 平均 で正規乱数が作れる。標準正規分布は分散1、平均0なのでその乱数は x = Σ[1~12]RAND() - 6 ですよね。この乱数を例えば100個羅列するにはどうしたらいいのでしょうか? もし間違ってたら指摘してください。 参考文献「Cによるシミュレーションプログラム 石川宏」 #include <stdio.h> #include <stdlib.h> #define RAND() ((double)rand() / (1.0 + RAND_MAX)) #define NUMBER 10000 /* 発生させる乱数の数 */ main(void) { int j; double u, x; srand(5); for (j = 0; j <= 11; j++) { u = u + RAND(); } x = u - 6.0; }

  • Excel2007 個数を数えたい

    A-1~300まで=rand()で乱数を発生させました。 A-1から下へ順に発生させた乱数を初めて1が越えるまで足していき、その個数を調べたいのですが、良い関数はありませんでしょうか。 次に、同様に足していった乱数が初めて2を超える個数、3を超える個数といった風にしていきたいのですが、ご教示願えませんでしょうか。

  • Excel2007 FREQUENCY関数(データ配列、区間配列)

    エクセルでデータ集計をしています。 度数分布を出したいので、FREQUENCY関数を使おうとしています。 ただ、データの選択と区間の選択をした後、 CtrlとAltとEnterの3つのキーを同時に押したのですが、 計算セルのすべてに {=FREQUENCY(C2:C45158,B45160:B45173)} と出る場合と、計算セルの一番上のセルは =FREQUENCY(C2:C45158,B45160:B45173) となっていて、以下、 =FREQUENCY(C3:C45159,B45161:B45174) =FREQUENCY(C4:C45160,B45162:B45175)・・・ という具合に、計算式の前後に { } がなく、 しかも計算式の数字がひとつずつずれてしまう場合があります。 前者の場合は、区間のデータ個数が正しく表示されますが、 後者の場合の区間のデータ個数は、累計になってしまいます。 後者の場合でも、別計算で引き算により区間のデータ個数を 求めればよいのでしょうが、 同じ関数を用い、同じやり方でやっているのに、 どうして同じ結果(計算式)になってくれないのでしょうか? 何か良い方法はあるでしょうか?

  • 正規分布への適合度検定について

    統計ソフト(R)において、正規分布への適合度検定をするための、カイ二乗検定を用いた関数(normaldist←青木先生という方のサイト上にありました。http://aoki2.si.gunma-u.ac.jp/R/normaldist.html)を使う際に、度数分布表における階級の分け方(どれくらい細かく階級をとるか)を変えると、検定結果のp値が変化するのですが、階級の決まった分け方というものはあるのでしょうか?よろしくお願いします。