• ベストアンサー

一様分布について

あるイベントへの参加者数 5 万人であった。しかし,A さんは実際の人数は違ったのではないかと考えた。今年の入場者は入場に際して,1 から通し番号をつけた入場整理券を貰っている。A さんは会場を出てくる参加者 300 人に対して整理券の番号を尋ねたところ,番号の合計は 4,510,384 であった。 〔1〕入場者数の不偏推定値を求めよ。 〔2〕この入場者数の標準誤差を求めよ。 解答には、「一様分布の点推定を利用」と書かれています。なぜこれは、一様分布になるのでしょうか。又、1,2の解答も出来るだけ詳しく解説して頂けると助かります。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.4

(1) A さんが集めた整理券番号の平均を、 1,2,3,…,N (N は入場者数) の一様分布からの 独立反復抽出の標本平均と近似して、計算している。 1,2,3,…,N の一様分布の母平均は、(1+N)/2。 独立反復抽出の標本平均は、母平均と同じ。 その実測値が 4510384/300 だったのだから、 (1+N)/2 ≒ 4510384/300 と推定して、式を変形すると、 N ≒ (4510384/300)×2 - 1。 (2) の結果を見れば解るように、尻尾の -1 は あってもなくても気にならない程度の精度の近似だけど。 (2) 1,2,3,…,N の一様分布の母分散は、(N^2-1)/12。←[a] 平均 μ, 分散 σ^2 の母分布からの m 個標本平均は、 平均 μ, 分散 (σ^2)/m。←[b] A さんが集めた整理券番号の分散は ((N^2-1)/12)/300 となるから、標準誤差は √{ ((N^2-1)/12)/300 }。 この後、A No.2 に指摘されたとおりの間違いがあり、 (1) と同様に、(整理券番号の平均) = (1+N)/2 から (N の誤差) = (整理券番号の平均の誤差)×2 としなければならない。 (N の標準誤差) = 2×√{(N^2-1)/(12×300)}。 これに (1) の N を代入するのだが、 2×√{(N^2-1)/(12×300)} ≒ 2×√{(N^2)/(12×300)} = N/30 くらいに概算しても、大勢に影響無い 程度の近似ではある。 以上、(1) 約 3 万人程度 (2) 約 1000 人程度。 公表 5 万人は、ずいぶん鯖読んでるな。

hetaeigo1989
質問者

お礼

(1)の近似式の変形の仕方はしりませんでした。 二度も解説して頂き、ありがとうございました。 非常にわかりやすい説明でした。

その他の回答 (3)

noname#227064
noname#227064
回答No.3

#2に追加。 #1さんのように重複ありで(N^2-1)/3nを求めてから、(N-n)/(N-1)をかけて有限修正しても良いです。

noname#227064
noname#227064
回答No.2

察するにAさんは入場整理券が何枚配られたかを知りえない立場にいるのですね。 近似的な答えは概ね#1さんの回答のとおりです。 ただし、[2]は入場者数の標準誤差なので√{(N^2-1)/(12×300)}を2倍しないといけません。 あるイベントへの真の参加者数をN人、Aさんが訪ねた人数をn人、番号の合計をSとして、厳密に求めてみると [1] 2S/n-1 [2] √V[2S/n-1] = (2/n)√V[S] = (2/n)√(n(N+1)(N-n)/12) = √((N+1)(N-n)/(3n)) となります。 計算方法はすべての組み合わせについて計算するだけで、S^2の期待値の計算が少し難しいです。 E[S^2] = Σ_{i=1}^n i C(N-1,n-1)/C(N,n) + 2Σ_{i=1}^{n-1} Σ_{j=i+1}^n ij C(N-2,n-2)/C(N,n) = Σ_{i=1}^n i (C(N-1,n-1)/C(N,n)-C(N-2,n-2)/C(N,n)) + (Σ_{i=1}^n i)^2 C(N-2,n-2)/C(N,n) と計算していきます。 ただし、C(n,r)はn個のものからr個を選ぶ組み合わせの数です。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.1

Aさんが5万人から抽出した300人は、同じ人の重複が無いのだけれど、 5万人から300人なら、もともと重複が起こる確率が小さいから、 大雑把な話としては、5万人から1人選ぶ操作を300回繰り返したのと そう大差無い…と思ってもいいんじゃないかな?ということ。 5万人から1人選ぶ操作が、5万の各人について等確率であれば、 それは 1/50000 の一様分布ということ。その独立反復と仮定する訳。 すると、 (1) 整理券番号の標本平均が、母平均の不偏推定値になる。 母平均は、入場者数を N として (1+N)/2 だから、結局、 N = (4510384 / 300)×2 - 1 が、入場者数の不偏推定値となる。 (2) 整理券番号の母分布を、1,2,3,…,N (N は入場者数) の 一様分布と仮定したから、母平均は (1+N)/2、母分散は (N^2-1)/12。 そこからの標本数 300 の独立反復抽出の平均値は、中心極限定理より、 平均 (1+N)/2、分散 (N^2-1)/(12×300) の正規分布で近似できる。 標準誤差は、√{(N^2-1)/(12×300)}。この N は解らないのだが、 先に推定した N の不偏推定値で代用すれば、標準誤差が推定できる。

hetaeigo1989
質問者

補足

すいません。 (1+N)/2 だから、結局、N = (4510384 / 300)×2 - 1 となるのはなぜでしょうか。初心者なので、(1)(2)共に詳しく補足して頂けると助かります。 よろしくお願いします。

関連するQ&A

  • 不偏分散の分布は?

    不偏分散の分布について混乱していますので、ご助言頂けましたら幸甚です。 例えば母集団の分布を正規分布N(μ,σ^2)とした際、 標本平均x(=1/nΣxi)を区間推定する場合、正規分布の再帰性より、標本平均の分布はN(μ,(σ/√n)^2)となることから、μの区間推定が可能と理解しています。 また、若干やり様は異なりますが、標本分散s^2=1/nΣ(x-xi)^2に対し、ns^2/σ^2がΧ2分布に従うことから、σの導出が可能と理解しています。 ここで、上記と同様に、不偏分散(=1/n-1Σ(x-xi)^2)についての分布とは、どのような分布になるのでしょうか? おそらくΧ2分布になると推察しますが、証明できてません。 また、不偏分散の導出方法は、 E[S^2]、即ちS^2の平均と理解していますが、 S^2を確率変数とした際の分布がΧ2分布なのであれば、 このΧ2分布の平均が、不偏分散になってもよさそうですが、 Χ2分布の平均=n ですので、不偏分散とは不一致です。 上記のとおり、整理がついておりませんので、教えて頂けましたら助かります。 特に上記のとおり混乱しておりますので、現在はむしろ、「不偏分散については、点推定でのみ用いるのか?」と考えております。

  • 不偏分散、ガンマ分布、そして不偏推定量

    X1..Xnは独立で標準分布、期待値μ、分散σ^2。不偏分散s^2=1/(n-1) Σ(Xi - X')^2, X'=1/n ΣXi, で iは1からnまでです。X'はガンマ分布Γ(α、λ)に従い、α=(n-1)/2, λ=(n-1)/(2*σ~2)です。 (a) ガンマ分布を利用して、s^2がσ^2の不偏推定量であることと、その分散を求めよ。 (b) T(k)=k*s^2、kは定数 を考えます。その際に、T(k)の偏り と 分散をσ^2の推定量で表せ。そして、T(k)の 誤差の平方は(MSE)を最小値にするkを求めよ。 と言う問題があります。 最初にs^2=1/(n-1) Σ(Xi^2 - n X'^2)と表し、E(X')=σ^2と言う準備はできたのですが、それ以降さっぱりここ3,4日間考えてますがわかりません。回答は自分で導きたいと思ってますので、アドバイスをいただけないでしょうか?

  • 六本木「BEE HIVE」について質問です。

    今度六本木にある会場でイベントが行われ、それに参加することになりました。 ですがはじめての場所で会場規模がどの程度なのか分からず困っています。 整理券順に入場なので自分がどの程度良い番号なのかを知っておきたいので、ご存知の方がいらっしゃいましたら是非とも教えて頂きたいです。 検索しても公式サイトらしきものはcoming soonで、画像検索でもそれらしき画像が見つかりませんでした。 広瀬こうみさんが過去に生中継をやったと検索では出ましたが、そのときの募集人数が50人だったようで、そのくらいの規模なのでしょうか?それとも本当はもっと広く大人数が入れる場所なのでしょうか? 会場は六本木にある「ライブ&レストラン Bee Hive」というところです。 知りたいのは主に「大体何人くらい入れるような広さなのか」です。他に情報があればお願いしたいです。 宜しくお願い致します。

  • エクセルでこんな数式作れますか?

    算数の文章問題っぽくなってしまいますが、 どうか一緒に考えてください。 あるイベントに500名の参加者がいるとします。 イベント会場は大部屋・小部屋 (収容人数はバラバラで、最小をa名、 最大をb名とします) 合わせて10部屋に分かれます。 参加者の部屋は、 整理番号順に前から順番に区切っています。 参加者名簿が一部あり、 整理番号順に1ページ100名ずつ、 計5ページのものが1部あります。 これを必要最低分コピーして、 各部屋の参加者が掲載されている分のページだけ 配布するとします。 なお、名簿はハサミで切ったりは できません。 これだけの条件で 数式を立てることは 可能でしょうか。 人数の少ない部屋が多い場合は 必然的に同じページが 何枚も必要になるかと思います。 余るページができても構いません。 エクセルではわからない場合でも 数学的な解答でも 参考になればと思いますので、 どうか知恵をお貸しください。

  • 愛知万博の使用済み入場券の抽選について

    使用済み入場券を数枚持っています。平日、どこかで、入場券番号の抽選があって、何かが当たると聞きました。 どこで、会場内の発表されているのか、また、ネットで公開されていて、入場していなくても、抽選に参加できるのか教えてください。

  • 整理券の運営方法。怒りますか?

    娘(3歳)と、農協が主催する子供向けの人気アニメショーに行って来ました。 事前のパンフレットで会場は500人入れて、 10時から整理券を配り、なくなり次第入場は出来ないとありました。 ショーは開場14時半、開演15時からです。 娘と9時過ぎに行くとすでにたくさんの人が並んでいて、 1時間ほど並んで整理券を貰いました。 これで開場の14時半まで自由に過ごせると思っていたら、 整理券に番号がふってません。 運営されている人に聞くと、入場出来る券であって 前の方の良い席で見たい場合は昼頃から並んで下さいとのこと。 小さい子供を連れて、また並べと?唖然としました。 行ったら貰えるなどの物の場合の整理券なら分かりますが、 ショーなどの良い席で見たい場合の整理券は 番号順に入場するものではないのでしょうか? 整理券を貰って近場をウロウロしていて、ふと会場を見ると整理券を持って 子供を連れた人が炎天下の中並んでいました。 整理券を貰うのに並んで、また並ぶ・・・。 おかしいと思いませんか?

  • 東京ゲームショウ ブースのイベントについて

    東京ゲームショウ2007に行きたいと思っています。 こういったイベントに参加するのが初めてなので、参加されたことがある方にお聞きしたいのですが、 発売前のゲームの声優さんが出演されるトークショーがあるらしく、 それを見に行きたいと思っています(その後、並べそうならそのゲームや他のゲームもやってみたいのですが) トークショーをやるのはイベントステージではなく、ブースで行うのですが、こういうブースでのトークショーは整理券のようなものは配布されているのでしょうか?(整理券は特になく、人だかりをかきわけて見るような感じなのかなと思ったのですが・・・) また、そのトークショーは11時くらいから開始になるので、それより前には入場したいと思っています。 ただ、毎年来場者数がものすごく多いので、開場何時間前から並べば11時までに入場できるのかがわからず・・・。 11時前までに入場するには何時くらいから並べばいいでしょうか? また、入場制限等がかかってしまう場合はあるのでしょうか? その時々によって違うと思いますので、だいたいの目安で結構ですので、お教えいただけると助かります。 どうぞよろしくお願いいたします。

  • 立見席について

    横浜アリーナの立見席をとったのですが、当日整理番号順の入場になると書いてありました。 この整理番号順というのは、当日整理券が配られるのでしょうか? それとも、チケットに書いてある番号のことでしょうか? 例えば、チケットに100番とか書いてあったらそれが整理番号になるのでしょうか? この場合、会場の30分前くらいに着いていれば大丈夫でしょうか?

  • 公開収録

    今度、NHK大阪ホールである「大阪発疾走ステージ WEST WIND」の公開収録に行ってきます。 元々ハガキでの応募制で先日入場整理券と称したハガキが送られてきました。 そこには「指定の時刻に入場整理券と座席指定券を引き替える」と書いてあるのですが、これは、会場で抽選か何かを行って座席を決めるということなのでしょうか? このハガキには何やら整理番号のような番号が書いてあったのですが、その番号によって座る場所ももう決まっているものなのでしょうか? 公開収録って初めて行くのでよく分かりません。 このような公開収録にいったことのある方、もしくは以前この番組の公開収録に行かれたことのある方がいらっしゃいましたら教えてください。 よろしくお願いします。

  • 分散分析のF値

    実験で、分散分析をしたのですが、数値がどうであれば、その条件に効果があるのかがわかりません。 条件は計7条件あるのですが、自由度、不偏分散、F値はそれぞれ出せたのですが、F値がどうであれば、条件に効果があるといえるのでしょうか?F分布表の見方もよくわからないため、困っています。 条件に効果がある、といえるのかどうか、1つの条件を例に教えてください。 A条件の不偏分散は10.100で、F値は5.668、誤差の不偏分散は1.782です。 よろしくお願いします。