ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：コインの表裏の出る回数の差がｍ回以下になる確率）

コインの表裏の出る回数の差がｍ回以下になる確率

2014/06/09 18:33

このQ&Aのポイント

某先進国の地方選挙や大統領選挙で、例えば１０００００票の中のわずか２００票の差で勝敗が決したことが現実にあります。日本の選挙でもありましたね。
コインの表裏に例えた選挙をモデル化し、Ａ候補とＢ候補の票の差がｍ回以下になる確率を求めることが真剣に検証したいと思っています。
具体的に、総票数１０００００票、Ａ候補５０１００票、Ｂ候補４９９００票で得票数差が２００票以下になる確率を求めたいのですが、どのような式を使えば計算できるでしょうか？

コインの表裏の出る回数の差がｍ回以下になる確率

某先進国の地方選挙や大統領選挙で、例えば１０００００票の中のわずか２００票の差で勝敗が決したことが現実にあります。日本の選挙でもありましたね。率にすると得票数の0.5％以下が決め手になったケースが。そこで、こうした選挙などをモデル化して、何％くらいでありえることなのか、真剣に検証したいと思います。タイトルではあえてコインの表裏に例えました。カードを落とした時に表が出るか裏が出るか、でも良いです。とにかく選挙でＡ候補に入れるかＢ候補に入れるかが完全に２分の１で独立、だとします。実際の選挙だと勝ち馬に乗りたがったり劣勢の候補を応援したくなったりいろいろですが、無視してください。無効票もないものとします。反復試行回数ｎ回とするとき、Ａの票が出る回数がｋ回とすると（回数と言ったり票と言ったり読みにくかったらすみません。カードでも選挙でもどちらでも良いです）、二項定理より、Ａの票が出る回数がｋ回となる確率Ｑ（ｎ，ｋ）＝ｎＣｋ（1/2）^ｎですよね？すると、Ａの票が出る回数がＢの票が出る回数よりｍ回多いとした場合、その確率Ｐ（ｎ，ｍ）は、以下の４通りに場合分けして出した答えで合っていますでしょうか？【質問1】１）ｎが偶数、すなわちｎ＝２ｊとおけて、ｍも偶数、すなわちｍ＝２ｉとおけるとき（ｊは自然数、ｉは　０≦ｉ≦ｊ　の整数）（同票数の場合もＡが勝ったと見なす）Ｐ（ｎ，ｍ）＝Ｒ（ｊ，ｍ）＝Ｑ（２ｊ，ｊ）＋Ｑ（２ｊ，ｊ+1）＋Ｑ（２ｊ，ｊ+2）＋・・・＋Ｑ（２ｊ，ｊ+ｍ）＝（２ｊＣｊ＋２ｊＣ(ｊ+1)＋２ｊＣ(ｊ+2)＋・・・＋２ｊＣ(ｊ+ｍ/2)）／（2^(２ｊ)）２）ｎが偶数、すなわちｎ＝２ｊとおけて、ｍが奇数、すなわちｍ＝２ｉ－１とおけるときＰ（ｎ，ｍ）＝０３）ｎが奇数、すなわちｎ＝２ｊ－１とおけて、ｍが偶数、すなわちｍ＝２ｉとおけるときＰ（ｎ，ｍ）＝０４）ｎが奇数、すなわちｎ＝２ｊ－１とおけて、ｍも奇数、すなわちｍ＝２ｉ－１とおけるとき（ｊ＝１の場合は考える必要なし）Ｐ（ｎ，ｍ）＝Ｒ（ｊ，ｍ）＝Ｑ（２ｊ－１，ｊ）＋Ｑ（２ｊ－１，ｊ+1）＋Ｑ（２ｊ－１，ｊ+2）＋・・・＋Ｑ（２ｊ－１，ｊ+ｍ）＝（(２ｊ－１)Ｃｊ＋(２ｊ－１)Ｃ(ｊ+1)＋(２ｊ－１)Ｃ(ｊ+2)＋・・・＋(２ｊ－１)Ｃ(ｊ+(ｍ+１)/2)）／（2^(２ｊ－１)）具体的に、総票数１０００００票、Ａ　５０１００票Ｂ　４９９００票得票数差　２００票　かそれ以下となる確率　Ｐ（100000，200）は（100000Ｃ50000＋100000Ｃ50001＋100000Ｃ50002＋・・・＋100000Ｃ50099＋100000Ｃ50100）／2^100000 で合っていますか？【質問2】（Σ記号も理解はできますが、書きにくいので無しで書きました。）（ｎ，ｍについての関数なのに、私の式ではｎを使わずにｊを使っていて、間違いだったらすみません。表現はおまかせします。）そこでこれに伴って質問です。【質問3】もっと簡単な式はありますか？【質問4】 10Ｃ6などは私も手計算できますが、100000Ｃ50000　になると無理です。何か参考になるサイトはあるでしょうか。【質問5】 2^100000　などについて何か参考になるサイトはあるでしょうか。【質問6】ずばり　Ｐ（100000，200）はいくつくらいになるのでしょう。Ｐ（1000，200）Ｐ（10000，200）Ｐ（100000，200）は次第に小さくなる傾向にありますか？（それが自然と思います）それは直線的にＰ（ｎ，ｍ）の　ｎの値に比例するのでしょうか。【質問7】私はデータ分析や標準分布については弱いです。でも　○○の確率で　１０００００回の試行回数なら差が何百回以下に収まるはずだ、というようなよく言われる用語があるのでしょうか。【質問8】一般的に、表も裏も出るのが等確率になるのなら、１０００００回のうち５００００回ちょうど表が出る　という事象は、「もっともありがちな事象」　であって、珍しいことでも何でもない、のでしょうか？選挙でこういうことがあると（確か日本のどこかの村で３００５０票と２９９５０票のような僅差の勝利がありましたね）、それがどれくらい数学で見て奇跡的なのか、興味を持たずにはいられません。ご助言よろしくお願いします。

ohmy-pasta
お礼率94% (50/53)

数学・算数
回答数4
ありがとう数4

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

supernova20102
ベストアンサー率100% (3/3)

2014/06/10 11:30 回答No.2

数式を立てて答を求めるのは苦手なので，シミュレーションで試してみました。回答順序が変わりますが... > 【質問4】 10Ｃ6などは私も手計算できますが、100000Ｃ50000　になると無理です。何か参考になるサイトはあるでしょうか。 > 【質問5】 2^100000　などについて何か参考になるサイトはあるでしょうかサイトというか，やはりコンピュータでの計算が必要でしょう。R という統計ソフトで，長精度計算をするライブラリ gmp を使えば，100000C50000 の答もあっという間に計算できますが，しかしそれは 30101 桁の整数なのでとても扱えるようなものではないと思います。しかし，実際に計算する必要のある数は，（100000Ｃ50000＋100000Ｃ50001＋100000Ｃ50002＋・・・＋100000Ｃ50099＋100000Ｃ50100）／2^100000 のような，べらぼうに大きい数100000Ｃ50000を，べらぼうに大きい数2^100000で割ったほどほどの数の和ですから，これは，gmp などを使わなくても計算できます。それぞれの項の対数をとって計算して，最後の答の　exp を取ります。R では 100000Ｃ50000 の対数を lchoose(100000, 50000) で計算し，100000*log(2)を引いて，答の exp を取るのです。それを 50000 から 50100 までやって合計すると求めたい確率が得られます。 > s=0 > for (i in 50000:50100) { + s=s+exp(lchoose(100000, i)-100000*log(2)) + } > print(s) [1] 0.2387487 または，もっと簡単に， > sum(dbinom(50000:50100, 100000, prob=0.5)) [1] 0.2387487 答は， 0.2387487 ということになりました。さて，これが正しいかどうか，R では，簡単にシミュレーションできます。 > r <- 100000000 > ans <- rbinom(r, 100000, prob=0.5) > mean(abs(ans-50000)*2 <= 200) [1] 0.4749635 100000000回の選挙があったとして，票差が 200 以下になる確率は，0.4749635 程度のようです（計算にはほぼ 10 秒かかりました）。先ほどの確率計算の結果が 0.2387487 でしたが，そのほぼ2倍になっていると思われます。違う原因は，あなたは，（100000Ｃ50000＋100000Ｃ50001＋100000Ｃ50002＋・・・＋100000Ｃ50099＋100000Ｃ50100）／2^100000 を考えましたが，もう一方の，（100000Ｃ49900＋100000Ｃ49901＋100000Ｃ49902＋・・・＋100000Ｃ49998＋100000Ｃ49999）／2^100000 が考え落とされているのではないかと。ということで，求める値は，0.4774974 なのではないかなと思いますが。 > 【質問7】でも　○○の確率で　１０００００回の試行回数なら差が何百回以下に収まるはずだ、というようなよく言われる用語があるのでしょうか信頼区間という用語があります。 > 【質問8】一般的に、表も裏も出るのが等確率になるのなら、１０００００回のうち５００００回ちょうど表が出る　という事象は、「もっともありがちな事象」　であって、珍しいことでも何でもない、のでしょうか？以下の計算式で，答は得られます。 > exp(lchoose(100000, 50000)-100000*log(2)) [1] 0.002523126 または，より簡単に > dbinom(50000, 100000, prob=0.5) [1] 0.002523126 そのようなことは，もっともありがちですが，決してその確率は高くはありませんね。

質問者

お礼 2014/06/10 12:32

30101 桁の整数！なるほど、それで他の方も近似とおっしゃっている意味がわかりました。 100000Ｃ50000 の対数を取れる、というソフトがあるんですねー。幅広いご知識を分けてくださって助かります。＞もう一方の（中略）が考え落とされているの件については、一応ＡとＢ（表と裏）の２つしか選択肢がないうちの　Ａが２００票差で「勝つ」という条件設定をしたものですから。でも、まとめて計算して２で割る、というものもたいへんわかりやすかったです。計算シミュレーションまでしてくださいまして、たいへん助かりました。 0.2387487 はそのまま　23％　でしょうか？つまり理論的には、１００回のうち２３回は差が２００以下になる見込み、ということで合っていますか？　私の予想よりは１桁高いので驚きました。票差が０になるのが 0.002523126 つまり　０.２５％、この前後は、０の時をピークに少しずつ下がる、と考えると、確かに　０.２５％　の１００倍弱になるのかも知れませんね。まあ、私の式立てが間違っていない、という前提かも知れませんが。＋100　　0.002523126よりそれなりに小さい数字＋99　　0.002523126よりそれなりに小さい数字・・・＋2　　0.002523126より微妙に小さい数字＋1　　0.002523126より微妙に小さい数字 ±0　　0.002523126 －1　　0.002523126より微妙に小さい数字－2　　0.002523126より微妙に小さい数字・・・－99　　0.002523126よりそれなりに小さい数字－100　　0.002523126よりそれなりに小さい数字１０秒もかかる計算を人にさせてしまってすみません。お手数にもご丁寧なご説明にも感謝しております。すると、人間社会でも　　　当たるも八卦、当たらぬも八卦という場面は多々ありますが、選挙や試合で　　　完全に実力が均衡していてどちらが勝ってもおかしくないという場面では、その得点差（票差）も限りなく　±０　に近付く、ある程度　±０　から前後にぶれることは当然あるが、２００票差以内というのは　そんなに奇跡的でもない（４分の１の確率でこの範囲に収まるはずだ）、ということで納得しました。ゴア大統領候補の頃からもやもやしていて、あの時は投票用紙に細工がしてあったとか、選挙に行かせないよう妨害があったとか言われて、再集計も行われて、陰謀説を一時期信じそうになりました。「中途半端に２０００票差で勝ったなら不正が疑われ続けたが、２００票差や２０票差のような『奇跡』と思わせるような数字だと、奇跡の方に人々が酔ってしまって、批判を打ち消せる」という演出もあるのかな、と思っていたのです。その根底には、　　　１０００００万人も投票して、２００票差なんてあるわけがないだろうという思い込みがあったわけです（数字はイメージですが）。その後再びアメリカにおいて、地方選挙で極小差の勝利がありました。日本でも最近、「わざと停電を起こして開票中の投票用紙を食べて処分する」　という事件がありましたから（この日本でですよ！）、不信感を抱かざるを得ず、「奇跡」に対して数字的な裏付けが欲しかったわけです。すっきり　しました！　ありがとうございます。

その他の回答 (3)

stomachman
ベストアンサー率57% (1014/1775)

2014/06/10 22:07 回答No.4

ANo.1へのコメントについてです。　たとえば「ある偏ったコインを10回トスしたら、表が4回出た」という観察があったとします。このとき、 H: 「表が出る確率がpのコインを10回トスしたとき、表が4回出た」とは「表が出る確率がpのコインの、トスの結果の無限集合の中からランダムに10個のサンプルを選んだら、4個が表だった」という意味だ。という仮定を置いたとします。要するに、ズルはしてない、ってことです。すると、 Q1:「表が出る確率がpのコインを10回トスしたとき、表が4回出る確率f(p)を求む」という問いに答えられる。仮定Hにより、サンプルはランダムに選ばれたのだから、確率f(p)が計算できて、　　f(p) = (10!/(4!6!))(p^4)((1-p)^6) である。　同じ仮定Hに基づけば、 Q2:「表が出る確率がpのコインを10回トスしたとき、表が4回出た。このコインをトスしたとき表が出る確率pについて、pがx以下である確率Φ(x)を求む」という問いにも答えられる。　そして、これらの結果を使って、 Q3: 「ある偏ったコインを10回トスしたら表が4回出た、ということが生じる確率Pを推定せよ」という問いに答えることができる。すなわち、f(p)と　　φ(x) = dΦ(x)/dx を用いて　　P = ∫{x=0～1} φ(x)f(x) dx である。　しかしながら、「投票の結果、候補Aは百万票中丁度50万票であった。候補Aの【真の支持率】をpとして、pがx以下である確率Φ(x)を求む」だとか「候補Aの【真の支持率】をpとして、百万票中丁度50万票を獲得する確率f(p)を計算せよ」という問いは成立たない。なぜなら、投票者がランダムに選ばれる訳ではない。つまり最も基本的な仮定Hが、この場合には存在しない。だから、コイントスとは全く話が違い、Φもfも計算のしようがない。　ならば、選挙の話にも仮定Hに相当する仮定H'を加えて「モデル化」してみようじゃないか、と言いたいところですが、さて、その仮定H'を、選挙の話に即して具体的に書けますかね？一体どの部分がランダムになると言うんでしょう。　元の話のどこをどう単純化したのか（つまりどんな仮定を加えたのか）を説明できないものをモデルとは呼ばない。元の話に関する洞察にはまるで繋がらないからです。ただ「何となく似ている気がする」というだけなら単なるアナロジー、すなわち「詩的な連想」に他ならない。

質問者

お礼 2014/06/11 11:30

再度のご回答ありがとうございます。 stomachmanさんがいかに数学にご堪能な雰囲気をお持ちなのかがよくわかりました。（真にどのくらいご堪能なのかは、私は測るモノサシを持ちません。）ただ同時に、stomachmanさんが私の住んでいる世界よりも数学の世界に半分移住なさっていることも伝わってきました。一所懸命ジェスチャーも交えて道案内をしようとしてくださっているのはありがたいのですが、コトバが半分くらい通じないのがもどかしいです。最初はですね、「Ａ君がＢ町から８０キロはなれたＣ町まで時速４キロで歩くとする。何時間かかるか。」という中学入試でもありがちな「モデル」問題に対して、「Ａ君の年齢や忍耐力にもよる。２０時間　飯も長休憩もなしにぶっ通しで歩ける人はそんなにたくさんいない。」という類の理屈をおっしゃっているのと同じだと、本気で感じました。しかしstomachmanさんは真剣に、集合や確率の際に考えるべき前提条件をおっしゃっているおつもりなのですね。ご回答なさっている質問に集合問題が多そうに見えることからも、集合のエキスパートであることが推察されます。しかし、ここから大事なことなので怒らずに聞いてください。私みたいな数学の素人（高校までしか数学を習っていない者）にとっては、stomachmanさんのおっしゃることは難し過ぎます。Ａ君の例にならうなら、「Ｂ町からＣ町までという距離と時間も、Ｂ町の時間系で考えるか、Ｃ町の時間系で考えるかで答えが異なる。一般相対性理論によれば・・・」みたいなことを言い出されている気分です（私は相対性理論をちっとも知らないので知ったかぶってすみません、イメージで聞いてください）。ここは「数学の研究者用の情報交換コミュニティ」ではなく、小学生でも登録可能な「一方通行的に教えるサイト」なので、たまには雲の上から降りてきていただけるとありがたいです。つまり具体的にはですね、＞　H: 「表が出る確率がpのコインを10回トスしたとき、表が4回出た」とは「表が出る確率がpのコインの、トスの結果の無限集合の中からランダムに10個のサンプルを選んだら、4個が表だった」という意味だ。＞　という仮定を置いたとします。この時点で、なぜこのような仮定を置かないといけないか、 Q1:「表が出る確率がpのコインを10回トスしたとき、表が4回出る確率f(p)を求む」 ↓ Q3: 「ある偏ったコインを10回トスしたら表が4回出た、ということが生じる確率Pを推定せよ」という問題の置き換えがなぜ生じるか、が完全に「雲の上の国のコトバ」にしか聞こえないのです（Ｑ１をＱ３の形で言い換えなさっているのだろう、と解釈したのですが、合っていますでしょうか？　それすらも不安です）。まず無限集合を考える時点でびっくりです。１０回トスするなら、２^10　通り　のすべての場合の数、という有限の分母を考えれば充分でしょう？　そもそも私は、確率の問題を解くときに、すべての場合の数を全体集合Ｕと言い表す、という類の習慣を持ち合わせていませんが。私の習慣によれば、１０万人という人数が多いとはいえ、１０万人が無作為にＡかＢを選ぶすべての場合の数は　２^100000　通り　になる、と理解しているのです。 stomachmanさんは、＞　トスの結果の無限集合とおっしゃった時点で　「トスを投げる回数は　１０回に限定せず、無限回（宇宙の終わりまで）考えられる」　ということをおっしゃっているのでしょう。それは「素人の国」に住んでいる私にもわかりました。でも、　　　小学生が　トスの結果の無限集合　を理解できるでしょうか？私はさすがに小学生ではありませんが、では　　　高校生なら　トスの結果の無限集合　を理解できて当たり前、なのでしょうか？恐らく、無限集合　が出てくる時点で、　　　Ｐ＝ｎ（Ａ）／　ｎ（Ｕ）みたいな私の知っている　「確率を求める式」　は役に立たないのでしょう。分母が無限大なのですから。そうすると、その世界では　100000Ｃ50000　や　10Ｃ6　も登場しない、ということでしょうか？　　　f(p) = (10!/(4!6!))(p^4)((1-p)^6) と書いていらっしゃるから　10Ｃ4　（10Ｃ6）はきっと存在するのでしょうが、「無限」という考え方と両方併用する意味がわかりません。Ｂ町からＣ町までを考えたいだけなのに、相対性理論だけじゃなく素粒子理論だとか超ひも理論だとかが登場した気分です。　　　P = ∫{x=0～1} φ(x)f(x) dx という書き方も、一応私は積分まで習っていますけど解けません。 φ(x) という　「確率の導関数」　を積分して、φ(x)f(x)　の和を求める、という手順そのものはわからなくもないですが、わざわざf(x)をそのように定義なさっている意味がわかりませんから、∫{x=0～1}　という積分区間も難儀です。【質問3】もっと簡単な式はありますか？に答えてくださったから、このような式を示してくださったのでしょうかね？　【質問2】の式よりも簡単なのかどうか、私にはわかりませんでした。私は決して、「すみませんが、わかりませんでした」　というつもりはありません。草野球の中にメジャーリーガーが飛び入り参加したら喜ばれることもあるでしょう。しかし居酒屋で「東京から静岡まで」という話をしているときに「相対性理論で考えるか、それ以外で考えるかで答えが異なってきますね。」と言い出したら、知識の引けらかしと受け取られて、嫌われる可能性もあるでしょう。私の言うことが「モデル化」ではなく単なる「アナロジー」、「詩的な連想」だ、というご忠告、聞いておきます。そうなんでしょうかね、「真剣に検証」したい、と言ったことは、選挙に対する「洞察」を深めたい、という話とは別次元のつもりでしたよ。別に私は選挙アナリストになるつもりもありませんし。　　　「モデル化」　という言葉が　どこかの国では　「専門用語」　として　　　受け止められる、ということも予想外でしたし。ご指摘によって私が今後　「安易にモデル化という言葉を使わない」　ように萎縮すると思います？とんでもない。普通の人がモデル化と言っている時の意図、が伝わらない方が、　　　頭が固くなっているかも知れないと思って欲しいと思いますよ。　　　どこをどう単純化したのか　の説明、　　　どんな仮定を加えたのか　の説明　　　なんて　い　ら　な　いのです。　　　大学で　数学論文を書いているのとは　明確に違うのですから。現に他の回答者様たちは、　　　選挙の話でも、コインの話でも、投げたカードの話でも、　　　（投げた下駄だと都合悪いですけど）　　　なんでもいいという前提から、　　　Ａに投票するのは「ランダムに」２分の１、Ｂに投票するのも等しく２分の１という　「普通の国のコトバ」　を正確に理解してくださっていますよ。どうしてこれを、「モデル化ではなく単なる詩的な連想だ」、なんて人に言えます？ stomachmanさんが、「こいつの言っていることは、モデル化ではなく単なる詩的な連想だ」　とお感じになるのは自由です。でもそれを、口に出してしまうと、居酒屋で相対性理論を持ち出す変わり者　になりかねません。場合によっては、「一般人に理解できないことを承知の上で知識自慢をする厭味者」「自分と同じレベルで議論できる仲間を探している閉じた世界の孤独者」ともなりかねないと思いますので、stomachmanさんがそう成り下がる前にご自分で自制できるご聡明な方であると信じております。反論、言い返しのご機会を与えないのもフェアでないとは思いますが、既に、stomachmanさんからいただくご回答は　私の【質問】たち　への回答ではなく、拡張的に別解の可能性（解ではなく解法）を示してくださっているだけ、のように感じますので、締め切らせていただきます。ちなみに、あのホーキング博士までサッカーＷ杯で「イングランドが勝つ」勝利の方程式を示しているそうですが、専門用語を並べ立てる専門家は専門家でも、そのくらいユーモアがあって、「高校生でもわかるように」配慮もあったなら、私みたいな数学オンチでも楽しめますね。どこか別の質問で　「サッカーの勝率は、２分の１ではないからタコには予想できない」　とか言ってるバカもいました（stomachmanさんじゃないですよ）けど、ホーキング博士の方がよっぽどユーモアあります。

質問者

補足 2014/06/11 11:40

補足ですが、他の回答者さんと比べるのは失礼と思って書かなかったことがあります。 supernova20102さんのご回答は、一部難しい関数・数式が含まれてはいますが、「高校生にも理解できるような」配慮に富んでいる素晴らしいご回答だと思います。あのくらいなら、知らない「専門用語」が含まれていたとしても、理解できます。（私が高校生だとは一言も言っていませんよ。） Tacosanさんのご回答もそうです。私自身は正規分布がどのようなものか、さわりくらいしか知りませんが、ストレートに２つの「答え」を具体的な数字で示したことは伝わりました。つまり、お二人とも知識自慢にはなっていないのですよ。「質問の前提がおかしい」みたいなこともおっしゃっていませんし。専門用語を使うこと全てが悪い、とは私も思いません。回答者に対して質問者が言い返すのはよく思われなかったかも知れませんが、そこをわかっていただきたいですね・・・

Tacosan
ベストアンサー率23% (3656/15482)

2014/06/10 13:08 回答No.3

正規分布で近似してもだいたい 47 % くらい. ちなみに 30050対29950 だとそれ以下になる確率は 43 % 前後. でも, そんな「村」はない.

質問者

お礼 2014/06/10 20:18

ええ。平成の大合併で、日本に「村」として残っている地方自治体は、ほんとに数えるほどでしたね。まあ、私の言う村は村八部や原子力村の村だと思ってください。複数の方法で出した数値を見比べさせていただいたおかげで勉強になります。４７％とか４３％というのは、「勝つ」じゃなくて、「勝つ」「負ける」両方含めて「差がその範囲に収まる」確率ですよね。そんなに高いんですね！６００００票の中で、差が１００以下になる確率が４３％。カードを　６００００回投げて、表と裏の差が１００以下になる確率が４３％。つるっつるのコインを　６００００回投げて、表と裏の差が１００以下になる確率が４３％。（どこかの国のコインでは表と裏の重心バランスが微妙にずれていると聞いたことはあります。）自然と　中央値？に集まるものだし、３１５００対２８５００　より　３００５０対２９９５０　の方が自然（差が３０００以内でなく、差が３０００ちょうどになる確率。今回の話ではそれは直接は出てきませんが。）なんですね。私は数学は平均程度にしかできませんが、世の中の物事を捉えるとき、数学を知っているか知らないかでここまでモノの見方が変わるのか、と個人的感覚として、数学の重要性を実感しました。ありがとうございました。

stomachman
ベストアンサー率57% (1014/1775)

2014/06/09 20:25 回答No.1

> こうした選挙などをモデル化して、何％くらいでありえることなのか、  > 真剣に検証したいと思います。 > それがどれくらい数学で見て奇跡的なのか　無理でしょ。「選挙管理事務局が名簿からランダムに投票者を選出して（つまりサンプリングして）、投票させた」というのならまだ話になりますけれども、ご質問の場合にはサンプリングは関係がない。投票に行く、という行動自体が既に投票者の意思の現れなのですから、ご質問は確率論で扱える範疇には入りませんよ。　それはさておき、ご質問の中盤部分についてなら、確率論が回答を与えてくれます。すなわち、コインやカードの話であるならば：「表」である確率がpであるような母集団からランダムにm個のサンプルを選んだとき、（つまりm回試行したとき）「表」が丁度r個得られる確率は二項分布 B(m,p,r) = (mCr) (p^r) ((1-p)^(m-r)) になります。平均は μ= mp, 分散は σ^2 = mp(1-p) です。  　そして、mが大きいとき、B(m,p,r)は平均μ,分散σ^2の正規分布で近似できます。お書きの幾つかの質問項目は、この計算方法が分かれば解消すると思います。　たとえば、r>(mp+α)となる確率を計算するには、累積正規分布表Φ(x) 　　Φ(x) = ∫{t=-∞～x} φ(t) dt　　ただしφ(t)は標準正規分布の確率密度関数（ガウス曲線）を使って、1-Φ(α/√(mp(1-p)))を調べれば良い。　また、a>r>bとなる確率を計算するには、Φ((mp+a)/√(mp(1-p)))-Φ((mp+b)/√(mp(1-p)))を調べれば良い。　なお、十分に「mが大きい」かどうかは、計算結果に求める精度（つまり二項分布を正規分布で近似することの誤差）によって基準が変わる訳ですが、ま、大抵の目的ならm>100ぐらいあれば足りるでしょう。こちらもご参考になるかも → http://okwave.jp/qa/q2386661.html

質問者

お礼 2014/06/10 01:14

＞投票に行く、という行動自体が既に投票者の意思の現れなのですから、ご質問は確率論で扱える範疇には入りませんよ。はあ、そうですか。どうも頭の中がご立派過ぎて私にはよくわかりません。モデル化　という言葉の中には「単純化」して、という日本語的意味を含んでいるつもりでしたから、まさか　「選挙に行く行かないの時点から意思が反映されているから、数学の問題としての確率は出せない」　という理屈をおっしゃる人がいらっしゃるとは思いませんでした。選挙はどうでも良いのですよ。既にコインやカードの例えも載せているのですから、数学以前に「日本語として」文をお読みいただければ私もこのようなことを言わずに済み、幸いでした。他者のタコのパウルくんのご質問も傍観しておりました。＞ご質問は確率の話じゃありません。の部分が今回私にくださったご回答とそっくりですね。まずは「確率について答えてあげるけど、この問題を確率で考えるのは間違えている」と相手にガツンということを一つのスタイルとなさっているのですか？　そのうち運営より、「質問の前提となっていることへの批判」としてマナー違反を問われると思いますよ。パウルくんの件は質問者さんの方に私は同情しています。相撲の星取り表のように●○○○●●○●のような８戦の勝敗を適当にコインや入った壺などで占う場合、stomachmanさんと違って数学の世界に住むより現実世界の方が長い我々は、「この確率はいくら？」と言ってしまうものです。あいにく高校までしか確率は習っていないもので。優勝チームは3位決定戦に出場しないだろう、のアドバイスはちっともわかりませんでした。全部の試合を占うのでなく、ドイツ戦の占いだ、と質問文に書いてあったくらいですから。きちんと読んでいないことを質問者さんに謝っても良いくらいだと思いますね。ドイツが決勝に出たら3位決定戦に出場しない、ドイツが3位決定戦に出たら決勝に出場しない、決勝まで８戦なのかどうかはどうでも良くて質問者が聞きたかったのは「連続８戦まで続いたとして８戦まで占った場合」というモデルケースだ、ということはサッカーの事なんざまるで知らないstomachmanさんだって、お分かりになったと思いますが。まあstomachmanさんがいかに数学にご堪能な方であるかは　　　１＋１＝２の証明って？でのtgbさんとの議論を拝見して、よくわかりました。もはや高校数学までの知識（かそれ以下）しか持ち得ない私には議論のどこに穴があるのかも全くわからないお話。質問した側が恐縮してしまうような有様でしたね。さて今回、ご回答を拝見したのですが、あまりにも内容がご高尚過ぎて、確率を探ろうとすること自体が無理なのか無理でなく一つの式は示してくださったのか、それすらよくわかりませんでした。【質問1】～【質問8】のどの辺りのお答えだったのでしょう。２分の１のケースをお伺いして、この式で合っているかともお尋ねしたのに、あえて確率がｐである場合の式に戻してくださったのは一つのイジワルですか？正直、私は二項分布も自分で書いた式程度にしか習っていないし、（B(m,p,r) = (mCr) (p^r) ((1-p)^(m-r)) 　は私の知っている式とほぼ同じ形です）正規分布は全く習っていません。データ分析は、標準偏差や偏差値の意味がかろうじてわかる程度で、累積正規分布表、標準正規分布の確率密度関数、平均μ,分散σ^2の正規分布で近似、などは、雲の上の人のおコトバでした。高校生に理解できるようなスタイルでご説明いただけるとありがたかったですね。「そのようにわかりやす～く教えてください」と言わなかった私も悪かったのでしょう。既に最初の入り口の時点で、「これを確率で考えるのがそもそもおかしい」と言われるのは、数学のレベルが違い過ぎることを意味していますから。精度とか、大抵の目的ならm>100ぐらいあれば足りる、とかのお話も、せっかく教えようとしてくださったのに、理解できませんでした。 m>100　くらいないと、50票差とか20票差とかいうケースは数字で出せない、ということでしょうか。私はもっとかちっと数字で出せるのかと思い込んでいたのですが、さすがに１０万ともなると近似するのが一般的、ということでしょうかね。ところでリンク先を拝見しましたが、二項分布が出てくる意味では共通点を見出せましたが、それ以外のどこが私の質問と関連性があるのかも、内容が高尚過ぎてわかりませんでした。私の質問も　誤差や信頼度　の話に帰結するということなのでしょうか？まあ、私が受けた印象を率直にお伝えするために、あえて揚げ足を取り直すと、＞このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布・・・という部分はオカシイと感じますね。だって質問のしかたによって「YES」と「NO」は完全に２分の１にはなりませんから。新聞各社の世論調査や、誘導尋問のように。屁理屈について、わかっていただけました？ま、この程度の指摘でかちんとこられるようなら、続きのご回答はけっこうですよ。 stomachmanさんのような数学の得意な方に【質問1】～【質問8】のご回答をいただきたかったのですが、肩透かしされて残念です。＞この計算方法が分かれば解消すると思います。という貴重なご意見ですので、この計算方法が分かるように努力したいと思います。独学でデータ分析を学ぶような感じにはなりますが。ありがとうございました。

質問者

補足 2014/06/10 01:30

１）ｎが偶数、ｍも偶数、という場合以外は、（ｊは自然数、ｉは　０≦ｉ≦ｊ　の整数）ではなく（ｊは自然数、ｉは　１≦ｉ≦ｊ　の整数）としなければならない場合も出てきますが、そこは皆様で修正の上ご理解願います。私は見落としておりましたが編集再投稿が間に合いませんでした。

コインの表裏の出る回数の差がｍ回以下になる確率

コインの表裏の出る回数の差がｍ回以下になる確率