コインの表裏の出る回数の差がm回以下になる確率
- 某先進国の地方選挙や大統領選挙で、例えば100000票の中のわずか200票の差で勝敗が決したことが現実にあります。日本の選挙でもありましたね。
- コインの表裏に例えた選挙をモデル化し、A候補とB候補の票の差がm回以下になる確率を求めることが真剣に検証したいと思っています。
- 具体的に、総票数100000票、A候補50100票、B候補49900票で得票数差が200票以下になる確率を求めたいのですが、どのような式を使えば計算できるでしょうか?
- ベストアンサー
コインの表裏の出る回数の差がm回以下になる確率
某先進国の地方選挙や大統領選挙で、例えば100000票の中のわずか200票の差で勝敗が決したことが現実にあります。日本の選挙でもありましたね。率にすると得票数の0.5%以下が決め手になったケースが。 そこで、こうした選挙などをモデル化して、何%くらいでありえることなのか、 真剣に検証したいと思います。 タイトルではあえてコインの表裏に例えました。カードを落とした時に表が出るか裏が出るか、でも良いです。とにかく選挙でA候補に入れるかB候補に入れるかが完全に2分の1で独立、だとします。実際の選挙だと勝ち馬に乗りたがったり劣勢の候補を応援したくなったりいろいろですが、無視してください。無効票もないものとします。 反復試行回数n回 とするとき、Aの票が出る 回数がk回 とすると(回数と言ったり票と言ったり読みにくかったらすみません。カードでも選挙でもどちらでも良いです)、 二項定理より、Aの票が出る回数がk回となる確率 Q(n,k)=nCk(1/2)^n ですよね? すると、 Aの票が出る回数がBの票が出る回数よりm回多い とした場合、その確率P(n,m)は、 以下の4通りに場合分けして出した答えで合っていますでしょうか? 【質問1】 1)nが偶数、すなわちn=2jとおけて、 mも偶数、すなわちm=2iとおけるとき(jは自然数、iは 0≦i≦j の整数) (同票数の場合もAが勝ったと見なす) P(n,m)=R(j,m) =Q(2j,j)+Q(2j,j+1)+Q(2j,j+2)+・・・+Q(2j,j+m) =(2jCj+2jC(j+1)+2jC(j+2)+・・・+2jC(j+m/2))/(2^(2j)) 2)nが偶数、すなわちn=2jとおけて、 mが奇数、すなわちm=2i-1とおけるとき P(n,m)=0 3)nが奇数、すなわちn=2j-1とおけて、 mが偶数、すなわちm=2iとおけるとき P(n,m)=0 4)nが奇数、すなわちn=2j-1とおけて、 mも奇数、すなわちm=2i-1とおけるとき (j=1の場合は考える必要なし) P(n,m)=R(j,m) =Q(2j-1,j)+Q(2j-1,j+1)+Q(2j-1,j+2)+・・・+Q(2j-1,j+m) =((2j-1)Cj+(2j-1)C(j+1)+(2j-1)C(j+2)+・・・+(2j-1)C(j+(m+1)/2))/(2^(2j-1)) 具体的に、 総票数100000票、 A 50100票 B 49900票 得票数差 200票 かそれ以下 となる確率 P(100000,200)は (100000C50000+100000C50001+100000C50002+・・・+100000C50099+100000C50100)/2^100000 で合っていますか?【質問2】 (Σ記号も理解はできますが、書きにくいので無しで書きました。) (n,mについての関数なのに、私の式ではnを使わずにjを使っていて、間違いだったらすみません。表現はおまかせします。) そこでこれに伴って質問です。 【質問3】 もっと簡単な式はありますか? 【質問4】 10C6などは私も手計算できますが、100000C50000 になると無理です。何か参考になるサイトはあるでしょうか。 【質問5】 2^100000 などについて何か参考になるサイトはあるでしょうか。 【質問6】 ずばり P(100000,200)はいくつくらいになるのでしょう。 P(1000,200) P(10000,200) P(100000,200) は次第に小さくなる傾向にありますか?(それが自然と思います) それは直線的にP(n,m)の nの値に比例するのでしょうか。 【質問7】 私はデータ分析や標準分布については弱いです。 でも ○○の確率で 100000回の試行回数なら差が何百回以下に収まるはずだ、というようなよく言われる用語があるのでしょうか。 【質問8】 一般的に、表も裏も出るのが等確率になるのなら、 100000回のうち50000回ちょうど表が出る という事象は、 「もっともありがちな事象」 であって、珍しいことでも何でもない、 のでしょうか? 選挙でこういうことがあると(確か日本のどこかの村で30050票と29950票のような僅差の勝利がありましたね)、それがどれくらい数学で見て奇跡的なのか、興味を持たずにはいられません。 ご助言よろしくお願いします。
- ohmy-pasta
- お礼率94% (50/53)
- 数学・算数
- 回答数4
- ありがとう数4
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
数式を立てて答を求めるのは苦手なので,シミュレーションで試してみました。 回答順序が変わりますが... > 【質問4】 10C6などは私も手計算できますが、100000C50000 になると無理です。何か参考になるサイトはあるでしょうか。 > 【質問5】 2^100000 などについて何か参考になるサイトはあるでしょうか サイトというか,やはりコンピュータでの計算が必要でしょう。R という統計ソフトで,長精度計算をするライブラリ gmp を使えば,100000C50000 の答もあっという間に計算できますが,しかしそれは 30101 桁の整数なのでとても扱えるようなものではないと思います。 しかし,実際に計算する必要のある数は, (100000C50000+100000C50001+100000C50002+・・・+100000C50099+100000C50100)/2^100000 のような,べらぼうに大きい数100000C50000を,べらぼうに大きい数2^100000で割ったほどほどの数の和ですから,これは,gmp などを使わなくても計算できます。それぞれの項の対数をとって計算して,最後の答の exp を取ります。R では 100000C50000 の対数を lchoose(100000, 50000) で計算し,100000*log(2)を引いて,答の exp を取るのです。それを 50000 から 50100 までやって合計すると求めたい確率が得られます。 > s=0 > for (i in 50000:50100) { + s=s+exp(lchoose(100000, i)-100000*log(2)) + } > print(s) [1] 0.2387487 または,もっと簡単に, > sum(dbinom(50000:50100, 100000, prob=0.5)) [1] 0.2387487 答は, 0.2387487 ということになりました。 さて,これが正しいかどうか,R では,簡単にシミュレーションできます。 > r <- 100000000 > ans <- rbinom(r, 100000, prob=0.5) > mean(abs(ans-50000)*2 <= 200) [1] 0.4749635 100000000回の選挙があったとして,票差が 200 以下になる確率は,0.4749635 程度のようです(計算にはほぼ 10 秒かかりました)。 先ほどの確率計算の結果が 0.2387487 でしたが,そのほぼ2倍になっていると思われます。違う原因は,あなたは, (100000C50000+100000C50001+100000C50002+・・・+100000C50099+100000C50100)/2^100000 を考えましたが,もう一方の, (100000C49900+100000C49901+100000C49902+・・・+100000C49998+100000C49999)/2^100000 が考え落とされているのではないかと。ということで,求める値は,0.4774974 なのではないかなと思いますが。 > 【質問7】 でも ○○の確率で 100000回の試行回数なら差が何百回以下に収まるはずだ、というようなよく言われる用語があるのでしょうか 信頼区間という用語があります。 > 【質問8】 一般的に、表も裏も出るのが等確率になるのなら、100000回のうち50000回ちょうど表が出る という事象は、「もっともありがちな事象」 であって、珍しいことでも何でもない、のでしょうか? 以下の計算式で,答は得られます。 > exp(lchoose(100000, 50000)-100000*log(2)) [1] 0.002523126 または,より簡単に > dbinom(50000, 100000, prob=0.5) [1] 0.002523126 そのようなことは,もっともありがちですが,決してその確率は高くはありませんね。
その他の回答 (3)
- stomachman
- ベストアンサー率57% (1014/1775)
ANo.1へのコメントについてです。 たとえば「ある偏ったコインを10回トスしたら、表が4回出た」という観察があったとします。このとき、 H: 「表が出る確率がpのコインを10回トスしたとき、表が4回出た」とは「表が出る確率がpのコインの、トスの結果の無限集合の中からランダムに10個のサンプルを選んだら、4個が表だった」という意味だ。 という仮定を置いたとします。要するに、ズルはしてない、ってことです。すると、 Q1:「表が出る確率がpのコインを10回トスしたとき、表が4回出る確率f(p)を求む」 という問いに答えられる。仮定Hにより、サンプルはランダムに選ばれたのだから、確率f(p)が計算できて、 f(p) = (10!/(4!6!))(p^4)((1-p)^6) である。 同じ仮定Hに基づけば、 Q2:「表が出る確率がpのコインを10回トスしたとき、表が4回出た。このコインをトスしたとき表が出る確率pについて、pがx以下である確率Φ(x)を求む」 という問いにも答えられる。 そして、これらの結果を使って、 Q3: 「ある偏ったコインを10回トスしたら表が4回出た、ということが生じる確率Pを推定せよ」 という問いに答えることができる。すなわち、f(p)と φ(x) = dΦ(x)/dx を用いて P = ∫{x=0~1} φ(x)f(x) dx である。 しかしながら、「投票の結果、候補Aは百万票中丁度50万票であった。候補Aの【真の支持率】をpとして、pがx以下である確率Φ(x)を求む」だとか「候補Aの【真の支持率】をpとして、百万票中丁度50万票を獲得する確率f(p)を計算せよ」という問いは成立たない。なぜなら、投票者がランダムに選ばれる訳ではない。つまり最も基本的な仮定Hが、この場合には存在しない。だから、コイントスとは全く話が違い、Φもfも計算のしようがない。 ならば、選挙の話にも仮定Hに相当する仮定H'を加えて「モデル化」してみようじゃないか、と言いたいところですが、さて、その仮定H'を、選挙の話に即して具体的に書けますかね?一体どの部分がランダムになると言うんでしょう。 元の話のどこをどう単純化したのか(つまりどんな仮定を加えたのか)を説明できないものをモデルとは呼ばない。元の話に関する洞察にはまるで繋がらないからです。ただ「何となく似ている気がする」というだけなら単なるアナロジー、すなわち「詩的な連想」に他ならない。
お礼
再度のご回答ありがとうございます。 stomachmanさんがいかに数学にご堪能な雰囲気をお持ちなのかがよくわかりました。 (真にどのくらいご堪能なのかは、私は測るモノサシを持ちません。) ただ同時に、stomachmanさんが私の住んでいる世界よりも数学の世界に半分移住なさっていることも伝わってきました。一所懸命ジェスチャーも交えて道案内をしようとしてくださっているのはありがたいのですが、コトバが半分くらい通じないのがもどかしいです。 最初はですね、 「A君がB町から80キロはなれたC町まで時速4キロで歩くとする。何時間かかるか。」という中学入試でもありがちな「モデル」問題に対して、「A君の年齢や忍耐力にもよる。20時間 飯も長休憩もなしにぶっ通しで歩ける人はそんなにたくさんいない。」 という類の理屈をおっしゃっているのと同じだと、本気で感じました。 しかしstomachmanさんは真剣に、集合や確率の際に考えるべき前提条件をおっしゃっているおつもりなのですね。 ご回答なさっている質問に集合問題が多そうに見えることからも、集合のエキスパートであることが推察されます。 しかし、ここから大事なことなので怒らずに聞いてください。 私みたいな数学の素人(高校までしか数学を習っていない者)にとっては、stomachmanさんのおっしゃることは難し過ぎます。A君の例にならうなら、 「B町からC町までという距離と時間も、B町の時間系で考えるか、C町の時間系で考えるかで答えが異なる。一般相対性理論によれば・・・」 みたいなことを言い出されている気分です(私は相対性理論をちっとも知らないので知ったかぶってすみません、イメージで聞いてください)。 ここは「数学の研究者用の情報交換コミュニティ」ではなく、小学生でも登録可能な「一方通行的に教えるサイト」なので、たまには雲の上から降りてきていただけるとありがたいです。 つまり具体的にはですね、 > H: 「表が出る確率がpのコインを10回トスしたとき、表が4回出た」とは「表が出る確率がpのコインの、トスの結果の無限集合の中からランダムに10個のサンプルを選んだら、4個が表だった」という意味だ。 > という仮定を置いたとします。 この時点で、なぜこのような仮定を置かないといけないか、 Q1:「表が出る確率がpのコインを10回トスしたとき、表が4回出る確率f(p)を求む」 ↓ Q3: 「ある偏ったコインを10回トスしたら表が4回出た、ということが生じる確率Pを推定せよ」 という問題の置き換えがなぜ生じるか、 が完全に「雲の上の国のコトバ」にしか聞こえないのです(Q1をQ3の形で言い換えなさっているのだろう、と解釈したのですが、合っていますでしょうか? それすらも不安です)。 まず無限集合を考える時点でびっくりです。 10回トスするなら、2^10 通り のすべての場合の数、という有限の分母を考えれば充分でしょう? そもそも私は、確率の問題を解くときに、すべての場合の数を全体集合Uと言い表す、という類の習慣を持ち合わせていませんが。 私の習慣によれば、10万人という人数が多いとはいえ、10万人が無作為にAかBを選ぶすべての場合の数は 2^100000 通り になる、と理解しているのです。 stomachmanさんは、 > トスの結果の無限集合 とおっしゃった時点で 「トスを投げる回数は 10回に限定せず、無限回(宇宙の終わりまで)考えられる」 ということをおっしゃっているのでしょう。それは「素人の国」に住んでいる私にもわかりました。 でも、 小学生が トスの結果の無限集合 を理解できるでしょうか? 私はさすがに小学生ではありませんが、では 高校生なら トスの結果の無限集合 を理解できて当たり前、なのでしょうか? 恐らく、無限集合 が出てくる時点で、 P=n(A)/ n(U) みたいな私の知っている 「確率を求める式」 は役に立たないのでしょう。分母が無限大なのですから。 そうすると、その世界では 100000C50000 や 10C6 も登場しない、ということでしょうか? f(p) = (10!/(4!6!))(p^4)((1-p)^6) と書いていらっしゃるから 10C4 (10C6)はきっと存在するのでしょうが、「無限」という考え方と両方併用する意味がわかりません。 B町からC町までを考えたいだけなのに、相対性理論だけじゃなく素粒子理論だとか超ひも理論だとかが登場した気分です。 P = ∫{x=0~1} φ(x)f(x) dx という書き方も、一応私は積分まで習っていますけど解けません。 φ(x) という 「確率の導関数」 を積分して、φ(x)f(x) の和を求める、 という手順そのものはわからなくもないですが、わざわざf(x)をそのように定義なさっている意味がわかりませんから、∫{x=0~1} という積分区間も難儀です。 【質問3】もっと簡単な式はありますか? に答えてくださったから、このような式を示してくださったのでしょうかね? 【質問2】の式よりも簡単なのかどうか、私にはわかりませんでした。 私は決して、「すみませんが、わかりませんでした」 というつもりはありません。 草野球の中にメジャーリーガーが飛び入り参加したら喜ばれることもあるでしょう。しかし居酒屋で「東京から静岡まで」という話をしているときに「相対性理論で考えるか、それ以外で考えるかで答えが異なってきますね。」と言い出したら、知識の引けらかしと受け取られて、嫌われる可能性もあるでしょう。 私の言うことが「モデル化」ではなく単なる「アナロジー」、「詩的な連想」だ、というご忠告、聞いておきます。 そうなんでしょうかね、「真剣に検証」したい、と言ったことは、選挙に対する「洞察」を深めたい、という話とは別次元のつもりでしたよ。別に私は選挙アナリストになるつもりもありませんし。 「モデル化」 という言葉が どこかの国では 「専門用語」 として 受け止められる、ということも予想外 でしたし。 ご指摘によって私が今後 「安易にモデル化という言葉を使わない」 ように萎縮すると思います? とんでもない。普通の人がモデル化と言っている時の意図、が伝わらない方が、 頭が固くなっているかも知れない と思って欲しいと思いますよ。 どこをどう単純化したのか の説明、 どんな仮定を加えたのか の説明 なんて い ら な い のです。 大学で 数学論文を書いているのとは 明確に違う のですから。 現に他の回答者様たちは、 選挙の話でも、コインの話でも、投げたカードの話でも、 (投げた下駄だと都合悪いですけど) なんでもいい という前提から、 Aに投票するのは「ランダムに」2分の1、Bに投票するのも等しく2分の1 という 「普通の国のコトバ」 を正確に理解してくださっていますよ。どうしてこれを、「モデル化ではなく単なる詩的な連想だ」、なんて人に言えます? stomachmanさんが、「こいつの言っていることは、モデル化ではなく単なる詩的な連想だ」 とお感じになるのは自由です。でもそれを、口に出してしまうと、居酒屋で相対性理論を持ち出す変わり者 になりかねません。 場合によっては、 「一般人に理解できないことを承知の上で知識自慢をする厭味者」 「自分と同じレベルで議論できる仲間を探している閉じた世界の孤独者」 ともなりかねないと思いますので、stomachmanさんがそう成り下がる前にご自分で自制できるご聡明な方であると信じております。 反論、言い返しのご機会を与えないのもフェアでないとは思いますが、既に、stomachmanさんからいただくご回答は 私の【質問】たち への回答ではなく、拡張的に別解の可能性(解ではなく解法)を示してくださっているだけ、のように感じますので、締め切らせていただきます。 ちなみに、あのホーキング博士までサッカーW杯で「イングランドが勝つ」勝利の方程式を示しているそうですが、専門用語を並べ立てる専門家は専門家でも、そのくらいユーモアがあって、「高校生でもわかるように」配慮もあったなら、私みたいな数学オンチでも楽しめますね。どこか別の質問で 「サッカーの勝率は、2分の1ではないからタコには予想できない」 とか言ってるバカもいました(stomachmanさんじゃないですよ)けど、ホーキング博士の方がよっぽどユーモアあります。
補足
補足ですが、 他の回答者さんと比べるのは失礼と思って書かなかったことがあります。 supernova20102さんのご回答は、一部難しい関数・数式が含まれてはいますが、 「高校生にも理解できるような」配慮に富んでいる素晴らしいご回答だと思います。あのくらいなら、知らない「専門用語」が含まれていたとしても、理解できます。(私が高校生だとは一言も言っていませんよ。) Tacosanさんのご回答もそうです。私自身は正規分布がどのようなものか、さわりくらいしか知りませんが、ストレートに2つの「答え」を具体的な数字で示したことは伝わりました。 つまり、お二人とも知識自慢にはなっていないのですよ。 「質問の前提がおかしい」みたいなこともおっしゃっていませんし。 専門用語を使うこと全てが悪い、とは私も思いません。 回答者に対して質問者が言い返すのはよく思われなかったかも知れませんが、そこをわかっていただきたいですね・・・
- Tacosan
- ベストアンサー率23% (3656/15482)
正規分布で近似してもだいたい 47 % くらい. ちなみに 30050対29950 だとそれ以下になる確率は 43 % 前後. でも, そんな「村」はない.
お礼
ええ。 平成の大合併で、日本に「村」として残っている地方自治体は、ほんとに数えるほどでしたね。 まあ、私の言う村は村八部や原子力村の村だと思ってください。 複数の方法で出した数値を見比べさせていただいたおかげで勉強になります。 47%とか43%というのは、「勝つ」じゃなくて、「勝つ」「負ける」両方含めて「差がその範囲に収まる」確率ですよね。 そんなに高いんですね! 60000票の中で、差が100以下になる確率が43%。 カードを 60000回投げて、表と裏の差が100以下になる確率が43%。 つるっつるのコインを 60000回投げて、表と裏の差が100以下になる確率が43%。 (どこかの国のコインでは表と裏の重心バランスが微妙にずれていると聞いたことはあります。) 自然と 中央値?に集まるものだし、31500対28500 より 30050対29950 の方が自然(差が3000以内でなく、差が3000ちょうどになる確率。今回の話ではそれは直接は出てきませんが。)なんですね。 私は数学は平均程度にしかできませんが、 世の中の物事を捉えるとき、数学を知っているか知らないかでここまでモノの見方が変わるのか、と 個人的感覚として、数学の重要性を実感しました。 ありがとうございました。
- stomachman
- ベストアンサー率57% (1014/1775)
> こうした選挙などをモデル化して、何%くらいでありえることなのか、 > 真剣に検証したいと思います。 > それがどれくらい数学で見て奇跡的なのか 無理でしょ。「選挙管理事務局が名簿からランダムに投票者を選出して(つまりサンプリングして)、投票させた」というのならまだ話になりますけれども、ご質問の場合にはサンプリングは関係がない。投票に行く、という行動自体が既に投票者の意思の現れなのですから、ご質問は確率論で扱える範疇には入りませんよ。 それはさておき、ご質問の中盤部分についてなら、確率論が回答を与えてくれます。すなわち、コインやカードの話であるならば: 「表」である確率がpであるような母集団からランダムにm個のサンプルを選んだとき、(つまりm回試行したとき)「表」が丁度r個得られる確率は二項分布 B(m,p,r) = (mCr) (p^r) ((1-p)^(m-r)) になります。平均は μ= mp, 分散は σ^2 = mp(1-p) です。 そして、mが大きいとき、B(m,p,r)は平均μ,分散σ^2の正規分布で近似できます。お書きの幾つかの質問項目は、この計算方法が分かれば解消すると思います。 たとえば、r>(mp+α)となる確率を計算するには、累積正規分布表Φ(x) Φ(x) = ∫{t=-∞~x} φ(t) dt ただしφ(t)は標準正規分布の確率密度関数(ガウス曲線) を使って、1-Φ(α/√(mp(1-p)))を調べれば良い。 また、a>r>bとなる確率を計算するには、Φ((mp+a)/√(mp(1-p)))-Φ((mp+b)/√(mp(1-p)))を調べれば良い。 なお、十分に「mが大きい」かどうかは、計算結果に求める精度(つまり二項分布を正規分布で近似することの誤差)によって基準が変わる訳ですが、ま、大抵の目的ならm>100ぐらいあれば足りるでしょう。 こちらもご参考になるかも → http://okwave.jp/qa/q2386661.html
お礼
>投票に行く、という行動自体が既に投票者の意思の現れなのですから、ご質問は確率論で扱える範疇には入りませんよ。 はあ、そうですか。 どうも頭の中がご立派過ぎて私にはよくわかりません。 モデル化 という言葉の中には「単純化」して、という日本語的意味を含んでいるつもりでしたから、 まさか 「選挙に行く行かないの時点から意思が反映されているから、数学の問題としての確率は出せない」 という理屈をおっしゃる人がいらっしゃるとは思いませんでした。 選挙はどうでも良いのですよ。既にコインやカードの例えも載せているのですから、数学以前に「日本語として」文をお読みいただければ私もこのようなことを言わずに済み、幸いでした。 他者のタコのパウルくんのご質問も傍観しておりました。 >ご質問は確率の話じゃありません。 の部分が今回私にくださったご回答とそっくりですね。 まずは「確率について答えてあげるけど、この問題を確率で考えるのは間違えている」と相手にガツンということを一つのスタイルとなさっているのですか? そのうち運営より、「質問の前提となっていることへの批判」としてマナー違反を問われると思いますよ。 パウルくんの件は質問者さんの方に私は同情しています。相撲の星取り表のように●○○○●●○●のような8戦の勝敗を適当にコインや入った壺などで占う場合、stomachmanさんと違って数学の世界に住むより現実世界の方が長い我々は、 「この確率はいくら?」 と言ってしまうものです。あいにく高校までしか確率は習っていないもので。 優勝チームは3位決定戦に出場しないだろう、のアドバイスはちっともわかりませんでした。全部の試合を占うのでなく、ドイツ戦の占いだ、と質問文に書いてあったくらいですから。きちんと読んでいないことを質問者さんに謝っても良いくらいだと思いますね。 ドイツが決勝に出たら3位決定戦に出場しない、ドイツが3位決定戦に出たら決勝に出場しない、決勝まで8戦なのかどうかはどうでも良くて質問者が聞きたかったのは「連続8戦まで続いたとして8戦まで占った場合」というモデルケースだ、 ということはサッカーの事なんざまるで知らないstomachmanさんだって、お分かりになったと思いますが。 まあstomachmanさんがいかに数学にご堪能な方であるかは 1+1=2の証明って? でのtgbさんとの議論を拝見して、よくわかりました。 もはや高校数学までの知識(かそれ以下)しか持ち得ない私には議論のどこに穴があるのかも全くわからないお話。質問した側が恐縮してしまうような有様でしたね。 さて今回、ご回答を拝見したのですが、あまりにも内容がご高尚過ぎて、 確率を探ろうとすること自体が無理なのか無理でなく一つの式は示してくださったのか、それすらよくわかりませんでした。 【質問1】~【質問8】のどの辺りのお答えだったのでしょう。2分の1のケースをお伺いして、この式で合っているかともお尋ねしたのに、あえて確率がpである場合の式に戻してくださったのは一つのイジワルですか? 正直、私は二項分布も自分で書いた式程度にしか習っていないし、 (B(m,p,r) = (mCr) (p^r) ((1-p)^(m-r)) は私の知っている式とほぼ同じ形です) 正規分布は全く習っていません。 データ分析は、標準偏差や偏差値の意味がかろうじてわかる程度で、 累積正規分布表、標準正規分布の確率密度関数、平均μ,分散σ^2の正規分布で近似、 などは、雲の上の人のおコトバでした。高校生に理解できるようなスタイルでご説明いただけるとありがたかったですね。「そのようにわかりやす~く教えてください」と言わなかった私も悪かったのでしょう。既に最初の入り口の時点で、「これを確率で考えるのがそもそもおかしい」と言われるのは、数学のレベルが違い過ぎることを意味していますから。 精度とか、大抵の目的ならm>100ぐらいあれば足りる、 とかのお話も、せっかく教えようとしてくださったのに、理解できませんでした。 m>100 くらいないと、50票差とか20票差とかいうケースは数字で出せない、 ということでしょうか。私はもっとかちっと数字で出せるのかと思い込んでいたのですが、さすがに10万ともなると近似するのが一般的、ということでしょうかね。 ところでリンク先を拝見しましたが、二項分布が出てくる意味では共通点を見出せましたが、それ以外のどこが私の質問と関連性があるのかも、内容が高尚過ぎてわかりませんでした。 私の質問も 誤差や信頼度 の話に帰結する ということなのでしょうか? まあ、私が受けた印象を率直にお伝えするために、あえて揚げ足を取り直すと、 >このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布・・・ という部分はオカシイと感じますね。だって質問のしかたによって「YES」と「NO」は完全に2分の1にはなりませんから。新聞各社の世論調査や、誘導尋問のように。 屁理屈について、わかっていただけました? ま、この程度の指摘でかちんとこられるようなら、続きのご回答はけっこうですよ。 stomachmanさんのような数学の得意な方に【質問1】~【質問8】のご回答をいただきたかったのですが、肩透かしされて残念です。 >この計算方法が分かれば解消すると思います。 という貴重なご意見ですので、この計算方法が分かるように努力したいと思います。独学でデータ分析を学ぶような感じにはなりますが。 ありがとうございました。
補足
1)nが偶数、mも偶数、 という場合以外は、 (jは自然数、iは 0≦i≦j の整数) ではなく (jは自然数、iは 1≦i≦j の整数) としなければならない場合も出てきますが、そこは皆様で修正の上ご理解願います。 私は見落としておりましたが編集再投稿が間に合いませんでした。
関連するQ&A
- コインを∞回投げた場合の表が出る回数の期待値は?
n回試行における確率pの期待値はnpですよね n回中k回表が出る確率p(k)はnCk(1/2)^nたから、期待値はn*nCk/2^n ここまでは分かるのですが、ここからn→∞として収束したとして(そもそも何に収束するか分からないのですが……)それは∞回投げた場合の表が出る回数の期待値にはならないですよね どうすればいいのでしょうか 教えてください
- ベストアンサー
- 数学・算数
- 確率 m枚のカードから1枚取り出す
1からmまでの番号が1つずつ書いてあるm枚のカードが入っている箱がある。この箱から1枚取り出してはまたもとに戻す操作をn回繰り返し、第i回目に取り出したカードの番号をAiとする。A1≧A2≧A3≧・・・・≧Anとなる確率をp(m,n)で表すとき、次の値を求めよ。 (1)p(2,n) (2)p(3,n) (3)p(4,7) (4)p(4,n) この問題を解いているのですが僕にとってかなり難問です。 とりあえず(1)なのですが、2がずっと続いて途中で1になるような確率を出せばいいのではないかと考えたのですが、「何個目で1に変わるのか」をどう表すのかがよくわかりません。1回目で変わる、2回目、3回目と分けようと思ったのですが、nなので無理でした。 こういう場合、確率はどのようにして出すのでしょうか?教科書や傍用問題集では見たことのないタイプです。 回答いただけるとありがたいです。よろしくお願いします
- ベストアンサー
- 数学・算数
- 「コインを n 回投げて、表が出る回数」の分散?
ものすごく基本的な質問だとは思うのですが・・・ コインを n 回投げて、表が出る回数の分散って、きれいな解があるのでしょうか?コインの表裏は確率1/2だとします。 ΣnCi (1/2)^i (1/2)^(n-i) これが回数の期待値の式ですよね。 この先がよく分からなくて・・
- ベストアンサー
- 数学・算数
- ピタゴラス数にからんだ整数問題
以下の問題を一応証明したのですが、論述に自信がありません。入試の採点でつっこまれそうなか所を指摘して欲しいです。(京大志望です) 自然数 a,b,c について,等式 a^2+b^2=c^2 が成り立ち,かつ a,b は互いに素とする。このとき,次のことを証明せよ。 (1) a が奇数ならば,b は偶数であり,したがって c は奇数である。 (2) a が奇数のとき,a+c=2d^2 となる自然数 d が存在する。 (1) a,bをともに奇数とすると i,jを任意の自然数として a=2i-1 b=2j-1 とおける。 すると、 a^2+b^2=(2i-1)^2+(2j-1)^2 =4(i^2+j^2)+4(i-j)+2=c^2 よってcが奇数であるときc^2も奇数となるからcは偶数。 よって c=2k とおく。 すると、 0=a^2+b^2-c^2 =4(i^2+j^2-k^2)+4(i-j)+2≡2(mod.4) となって不合理。 よってa,bがともに奇数とはなり得ない。 よってaが奇数ならばbは偶数以外ありえない。 (2) m,n(m<n)を自然数として a=n^2-m^2 c=n^2+m^2 とおく。 (a,cはともに奇数よりn,mのうち一方は偶数で一方は奇数) 以下題意をみたす任意のa,cがこのようにあらわせることを示す。 上の式をn^2,m^2について解くと n^2=(c+a)/2 m^2=(c-a)/2 となる。 よって n^2m^2=(c^2-a^2)/4=b^2/4 よって b=2mn となる。 これはbが偶数であるという(1)に矛盾しない。 よって上のようにa,b,cを表現することに不合理はない。(ただしm,nは互いに素とする。でないとa,b,cが互いに素であるという仮定に反する) またこれより題意をみたすとき a+c=2n^2 よって題意は示された。 (2)のa,cがm,nであのように表現できるという証明で、とりあえず矛盾はなさそうだからOKと言うような論法になってしまっている気がするのですが… どうでしょうか?
- ベストアンサー
- 数学・算数
- 確率の漸化式の問題です
円周上に、右回りも順で3点A,B,Cがあり、円周にそって、これらの点の上を右回りに進むものとする。1つのサイコロを投げて、偶数の目がでれば、その数だけ進み、奇数ならば1つ進む試行を繰り返す。初めAにいて、n回目の試行の後でAにいる確率をP_n、Bにいる確率をQ_n、Cにいる確率を R_nとして次の問に答えよ。 (1)P_nをR_n-1(n>=2)で表せ。 (2)P_3nを求めよ。
- ベストアンサー
- 数学・算数
- 助けてください
10は偶数で5の倍数です。 11は素数です。 12は偶数で6の倍数です。 13は素数です。 14は偶数で7の倍数です。 15は奇数で5の倍数です。 16は偶数で8の倍数です。 17は素数です。 18は偶数で9の倍数です。 19は素数です。 20は偶数で10の倍数です。 と出力させたいのですが、 H:\>java SuuNoSyurui 11は奇数で0の倍数です。 12は偶数で0の倍数です。 13は奇数で0の倍数です。 14は偶数で0の倍数です。 15は奇数で0の倍数です。 15は素数です。 16は偶数で0の倍数です。 17は奇数で0の倍数です。 17は素数です。 18は偶数で0の倍数です。 19は奇数で0の倍数です。 19は素数です。 20は偶数で0の倍数です。 -- Press any key to exit (Input "c" to continue) -- こうでてしまいます。 下のが立てたプログラムです。 public class SuuNoSyurui { public static void main(String[] args) { int i=1,j=2; int n1=10; int n2=20; int n=n2-n1; int baisu=0; for(i=1;i<=n;i++) { if (i%2==0){ System.out.println("\t"+(i+n)+"は偶数で"+baisu+"の倍数です。"); } else { System.out.println("\t"+(i+n)+"は奇数で"+baisu+"の倍数です。"); } for(j=3;j<=(i-2);j +=2) { if (((i-2)%j==0) && ((i-2)%2)==1){ System.out.println("\t"+(i+n)+"は素数です。"); } } } } }
- 締切済み
- Java
- 教えてください!コイン、サイコロを投げる回数の増減と確率の問題
明日提出の統計学の課題で分からない質問があり 大ピンチ状態になっています!! 分からないのは下の3つです。 (1)さいころを10回投げて偶数が4回出る確率と 100回投げて40回出る確率は同じか? サイコロを10回投げたとき、偶数の目が出る確率は5回程度になることが多い。でも実際には、0回~10回までの全ての可能性がある。投げるのを00回も繰り返せば、理論値に近似する結果が得られると思うけれど、理論上の確率は同じではないか?と思うのですが正しいでしょうか? (2)コインを10回投げて表が4回出る確率と、その後で10回投げて裏が4回出る確率は同じか? これも確率と 表裏、時間の前後¥が関係ないとすると 理論上の確率は同じと思うのですが正しいでしょうか? (3)信頼度95%で視聴率の区間を調べたら18%~22%だったとして、 A.視聴率は30%以下と言えるか? B.視聴率は20%以上と言えるか? C.視聴率は95%といえるか? B.は、視聴率は平均20%の正規分布に従うので, 視聴率が20%以上である確率は50%, 視聴率が20%以下である確率も50%. 従って, 「視聴率が20%以上である」という表現は「正しくない(NO)」ということで良いのではないかと思いました。間違えていた教えてください。 また、A、Cについてはどうしたら分かるのか どなたかご指導いただけますでしょうか??どうぞよろしく願います。
- 締切済み
- 数学・算数
- 分数の未解決問題のことで質問です
今回はコラッツ予想が正しいと仮定すれば、エルディッシュ分数予想が正しいことを実験的に証明してみたいと思います。自信はありませんが。 ⑴ ある奇数の数列 p[n]を考えます p[n]は 奇数でないといけないと仮定します。p[1]をスタート場所と 考えた時、p[1]は奇数であるとします。次の式が成り 立つとします。 (2^s)・p[n]=3・ p[n−1]+1 ① と式をあらわした時、十分に大きな数をLとした時に、 p[L]=1 となる予想がコラッツ予想だと思っています。 (2^s)・p[n]=3・ p[n−1]+1=m ② ⑵ こちらの予想はエルディッシュの分数予想で、 a、b、c は任意の自然数を代入可能で、Q[k]は 分数が解ける数で、 Q[k]=24・k+1=4abcーbーc ③ です。 ここで、m=ab とおきmの約数を σ(m)で表すと Q[k]=4mcーcーσ(m)=(4mー1)cーσ(m)④ となります。ちなみにmは偶数です。 ここで④の式のmは任意の偶数ですので、 m=3・p[n−1]+1を代入して計算することが可能で、 計算してみると②と④より Q[k]=(12・p[n−1]+4−1)cーσ(m) =3(4・p[nー1]+1)cーσ(m) =12・c・p[n−1]+3cーσ(m) ⑤ となります。 ここでQ[k]=24k+1、kは自然数です。 Q[k]=12・c・p[n−1]+3cーσ(m)=24k+1 ここで、 12・c・p[n−1]=24k ⑥ 3cーσ(m)=1 ⑦ とおくと、⑦より 3cー1=σ(m) dをある自然数とすると、 m=d・(3cー1) ⑧ ⑥より 12・c・p[n−1]=24k c・p[n−1]=2k ⑨ ②、⑧より 3・p[n−1]+1=m=d・(3cー1)となりますので、 d=2とおけば良いと思います。ですのでmは偶数です。 このことを実験的に確かめてみます。 k=18の時は Q[18]=24・18+1=433 ⑨より c・p[nー1]=2・18 c・p[nー1]=36 c=4、p[nー1]=9、k=18、となり、 m=d・(3cー1)=d・11=22 Q[k]=12・c・p[nー1]+3cーσ(m) Q[18]=48・9+12ーσ(22) =432+1 =433 となります。
- ベストアンサー
- 数学・算数
- 集合と論理
「f(x)=x^2+ax+b とする。∀n∈Z に対して、f(n)が偶数となるためのa,bの条件を求めよ。」 この問題に対して私は以下のように解答しました。 「(ⅰ)nが偶数 つまりn=2p(p∈Z)と表わせるとき f(n)=f(2p)=2*2p^2+2ap+b f(n)が偶数となるとき bが偶数であることが必要 (ⅱ)nが奇数 つまりn=2q+1(q∈Z)と表わせるとき f(n)=f(2q+1)=2*2q^2+2(a+2)q+a+b+1 f(n)が偶数となるとき a+b+1が偶数であることが必要 (ⅰ),(ⅱ)より f(n)が∀n∈Z に対して偶数となるとき aは奇数、bは偶数であることが必要 逆にaは奇数、bは偶数 すなわち a=2s+1(s∈Z), b=2t(t∈Z) であるとき f(x)=x^2+(2s+1)x+2t となり (a)nが偶数 つまりn=2p(p∈Z)と表わせるとき f(n)=2*2p^2+2p(2s+1)+2t となり f(n)は偶数 (b)nが奇数 つまりn=2q+1(q∈Z)と表わせるとき f(n)=2*2q^2+2(2s+3)q+2t+2 となり f(n)は偶数 となるから f(n)は∀n∈Z に対して偶数となる 以上よりn∈Z に対して、f(n)が偶数となるためのa,bの条件は aが奇数で、bが偶数であること」 設問に対する証明はこれで良いのでしょうか。
- ベストアンサー
- 数学・算数
- サイコロを繰り返し振って1の目がr回連続して出るまでの振る回数の期待値
(1)1からmの目があるサイコロを繰り返し振るとします。 「1の目が」r回連続して出たら、振るのをやめるとします。 n回目にやめる確率、とやめる回数の期待値に興味を持っています。 また問題文を少し変更したものにも興味があります。 (2)1からmの目があるサイコロを繰り返し振るとします。 「どんな目でもいいので」r回連続して出たら、振るのをやめるとします。 n回目にやめる確率、とやめる回数の期待値。 (3)1からmの目があるサイコロを繰り返し振るとします。 「1の目が」総計でr回出たら、振るのをやめるとします。 n回目にやめる確率、とやめる回数の期待値。 (4)1からmの目があるサイコロを繰り返し振るとします。 「どんな目でもいいので」総計でr回出たら、振るのをやめるとします。 n回目にやめる確率、とやめる回数の期待値。 nに関する漸化式を立てようとしたのですが、ややこしくてうまくいきません。 ご存知の方は教えていただけないでしょうか? 写像で言うと次のような写像(数列)における性質を考えています。 f:{1,2,3,…}→{1,2,3,…,m}
- ベストアンサー
- 数学・算数
お礼
30101 桁の整数! なるほど、それで他の方も近似とおっしゃっている意味がわかりました。 100000C50000 の対数を取れる、というソフトがあるんですねー。幅広いご知識を分けてくださって助かります。 >もう一方の(中略)が考え落とされている の件については、 一応AとB(表と裏)の2つしか選択肢がないうちの Aが200票差で「勝つ」という条件設定をしたものですから。 でも、まとめて計算して2で割る、というものもたいへんわかりやすかったです。 計算シミュレーションまでしてくださいまして、たいへん助かりました。 0.2387487 はそのまま 23% でしょうか? つまり理論的には、100回のうち23回は差が200以下になる見込み、ということで合っていますか? 私の予想よりは1桁高いので驚きました。 票差が0になるのが 0.002523126 つまり 0.25%、 この前後は、0の時をピークに少しずつ下がる、 と考えると、確かに 0.25% の100倍弱になるのかも知れませんね。 まあ、私の式立てが間違っていない、という前提かも知れませんが。 +100 0.002523126よりそれなりに小さい数字 +99 0.002523126よりそれなりに小さい数字 ・・・ +2 0.002523126より微妙に小さい数字 +1 0.002523126より微妙に小さい数字 ±0 0.002523126 -1 0.002523126より微妙に小さい数字 -2 0.002523126より微妙に小さい数字 ・・・ -99 0.002523126よりそれなりに小さい数字 -100 0.002523126よりそれなりに小さい数字 10秒もかかる計算を人にさせてしまってすみません。お手数にもご丁寧なご説明にも感謝しております。 すると、人間社会でも 当たるも八卦、当たらぬも八卦 という場面は多々ありますが、選挙や試合で 完全に実力が均衡していてどちらが勝ってもおかしくない という場面では、その得点差(票差)も限りなく ±0 に近付く、 ある程度 ±0 から前後にぶれることは当然あるが、 200票差以内というのは そんなに奇跡的でもない(4分の1の確率でこの範囲に収まるはずだ)、 ということで納得しました。 ゴア大統領候補の頃からもやもやしていて、あの時は投票用紙に細工がしてあったとか、選挙に行かせないよう妨害があったとか言われて、再集計も行われて、陰謀説を一時期信じそうになりました。 「中途半端に2000票差で勝ったなら不正が疑われ続けたが、200票差や20票差のような『奇跡』と思わせるような数字だと、奇跡の方に人々が酔ってしまって、批判を打ち消せる」 という演出もあるのかな、と思っていたのです。その根底には、 100000万人も投票して、200票差なんてあるわけがないだろう という思い込みがあったわけです(数字はイメージですが)。 その後再びアメリカにおいて、地方選挙で極小差の勝利がありました。 日本でも最近、「わざと停電を起こして開票中の投票用紙を食べて処分する」 という事件がありましたから(この日本でですよ!)、 不信感を抱かざるを得ず、 「奇跡」に対して数字的な裏付けが欲しかったわけです。 すっきり しました! ありがとうございます。