• ベストアンサー
  • 暇なときにでも

統計学のサンプル数2000の根拠は?

みなさんこんにちは. 既出でしたら申し訳ないですが,トリビアの泉等で何か統計を調べる際に,統計の専門家が出てきて「2000人も調査すればデータの信頼性は十分だ」などと言っていますよね. その根拠となる数式なり方法論なりがあるのかな?と思って調べてみたらどうやら↓のページに掲載されている数式のようなのですが,このページを作られている方もその数式の妥当性に疑問を感じておられるらしく,読んでいて余計わからなくなってしまいました. 世論調査におけるサンプリング数の決定 http://www.wound-treatment.jp/next/wound225.htm どなたか統計学にお詳しい方,簡潔に教えていただけませんでしょうか?(あまりに専門的な議論は理解不能ですのでお手柔らかに‥)よろしくお願いします.

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数9569
  • ありがとう数12

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2
  • solla
  • ベストアンサー率59% (45/76)

統計的な結果を出す際に、ある信頼度を確保するために必要となる必要サンプル数を決定することはできます。実際、臨床試験や疫学調査などでは必ず行われます。しかしその求め方は、サンプリングや割付の方法といった研究デザインや結果指標として何を見るか、どのような統計的分析方法を使うかによって変わります。それが決まったとしてもどの程度の信頼度を確保するかによって得られる必要サンプル数は変わります。 例えばご質問のリンク先に示されているのは、「単純無作為抽出で結果指標を 2 値の割合とし、正規近似に基づく 2 項確率の推定を行う」場合の式です(サイトの作者はそこまで理解はされていないようですが)。従って「単純無作為抽出で対象者を選び、内閣支持率といった割合で、その真値が極端に 0% や 100% に偏っていないと考えられる場合に、その割合を推定する」のには有効です。そうではなく例えば 2 段階層化抽出で世帯収入の平均値を推定したいといった場合にはまた違った式になります。 つまりどのような場合でも通用するような最小サンプル数といったことは本来言えませんが、ごく一般的に世論調査のような形で単純に内閣支持率のようなものを“それなりの”信頼度をもって調査するのに必要なサンプル数は、通常は 2,000 よりももっと少ないと思います。例えば関東や関西の視聴率調査などはそれぞれ 600 世帯のサンプルに基づいています。その意味で「2,000 あれば十分」という言い方は間違ってはいないと思いますが…。 しかし統計調査の信頼性はサンプル数ももちろん重要ですが、それ以上に調査対象の選定方法(サンプリング方法)が重要です。そのことに言及せずサンプル数がいくつあれば信頼性は充分などと言うのはおかしな話です。1936 年の米国大統領選挙の際にリテラリーダイジェスト社が多額の費用をかけて膨大な人数のアンケート結果を元に共和党の勝利を予想したのにもかかわらず、民主党のルーズベルトが当選して見事に予想が外れたのは有名な話です。これはその後の分析で調査対象に偏りがあったことが主な原因と言われています。 ちなみに「データの信頼性」と「結果の信頼性」は指しているものが異なりますのでご注意ください。サンプル数は「結果の信頼性」にはかかわりますが「データの信頼性」には関係ありません。対して、調査対象の選定方法は両方にかかわります。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

大変丁寧な回答ありがとうございます.調査対象の数だけ多様なサンプリング手法があると考えてよろしいでしょうか.そうなると統計学では,ことサンプリングに関しては「一般的」手法というのは中々難しそうですね.調査対象によってサンプリング方法をカスタマイズしていくのが統計学の醍醐味?なんでしょうか.抽出したサンプルを分析する手法は有効な手法がたくさん確立されていそうですが‥.

関連するQ&A

  • 統計学的に信頼できるサンプル数

    統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。 http://www.wound-treatment.jp/next/wound225.htm ここでは、10万人の世論調査をする場合2000人必要とのこと。 実際数式に数字を当てはめてみると10万人を超える集団になると 1500人を調査すれば傾向を把握できるということがわかりました。 ここからが疑問なのですが、 「地域別の男女の傾向を把握」したいという調査があるとします。 (東北、関東、四国・・・・のそれぞれ男女別) 東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。 すると、 東北の男性:1500人 女性:1500人 関東の男性:1500人 女性:1500人 四国の男性:1500人 女性:1500人 ・ ・ ・ という調査数でよいのでしょうか?? 最終的にその選んだサンプル数の全数で、「男女別の傾向」も 出したいと思っております。 普通に考えると、 人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。 同じ数だと、全国の傾向を出したいのに 人数の少ない四国と関東が同じであれば、四国の意見傾向にひきづられるような気がします。 そうすると調査人口は変えたほうがいいのでしょうか? (四国を500人 500人にして、関東を2500人 2500人にするなど) そうして人数を変えてしまうと そもそもの、10万人の調査は1500人が必要だという統計上の件数に基づかないので 関東の人口をたとえば4000人に増やすのでしょうか? それとも、世論調査は2000人あればいいということで 2000人を人口比率で四国・関東・・・・の男女別に割り振ればいいのでしょうか。 よろしくお願いいたします。

  • 統計学について

    大学での論文作成のために日本の大学生にアンケートをしようと考えています。 それにあたって統計学的に人数を絞り込んでアンケートしようと思うのですが。統計学的に何人の大学生にアンケートすれば日本全体の大学生のアンケート考えられるか教えてもらえないでしょうか? 因みに 日本の大学生総数: 2859207人(ソース: 文部科学省学校基本調査) です調査内容は男女関係なく取ろうと考えています。 専門家の方、もしくは統計学に詳しい方宜しくお願いします。

  • 統計学 F( , ) P=...について

    専門外の医学の英語論文を読まなければならなくなりました。 内容はマウスを使って、ストレスと海馬の大きさをMRIを使って調べるものです。 英語自体は難しくないのですが、 使われている数式に意味が分かりません。 F(2, 15)=0.524 P=0.602 のような式がたくさん使われています。 自分で調べてみて、統計学のF検定とか有意確率などの項目と関連がある程度のことはわかったのですが、数式の意味が分かりません。 どなたか、ご教示していただけないでしょうか。

その他の回答 (1)

  • 回答No.1
noname#21649

極端に簡略化します。したがって.正確な表現ではありません。 20回に1回間違う確立が.危険率5%という普通の検定の場合。大体2シグマ離れていると20回に1回間違えるが.それなりに正しい値となる。 100回に1回間違う確立が危険率1%という検定の場合で.大体3シグマ離れていると.100回に1回間違えるがそれなりに正しい値となる。ただし.癖がある場合(例.トレミドレミドレミ...)は正しい値を示さない場合がある。 3シグマの精度がある指標値を計算するのに必要なデータの個数が大体1000個。2倍の数があれば大体変なことにはなっていなすはず。 注意点として.サンプルの対象を間違わないこと。 一例として「国鉄民営化で便利になった」と答える人は.日本全体の面積で約10%の割合に住む人だけ。残る90%の人は「国鉄が廃止になって不便になった」となります。 近年.世論調査が若小者の切り捨てを目的に使われることが多いですから。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

「3シグマの精度がある指標値を計算するのに必要なデータの個数が大体1000個」というところがミソのようですね.そちらの根拠はよく理解できませんでしたが,「2000というのは間違ってはいない.ただし,サンプリングに注意」という点でNo.2さんとも共通の見解ということでよろしいでしょうか?確かに母集団の抽出が「無作為」と「作為」では結果に影響するのは想像に難くありませんね.

関連するQ&A

  • 統計学についてお答えください。

    統計学についてお答えください。 ある新聞社の世論調査で、無作為に選んだ有権者に対して、与党を支持するか野党を支持するかどうか聞き取り調査を行ったところ、3000人中840人が与党を支持すると答えた。 ?信頼度95%のとき、与党の支持率(母比率p)の信頼区間の幅を0.05以下にするためには、何人を調査すればよいか? ?信頼度95%のとき、与党の支持率(母比率p)と標本比率の誤差を0.02以下にするためには何人を調査すればよいか?

  • よくマスコミで内閣支持率世論調査がありますが、統計学的に回答数(よくあ

    よくマスコミで内閣支持率世論調査がありますが、統計学的に回答数(よくあるのは2000人)は十分なのですか? また、本来何人分の回答が必須になるのですか?

  • 統計学の信頼区間

    現在、日本語でも勉強したことのないsurvey designと統計学の授業を英語で、しかも駆け足で学んでいます。今まで文系で来たので、もう何が何だかわかりません。どなたか以下のことを簡単に教えていただけませんでしょうか。 2009年、ロンドンで8年生を対象とした読解能力調査が実施された。シンプル・ランダム・サンプリングを用いて1000人をサンプルした。全員から回答を得ることができた。このサーベイによって出された平均値の一つがPである。このPは、一日に一時間以上テレビを見る生徒のプロポーションである。そしてこのPの値は0.25である。 1) このPに対する95% confidence interval(信頼区間)を計算し、解釈せよ。 さて、費用削減の為、来年度の調査より、以下の方法をとることにした。 まず、学校をシンプルランダムサンプリングで選別し、その後にそれらの学校の生徒の約5パーセントをシンプル・ランダム・サンプリングでサンプルする。サンプルサイズは2009年度とおなじである。そして、その際の平均値Pが2009年度と同じ0.25になると仮定した場合、信頼区間は昨年度から変化するか否か、説明せよ。 どうぞよろしくお願いします。

  • 統計民主主義

    統計民主主義 テレビ新聞では印籠を示すかのように世論調査の話が持ち出され、解説者、司会者、評論家、地方議員、野党議員、などもそのように話します。先程もビートたけしが「子ども手当などだ~れも賛成していないんだから、こんな政策やめればいいのに」といっていました。 ならば、統計学に基づいて世論調査を行い、それを民意と判断すればよいのではないでしょうか。 組織票の問題、票の格差の問題、小選挙区制、中選挙区制の問題、民意が反映されないとする問題、など多くの評論家、学者さんなどの指摘する一通りの問題が解決します。また一回の選挙にかかる数千億円という費用も無くせます、国会議員という職業も無くなるか内閣程度の少数に出来ます、議員の汚職もなくなります、一人年間数億円という議員活動費用もなくなります。 専門家も指摘する多くの問題も解決しますメリットの方が多いように見えますが、統計学に基づいた調査による民意算定では何が問題あるでしょうか。

  • マスコミの千人規模の世論調査は世論を反映していますか?

    マスコミの世論調査がさかんに行われていますが、 その方法は、おおむね1000人か2000人に電話して その半分くらいから有効回答を得たというものです。 国民の数は1億3千万人です。 1%は、130万人 0.1%は、13万人 0.01%は、1.3万人 たった1000人くらいの回答が世論を代表しているといえるのでしょうか? せめて数万人くらいでないと信用できないようにおもいます。 それとも統計学上正当とされているのでしょうか? よろしくお願いします。

  • サンプリング数の決定における許容誤差について

    統計の勉強をしていたところ http://www.wound-treatment.jp/next/wound225.htm のようなHPを見つけました。 ここで許容できる誤差の範囲とあります。ここでは2.5としているようですが、 これは2.5%のことで、サンプルを母集団に戻した時に2.5%の誤差が含まれているでしょう。 といった考え方なのでしょうか? 例えば、世論調査の場合、人口が1億人とすれば 1億×2.5%=2500000人くらい誤差を含みますってことでしょうか? それとも、もっと細かな計算をして誤差範囲を計算するのでしょうか? どなたか解説おねがいします。 また説明されているサイトがありましたらご紹介ください。

  • 実験におけるサンプルの大きさ選定について

    よろしくお願いします。 現在、帯電量を測る実験を行っているのですが、いざ始めてみたら計測対象が多すぎて計測時間がかなりかかることが判明しました。 これではまずいので、計測対象を何個か選定して測定することにしました。 母集団:N(今回は9000個です) 許容誤差:E [%] 信頼係数:K 想定する調査結果:p N/((E/K)^2*(N-1)/(p*(100-p))+1) 以上の式により求めました。 参考URL:http://www.wound-treatment.jp/next/wound225.htm 参考URLの式は世論調査ですが、「全て測定できないのでどのくらい測定すれば統計的に十分か」という意味で同じと思い、用いました。 N=9000個、許容誤差3%、信頼度95%とし、計算結果は、 n=9000/((3/1.96)^2*(9000-1)/(50*(100-50))+1) n=954.0923892 となりました。 少なくとも955個必要、という結果から1000個ほど測定しようと思っています。 この式というのは、上述の通り、世論調査の式ですが、「全て測定できないのでどのくらい測定すれば統計的に十分か」という意味で同じと思い、用いましたが、この用いること自体は可能なのでしょうか。 それともこの実験の場合は別の式になるのでしょうか。 また、この参考URLの式はどのように導いたのでしょうか。そういう定義だったらそれでいいのですが、誘導された式であるなら、そのあたりの誘導を知りたいと思い、質問させていただきました。 ご教授よろしくお願いいたします。

  • 不良品を検査で見つける為の統計的サンプリング手法

    教えてください。 世論調査などでは、母集団のおおざっぱな傾向を把握するために、統計的なサンプリング手法が使われていると思います。 母集団と、許容誤差と、信頼レベルを定めて、サンプルサイズを決めるというやり方で。 ここで疑問なのですが、製造業の工場などで、不良品を見つけるための品質検査でも、何らかのサンプリング検査を行っていると思います。 このサンプリング検査は、世論調査で行われるようなサンプリング手法と同様なのでしょうか? 仮に、許容誤差1%、信頼レベル99%に設定して品質検査を行って不良品が見つからなかった場合、不良率は0%です。ですが誤差1%なのだから母集団の1%分は依然として不良品の可能性が否定できないことになってしまいます。 こういった大雑把なサンプリング手法が、製造業で認められているのでしょうか? 人の命に係わる、たとえば自動車や製薬などの分野では、もっと別の検査を行っているのでしょうか。 それとも、基本的な考え方は、世論調査などのやり方と同様なのでしょうか。

  • 品質管理(QC)と統計学にまたがる質問です

    品質管理と統計学の両方にまたがる質問ですが、 「時間支給にもとづき部品が投入されるときに、員数の誤差を取り除いてくれ」 の意味がわかりませんでした。工場のロットごとを多分サンプル調査すると思うのですが、専門用語らしきものが多すぎて理解ができません。解説をお願いします。 員数は単に「数字」でいいのでしょうか?「誤差をとりのぞく」とはサンプル数をロットごと一定にして比較する、という意味でしょうか?

  • 量産品の特性のばらつきを「トリビアの泉式」に推定…

    量産品の特性のばらつきを「トリビアの泉式」に推定したい。 市場に約5000台程度出ている製品について その特性のばらつきを,少量のサンプルで推定したいと考えています。 具体的に必要な母数は何個になるのでしょうか TVのトリビアの泉でよく同様のサンプリングはどのように推定しているのでしょうか。 統計学の本を斜め読みしたのですが,太刀打ちできず困っています。