• ベストアンサー

統計学のサンプル数2000の根拠は?

みなさんこんにちは. 既出でしたら申し訳ないですが,トリビアの泉等で何か統計を調べる際に,統計の専門家が出てきて「2000人も調査すればデータの信頼性は十分だ」などと言っていますよね. その根拠となる数式なり方法論なりがあるのかな?と思って調べてみたらどうやら↓のページに掲載されている数式のようなのですが,このページを作られている方もその数式の妥当性に疑問を感じておられるらしく,読んでいて余計わからなくなってしまいました. 世論調査におけるサンプリング数の決定 http://www.wound-treatment.jp/next/wound225.htm どなたか統計学にお詳しい方,簡潔に教えていただけませんでしょうか?(あまりに専門的な議論は理解不能ですのでお手柔らかに‥)よろしくお願いします.

質問者が選んだベストアンサー

  • ベストアンサー
  • solla
  • ベストアンサー率59% (45/76)
回答No.2

統計的な結果を出す際に、ある信頼度を確保するために必要となる必要サンプル数を決定することはできます。実際、臨床試験や疫学調査などでは必ず行われます。しかしその求め方は、サンプリングや割付の方法といった研究デザインや結果指標として何を見るか、どのような統計的分析方法を使うかによって変わります。それが決まったとしてもどの程度の信頼度を確保するかによって得られる必要サンプル数は変わります。 例えばご質問のリンク先に示されているのは、「単純無作為抽出で結果指標を 2 値の割合とし、正規近似に基づく 2 項確率の推定を行う」場合の式です(サイトの作者はそこまで理解はされていないようですが)。従って「単純無作為抽出で対象者を選び、内閣支持率といった割合で、その真値が極端に 0% や 100% に偏っていないと考えられる場合に、その割合を推定する」のには有効です。そうではなく例えば 2 段階層化抽出で世帯収入の平均値を推定したいといった場合にはまた違った式になります。 つまりどのような場合でも通用するような最小サンプル数といったことは本来言えませんが、ごく一般的に世論調査のような形で単純に内閣支持率のようなものを“それなりの”信頼度をもって調査するのに必要なサンプル数は、通常は 2,000 よりももっと少ないと思います。例えば関東や関西の視聴率調査などはそれぞれ 600 世帯のサンプルに基づいています。その意味で「2,000 あれば十分」という言い方は間違ってはいないと思いますが…。 しかし統計調査の信頼性はサンプル数ももちろん重要ですが、それ以上に調査対象の選定方法(サンプリング方法)が重要です。そのことに言及せずサンプル数がいくつあれば信頼性は充分などと言うのはおかしな話です。1936 年の米国大統領選挙の際にリテラリーダイジェスト社が多額の費用をかけて膨大な人数のアンケート結果を元に共和党の勝利を予想したのにもかかわらず、民主党のルーズベルトが当選して見事に予想が外れたのは有名な話です。これはその後の分析で調査対象に偏りがあったことが主な原因と言われています。 ちなみに「データの信頼性」と「結果の信頼性」は指しているものが異なりますのでご注意ください。サンプル数は「結果の信頼性」にはかかわりますが「データの信頼性」には関係ありません。対して、調査対象の選定方法は両方にかかわります。

zakk_goo
質問者

お礼

大変丁寧な回答ありがとうございます.調査対象の数だけ多様なサンプリング手法があると考えてよろしいでしょうか.そうなると統計学では,ことサンプリングに関しては「一般的」手法というのは中々難しそうですね.調査対象によってサンプリング方法をカスタマイズしていくのが統計学の醍醐味?なんでしょうか.抽出したサンプルを分析する手法は有効な手法がたくさん確立されていそうですが‥.

その他の回答 (1)

noname#21649
noname#21649
回答No.1

極端に簡略化します。したがって.正確な表現ではありません。 20回に1回間違う確立が.危険率5%という普通の検定の場合。大体2シグマ離れていると20回に1回間違えるが.それなりに正しい値となる。 100回に1回間違う確立が危険率1%という検定の場合で.大体3シグマ離れていると.100回に1回間違えるがそれなりに正しい値となる。ただし.癖がある場合(例.トレミドレミドレミ...)は正しい値を示さない場合がある。 3シグマの精度がある指標値を計算するのに必要なデータの個数が大体1000個。2倍の数があれば大体変なことにはなっていなすはず。 注意点として.サンプルの対象を間違わないこと。 一例として「国鉄民営化で便利になった」と答える人は.日本全体の面積で約10%の割合に住む人だけ。残る90%の人は「国鉄が廃止になって不便になった」となります。 近年.世論調査が若小者の切り捨てを目的に使われることが多いですから。

zakk_goo
質問者

お礼

「3シグマの精度がある指標値を計算するのに必要なデータの個数が大体1000個」というところがミソのようですね.そちらの根拠はよく理解できませんでしたが,「2000というのは間違ってはいない.ただし,サンプリングに注意」という点でNo.2さんとも共通の見解ということでよろしいでしょうか?確かに母集団の抽出が「無作為」と「作為」では結果に影響するのは想像に難くありませんね.

関連するQ&A

  • 統計学的に信頼できるサンプル数

    統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。 http://www.wound-treatment.jp/next/wound225.htm ここでは、10万人の世論調査をする場合2000人必要とのこと。 実際数式に数字を当てはめてみると10万人を超える集団になると 1500人を調査すれば傾向を把握できるということがわかりました。 ここからが疑問なのですが、 「地域別の男女の傾向を把握」したいという調査があるとします。 (東北、関東、四国・・・・のそれぞれ男女別) 東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。 すると、 東北の男性:1500人 女性:1500人 関東の男性:1500人 女性:1500人 四国の男性:1500人 女性:1500人 ・ ・ ・ という調査数でよいのでしょうか?? 最終的にその選んだサンプル数の全数で、「男女別の傾向」も 出したいと思っております。 普通に考えると、 人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。 同じ数だと、全国の傾向を出したいのに 人数の少ない四国と関東が同じであれば、四国の意見傾向にひきづられるような気がします。 そうすると調査人口は変えたほうがいいのでしょうか? (四国を500人 500人にして、関東を2500人 2500人にするなど) そうして人数を変えてしまうと そもそもの、10万人の調査は1500人が必要だという統計上の件数に基づかないので 関東の人口をたとえば4000人に増やすのでしょうか? それとも、世論調査は2000人あればいいということで 2000人を人口比率で四国・関東・・・・の男女別に割り振ればいいのでしょうか。 よろしくお願いいたします。

  • サンプリング数の決定における許容誤差について

    統計の勉強をしていたところ http://www.wound-treatment.jp/next/wound225.htm のようなHPを見つけました。 ここで許容できる誤差の範囲とあります。ここでは2.5としているようですが、 これは2.5%のことで、サンプルを母集団に戻した時に2.5%の誤差が含まれているでしょう。 といった考え方なのでしょうか? 例えば、世論調査の場合、人口が1億人とすれば 1億×2.5%=2500000人くらい誤差を含みますってことでしょうか? それとも、もっと細かな計算をして誤差範囲を計算するのでしょうか? どなたか解説おねがいします。 また説明されているサイトがありましたらご紹介ください。

  • 実験におけるサンプルの大きさ選定について

    よろしくお願いします。 現在、帯電量を測る実験を行っているのですが、いざ始めてみたら計測対象が多すぎて計測時間がかなりかかることが判明しました。 これではまずいので、計測対象を何個か選定して測定することにしました。 母集団:N(今回は9000個です) 許容誤差:E [%] 信頼係数:K 想定する調査結果:p N/((E/K)^2*(N-1)/(p*(100-p))+1) 以上の式により求めました。 参考URL:http://www.wound-treatment.jp/next/wound225.htm 参考URLの式は世論調査ですが、「全て測定できないのでどのくらい測定すれば統計的に十分か」という意味で同じと思い、用いました。 N=9000個、許容誤差3%、信頼度95%とし、計算結果は、 n=9000/((3/1.96)^2*(9000-1)/(50*(100-50))+1) n=954.0923892 となりました。 少なくとも955個必要、という結果から1000個ほど測定しようと思っています。 この式というのは、上述の通り、世論調査の式ですが、「全て測定できないのでどのくらい測定すれば統計的に十分か」という意味で同じと思い、用いましたが、この用いること自体は可能なのでしょうか。 それともこの実験の場合は別の式になるのでしょうか。 また、この参考URLの式はどのように導いたのでしょうか。そういう定義だったらそれでいいのですが、誘導された式であるなら、そのあたりの誘導を知りたいと思い、質問させていただきました。 ご教授よろしくお願いいたします。

  • 確率について(サンプル数の計算方法)

    専門外に付き教えて頂きたいのですが・・・ ある試験を行おうとしています。 その試験とは、 ある機械が繰り返して動作したときに不規則に一定の割合でエラーが発生していました。 そして、そのエラーの原因を対策して改善したので、その確認試験を行おうとしています。 仮定条件1)改善前の、エラーの発生比率は、おおよそ7%程度でした。 仮定条件2)機械の運転回数は、1ヶ月あたり10万回で、その間に3回以下のエラーの発生はOKとします。 そこで、いったい何回繰り返し動作させれば、確認に十分な回数になるのか? これを求めるために、色々考えたのですが、下記のURLにアンケート調査のサンプル数の求め方が記載されていました。 http://www.wound-treatment.jp/next/wound225.htm これを読みますと、例えば2σの分布で誤差率を2.5%で計算すると・・・ などのような例が記載されていました。 ここからが、質問なのですが、 Q1.今回のように試験の回数を求めるのに上記の式を引用しても良いのでしょうか? Q2.Q1がOKならば、「想定する調査結果」の意味合いが良くわかっておらず、適正な数値として、何を入れればよいのでしょうか? Q3.このような計算を行う際に、エラーの発生比率などは無関係なのでしょうか? Q4.Q1がNGならば、どのような計算で求めればよいのでしょうか? 当方、専門ではございませんので、具体的な計算例などを出して説明して頂けると大変助かります。 よろしくおねがいします。

  • 不良品を検査で見つける為の統計的サンプリング手法

    教えてください。 世論調査などでは、母集団のおおざっぱな傾向を把握するために、統計的なサンプリング手法が使われていると思います。 母集団と、許容誤差と、信頼レベルを定めて、サンプルサイズを決めるというやり方で。 ここで疑問なのですが、製造業の工場などで、不良品を見つけるための品質検査でも、何らかのサンプリング検査を行っていると思います。 このサンプリング検査は、世論調査で行われるようなサンプリング手法と同様なのでしょうか? 仮に、許容誤差1%、信頼レベル99%に設定して品質検査を行って不良品が見つからなかった場合、不良率は0%です。ですが誤差1%なのだから母集団の1%分は依然として不良品の可能性が否定できないことになってしまいます。 こういった大雑把なサンプリング手法が、製造業で認められているのでしょうか? 人の命に係わる、たとえば自動車や製薬などの分野では、もっと別の検査を行っているのでしょうか。 それとも、基本的な考え方は、世論調査などのやり方と同様なのでしょうか。

  • 量産品の特性のばらつきを「トリビアの泉式」に推定…

    量産品の特性のばらつきを「トリビアの泉式」に推定したい。 市場に約5000台程度出ている製品について その特性のばらつきを,少量のサンプルで推定したいと考えています。 具体的に必要な母数は何個になるのでしょうか TVのトリビアの泉でよく同様のサンプリングはどのように推定しているのでしょうか。 統計学の本を斜め読みしたのですが,太刀打ちできず困っています。

  • 統計民主主義

    統計民主主義 テレビ新聞では印籠を示すかのように世論調査の話が持ち出され、解説者、司会者、評論家、地方議員、野党議員、などもそのように話します。先程もビートたけしが「子ども手当などだ~れも賛成していないんだから、こんな政策やめればいいのに」といっていました。 ならば、統計学に基づいて世論調査を行い、それを民意と判断すればよいのではないでしょうか。 組織票の問題、票の格差の問題、小選挙区制、中選挙区制の問題、民意が反映されないとする問題、など多くの評論家、学者さんなどの指摘する一通りの問題が解決します。また一回の選挙にかかる数千億円という費用も無くせます、国会議員という職業も無くなるか内閣程度の少数に出来ます、議員の汚職もなくなります、一人年間数億円という議員活動費用もなくなります。 専門家も指摘する多くの問題も解決しますメリットの方が多いように見えますが、統計学に基づいた調査による民意算定では何が問題あるでしょうか。

  • サンプリングデータの抽出方法の実情は?

    「サンプリングとは、母集団から偏りがない状態で一部の個体(標本)をランダムで抽出し、そこから母集団の性質を統計学的に推定することを意味します。」とあります。 http://markezine.jp/article/detail/18649 マスコミの世論調査では、ランダムな電話番号に掛けることで「偏りがない」ことを担保しているようです。 しかし、一般の、学術論文とか、企業の報告書などでは、サンプリングデータの抽出方法について、そこまで「偏りがない」ことを担保する方法をとっているでしょうか? 実情を教えてください。

  • 統計学におけるサンプル数

    何かの統計で、属性aが30%、bが20%、cが50%とかやります。 テレビの視聴率とかもそうですよね。 そのとき、これくらいの数を調べたらこれ以上サンプルを増やしても大してかわらない、というライン(必要な調査数)はどうやって決まるのですか? あんまり難しくなく、大づかみに教えてくれるとうれしいです。

  • サンプル数の少ない統計処理

    データ数が3個、3個の独立した2郡の有意差検定を行いたいのですが、データ数が少ないため単純にt検定を行って良いか迷っています。 誰か教えてください。