• 締切済み

サンプルサイズの決定方法

母比率を推定するにあたってサンプルサイズを決めたいのですが、 ちょっと困っています・・。 母集団を無限母集団と想定して、下記の公式を適用したいと思います。 (Z(α/2)/F)^2 * p(1-p) 母比率は大体1%くらいだと当たりをつけていますので、 信頼度95%、精度3%で、サンプルサイズを算出すると「42」という結果になります。 これは直感的に小さすぎると思います。 で、サンプルサイズを過小評価したくないという理由で、 p=50%を想定すれば「1,067」という結果が得られますが、 はっきり言って、こんなサンプリングはやってられません。 私はどのようにサイズをどのように判断するべきなのでしょうか? 宜しくお願いいたします。

noname#2826
noname#2826

みんなの回答

  • kony0
  • ベストアンサー率36% (175/474)
回答No.1

私の感覚では、母平均未知の2項分布で標本数と実現数を固定したとき、母平均はβ分布に従うと思っているのですが(この感覚がそもそも間違っているかもしれません) たとえば標本数を10,000も取ったとして、そのうちの実現数が100のとき、母平均はBETA(101,9901)にしたがっているということになり この上下2.5%点は0.82%から1.21%となってしまいます。(EXCELにて算出) そもそもの導入部分から間違っている可能性もあるので自信ないのですが、標本数10,000もとっても、じゅうぶんな精度で母平均を求めるのは難しいと思います。これについてどう思われます?(逆に質問してしまい申し訳ありませんが)

関連するQ&A

  • ■統計■サンプル100の場合の誤差は?

    母集団が1000あり、そこからA,B,C,Dそれぞれ種類を選んだ数がどれくらいあるかを、 無作為に100のサンプルを抜き出し、それぞれの比率がA30%、B10%、C20%、D40%)という 結果になった場合の 確からしさ??と精度(誤差)はいくついなるのでしょうか? よろしくお願いいたします。

  • アンケート調査に必要なサンプル数

    現在、2000世帯、7000人の町のアンケート調査を予定していますが、サンプル数をどの程度確保したらよく分かりません。 統計学には疎いのですが、標本サイズと誤差の関係を示す、e=1.96√p(1-p)/n p母集団比率、n標本サイズ、信頼係数95% という式をホームページから見つけました。 これによると、誤差を4%以内にするためには600サンプル必要とありますが、2000世帯に600サンプルでは感覚的に過大に思います。 何か別の考え方があればご教示願います。

  • サンプルサイズとPバリューの関係について。

    どのカテゴリーで質問したらよいのか分からなかったのでこちらで質問します。 リサーチする時のサンプルサイズが重要なのは 小さすぎても大きすぎても適切な結果を得ることが出来なかったり時間の無駄になってしまうからということですよね?? それと・・・・ サンプルサイズはPバリューとexternal validityの2つにどの様な関係があるのでしょうか? 簡単でいいので何かアイデアをお願いします。

  • 有意差があってもサンプルサイズが少ないと駄目?

    AとBを発生させる因子(α)が有意差(P<0.05)をもって導き出されました。しかし、サンプルサイズが小さいので統計的に結論として使えないと指摘されました。しかし、それを指摘しない人もいます。 今までの結果からAの発生頻度は約5%、Bは6%といわれていますが、性格にはいまだ不明です。 今回調べた母集団が61人であるため、Aは3人(4.9%)、Bは2人(3.3%)です。 Aを発生させる因子(β)、とBを発生させる因子(α)が有意差(P<0.05)をもって導き出されました。 この(α)と(β)という因子がA,Bを発生させる結論としましたが、AとBの発生人数が少ないため、結論として導き出されないといわれました。 しかし、それを指摘しない人もいます。 これは考え方でしょうか?、それとも、結論としてサンプルサイズが少ないのでこの検討は駄目といわれることが多いのでしょうか?

  • 「標本平均の分散」についての質問です.

    「標本平均の分散」についての質問です. 「母集団からn個のデータを無作為抽出する.すると,サンプルサイズnの標本ができ,標本平均が計算できる.これを,標本平均1としよう.この作業を何度も繰り返し,標本平均2,標本平均3・・・と,多数の標本平均を集める.これらの標本平均の分散は,母分散のn分の1(母分散/n)である」という説明をある本で読みました. では,極端な話,1000個のデータからなる母集団(有限母集団)から,サンプルサイズ1000個(母集団サイズと同じ)の標本をいくつも作ったとします.標本平均は,いつも母平均そのものであり,よって,標本平均の分散は0です.母分散/1000とはなりません. 上記の説明が間違っているのでしょうか?私が何か勘違いをしているのでしょうか?それとも,説明は無限母集団を対象としている,とか,母集団サイズとサンプルサイズが一致するような抽出は想定されていない,と言った理由があるのでしょうか?

  • サンプルサイズが極端に少ない場合の検定法

     2郡の達成度を集計したところ、 ((4)完全にできた  (3)ある程度できた  (2)ほとんど出来なかった  (1)全くできなかった) ケース1.   (4)    (3)    (2)    (1)     A郡  4人   4人   1人   1人     B郡  0人   4人   0人   0人 という結果で、また別の2郡では、 ケース2.   (4)    (3)    (2)    (1)     C郡  3人   1人   2人   2人     D郡  1人   1人   3人   0人   という結果になりました。これだけサンプルサイズが少なくても、比率の差や代表値の差を検定して、2郡の達成度の比較は可能でしょうか? 可能であれば、どのノンパラメトリック検定がよいでしょうか。  あまりにサンプルサイズが少ないので、(4)と(3)、(2)と(1)をまとめて、 2×2のフィッシャーの正確確立検定を採用する事も考えています。  一つ一つのサンプルサイズはとても小さいのですが、比較する2郡の数はかなり多いので、どれか一つでも有意水準に達すればいいと考えています。  統計に関して全く無知なのですがよろしくお願い致します。   

  • サンプル選定、T検定とF検定について

    サンプル選定の仕方で悩んでいます。詳しい方、教えて下さい。統計初心者ですので、表現の仕方などが間違っているかもしれません。 相関関係のあると思われる2群のサンプルについて、適切なサンプル(相関が認められる)のみを選び出したいのですが、方法は次の通りでいいのでしょうか。 (1) F検定をして、母集団の分散が等しい場合と異なっている場合に分ける。 (2) (1)の結果を基にT検定でP値を求める。 (3) (2)の結果が5%未満であるものをサンプルとして選定する。 上の方法が間違っていない事が前提ですが、(3)のP値が5%未満になると有意差があるという説明がサンプルとして選ぶべきか選ばないという事を意味しているのか確信がありません。 よろしくお願いします。

  • 統計学:サンプリング精度の応用についての疑問

    サンプリング精度に似た内容で非常に困っていることがあります。 総数をサンプリングから推測する時の精度についての疑問です。 例えば100m四方のグラウンドに数万個の白と黒の碁石が散らばっている場合、その白と黒の割合を推測するには、サンプリング精度の式(最大許容範囲=1.960xルート[p(1-p)/n])から95%信頼区間の精度が求められます。 私の疑問は100m四方のグラウンドに数万個の碁石が散らばっている場合、一定の割合でサンプリングした場合(例えば1m四方)の数から、グランド全体の黒の碁石の総数を推測したいのです。サンプリング面積(例えば1m四方が10マス)と数えた碁石の数から、推定した全体の碁石総数の95%信頼区間はどうやって計算したら良いか教えてください。 (実は、細胞懸濁液中の細胞数を、血球計算盤から計算する時の精度の問題です。体積を面積に置き換えて見ました。)

  • 統計学

    統計学入門を勉強中ですが解答がわかりません。お力をお貸しください。問)ある母集団から5個のサンプルを選び、次のデータを得た。母平均・母分散を推定せよ。2.43 1.89 2.37 2.30 1.74

  • 統計局のデータについて

    統計局ホームページに載っている統計結果は、標本調査によって得られた結果をもとに母平均や母比率を推定して求められたデータなのですか? その場合、例えば月の失業率の結果(エクセルファイル)を母推定してみることは無意味ですよね?