• 締切済み

適正サンプル数について

下記内容のアンケート調査結果の信憑性がどの程度あるのかという部分に疑問を感じています。 有効サンプル数としてはどうなんでしょうか。どなたか助けてください! 《Web転職サイト総合満足度調査結果》 ・対象サイト  30サイト ・指標数    11指標(満足・やや満足・0・やや不満足・不満足) ・有効サンプル 1,176名(男:639・女:537)         ※過去1年以内にサイトを利用した転職経験者 1位:98.32 2位:93.82 この差の「信頼度」・「影響度」の信憑性です。

  • goodl
  • お礼率100% (2/2)

みんなの回答

  • gootaroh
  • ベストアンサー率47% (396/826)
回答No.1

統計学上意味のあるサンプルの大きさというのがあります。 それには許容誤差と信頼率という二つの指標が参考になります。 ダーツに例えると、「真の値」を的の中心だとすれば、「許容誤差」とは的の大きさ、「信頼率」とは命中率のことです。「有効回答数」とは言ってみればダーツの腕前ですね。 さて、一般的には許容誤差5%、信頼率95%と設定し、どれくらいの有効回答を集めるかを決めることが多いです。 ということは、集まった有効回答数が統計学上意味があるかどうかは、逆算すればよいということになります。 なお、許容誤差は小さい方が、信頼率は大きい方が、より真に近付きます。 つまり、的が小さいということは的の中心に近付くということですし、信頼率が大きいということは、その的に命中する確率が高いということですから。 しかしながら、有効回答数を一定として、許容誤差を小さくすると、信頼率は小さくなります。的が小さいほど命中率は下がりますからね。 それでも命中率を上げようとすれば、腕前を上げるしかありません。つまり有効回答数を増やせばよいのです。 ま、本当の統計学からすれば厳密さに欠けますが、分かりやすくいうと以上のような関係性にあることを、まずはご理解ください。 その上で、細かい計算過程は省略して説明すると、一般的な許容誤差5%、信頼率95%という前提で、母集団の人数ごとの有効回答数は次のとおりです。 母集団 有効回答数 1万人 370人 10万人 383人 100万人 384人 1000万人 385人 となります。以外に少ないでしょ?これだけで統計学上は十分意味があるんです。 過去1年以内にサイトを利用した転職経験者が何人いるか分かりませんが、1万人でも370人、1000万人でも385人ですから、1176人も集めれば十分といえると思います。 あとは、11指標の中身(聞き方)が適切かどうかですね。変に誘導した質問も中にはありますから。 このほか、調査方法(対面か郵送かWebかなど)によっても、回答者の層が偏ることがありますね。 調査の信憑性を判断するには、このように多面的に検討しなければなりませんが、少なくとも有効回答数(「サンプルの大きさ」といいます。この場合「サンプル数」という人が多いですが、間違いです。「サンプル数」だと別の意味になります)については問題ないと思います。

goodl
質問者

お礼

非常にイメージのしやすい説明ありがとうございました。 助かりました。 母集団と有効回答数(サンプル数の大きさ)等、勉強に なりました。

関連するQ&A

  • アンケートなどの有効サンプル数

    ご質問させてください。 アンケートなどをするときによく有効サンプル数というものを聞きます。アンケートの大きい、少ないに関わらず、500人のサンプルがないとそのアンケートに信憑性がないといわれます。それはいったいなぜなんでしょうか? また、街角でアンケートをよくしていますが、あのアンケートは役に立つものなのでしょうか?10人ぐらいに聞いたところで、それが、その商品の役に立つとは特に思いません。 是非とも皆さまこの疑問に対してご教授ください。ヨロシクお願いいたします。

  • 統計的に必要なサンプル数について

    以下のようなアンケートを実施した場合、統計学的に信頼のおけるサンプル数について、どのように考えればよいか教えていただけないでしょうか? 下記のようにビールについてのアンケートを実施し、最終的にビールの満足度ランキングを作成するとします。 【質問1】 普段一番よく飲むビールの銘柄は何ですか 1|アサヒスーパードライ 2|キリン一番絞り 3|キリンラガー 4|サッポロ黒ラベル 【質問2】 (1)「コク」についての満足度をお聞きします 1|大変良い 2|良い 3|普通 4|悪い 5|大変良くない (2)「切れ味」についての満足度をお聞きします 1|大変良い 2|良い 3|普通 4|悪い 5|大変良くない (3)「のどごし」についての満足度をお聞きします 1|大変良い 2|良い 3|普通 4|悪い 5|大変悪い 【質問3】質問1でお選びになったビールの総合満足度についてお聞きします。 1|大変良い 2|良い 3|普通 4|悪い 5|大変悪い ---------------------------------------------------- 【前提】 回答結果の内訳は以下の通りだったとします。 スーパードライ|600 一番絞り |400 ラガー|15 黒ラベル |100 各社ビールの総合満足度は上記3つの設問から算出します。 なお、3つの設問全てに下記の通り点数を付与します。 大変良い=5点 良い=4点 普通=3点 悪い=2点 大変悪い=1点 ここで質問です。 (詳細は省略しますが)ざっくり、まず総合満足度についての重回帰式を立て、それをもとに各ビール毎に総合満足度の平均値を算出、それらを比較(分散分析⇒多重比較で有意性の判断もする)して、順位づけを行う方法を考えています。 この時、例えば上記の前提条件では、キリンラガーのサンプルサイズが15と他と比べて少なかったりするわけですが、何をどう考えて、ランキング対象とするビールを決めればよいのでしょうか?

  • 統計学 市場の必要サンプル数の算出方法教えて下さい

    10万6,015人の母集団から987人の有効アンケートをもらいました。 この987人のうち25%は、商品を使ってみたいという結果になりました。 987人のサンプル数は、必要サンプル数を満たしているかを 統計学をもとに調べています。 仕事で、信頼度95%?!として、調べることになっているのですが、 WEBで調べても、文型の私には理解が難しくて、 どなたか教えていただけませんでしょうか。 本当に困っています。 すみませんが、どうぞ宜しくお願いします。

  • アンケートのサンプルサイズについて

    統計素人です。ご教授いただければ幸いです。 商品の満足度について調査するためにアンケートを行う予定です。 回答は5段階(★5、★4、★3、★2、★1)。 商品の満足度を9段階(★5、★4.5、・・・、★1)の代表値で 表したいと思います。 回答の★印を等間隔の順序尺度として扱い、アンケート全体の中央値を 商品の代表値としようと思います。 この時、商品の満足度を精度x%以内で推定するためには 何件以上のアンケート結果が必要でしょうか?信頼度は95%とします。 この場合(順序尺度)の精度x%というのはどういった考え方をすればよいのでしょうか? (もし、間違ったことを言っていたらつっこんでください。)

  • アンケート調査に必要なサンプル数

    現在、2000世帯、7000人の町のアンケート調査を予定していますが、サンプル数をどの程度確保したらよく分かりません。 統計学には疎いのですが、標本サイズと誤差の関係を示す、e=1.96√p(1-p)/n p母集団比率、n標本サイズ、信頼係数95% という式をホームページから見つけました。 これによると、誤差を4%以内にするためには600サンプル必要とありますが、2000世帯に600サンプルでは感覚的に過大に思います。 何か別の考え方があればご教示願います。

  • アンケートのサンプル数の目安

    アンケートの回収サンプルには、目安となる数がありますか? 質問項目や質問数にもよると思いますが、一般的な数値として、 どれくらいの回答サンプルを回収すれば、データとして分析に役立つでしょうか? サンプリング誤差の早見表(信頼度95%)を見ましたが、よく理解できません。 どなたか、教えてください。

  • 検定のサンプル数について

    こんにちは。 最近レポートをまとめる際に統計学を使うようになった者です。 とても基礎的な質問だと思いますが、検定のサンプル数はどれくらいあれば有意差など調べる際に有効なのでしょうか?サンプル数によって使う計算式が違うというのを耳にしたのですが、実際はどうなのでしょうか? サンプル数が50~100ぐらいで有意差など十分な結果が出せるのであればいいのですが・・・ 教えて下さい。

  • サンプル数が大きく異なる分散分析について

     大学の統計の講義で勉強しています。分散分析で少し疑問があったので質問させてください。  練習用のデータでは、幸福度に関する調査で、量的変数として1~10の段階評価の幸福度があり、質的変数は幾つかあったのですが、自分はその中から、年齢(20代/50代)と喫煙の有無の2種類を選びました。  このデータから2要因の被験者間分散分析を行い、喫煙の有無(有/無)と被験者の年齢段階(20代/50代)と、その組み合わせの効果によって幸福度の平均値に差がでるかということを調査してみようと考えました。  しかし調べてみると、20代の喫煙有り/無しが(12/95)。50代では (15/90)とサンプル数が大きく異なっています。  このようなケースで分散分析を行った結果は、信頼できるものといえるのでしょうか?また、言えない場合はどのように調整すればいいのでしょうか。データ数を揃えるために、多い方のデータから無作為抽出を行って必要な分だけデータを取り出してしまったりしていいんでしょうか?  よろしくお願いします。

  • サンプル数をどれぐらい集めれば、正しいのでしょうか

    例えば、10万部のチラシを作成したとします。 そのチラシに、ハガキなり、WEBで「アンケートにお答え下さい」と告知し、 性別、年齢、住所などを聞きます。 その10万通のチラシが、廃棄されることなく、人の手に渡ったとなった場合、 何通のアンケートが回収(回答)できれば、 「そのアンケート内容が、チラシを受け取った人の属性である」 と言って差し支えないのでしょうか(統計学として)。 10万通のチラシについて、男女比が6:4で、30歳代が60%で、 など、社内資料として、まとめたいと思っています。 単純に、返答のあった数で、男女比などを出すことができますが、 もちろん10万通の回答があればいいのですが、 500通で、統計学的に誤差プラス・マイナス2%とか、 統計学として、信憑性のある数値としてまとめることができるのかを 知りたいと思います。 あるいは、上記のようなことが分かるサイトのURLを ご教示いただければと思います。 ご回答、よろしくお願いいたします。

  • サンプル調査について教えてください。当方、素人ですのでよろしくお願いし

    サンプル調査について教えてください。当方、素人ですのでよろしくお願いします。 10万個ある設備の容量を一つ一つデータ管理しているのですが、その一部でデータの誤りが発見されました(2個発見された)。10万個の管理されているデータがはたして本当に信頼できるものなのか、サンプル調査して確認したいと考えています。どの程度信頼できるのかを数字で言いたいのですが、どのように考えればいいのでしょうか?ちなみに、状況は以下の通りです。 設備数は10万個 基本的にデータはあっていると考えられます(最悪でも2000個に1個程度は誤りがあるかもという程度です) 無作為に400個の設備をサンプル調査した結果は全てデータは適正でした(調査した数に意味はありません) 以上です。至急回答頂けると大変助かります。よろしくお願いいたします。