• 締切済み

(統計学)n数をいくらにすれば良いでしょうか。

統計が無知な私に、ぜひご教示願います。 いま、丸い形をしたサンプルが30000個あり、 それぞれのサイズにややばらつきがあります(正規分布とします)。 大きすぎるもの、小さすぎるものは不合格になるとします。 30000個をすべて確認すると、 その中の不合格はだいたい50-100個程度と把握しているのですが、 毎回30000個確認するのは大変なので、 n数を少なくして確認し、 「この日製造したサンプルは不合格率○%だった~」、という話をしたいと思っています。 だいたいいくらくらいのn数にすれば、ある程度信頼性のある話ができるのでしょうか? できれば理由も添えて、お願いします。

みんなの回答

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

オーソドックスな、「母比率の推定」の問題です。 統計の入門書には、大概、この名前の章があって、 信頼区間の求め方が書いありますよ。

  • DJ-Potato
  • ベストアンサー率36% (692/1917)
回答No.1

30000個に50~100個の不良品だとすると、不良品は300~600個に1個ということになります。 0.167~0.333%ですか。 nを現実的に確認できる個数で設定して、ある日の不合格率が0.15%でした。 統計に疎い上司は「いつもより少ないんだね、良かった良かった」って言うかもしれません。 統計に強い上司は「で、有意確率は?」とか「信頼区間は?」とか言うでしょう。 ある程度信頼性のある話をするためには、どの程度信頼性があるのか明記して話さないといけません。 統計は実は結構うさんくさいもので、うまく使えば上手に人を騙せる数字のトリックを生み出すことができます。 あとは具体的な数字で言うと、例えばn=1000程度だと、不合格は0~5くらいでしょうか。 1/300なら平均的には3個くらい不良品が出そうですね。 でも0個だった時に、あるいは1個だった時に、不合格率が0%でした、0.1%でした、と言っても信憑性に欠ける印象がありませんか? 統計とは、そんなもんです。