• ベストアンサー

適正なサンプル数について

ある製品の50000個のサンプルを10セット測定した結果、それぞれのサンプル集団から400PPM~1000PPMの不具合が発見されたとします(400ppmが3集団、600ppmが3集団、1000ppmが4集団とお考え下さい)。今新たに改良品を作りその改善度合いを確認するとしたら、サンプルは最低でいくつ必要になりますか?  よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

#1です。 大雑把で厳密性を欠くかもしれませんが、実用的な見積もり方法をご紹介します。どなたか、さらに理論的な解析を補足してくださることを期待します。しかし、理論的に厳密であっても、それが実際どの程度の効果があるかは疑問です。というのは、いろいろな現実的要因(例えば、サンプルを用意する費用とか、やり直しの容易さとか、有意差が出ないとどれくらい困るとか)を考慮することが必要だからです。 不良率の現状が 0.0007、これを 0.0004まで改善することを目標とします。そしてこれが達成された場合、何個のサンプルを取れば、改善の検定が有意にできるだろうか、を考えます。 #1です。 サンプル数をNとすると、不良数は、0.0004N個を中心として、分散も同じく0.0004Nとなります(したがって、標準偏差は0.02√Nです)。分布型は、正確には二項分布ですが、近似的には正規分布です。 改善前と改善後の、不良数中心の隔たりは、0.0007N-0.0004N=0.0003Nであり、これを標準偏差で割って正規化した値は、0.0003N/0.02√N=0.015√Nです。8割方有意となる程度に差がついて欲しいのであれば、標準正規分布の片側20%点が0.84ですから、0.015√N=0.84とおいて、N=3136が必要サンプル数となります。キリのいいところで3200個ではいかがでしょう。 念のため3200個のサンプルに対して、不良率0.0007なら平均不良数は22.4個、0.0004なら12.8個です。常識的にも、この程度の差が出れば、改善効果があったとしてもおかしくないでしょう。

tamasakana
質問者

お礼

分りやすい解説ありがとうございました。 統計学の便利さ感じると同時に、きちんと勉強する必要性も実感しました。

その他の回答 (1)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.1

これだけの条件では、必要サンプル数は、理論的には決まりません。 どの程度改善したいのか、という目標を設定し、かつ、その目標が達成された場合、どの程度の確率で有意に検出したいのか(検出力)を設定すれば、数学的に必要サンプル数が出てくるはずです。

tamasakana
質問者

補足

アドバイスありがとうございます。 改善の度合いは400~1000ppmだったものを400ppmに一様に低く抑えたい考えています。 検定の確からしさとしては80%程度と仮定したいと思います。 良否判定には製品のある寸法を測ります。規定値を超えたらNGです。 寸法のバラツキは正規分布に従うとします。 自分でも深く考えてみたいとは思うんですが、一朝一夕にはいかず、お力を貸して頂きたくお願いします。

関連するQ&A

  • 製品ばらつき把握 サンプル数

    製品ばらつき把握 サンプル数 メーカー勤務の設計職のものです。 今、電源基板の入力電力の製品ばらつきを確認しています。 サンプル数をいくつとればいいのでしょうか。 100も1000も測定することはできません。

  • 信頼できる標本抽出に必要な数の決め方(統計)

    はじめまして。 実験で適切なサンプル測定数を決めたいのですが 統計的なことに弱く困っています。 どなたか教えてください。 例えば 5 6 8 8 9 10 6 7 といった母集団(n=8,平均=7.375,標準偏差=1.69) があった時に、 この母集団から信頼度α%の平均値を得るのに必要な 最低のサンプル数はどうやったら知れるのでしょうか。 どなたかご回答お願い致します。

  • 統計学 市場の必要サンプル数の算出方法教えて下さい

    10万6,015人の母集団から987人の有効アンケートをもらいました。 この987人のうち25%は、商品を使ってみたいという結果になりました。 987人のサンプル数は、必要サンプル数を満たしているかを 統計学をもとに調べています。 仕事で、信頼度95%?!として、調べることになっているのですが、 WEBで調べても、文型の私には理解が難しくて、 どなたか教えていただけませんでしょうか。 本当に困っています。 すみませんが、どうぞ宜しくお願いします。

  • 統計 考古学調査でのサンプル数と結果の妥当性

    統計について知識のないものからの質問です。 サハラ砂漠には様々な古墳がありますが、その中で「鍵穴型円墳」が約1000基あります。その内7基の年代測定をしたところすべて紀元前3000年前後に集中しています(CalBC3340-3030~CalBC2910-2700の範囲)。  この結果を受けて、「この形式の古墳は紀元前3000年前後のもの」と断定してよいものでしょうか。母数に対してサンプル数が少なすぎないでしょうか。 結果の妥当性はどのように考えれば良いのでしょうか。  別の方の質問への回答で、「正規分布でない場合は最低6-8サンプル必要」との説明を見つけましたが、このサンプル数での妥当性はどのように考えるべきでしょうか。 よろしくお願い致します。(素人の考古学愛好者からの質問)

  • 母集団のばらつきをサンプルから推測【統計学】

    客先に納入している、ある製品の寸法のバラつきを聞かれ、n=10個でデータ測定して提出したら、「サンプル数が少ない!もっと信頼性のあるデータをくれ!」と怒られてしまいました。 で、統計学に基づいて抽出サンプル数を決めたいのですが、いろいろなサイトやここの過去質問を見て回っても、難しくてさっぱりわかりません。 ちなみに10個計ったときのデータは以下の通りです。 図面寸法:3.5mm±0.1mm 実測寸法:3.56mm~3.58mm 上記データより、母集団も大体はこの寸法前後に収まると予測できるのですが、95%の精度で寸法のバラつきを予測する場合、サンプル数をいくつ取ったらいいのかわかりません。 だれかご教授願います! ちなみに母集団の数は数十万個です。 しかも、サンプル数を決定した根拠を説明するために、資料も用意しなければならないので、どこかいいサイトがあったら教えてください!

  • サンプル数の妥当性を統計で求めるには?

    初めまして。統計や確率には全くの素人ですので、間違った内容の質問になっているかも知れませんがよろしくお願いします。 ある製品の故障率を求めよという指示がありました。 ただしその製品はある試験で1000時間まで試験を行なった実績はあるのですが、1000時間で故障はありませんでした。 試験サンプル数は3台です。 これに対して、4台で試験したと仮定し、4台目が1001時間で故障したと仮定してワイブル分析を行いなさいという指示です。(通常この製品の試験はサンプル数3台で試験しているのですが、サンプル数3台による試験結果の妥当性を、過去の試験実績データ---と言っても故障実績の無い試験実績データですが---から立証せよというものです。) 質問1:以上につき、できるだけ具体的に分かりやすくご教授いただけますでしょうか? そもそもここまでの過程でつまずいていますが、これを求めるにあたっては故障率を想定する必要があるということも聞きました。 しかし対象の製品は部品ではなく、色々な電子部品が数百点以上実装されたいわゆる箱物です。 実際は一つ一つの部品の故障率を求め、総合して「箱物」としての故障率を求める必要があるのでしょうが、今回故障率に関してはそこまでしなくとも良いと。。。 質問2:家電製品なのですが、そのものずばりでなくとも結構ですので、一般的なテレビの故障率は○○、エアコンの故障率は○○という参考文献などありますでしょうか?又は、家電製品全般という括りでも結構です。 以上、非常に初歩的な質問ですし間違った認識で書いている部分も多々あるかとは思いますが、よろしくお願いいたします。

  • サンプル調査について教えてください。当方、素人ですのでよろしくお願いし

    サンプル調査について教えてください。当方、素人ですのでよろしくお願いします。 10万個ある設備の容量を一つ一つデータ管理しているのですが、その一部でデータの誤りが発見されました(2個発見された)。10万個の管理されているデータがはたして本当に信頼できるものなのか、サンプル調査して確認したいと考えています。どの程度信頼できるのかを数字で言いたいのですが、どのように考えればいいのでしょうか?ちなみに、状況は以下の通りです。 設備数は10万個 基本的にデータはあっていると考えられます(最悪でも2000個に1個程度は誤りがあるかもという程度です) 無作為に400個の設備をサンプル調査した結果は全てデータは適正でした(調査した数に意味はありません) 以上です。至急回答頂けると大変助かります。よろしくお願いいたします。

  • 検量線を引くために最低限必要なプロット数について

    検量線を引くために最低限必要なプロット数について 大学1年のものです。学生実習で、分光光度計を使って吸光度を測定し、これを濃度に対してプロットして検量線を作成し、グラフの傾きからモル吸光係数を算出する、という実験を行ないました(サンプル数n=6)。 このとき、最低限必要なサンプル数は、どうやって6点に決めていたのでしょうか? 「極端な話、2点プロットすれば直線は1つに定まるが、測定値がずれていた場合、検量線も大きくずれてしまう。なので、3点、4点…とプロット数を増やせば、より真の値に近い検量線が引ける。だからサンプル数を多く取る」 という話は聞きましたが、どうやってサンプル数(n=6)を決めていたのでしょうか?なぜ5でも7でもなくて6としたのでしょうか?基準となる考え方などがあれば教えていただきたいです。 実習時には6点取るようにといわれ、その時はスルーしていたのですが、後になってから気になったので、ここで質問させていただきました。よろしくお願いします。

  • H NMRの測定結果についてについて

    実験でサリチル酸メチルを合成しNMRスペクトルの測定をしました その結果が以下の画像なのですが、7.2~7.9ppmにベンゼン環のスペクトルが確認できましたが 6.8~7.0ppmによくわからないスペクトルが出てしまいました NMRの知識がしっかりしてないので自信がないのですが、この6.8~7.0ppmのスペクトルは 不純物によるものと考えていいのでしょうか、よろしくお願いします

  • 河川や湖沼の全窒素濃度について

    大学の授業で河川や湖沼の全窒素濃度を測定しました。 濃度は日ごとに違いが出ました。 この測定結果が正しいかどうか自信はないのですが。 ある川の全窒素は 5月25日 0.27ppm 6月1日 0.271ppm 6月15日 0.58ppm 6月22日 1.47ppm この値の違いの原因には何が考えられるでしょうか? あと河川や湖沼の全窒素濃度を低くするためにはどういうことが必要なのでしょうか?