• 締切済み

工程能力のN数補正について

データ数(N数)が少ない場合の工程能力を求める際、標準偏差を補正したいです。調べたところ下記2つの方法があるようなのですが、どちらが正しい考え方なのでしょうか。使い分け等あれば教えていただきたいです。補正方法(1)のほうが(2)に比べて補正係数が大きく(信頼区間にもよりますが)、その意味するところの違いも教えていただきたいです。 できれば、実用面からエクセルでの計算例もあるとありがたいです。 ※下名の知識レベルとしては、学生時代に一度統計学の講義を受けた程度でほとんど忘れています。 補正方法(1)(・・・計算方法はわかりました)  標本から求めた標準偏差をχ二乗分布で区間推定し、  母集団の標準偏差とのずれを補正する   ※参考URL:http://ouenblog.divaandco.com/?eid=940571 補正方法(2)(・・・合っているかだけでなく、計算方法も不明)  標準偏差の不偏推定量D(Wikipediaより)を直接使い、標本の標準偏差との差を補正する。  具体的には、不偏分散u^2にはエクセルにおけるSTDEV関数で求めた標準偏差を代入し、  ガンマ関数の部分はGAMMALN関数内に自由度÷2、データ数÷2を入れて計算する?   ※参考URL:http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE   →"統計値の標準偏差"の上から5番目の式 統計学は難しいですね・・・ ご回答よろしくお願いします。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 「標準偏差の補正」と仰るのは、(a)単に母集団の標準偏差を推定したいのか、(b) 標準偏差の信頼区間の上限・下限(つまり「最悪」どこまで大きい可能性があるか・「最良」どこまで小さい可能性があるか)を計算したいのか。どっちなのかをまずはっきりしてもらわんと。  (a) 「最もありそうな結果」を推定したいという話。  母集団の標準偏差を使ってCpkを計算すれば良い訳ですが、その母集団の標準偏差の推定には、「普通」は母集団の分散の不偏推定を行って、その平方根を使う。しかしうるさい事を言えば、平方根y=√xが非線形変換であるために、微妙な補正が必要になる(「補正方法(2)」に該当)。ただし、分散の不偏推定値が持つ相対誤差が小さい時には、y=√xをその接線で近似しても誤差が少ないので、補正はほとんど効かない。だから、そんな手間は掛けないのが「普通」。  (b) 「最悪(最良)どうなるか」を推定したいという話。(「補正方法(1)」に該当。)  たまたまサンプルのばらつきが実力以上に小さかった場合(実力よりばらついていた場合)に、(a)の方法で推定した母集団の標準偏差は真値より小さい(大きい)ことになるんで、それを使って計算したCpkは実力以上に良い(悪い)ことになる。なので、得られたサンプルから予測される最も悲観的(楽観的)な母集団の標準偏差は(そしてCpkは)幾らか、ということを推定しようということ。ただし、最悪(最良)とは言いながら、実際には信頼区間を勝手に設定した上での上限・下限を使うしかない。 > 補正方法(1)のほうが(2)に比べて補正係数が大きく  両者は全然別の目的で別のことをやっているのであり、比べるのは無意味。これは統計学が難しいという話じゃなくて、「一体何のために計算をやってるのか」を忘れちゃいけない、というだけのアッタリマエのことです。

関連するQ&A

  • 統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本

    統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本平均9.1(標準偏差2.3、n=25)を平均値検定した結果、z=2.43で有意水準5%で有意差ありとなっていました。ところが、それぞれの母平均を区間推定すると95%信頼区間で推定幅に重なりを持ってしまいます。もし、有意差があるなら、重なりを持たないと理解していますが…。当方の計算法の誤りまたは計算違いでしょうか?計算方法は、例えば前者の場合、7.5±1.96×不偏分散の平方根/28の平方根でやってます。

  • エクセルにて工程能力評価時の補正係数について

    お世話になります。 工程能力Cp、Cpkを算出する際ですが、 http://w3e.kanazawa-it.ac.jp/jinzai/qm/qm0703.pdf のページの50ページのように、サンプリング数(データ数)によって 補正係数を使って補正しています。 エクセルで工程能力を求めた場合、 STDEV関数で標準偏差を求めた場合、補正係数での計算は 不要という理解で正しいでしょうか? (普通そうしないと思いますが、  STDEVP関数で求めた場合、補正係数が必要という理解でしょうか?) 宜しくお願いします。

  • 区間推定に使うt値

    ある母集団から10個の標本を抜取って、 標本の平均μと不偏分散σ^2、標本標準偏差σ/√10を求めました。 次に母集団の平均の区間推定を行います。 99%の信頼度で区間推定した場合、ある参考書に、 区間= μ ± t × σ/√10 と記されていました。 このtという値は信頼度とサンプル数(自由度)によって変化するとのことなので、 t分布表から選択して計算するようにと書いてあります。 自分は エクセルのNorminv(0.005,μ,σ/√10)~Norminv(0.995,μ,σ/√10) を使って求めたほうが簡単なので、こちらを使用するのですが、 上の参考書の値と異なってしまいます。 エクセルのNorminv関数にはなにか欠点があるのでしょうか? よろしくお願いいたします。 データ添付します。

  • 信頼区間推定方法

    95%信頼区間の推定方法に付いての質問です。 信頼区間推定の計算式として下記の2通りの式を見掛けます。 1)信頼区間 = 標本平均 ±(t(95%) × 標本標準誤差 ) 2)信頼区間 = 標本平均 ±( 標準偏差 × 1.96 ) 2通りの式で同一標本の信頼区間推定してみるとそれぞれ 異なる区間が算出されます。 どちらの式を用いるべきなのでしょうか? また、なぜ結果の異なる計算式が並存するのでしょうか?

  • 標準偏差の不偏推定量

    http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE にて「不偏分散の平方根 u は、標準偏差の不偏推定量ではない」と書かれており、他の書物等でも同等の記述が確認されます。 しかし、不偏分散は母分散の不偏推定量なのですよね? (この認識が間違いかもしれませんが) であれば単に不変分散の平方根を取れば、母集団の標準偏差の不偏推定量に成ると思うのですが、なぜなら無いのでしょうか? 何故ガウス関数を用いた特殊な式(あまり理解していません)を用いる必要があるのでしょうか? ご回答、宜しくお願い致します。

  • 標本分散が母分散より少し小さくなる理由、不偏分散をn-1でわる理由

    お世話になっております。 統計学初心者で、母平均の信頼区間の推定について勉強しています。 勉強している中で、標本分散が母分散より少し小さくなるということ、 そのため標本分散ではなく不偏分散を利用し、不偏分散の算出は偏差平方和、サンプルサイズから1引いたもので割ることを勉強しました。 しかし標本分散が母分散より少し小さくなる理由、そして、そのために不偏分散の算出においてn-1でわる理由が分かりませんでした。 わかりやすい形で教えて頂けないでしょうか? どうぞよろしくお願い申し上げます。

  • 正規分布の標本標準偏差

    今、抵抗の正規分布の実験をしています。 ここで、1.6KΩの抵抗200本をLCRメーターを用いてKΩ単位で測り、これをエクセルに入力しました。 これをΩの単位に直すために1000倍して、これらの数値から標本標準偏差を出そうと思っています。 しかしながら、どう計算させても10.59という馬鹿大きい数値が出てきてしまいます。 最初はエクセルのSTDEV関数を用いて算出しましたが、どうにも信用できない数値なので、STDEV関数は使わず標本標準偏差の基本式を少しづつ崩してエクセル上で計算させたのですが、やはり10.59という数値になってしまいました。 試しに、KΩ単位のままで標本標準偏差を出してみたところ、0.01という、Ω単位の時の1000分の1倍の数値しか出てきませんでした。 標本平均は1590Ωと、少し低い値ですが、許容誤差範囲だと認識しています。 エクセルのシートを変えて計算させてもこの数値にしかなりません。 標本標準偏差は1に近いほど良いということですが、どのくらいの数値の範囲に収まるのが理想的なのでしょうか? また、このような経験のある方、こうじゃないか?と思われる方、エクセル、標本標準偏差に詳しい方がいらっしゃいましたら、ご回答をよろしくお願いします。

  • 標準偏差値が合わない

    Excel2007 Windows Vist です。 関数STDEVと関数を使わない方法の両方で 標準偏差値を計算してみました。 セルB2~B8に 9.2 7.7 5.3 6.4 8.5 4.6 6.6 を入力。 関数STDEVを使った場合は 標準偏差値=1.6673332 となります。 関数STDEVを使わない場合は 公式 √{Σ(Xi-Xm)^2/N} をつかい 標準偏差値=1.54365059 となり、値が合いません。 但し Xi :資料の値 Xm:資料の平均値 N :資料の数 とします。 どちらの値を使うべきなのでしょうか。

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。

  • 統計学 推定の標本標準偏差

    試験に備えて区間推定の練習問題をやっているのですが、どうしても標本標準偏差の値が解答とずれてしまいます。 何度もテキストを読み直しましたが、自分ではまったく原因がわかりません。 統計に詳しい方がいらっしゃいましたら、どうか教えてください。 お願いします。 問題:某地区の10世帯について1ヶ月の電気使用量を調査した。    5900 4300 4200 3800 5200 4500 5100 6200 4700 4100 この地区の電気使用量の平均を信頼係数90%で区間推定せよ。   (解答では、標本標準偏差は790.2となっている)