• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:統計的手法  3σ管理)

統計的手法で上限規格の証明をする方法とは?

このQ&Aのポイント
  • 統計的手法を用いて上限規格の証明をする方法について詳しく解説します。結果から得られた情報をもとに、3σ管理や工程能力指数を使用して証明することができます。
  • 分析結果から得られた情報を解析し、上限規格の30以下になるかどうかを統計的手法で証明する方法について説明します。3σの幅や工程能力指数を使用することで、上限規格を満たす確率を算出することができます。
  • 統計的手法を使用して上限規格の証明をする方法について詳しく説明します。3σ管理や工程能力指数を活用することで、30個を超える確率が極めて低いことを証明することができます。さらに、推定や検定を行うことで上限規格の範囲を推測することも可能です。

質問者が選んだベストアンサー

  • ベストアンサー
  • drmuraberg
  • ベストアンサー率71% (847/1183)
回答No.6

補足を見て気付きました。 データは2000個(10g)が一まとめのものを1サンプルとし, 69サンプルを作り、それに付いて着色粒子の数を数えた。 その結果が、ポアソン分布に近くなる可能性は高いですが、 <σ=3.7  平均=4.0  max=14  min=0> からλ=4で議論を進めたのは早とちりでした。 69個のサンプルの内、着色粒の無いサンプルの個数が1番多い のでは? そして着色粒の数が多い裾がだらだらと14個まで伸びているのでは? この場合λが1,2に近くなりますが、平均も分散も共に理論値のλ=k=1,2 より大きくなります。 外れが大きくなると、ポアソン分布を想定した議論は無意味になります。 正規分布を想定した議論がベースを失うように。 分布を想定しない議論の提案も有りますが、一般には確率は悪い方向に 動くので、シビアな品質問題への適用は難しいでしょう。 それにデータベースとの関連で説明もさらに難しくなります。 データーベースが有りながらユーザー(上司)への説明で「データーは さておいて、数学の理論では云々」では「なぬ?!」と言う反応が来ることが 予想されます。 2000個中40個と解釈すべきか、2000回で40回と考えるべきかは混乱中です。 まずデータを精査され、どの分布に従うか、またはどんな関数で近似できるのか を検討されることをお勧めします。 データとヒストグラムを写真添付して再質問されたらいかがでしょうか。 学問教育の欄にはよく出かけます。

bodybody1098
質問者

お礼

drmurabergさん貴重なお時間をさいて頂きありがとうございます。 そもそも自分が質問するときにもと詳しく書いてデータも合わせて添付するのが 本当ですね。たび重ねてお詫びします。一度データを整理してみたいと思います。 しかしdrmurabergさん統計にすごく詳しいですね。うらやましいです。 この機会に少しでもと思いいろいろ勉強します。ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (5)

  • drmuraberg
  • ベストアンサー率71% (847/1183)
回答No.5

訂正 <Px=∫P(X=k)dk= =∫λ^k*exp(-λ)/k!dk> kの積分ではなく、kとλを固定して得られた曲線のグラフの Xが3σ以上の部分の面積です。 離散的な数字ですので、横軸の離散数に付いての和を取っても良いでしょう。 横軸の0以上の数字は(数表から) X= 0, P=0 X= 1, P=0.01533 X= 2, P=0.09022 X= 3, P=0.16803 ・・・・・・・ X=11, P=0.01019 X=12, P=0.00531 X=13, P=0.00269 X=14, P=0.00133 X=15, P=0.00065 Pの和 X1~X15=0.99956 Pの和X11~X15=0.02017 Px=0.02017/0.99956=0.0202 つまり、この場合3σ以上の粒の個数は Nex=N*0.0202となります。 10/wが1000なら20個です。 検算はお任せします。 余談ですが、 宇宙からの放射線がカウンターに入る時間間隔がポアソン分布に従います。 間隔ほぼゼロで来るのも希、長い時間来ないのも希だからです。 ガイガーカウンタで測って解析させられました。 それ以外では、航空機事故の起こる間隔がこの分布に従うとされています。   

bodybody1098
質問者

補足

何度も申し訳ないです、理解できずに。1g=200粒 で10gで2000粒です。(実測値の平均) 重さが1粒0.005g(5mg) 10/wが2000粒の場合は3σ以上の面積の部分が40粒になるということでしょうか? 理解が出来なくてすいません。3σ以上の部分の色が付いた粒が40粒? なんかますますわからなくなってきました。こんなに詳しく説明してもらっているのに理解力 がなくて申し訳ありません。

全文を見る
すると、全ての回答が全文表示されます。
  • foomufoomu
  • ベストアンサー率36% (1018/2761)
回答No.4

チェビシェフの不等式によると http://ja.wikipedia.org/wiki/%E3%83%81%E3%82%A7%E3%83%93%E3%82%B7%E3%82%A7%E3%83%95%E3%81%AE%E4%B8%8D%E7%AD%89%E5%BC%8F 任意の分布に対して、3σの範囲内に全体の8/9が含まれることになります。 >3σは99.7%が・・・ の部分を「3σは88.8%が」、と置き換えれば、どんな場合でも問題なく通用します。

bodybody1098
質問者

お礼

foomufoomuさんありがとうございます。チェビシェフの不等式 はじめて耳にしました。 まだまだわからない事が沢山あります。勉強になります。3σが88.8%ですか。 ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。
  • drmuraberg
  • ベストアンサー率71% (847/1183)
回答No.3

No.1への補足で納得がゆきました。 69回サンプルを10gずつ取り、着色した粒の数を数えた訳ですね。 着色した粒の出現が希な場合はポアソン分布で表されるのは 納得できます。 まずサンプルに含まれる粒数が30個のベースになります。 1粒の平均重さをw(g)とすると、サンプル中の粒の平均個数Nは N=10(g)/w(g) 個 となります。 データの分布がポアソン分布 P(X=k)= λ^k*exp(-λ)/k! に従うとすると k=4.0,λ(=σ)=3.7での値はP=0.19279 k=4.0,λ(=3σ)=11.1での値はP=0.00956 となります。 3σより大きな物の占める割合Pxは Px=∫P(X=k)dk= =∫λ^k*exp(-λ)/k!dk   積分範囲は3σ~∞ となります。(P(X=k)は0~∞で1に規格化してある。) 着色粒の期待個数Nexは Nex = N*Px でこれが30個よりどれだけ小さいかが判断の根拠になります。 分布がポアソン分布とは違う場合は、データから近似曲線を得て、 それを数値(または図上で)積分することも考えられます。

bodybody1098
質問者

補足

drmuraberg さんありがとうございます。なかなか理解できず今ポアソン分布を調べて いるのですが、ホアソン分布にあてはめて計算すると 30粒になる確率は 0.00000000000000008%の確率で限りなく0に近いことになるのでしょうか?(エクセルの関数で計算) あまりにも高度すぎて理解できてないです。すいません。

全文を見る
すると、全ての回答が全文表示されます。
  • drmuraberg
  • ベストアンサー率71% (847/1183)
回答No.2

残念ながらお考えの方法ではできないと思います。 <分析結果より、上限規格の30個以上には まずならないというのを 統計的手法を用いて証明>という言葉を <分析結果より、1,000個中で上限規格(3σ)を越える物の個数は30を遙かに下回る事を 統計的手法を用いて証明>と理解してよろしいでしょうか? 3σの論法で基本的に間違っているのは、<σ=3.7  平均=4.0  max=14  min=0> の分布は正規分布とは程遠い事です。 したがって正規分布を使ったお考えの論は何の意味も持ちません。 分布形はポアソン分布に似たものになると思います。 http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83 ポアソン分布の場合、平均=分散ですから、この図のλ=4に近いように思えます。 (λが十分大きい場合、正規分布となります。) これを手許のデータでご確認の上で、上限公差を3σとした場合の、ポアソン分布での出現確率を 考えられる様お勧めします。

bodybody1098
質問者

補足

drmurabergさんアドバイスありがとうございます。統計に無知で情けないです。 No.1のokormazd さんも言っておられる正規分布にはならないので3σでの自分の考えでは 無理のようですね。安易に考えていました。 上限規格が30以下でデータからも全て30以下になっているのでこれでいいのかと思いましたが 難しいですね。 ポアソン分布ですか。これで一度調べてみます。簡単に出来るものなのでしょうか。 分析結果より、1,000個中で上限規格(3σ)を越える物の個数は30を遙かに下回る事を 統計的手法を用いて証明>と理解してよろしいでしょうか? ここは自分の考えではデータの結果より 30以上にはならないというのを証明したかったです。 データの取り方はNO.1さんの補足で書きました通りです。 頭の中がごちゃごちゃになってきました。すいません。

全文を見る
すると、全ての回答が全文表示されます。
  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.1

どのようなものの統計かはわかりませんが、データが変ではないでしょうか。 n=69 σ=3.7  平均=4.0  max=14  min=0 では、正規分布からは遠い様な気がするので、これを正規分布モデルで考えるのは適当ではないのではないでしょうか。 「0に近いほうがいい」というなら、平均が「0」に近く、データも負の値があるのが妥当だと思うのですが、どうでしょう。 二項分布なのでしょうか。データの取得とモデルを検討したほうがいいのではないでしょうか。 また、「上限規格の30個以上」という意味も分かりません。nが大きくなれば、規格を超えるものも多くなるはずですよね。 もう少し、どんなものについて、どうやって得たデータなのかわからなければ、「統計的手法を用いて証明」などできないと思いますが。私の勘違いならご容赦を。

bodybody1098
質問者

補足

okormazdさん、さっそくのアドバイスありがとうございます。説明も悪く統計にも詳しくなくて すいません。10グラム粒を計ってその中で色の付いた粒を数えてデータを取ったものです。 データは粒を数える方法でその中の色が付いているものを数えます。その色の付いた粒の数(個数)が 規格は30以上ではなくて 30以下です。なので色のついてない粒もあるので0のものも多数あります。 それで平均が4粒ということです。ですから負の値はないのです。(最小が0個になります) この色の付いたものが悪い粒とお考え下さい。色のついてないものが良い粒です。 色の付いてない粒が0が理想なんですが。これで色の付いている粒の規格が10gの中に30個以下 というのが規格です。 これでどうでしょうか?宜しくお願いします。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 工程能力指数のエクセルでの求め方を教えてください。

    工程能力指数のエクセルでの求め方を教えてください。 A2セル以下An(nは3以上の変数)まで入力されたデータに関して 工程能力指数をA1セルに導入する関数(あるいはマクロ)を教えていただきたいです。 STDEVP関数、平均、3σを使用し (1)工程能力指数1=(規格上限-規格下限)/(6×標準偏差(σ))   →規格上限、下限が設定されているパターン (2)工程能力指数2=(規格上限-データ平均値)/(3σ)     →規格下限なしのパターン (3)工程能力指数3=(データ平均値-規格下限)/(3σ)     →規格上限なしのパターン この3パターンの関数(あるいはマクロ)を教えてください。 データ数をみて、関数を組み込み、計算はできるのですが、 データの数が変数の場合の処理がわかりません。 詳しく教えていただけると非常に助かります。 よろしくお願いします。

  • 統計的手法を用いて

    再度質問させて頂きます。 抜き取りサンプリングして サンプル10グラムの粒を計量してその中から色の付いた粒を数えた結果が下記にあります。 10g計量して(2000粒) 色の付いた粒を数える作業を69回繰り返したデータです。 n-69  平均 4.0  σ 3.7  max 14  min 0  が結果です。 規格として色の付いた粒が30以下とします。(データからの結果は全て合格ですが) 統計的手法を使ってこの集団の色のついた粒が規格の30粒以下であるということを証明 するようなことは出来るでしょうか? データから色の付いた粒が何粒になるか推定が 出来るでしょうか? どんな方法がいいでしょうか?あまり統計に詳しくないので簡単にわかりやすい説明を して頂けるとありがたいのですが。 どうか宜しくお願いします。 10gを計量してその中から色の付いた粒を数える 10gは2000粒(1gが200粒) 重量 1粒が0.005g(5mg) 色の付いた粒(個) 10gの粒を計量してその中から色の付いた粒を数える。 これを69回行った。 個数 0       16(色の付いた粒 0個が16個あったという意味) 1       11 2       5 3       3 4       6 5       2 6       7 7       4 8       6 9       3 10       3     11          1  13       1 14       1 合計69

  • シックスシグマとは

    工程能力指数 Cp=(上限規格値-下限規格値)/6s     s=工程データの標準偏差 について、どうして6なのでしょう??? ネットで調べてもよくわからなかったので、教えてください。

  • ベイズ統計学の利用法について

    頻度論的な統計手法では,確率分布の推定誤差を母数の区間推定という方法で表現します. この場合,標本数が大きくなるとその区間は狭まり,無限になれば区間は限りなく狭くなります. しかし,現実の標本数は有限ですから,区間の上限と下限があります. 実務上は,上限値あるいは下限値を母数の推定値にして,安全側の判断をします. さて,ベイズ統計手法の場合,予測した確率分布の推定誤差はどのように表現するべきなのでしょうか? 実務上でベイズ統計学を利用したいのですが,この部分で悩んでおります. どなたか,よいアドバイスをお願いいたします.

  • 統計的処理についての質問です!

    統計的処理についての質問です! 治具の押し力量の規格値の妥当性(上限値と下限値)を確認するために、押し力量に関係する1寸法の図面上の公差の上限治具(力量が上限)と下限治具(力量が下限)にて押し力量を複数回測定することで、押し力量の規格値の妥当性を検証しようと考えました。 公差の上限と下限なので寸法上は不良率0.3%(3σから、はずれている)の不良品を用いた測定ですが、押し力量の測定結果をさらに3σをとって、規格値の妥当性を確認すると規格値から外れますが、これは、やりすぎと思いました・・・。 今回得られた測定結果から、押し力量の不良率が0.3%以下となる力量の規格値を新しく設定しようと考えますが、どのように導けばいいのでしょうか。 どなたか、ご回答頂けたら幸いです! よろしくお願いします!

  • 工程能力指数について

    工程能力指数の算出方法は、「規格上限-規格下限」を6σ(もしくは6s)で割るという 計算だということですが、そもそも6σで割る理由が良く飲み込めません。 工程能力指数が「1.33以上であれば・・・、1.67以上であれば・・・」 という表記があるのですが、だったらそもそも8σで割って1以上とすれば 分かりやすくて良いのではないかと思うからです。 いったいどうして6σで割る必要があるのでしょうか。 「昔はその程度(99.73%)の良品率で十分すぎるものだった名残り」など、 そうせざるを得ない理由でもあるのでしょうか?

  • どの統計手法を使うのかわかりません

    修士研究真っ最中のものです。 データ分析で迷っています。 以下のような場合、どのような統計手法を用いるべきでしょうか。 二つの集団(生徒と先生)のある行動パターンを知るため、アンケートをとって因子分析し、因子を抽出した これらの因子に、両集団でどのような差があるのか。とくに有意に高い、低いなど際立つ因子はあるか。 ----これを知りたいときに用いる検定はどのようなものなのか、はっきりとわかりません。 ご指南いただけましたら幸いです。 どうぞよろしくお願いいたします。

  • 上限値基準の工程能力指数算出について

    図面の基準値が公差の中央値狙いではなく上限値になってます。 その為実際の実測データも上限値寄りになってしまい、工程能力指数cpkの計算式に当てはめると、低い数値になってしまいます。 イメージ 基準値10.0 公差+0、-0.5 実測値max10.0、min9.8、平均9.93 実測は基準値付近になっているので状態はいいと思いますが、上記だと上限値10.0下限値9.5なので中央値9.75に対しては偏りがありcpkが低くなってしまいます。 設計者の意図はあくまで上限値狙いであり、製造側もそれに答えて上限値寄りに製作できているのですが、その工程能力を数字でどのように表せばいいのか困っております。 工程能力としては非常に高いと思っています。 もしかしたら片側規格と考えcpで算出すべきなのかもしれませんが、それだと10±0.25の設定だった場合より半分の実力値になるのでは?と疑問にも思っています。 アドバイス頂けると幸いです。

  • 製品の統計について

    統計についてお伺いしたい事があります。 製品の強度規格の設定で、一定の下限値より大きければ、上限については問題がないという条件で、統計を出したいのですが、どのような統計を用いればよろしいでしょうか? 現在、標準偏差の使用を試みたのですが、うまくいきませんでした。 引っ張り強度についての条件設定を検討しておりますが、N=40で試験を行った時、150N~398Nとばらつきが存在致しました。 下限条件として150N以上という設定を行おうと考えましたが、平均値-3σの値は非常に小さくなり、平均値から逸脱した値を用いずに計算を行っても、平均値-3σの値はなかなか大きくならず、ほとんどの値を計算から省かなくてはならないという状態でした。 つきましては、どのような統計の出し方が良いのか教えて頂きたく、質問させて頂きました。 よろしくお願い致します。

  • 工程能力指数(CP)についての質問です

    工程能力指数(CP)についての質問です CP値を判断する基準として 下記の条件がある事は認識していますが      Cp<1.00 量産不可能  1.00<Cp<1.33 改善必要  1.33<Cp<1.67 量産可能  1.67<Cp     検査規格の変更 この条件は 3σを前提とした条件でしょうか Cp値の公式は  Cp=(規格上限値-規格下限値)/6σ      6σ=±3σ ですが  Cp=(規格上限値-規格下限値)/4σ      4σ=±2σ で計算する事は可能でしょうか 仮に可能であった場合 2σや4σでCP値を求めると 上記の条件の数値は変わってくるのでしょうか わかりにくい質問ですが 回答をお願いします