• 締切済み

3σについて

3σとは何でしょうか? σというのは標準偏差(ばらつきを評価するもの?)ですよね。 また、実験値(数値列)があるとします。1.05±0.4%(正規化分散というらしい、この範囲に正解値が分布しているという事例があるので、実験値を評価したい)というのは、3σの範囲を表示すれば、3.15±1.2%となり、±3.15%、つまり、1.03と0.97を正解値に掛けることになるのでしょうか?それはなぜでしょうか?イマイチ理屈が分かりません。 またここで、1.2とは何でしょうか? 2σや6σもあるが、3σを使う理由は何か?何を意味するのか? 3σの範囲に入らなければ、ばらつきがある?駄目なのでしょうか? 言い訳ではないのですが、確率を習ってなく、自分で調べているのですがよく分かりません。 この汚い文章を見て、私が何をしたいか予想がつく方は、どうかお助けください。

みんなの回答

回答No.12

質問者さんの状況はこの様なものでしょうか? ・過去にも測定例のある測定を行った ・過去の測定で σ はわかっている(ようだ) ・今回の測定結果を過去の測定結果の σ から「測定の」妥当性を知りたい それに対する疑問は次のことでしょうか。 1)3σをかければいいのか?どうして?(3σの使い方って?どうやって評価すべき?) 2)3σを使う理由は?意味は? 3)3σの中に(今回の測定データが)はいらなければ、ばらつきが大きいということ? 違っているようでしたら補足をお願いします。 以下、上記を前提に回答いたします。 1)1.05±0.4% と書かれていますが、統計的なデータを表す場合は 平均±ばらつき範囲(3σとか) で表す場合が多いです。 この表記に従えば 平均=1.05、偏差(σ)=0.4% となります(0.4%は3σとかかもしれませんが、ここではσとします)。 そうすると 3σ=1.2% になります。 つまり同一条件にて測定を行えば(分布の両側で判定の場合)約99.5%範囲内に結果が現れます。 ざっくり言って今回の測定データ数が10個程度であるならば範囲外のデータが1個あると今回の測定は疑わしい(測定ミスや元々測定再現性が低いなど)かもしれません。 一方、偏差(σ)=1.05±0.4% という表記の場合も(見たことはありませんが)ありえるかも知れません。 (例えば、個体ばらつきと製品ばらつきを別々に記載したいときとか、測定の度ばらつきが異なる測定とか) その場合は(多分正確ではないですが) 3.15±1.2%→±4.35% を使ってもよいかもしれません。 2)については他の方が示されている通りだと思います。 数学的にはあまり意味はなく、直感的な「ほとんど」を表す適当なところ、みたいな感じでしょうか。 工業系では最近6σで工程能力等を評価する向きもあるようです。 3)については大きく外れている、山が明らかに2つ以上あるなどの場合は別のばらつき要因がある可能性があります。 ですが、測定対象によってはある程度許容される場合もあるかと思います。 判断がつかない場合は、データ数を増やしてみるのもいいのではないでしょうか。 その場合はできれば今回の測定データと一緒にしないほうがよいと思います(単一の測定以外のばらつきを含むので)。

参考URL:
http://yoshio.sccs.chukyo-u.ac.jp/courses/applied-statistics/contents/bunpu-hyouhon-heikin.html
全文を見る
すると、全ての回答が全文表示されます。
回答No.11

誤解を生んでいるようなので補足します。 >3σや5σは、ばらつきの幅です。数字が大きいほうが幅が有るということです。 ↑これはその通りです。 >製品の精度を上げるのは、同じ分布であれば、その幅を狭い範囲で使うことになります。5σにするということは、ばらつきのひどいものまで採用するということです。だから逆に(選別などして)2σまでの採用にすることになります。この場合、歩留まりが悪くなります。 ●これは、σをどう使うかの話ですね。  私は、自分の経験のマスプロダクションの話をしてしましたが、  通常の工業製品は、全品測定して選別などして生産できません。  したがって、抜き取ったサンプルから平均値と標準偏差を出して、  たとえば寸法で言えば最悪寸法がいくつになるかを推測するわけです。  その最悪の寸法でも機能上、問題がないかどうかで製品化してよいかを  判断します。(標準偏差も不偏分散から計算する方が正しい)  その最悪寸法を類推するときに、3σを使った方が甘く  6σを使った方が厳しいという訳です。  より厳密な数学的な手法や開発段階ならば実験計画法などいろいろ方法があるのですが、  日本の工場レベルでは、この程度の手法でよい製品を永らく作ってきました。  3σなどという数学的な意味が薄い単語が出てきたので、製造業にたずさわって  とまどっている方と思って回答しましたが、内容次第では誤解を生みそうですので、  もし疑問があれば補足でお知らせ下さい。

全文を見る
すると、全ての回答が全文表示されます。
  • fool_ish
  • ベストアンサー率16% (2/12)
回答No.10

おそらく,#4さんは,#3さんの書き込み > 「この飛行機は大丈夫です。99.7%は墜落しません。」と言われたら、あなたは乗りますか? を見て,「飛行機が落ちるか落ちないかの2値データに対して適用するものではない」と言ったのでしょう.この指摘はもっともだと思います. 上の表現を見て,#8で仰っているような「飛行機の部品の寸法」の話であるとは,まず思えません.後出しと感じました.

全文を見る
すると、全ての回答が全文表示されます。
回答No.9

もう最後にしますが、滅茶苦茶な回答がされているので、補足しておきます。 3σや5σは、ばらつきの幅です。数字が大きいほうが幅が有るということです。 製品の精度を上げるのは、同じ分布であれば、その幅を狭い範囲で使うことになります。5σにするということは、ばらつきのひどいものまで採用するということです。だから逆に(選別などして)2σまでの採用にすることになります。この場合、歩留まりが悪くなります。 また、その3σなりの幅の絶対値を狭くする(ばらつきを少なくする)という改善を図ります。 もう一つは、規格上**以下というようなばあいは、センター値を規格に対してさらに余裕があるように改善します。

全文を見る
すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.8

#5です。 私の口下手の分を#7さんが正確に言ってくださいました。ありがとうございました。 #4,6さん Wrote: > データ数が少ない時はポアソン分布になり、充分多くなれば正規分布になります。 分布のタイプは母集団の性質であり、データ数の問題ではありません。正規分布から少数の標本をとることは、日常いくらでもあることです。また、自由度の非常に小さいポアソン分布から、どんなにたくさんのデータを取っても、左右非対称な山になって、決して正規分布には近づかず、±3σというような検討には適しません。 > 飛行機の事故の例‥‥3σなんか使うわけないじゃないですか。5σだの6σだのに何の意味があるのでしょうか、 飛行機のある部品の寸法が、ある許容範囲から出ると危険だということが分かっているとします。しかし、工場で実際に作られているその部品が、分布の中心は安定しているとしても、標準偏差が上記の許容範囲の1/6程度だったら、私は乗らない、と言っているのです。1/12 程度だったら安心して乗りましょう、ということです。これが「何でも±3σじゃない」の意味です。統計的品質管理の概念や手法から外れた話じゃないと思います。

全文を見る
すると、全ての回答が全文表示されます。
回答No.7

複数の会社の製品開発をしております。 自分の私見ですが、 ●個人的には、3σ の 3 には(学術的な)意味はないと思います。 ●日本の工業会では、通常の工業製品では3σを使うことが多く、  命にかかわるもの (医療機器や、自動車の安全装置(エアバック)など)  では、6σなどを使っている企業もありました。  (あるいは、3σとした上で安全率を2倍にしたり・・・ こうなると   もう数学的には全く意味を成しません) ●結局、製品開発時や量産時に、故障もそこそこ少なく経済性もいい  バランスで 3σ が選ばれて、工業界では半ば標準化している  とう風に理解しています。

全文を見る
すると、全ての回答が全文表示されます。
回答No.6

#4です。 #5さんと議論するつもりはありませんが、 #5さんは、多分わかっているのに、質問にたいする私の回答にたいして、混乱させているので、補足しておきます。 正確な学問上は、ポアソン分布ではなく正規分布といえばよかったのでしょうが、分散に対してデータ数が少ない時はポアソン分布になり、充分多くなれば正規分布になります。実際の世界ではデータ数が十分に多くない場合が多いのでポアソン分布を引用しただけです。また、ポアソン分布であっても正規分布に近似出来ます。  飛行機の事故の例は、そんなのにつかわないと言っているだけです。  3σなんか使うわけないじゃないですか。  5σだの6σだのに何の意味があるのでしょうか、だいたいどのようなデータの集団を想定して言われているのでしょうか。

全文を見る
すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.5

#3です。 #4の方は、ポアソン分布を例に挙げられましたが、この分布は非対称であって、±3σは意味をなしません。自由度が非常に大きければ意味があるといえますが、その場合は、近似正規分布として扱われるからです。ポアソン分布本来の性質の中には、±3σ←→99.7%というものはありません。 飛行機の例はふさわしくない、と言われますが、正規分布で判定を行う場合、もし人命に関わるようなことであれば、3σにこだわるべきでなく、5σとか6σという基準もありうる、という意味で申し上げたものであって、大いに関係があります。3は、常識の数であって、学問的に導かれた数ではない、ということを強調しておきます。

全文を見る
すると、全ての回答が全文表示されます。
回答No.4

3σには意味があります。 ばらつきがあるデータをたくさん集計するとポアソン分布をなします。 この分布は、中心値に近いところはデータがたくさんあり、離れていくと急激に下がりそしてまただんだん緩やかにデータ数が減少していきます。 3σというのは、±3σの中におさまるデータが全体の97.7%であるということで、ばらつきのほとんどのデータが治まると共に、そのあたりのばらつき以降は発生確率が非常に低い範囲となります。(ここが重要)  品質管理などばらつきを管理する時、あるデータが発生した時にそのデータが正常なばらつきで発生したものか異常な状態で発生したかの判定が必要になります。その目安として、±3σを超えたデータは正常なばらつきではなく異常なデータとして判定できるだろうという値になります。 #3の方が言われているような、飛行機が落ちる確立などに使う値ではありません。  

全文を見る
すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

私は、3σの"3"には、学問的な意味はまったくないと思っています。 ごくごく平凡な常識として、99.7%なら、ほぼ全部と考えていいんじゃない?といった程度のものです。もちろん、検討の対象となる問題によります。 「この飛行機は大丈夫です。99.7%は墜落しません。」と言われたら、あなたは乗りますか?

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 確率・統計の問題についての質問です。

    問題:「確率変数Xは、平均50、分散9の正規分布に 従うとする。次の条件を満たすCを求めよ。」 ・P(50-C<X<50+C)=99.7% 手持ちの回答では、「Xを標準化した確率変数をZとすると、 Zは標準正規分布に従う、そして今、標準正規分布において 確率が99.7%になるのはZが+-3σの範囲である。 よって、C/σ=3からC=9となる」(σ:標準偏差) ここで私が疑問に持ったのはなぜ?Zの範囲+-3にσを かけるのでしょうか?いま分散が9ということはσは3ですよね? しかし、3のままで式を変形していくと、C=9にはならない と思います。なぜσをつけるのでしょうか? そこのところがわかりません。 どなたか教えてください。 よろしくお願いします<(_ _)>。

  • 標準偏差について

    工程管理を定量的に評価するためにCpkとCp値をもって行っていますが、疑問を感じております。 正規分布しているデータにおいて標準偏差σを算出し、ばらつきを見る。±σであれば68.27、±2σであれば97.45、±3σであれば99.73% データが集約されるとのことですが、実際この数値はどのように算出されたのですか?もう一点、Cp=1は99.73%、Cp=1.33は???(データのばらつきは多分8σ、)Cp=1.67は???(データのばらつきは多分10σ)できれば計算方法についても どうかよろしくお願いします。

  • 質量がばらついているサンプルから30個抜き出したときの合計質量について

    質量のばらつきの分布は以下の通りです。 範囲下[g] 範囲上[g] 範囲の発生確率    -∞  ~  0.242   0.00001472 0.242  ~  0.244   0.00036441 0.244  ~  0.246   0.00489412 0.246  ~  0.248   0.03503498 0.248  ~  0.25    0.13410668 0.25  ~  0.252   0.27521241 0.252  ~  0.254   0.30327643 0.254  ~  0.256   0.17949719 0.256  ~  0.258   0.05699261 0.258  ~  0.26    0.00968488 0.26  ~  0.262   0.00087813 0.262  ~  0.264   0.00004234 0.264  ~  +∞    0.00000110 表の通り、1個抜き出すのであれば確率は分かっています。 (正規分布からEXCELのNORMDIST関数で計算) 知りたいのは30個の合計重量が、 0.25×30 ~ 0.254×30、つまり、7.5 ~ 7.62に収まる確率です。 1個の重量が0.25~0.254に収まる確率は、 上の表から、0.57848884と分かりますが、 単純にこれを30乗すると、 7.393×10^-8 という小さい確率になってしまいます。 重要なのは合計重量なので、 例えば0.249が1個混じっても、0.255が1個バランスよく混じれば、 相殺されて、適合する重量になると思います。 これを含めて計算する方法はあるのでしょうか? 実際に30個抜き出す実験をして、 確率を求めるしかないのでしょうか? ちなみにサンプルを抜き出す母数は4万個程度です。 何卒よろしくお願いいたします。

  • 誤差分布について

    確率誤差とは50%の確率で生じる誤差の範囲のことですよね。 標準偏差をσとすると ε=0.6745σ で求められます。 ここからが本題で、 誤差分布の式および標準正規分布 上側分布表より 誤差が約30%の確率で生じる範囲はどのように求めれば良いのでしょうか。教えてください。

  • 勉強してるのですが、結局、分散の意味がわかりません。

    勉強してるのですが、結局、分散の意味がわかりません。 分散は平均値からのばらつきを示しますので、値が大きければ、分布が大きく、小さければ分布が平均値付近に集中していることを示します。 とあるのですが、値が大きいというのはどの程度を示しますか? いい例が思いつかなかったのですが、 (2 3 5 5 5 7 8 9 10 100) では、分散は801.04ですが、これは大きいほうでしょうか? また、これ以外にもわかりやすい例があれば教えてほしいです。 特に、クラスのテストの平均点・血液型の分布 などを知りたいです。 経済学部一回生のものですが、いまいちわからなかったので質問しました。 また、標準偏差はバラツキをあらわす目安で たとえば製品の長さを測定した結果、40、50、60、70、80cmだったとします。 この場合の標準偏差は14.1で 14.1cmのバラツキがあるということだと思いますが、 このバラツキというのはどこを基準としたバラツキなんでしょうか? 長さはそれぞれ10cmずつしか違いませんし・・・ 中央値からのバラツキなんでしょうか? これももっとわかりやすい例とかあればお願いします。

  • 標準偏差の評価において妥当なデータ数は幾つか?

     標準偏差や分散などのデータのばらつきを調べる場合、評価の対象にするデータ数が多い程、その母集団の性質に近くなります。しかし、評価するデータ数が2個では、それから標準偏差を求めても、それが母集団の性質を表す数値とは言い難いです。評価するデータ数が幾つ以上であれば、その標準偏差や分散が意味のある値となるのでしょうか?一般的に。

  • ワイブル分布の標準偏差

    統計初心者です。 ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか? 平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?) よろしくご教授願います。

  • 正規分布へのfitting

    ある実験データがあり、正規分布に近い形をしています。しかし近いとはいえ、少々ズレているため分散と平均値を求め正規分布の曲線を実験データに重ねて描くと、、、なぜか大幅にずれてます。原因は、平均から大きく離れたところにデータが少ないとはいえポツポツとあり、分散が大きくなるからです(平均値はほぼ正しい値と思われます)。 分散を求める際に正規分布おかまいなく求めるため過大になるのかと思い、正規分布にfittingしようと考えました。つまり最小二乗法により実験データに近い正規分布を求め、分散を求めるのです。 この方法は意味ありますか?おそらく太古の昔から用いられてるような誰でも思い付く方法と思いますが。。。また、実際に計算する場合、エクセル等で関数は用意されてますか?それともlogを取り2次関数に展開しfittingする必要がありますか?

  • 標本分布について

    問題 確率変数Xはある株式の利回り(%)、平均3、分散10の正規分布N(3,10)に従うものとする。株式投資が損となる確率を求む 答え σ=√10=3.126であるから、条件X<0はZ<-0.949となり、P(X<0)=P(Z<-0.949)=0.329である 正規分布表を見ると、0.171となっており、答えとまったく違います。 0.329がどういう計算で出た数値なのでしょうか?

  • 基礎統計の問題なんですが・・・。

    基礎統計の問題で、参考書を読んでもなかなかできない問題があって 苦しんでいます。 もしわかるかたがいたら、おしえていただけませんか? 正規分布N(50,10)を表す(確率密度関数の)グラフと 正規分布N(50,20)のグラフを書き、分布形の特徴の違いを示し 分散の意味を簡単に説明せよ。 こんな問題なんですが、 応えていただける範囲で教えていただけないでしょうか? よろしくお願いします><