• ベストアンサー

基準値からのばらつき

平均からのばらつきを調べるためには標準偏差というものがありますが 平均ではなくある基準値からのばらつきを調べたいのですがその場合も 標準偏差の計算式を応用でできるのでしょうか。 例)A、B、Cという数値がある場合 標準偏差 (A-平均)^2 (B-平均)^2 (C-平均)^2 の平均の平方根   ↓ 基準値Dからのばらつき (A-基準値D)^2 (B-基準値D)^2 (C-基準値D)^2 の平均の平方根 という式は成り立つのでしょうか? 

質問者が選んだベストアンサー

  • ベストアンサー
  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

成り立つとか成り立たたないとかの話ではなく、 「基準値からのバラつき」なるものを そのように定義したいってことでしょう? すればいいんじゃないですか? 誰も止めません。 ヒルベルトなんか、直線をビアマグと呼んでました。 …とかは置いといて、 n 個のデータ xi (i=1,2,…,n) の平均を m とすると、 基準値 D との差の 2 乗和は、 Σ(xi-D)2乗 = Σ((xi-m)-(D-m))2乗 = Σ((xi-m)2乗 - 2(xi-m)(D-m) + (D-m)2乗) = Σ(xi-m)2乗 - 2(D-m)Σ(xi-m) + Σ(D-m)2乗 = Σ(xi-m)2乗 - 0 + n(D-m)2乗. 両辺を n で割ると、 (1/n)Σ(xi-D)2乗 = (xiの分散) + (D-m)2乗 となります。 貴方の「バラつき」は、(基準値と平均の差の 2 乗)と分散の和の平方根です。 xi の分散に対して単調増加ですから、 バラつきの指標として使えそうな気はしますね。

その他の回答 (2)

回答No.3

#1です。私に再質問がありましたが、 #2 alice_44さんが見事に証明して下さっていますので、 私から回答するまでも無く、「成り立ちます」。

回答No.1

企業でSQCを推進する立場の者です。 標準偏差と平均との関係 x^2=μ^2+σ^2 を変形すればできるのでは? ちょっと、証明の式を考える必要があると思いますが・・・・ つまりxを、基準点Dを原点とする座標系に写像すれば、 そのまま、変換できると思います。

haruxyz
質問者

お礼

早速のご回答ありがとうございます。すみません。専門用語が 全く分からいないのですが、結論としては私が仮定した考えが 成り立つと考えて良いのでしょうか?

関連するQ&A

  • ボリンジャーバンドの標準偏差の計算方法。

    ボリンジャーバンドの計算方法で良くわからない所があるので教えて頂きたいと思います。計算方法はn日移動平均線を基準とする場合、まずn日の標準偏差を求めます。n日の標準偏差は、n日間の個々の終値からn日移動平均値を引き、それぞれを2乗し、「その数値n日分を合計したものでnを割り」さらに平方根したものがn日標準偏差になります。これにより求められたσ(標準偏差)を、当日移動平均値から加減したものが±1標準偏差です。±2標準偏差を求める場合はσを2倍したものを加減します。という事なのですが「その数値n日分を合計したものでnを割り」という所は、その数値n日分を合計したもの「を」で割るではないのでしょうか?20日目の標準偏差値を求めるため具体的に数字を当てはめてみたいと思います。nは20日、20日目の終値は21,090、移動平均値は19,378、とします。よって21,090-19,378=1713X1713=2,932,656となります。この値のn日分の合計を24,909,236とすると、テキストによる計算では20÷24,909,236=0.000000802915 となり、これを平方根した0.00089606が20日標準偏差となると思います。しかしこれでは値が小さすぎて明らかに間違いだと思います。逆に24,909,236÷20=1,245,462、これを平方根で返してやると1,116となり+2標準偏差は21,610になると思います。でもこの値でも正解と微妙に違うんです。標準偏差の正しい計算方法と、今回示した例の+2標準偏差の値を教えて下さい。宜しくお願い致します。

  • バラツキを考慮して平均を補正したい

    会社でちょっとした統計処理をしていて、 バラツキを考慮して平均を補正するという作業をしたいのでが、、、 なかなかうまくいきませなん。 例1) a1=2, a2=2, a3=2 例2) b1=-1, b2=0, b3=7 例1)a1~a3の平均と、例2)b1~b3の平均はどちらも"2"です。 しかし、例2)はb3だけが突出していて印象的には"2"よりも若干低めの、0~1ぐらいに補正したいのです。 しかし、補正をするための数学的根拠が見つけられないのです(そもそも無いのか?)。 私のつたない知識ですと、バラツキを現す手法としては標準偏差が思い当たりますが、 例1)の標準偏差=0 例2)の標準偏差=3.56 なので、これを利用して何とかならないか、、、などなど考えています。 平均値をバラツキを考慮して補正する、数学的根拠のある方法は存在するのでしょうか。

  • 多項式のバラツキ成分分析方法について

    現在実験での計測値から算出される"A"という項目の値のバラツキが大きく、そのAのバラツキを小さくしたく要因分析をおこなっています。 項目Aの算出方法は、  A=B-C-D  B,C,D:実験での計測値 という関係式で与えられます。 Aのバラツキ:σa Bのバラツキ:σb Cのバラツキ:σc Dのバラツキ:σd とした時、 σaをσb、σc、σdで表すことはできるのでしょうか? 私の考えでは、 A±σa=(B±σb)-(C±σc)-(D±σd) となるので、 σa=√(σb^2-σc^2-σd^2) となると思うのですが、この式ではσc、σdが大きくなるほどσaが小さくなり、事実とつじつま合いません。 単純に下記のように平方二乗和で求めたほうがよいのでしょうか? σa=√(σb^2+σc^2+σd^2) σaがσb、σc、σdの式で表すことができれば、B、C、Dのどの項のバラツキが大きいかが分かり、σaを小さくする小さくするための対策が検討できるのですが・・・ 類似の問題を経験されたことのある方、バラツキ計算方法の知識を有する方、 ご教授お願いします。

  • 基準化したデータより得られた回帰式に新たな説明変数を代入する際の取り扱いについて

    基準化したデータより得られた回帰式に新たな説明変数の数値を代入し、従属変数の数値を計算(予測)する際、その代入される説明変数も基準化されている必要があると思いますが、その基準化の方法はどのように行えばよいのでしょうか? 例えば、サンプル数10、従属変数1、説明変数4というデータセットがあり、全変数を基準化し回帰係数を求めたとします。 得られた回帰式を用い新しいデータの説明変数の数値を代入することにより説明変数の値を予測したいと思います。 この際、この新たなデータも基準化される必要があると思うのですが、基準化する際には回帰係数を求めるために用いた10個のサンプルより計算された各説明変数の平均及び標準偏差を用いて、基準化を行うのでしょうか? 具体的には10個のサンプルから計算された説明変数a,b,c,dの平均がそれぞれ2,4,6,8、及び標準偏差が10,20,30,40であったとします。 新たなデータの説明変数a,b,c,dの値が3,6,9,12であった場合は、それぞれ(3-2)/10, (6-4)/20, (9-6)/30, (12-8)/40の値を計算し、その数値を回帰式に代入するのでしょうか? 長くなってしまい申し訳ありませんが、どなたか詳しい方がいましたら是非教えていただきたくお願いします。

  • 標準偏差について

    下記、アドバイスをお願いします。 前提:標準偏差=データの各観測値と平均との差の2乗の平均を取って、その平方根を取った値。正規化された形で表されたデータのばらつきを示す数値。 1.0.86 2.4.4 3.-0.72 4.0.44 5.1.57 6.1.13 7.-1.70 8.-0.58 上記の平均は、0.86←これは、理解できます。 上記の標準偏差は、1.86←これが、分かりません。 上記の標準偏差に対する比率0.36←これも、分かりません。 標準偏差・標準偏差に対する比率の出し方の指南をお願いします。 宜しくお願いします。

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。

  • 統計 基準値の標準偏差はなぜ1か

    統計の勉強をしていて、標準偏差とはデータの ばらつき具合、分散と書かれていました。 平均から比べてどのくらい差があるかという事は 理解しました。 しかし基準値を勉強していて、 本には基準値の平均は必ず0である。標準偏差は 必ず1であると書かれています。標準偏差は データのばらつき具合なのに、なぜ基準値の元では すべての標準偏差は1になるのでしょうか?

  • 二乗平均平方根(RMS)と標準偏差

    同僚と実験データの解析結果を見ていて混乱してきたので確認させて ください。 タイトルの二乗平均平方根(RMS)と標準偏差に関して。 私の認識は〔http://ja.wikipedia.org/wiki/%E4%BA%8C%E4%B9%97%E5%B9%B3%E5%9D%87%E5%B9%B3%E6%96%B9%E6%A0%B9〕 のとおりなので、平均値が“0”の場合のみ標準偏差と同じ結果になる・・・ なのですが同僚は〔ガウス分布を取るデータ群に対してはRMSと標準偏差 は同じ〕とし平均値が“0”でないデータ群にも当てはまると主張して います。平均値が“0”をとらない場合、まさに“標準偏差”の計算式を 持ってきて〔RMS〕と言い切っております。 ネットを見ると〔http://vrsk.livedoor.biz/archives/50657425.html〕 のように〔RMS=標準偏差〕と言い切っているところもあります。 分野によっては〔RMS=標準偏差〕として扱う分野もあるのでしょうか?

  • 集合部品の工程能力

    数点の部品を組付けた場合の工程能力の算出方法を 教えて下さい。 例えば、5枚の板(a~e)を積み上げていった場合の高さ寸法の工程 能力を出す場合、 a: 板厚規格 1±0.1 平均値 1.02 標準偏差 0.02 Cpk 1.33 b: 板厚規格 2±0.2 平均値 2.05 標準偏差 0.03 Cpk 1.67 c: 板厚規格 3±0.3 平均値 3.13 標準偏差 0.06 Cpk 1.00 d: 板厚規格 4±0.4 平均値 4.12 標準偏差 0.14 Cpk 0.67 e: 板厚規格 5±0.5 平均値 5.21 標準偏差 0.06 Cpk 1.50 と仮定すると、どのようになりますか? 集合部品の規格は二乗和平方根をとり15±0.74とします。

  • 統計 標準偏差について素朴な疑問

    SDについて、標準偏差は、データのばらつきを表す分散に平方根をつけた値である。分散に平方根をつけることによって、データと同じ単位で比較できるのだ。 という理解をしています。 そこで素朴な疑問です。データのばらつきをデータの単位と同じ水準でみたいのなら、わざわざ二乗して平方根つけるなんてめんどくさいことしないで、各データの平均値の差を絶対値で求めて平均値を求めればいいのでは??と思いました。 どんな弊害が出てくるのでしょう?教えてください。