• ベストアンサー

標準化とは?

標準化というと、平均を0、標準偏差1とする と説明されています。 そして正規分布にしたがって計算することを学んでいます。 例えば平均170センチであれば 185-170、それをσで割る公式があります。 平均を0とするのに170で引く行為は理解できます。 しかしそこから導いた値15をσで割るということがどうしても理解できません。 割るという行為は 1あたりの平均を出す と理解していますが・・・・ σで割るということがしっくりきません。 どなたか宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.3

> 割るという行為は 1あたりの平均を出す と理解していますが・・・・ 計算は、「意味」で考えちゃ駄目です。 恣意的な解釈は、誤解や混乱のもとにしかなりません。 定義を確認して、淡々と計算しましょう。 正規分布 N(μ,σ^2) の定義は、確率密度関数が ( 1/√(2πσ^2) )・e^( -(x-μ)^2 / (2σ^2) ) であることです。確率変数 X が、この確率密度を持つとき、 計算してみると、X の平均は μ、標準偏差は σ になります。 そのような X に対して、Z = (X-μ)/σ と置くと、 Z は確率密度関数 ( 1/√(2π) )・e^( -x^2 / 2 ) を持つ確率変数になります。 つまり、Z は正規分布 N(0,1) に従う訳です。 N(0,1) のことを「標準正規分布」と呼ぶのでした。 単純な変数変換の話です。 解釈論や哲学論の出番はありません。

gklkjoo
質問者

お礼

ご回答ありがとうございます。すいません結局よくわかりませんでした。 もう一度改めて質問させていただきます。失礼いたしました。

その他の回答 (4)

noname#221368
noname#221368
回答No.5

 #3,4さんの言うように、淡々とやるのが安全ですが、それを前提にするなら、#2さんへの補足をしても良いかなと思いました。  工学系では、標準化と正規化はけっこうごっちゃにして使われます。σで割るのは、(数学で厳密に定義されたものではない)正規化の考えの一種とも考えられます。  例えば全然別の物理機構による現象の測定値頻度が、けっこう似てると感じるなんて事があります。そういう場合、生の度数分布を使用してると比較しにくいですが、平均シフトした測定値をσで割って「無次元化する」というのは、一つの手です。  その結果、度数分布が本当に似ていたら、物理機構に関わらない数学的理屈が成り立ってるのではないか?、などと疑います。要は無次元化すると、見やすく(比較しやすく)なる、という事です。  一番身近な例は、相対誤差です。なぜ相対誤差で語るかを考えれば、正規化の意味はわかるはずです。  上記は単純な考えだけに、適用範囲は広いです。  無次元化ではないですが、「単位当たりの」で定義される、ヤング率や電気低効率などはみな、上記の発想で考えられた物質定数です。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.4

確率密度関数の変換も、書いときましょうか。 Z = (X-μ)/σ (ただしσ>0) と置くと、 X ≦ t は Z ≦ (t-μ)/σ と同値ですから、その確率について Prob(X ≦ t) = Prob(Z ≦ (t-μ)/σ) が成り立ちます。 X が正規分布 N(μ,σ^2) に従うなら、 Prob(X ≦ t) = ∫[-∞,t]( 1/√(2πσ^2) )・e^( -(x-μ)^2 / (2σ^2) )dx. Z の確率密度関数を f(z) と置くと、 Prob(Z ≦ (t-μ)/σ) = ∫[-∞,(t-μ)/σ]f(z)dz. ∫[-∞,(t-μ)/σ]f(z)dz = ∫[-∞,t]( 1/√(2πσ^2) )・e^( -(x-μ)^2 / (2σ^2) )dx の両辺を t で微分すると、 f( (t-μ)/σ )/σ = ( 1/√(2πσ^2) )・e^( -(t-μ)^2 / (2σ^2) ). 両辺を σ 倍して、変数を w = (t-μ)/σ で書き換えると、 f( w ) = ( 1/√(2π) )・e^( -w^2 / 2 ). この式は、f が標準正規分布 N(0,1) の確率密度関数 であることを示しています。

回答No.2

>例えば平均170センチであれば >185-170、それをσで割る公式があります。 個々のデータに対してこの処置を行い、平均と 標準偏差を求めたらどうなるのかを考えてみる べきでしょう。

  • info22_
  • ベストアンサー率67% (2650/3922)
回答No.1

>しかしそこから導いた値15をσで割るということがどうしても理解できません。 >割るという行為は 1あたりの平均を出す と理解していますが・・・・ >σで割るということがしっくりきません。 標準偏差1の分布に換算する為です。 平均を出すためではありません。 標準偏差を1にして、平均をゼロの分布に変換すれば、標準正規分布表が利用できます。

関連するQ&A

  • 標準得点はなぜ平均0,分散1になるのか

    標準得点がなぜX~N(0,1)の分布になるのかが理解できません。 なんとなくですが、計算式 "(X-平均)/標準偏差"から、標準得点とは 「"平均から値Xの差"が標準偏差のどれくらいの割合か」 という意味だろうなぁと理解してます。 しかし、なぜこの計算式の結果が、平均が0、標準偏差が1の分布になるのでしょうか?

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • ワイブル分布の標準偏差

    統計初心者です。 ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか? 平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?) よろしくご教授願います。

  • 標準偏差について

    ある正規分布(標準偏差a)に従う集団からある正規分布(標準偏差b)に従う集団を引いたもの(または足したもの)の正規分布の標準偏差cは、aとbを用いてどのように表せるのでしょうか? 確か数式があったと思うのですが、ど忘れしました。 平均はただ足しただけだったと思うのですが、 標準偏差は足してルートとったりとかしてたような気が… ネットで調べてもうまく見つからないので、 覚えている方がいればお願いします。 稚拙な説明で申し訳ありません。

  • 標準偏差について教えてください。

    標準偏差について教えてください。 統計初心者です。正規分布するとわかっている母集団があって、ある値がその母集団で標準偏差がいくつなのかを知りたいと思っています。母集団は平均値、1.5SDの値はわかっていますが、それ以上はわかっていません。 初心者のため、簡単に教えていただけるとうれしいです。お願いいたします。

  • 統計学?

    初めて投稿します。まともに勉強もしないで生きてきて全然わからない問題あります。 Aの測定値は、平均値μ1、標準偏差のα1の分布 Bの測定値は、平均値μ2、標準偏差のα2の分布 Aの測定値の分布とBの測定値の分布から1つずつの値を抜き取ったとして Aの測定値-Bの測定値という値を計算すると、その分布は正規分布する。 正規分布の平均値と標準偏差は下記のとおりである。 平均値μ=μ1-μ2である。なぜこうなるのかを記述せよ。 さらに標準偏差を導きなさい。 言葉の意味も含めて教えていただけるとうれしいです。よろしくお願いいたします。

  • なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。

    なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。 標準正規分布表がそうだから、と言えば終わりですが。 それより根本的な話で。 この値は、どうやって決める事ができたのですか? 観測による当てはめ、なのか、理論的な計算、なのか。。。。 根拠を知りたいです。 文献も教えていただけると助かります。

  • 平均値、標準偏差、幾何平均、幾何標準偏差の推定

    数学素人でさっぱり意味が分かりません。 分布なのですが、一部書き込みます。 A  累積分布  確率密度 1   0.0009329 0.0009329 2  0.0012776 0.0003447 4  0.0023306 0.0010530 6  0.0040988 0.0017682 8  0.0069518 0.0028531 10  0.0113821 0.0044303 ~   ~     ~ 28  0.4085144 0.0898605 30  0.5000000 0.0914856 32  0.5882070 0.0882027 ~   ~     ~ 68  0.9995101 0.0002532 70  0.9996741 0.0001640 80  0.9999535 0.0002795 100 0.9999989 000000453 Aを正規分布で近似した場合、平均値と標準偏差の推定 Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定 エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

  • 平均値と標準偏差から確立密度関数(曲線)を描く方法

    確立密度からその平均値と標準偏差を求めると正規分布曲線を描くことが可能ですが、同じように平均値と標準偏差を使ってスチューデントt分布やラプラス分布、コーシー分布曲線を求めることは可能なのでしょうか? 現在、確率変数とその確立密度の値はあるのですが、正規分布には乗らないため別のフィッティング関数を探しています。

  • 標準偏差の問題です

    平均値U=10、標準偏差α=2となる正規分布で、任意に取り出した1つが8と16 との間に入る確率を標準正規分布表より求めなさい。