• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:数値データの正規化)

数値データの正規化とは?正規化された数値と偏差値の関係について

このQ&Aのポイント
  • 数値データを統計的に処理する際には、まず標準偏差を求めます。そして、更なる解析をするためには、数値を正規化し比較する必要があります。
  • 正規化された数値は、平均値が0で、標準偏差・分散が1に設定され、-1から+1の範囲に収まります。
  • しかし、正規化された数値が-1から+1の範囲の値しか取らない場合、偏差値も40から60の値しか示さないため、偏差値だけでは東大合格などの目標を達成することは難しいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • f272
  • ベストアンサー率46% (8035/17170)
回答No.2

> 私が誤った理解をするに至った経緯を推論していただけないでしょうか? 正規化というのにはただ一つのやり方しかないと思い込んだのが間違いのもとです。 正規化とはデータを使いやすい数値に変換するということであってそのやり方にはいくつかあります。 平均値を引いて標準偏差で割るのも一つの方法ですが, 最小値を引いて(最大値-最小値)で割ったり, 中央値を引いて(最大値-最小値)で割ることも考えられるでしょう。 最後のやり方をすれば「正規化された数値は-1~+1の範囲にある」と言えます。

sohchan
質問者

お礼

正規化の方法は「平均値を引いて標準偏差で割る」と思ってましたが、他の方法もあるんですね!おかげさまで知識の幅が拡がりました。正規化の範囲についてはスッキリしない部分が残りはしますが、ここは割り切って頭を切り換えることにします。ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

回答No.3

http://www.google.co.jp/url?sa=t&rct=j&q=%E3%82%AC%E3%82%A6%E3%82%B9%E5%88%86%E5%B8%83&source=web&cd=9&ved=0CIIBEBYwCA&url=http%3A%2F%2Fwww.tokyo-kasei.ac.jp%2F~matsuki%2Fjyugyo%2Fjohokatuyou%2Fjokatu-2.pdf&ei=0SJHT7nbC4eQiAfHtNmuDg&usg=AFQjCNEuvYi1no-z3WUw8JRpMTfanpIkGA&sig2=-CnQLJkMHtxMmdgF_2-lPQ にありますが、標準正規分布 -∞から∞ まで 積分したとき 1 になります。 当然u も同じ値をだけあります。  -∞から∞ の値をとります。

全文を見る
すると、全ての回答が全文表示されます。
  • aokii
  • ベストアンサー率23% (5210/22062)
回答No.1

正規化された数値は-1~+1の範囲にある。 は間違いです。 分布が正規分布に近い場合は、40から60の間に約68.3%、30から70の間に約95.4%、20から80の間に約99.73%、10から90の間に約99.9937%、0から100の間に約99.999953%が含まれる事が知られている。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 正規分布について

    こんばんは 統計初心者でお聞きしたいことがあり質問させていただきました。 正規分布では、95%のものが平均値±標準偏差×2の中に収まるというのはわかりました。 そこでお聞きしたいのが、正規分布を使って「目標値に達していない人が何%いるのか」というのを算出できるかということです。以下の数値を使用する予定です。 目標値2.4 平均値2.61 標準偏差1.69 例えばここで、「2.0以下の人が何%いるか」ということがわかるのでしょうか。

  • 情報処理技術者試験 標準正規分布表

    過去の問題で、どうしても理解できない問題があります。 わかる方、教えてください! 【問】 ある工場で製造している部品の長さの誤差は、平均0mm、標準偏差0.5mmの正規分布に 従っている。誤差の許容範囲が±1mmのとき、不良品の発生率は何%になるか。 標準正規分布法を用いて最も近い値を選べ。 「標準正規分布表」 確立変数  分布関数値  確立密度関数値 0.00-------0.5000-------0.3938 0.50-------0.6915-------0.3521 1.00-------0.8413-------0.2420 1.50-------0.9332-------0.1296 2.00-------0.9773-------0.0540 2.50-------0.9938-------0.0175 3.00-------0.9987-------0.0044 3.50-------0.9998-------0.0009 ア.2.3 イ.4.5 ウ.5.4 エ.15.9 答えは、(1-0.9773)×2×100=4.54% より「イ」 →何故ここで(1-0.9773)となるのでしょうか。 答えの説明では~ U =(許容範囲-平均)÷標準偏差 = 1-0(mm)÷0.5 = 2 「標準正規分布表」より、確率変数2の分布関数値を読み取ると、 0.9773となります。 これは、標準正規分布の半分で、0.5(50%)になりますので、 ±の両方で2倍します。 (1-0.9773)×2×100=4.54% ~以下類似問題でとき方が違うのは?~ ある製品の質量が平均100gで、標準偏差5gの正規分布に従う場合、 ±10gの誤差を超えるものを不良品とすると、不良品の確立は何%か。 U P 0.0 0.500 0.5 0.309 1.0 0.159 1.5 0.067 2.0 0.023 2.5 0.006 上記の場合、 規格品の範囲は、100±10gなので、90~110gとなります。 110gを元に標準化すると、 U=(110-100)÷5=2.0 となり、標準正規ぷんぷ表のU=2.0のPを読み取ると 0.023であり、左右対称であることから2倍します。 0.023×2=0.046 ** お願いします。

  • 正規分布の標準偏差

    「質問」 下記の画像に記述されている標準偏差の意味がわかりません。 「質問の経緯」 標準偏差や分散の意味については理解できているつもりです。 下記の画像の赤線の部分には正規分布nの分散は120^2 と書かれています。なので当然標準偏差は120です。 ところが、この後標準偏差を無作為標本の標本数で割っています。 正規分布の標準偏差を無作為標本の標本数で割った数のことを 標準偏差と書いているようなのですが、ここについてよく分かりません。 「質問のまとめ」 正規分布の標準偏差を標本数で割った数字を改めて 標準偏差としている意味がよく分かりません。 教えてほしいです。

  • 結局その数値 分散,標準偏差の数値は何?

    こんにちは。  計算は公式に入れてなんとかできました。次の問題です。  問題 5人の生徒の英語のテストの得点xである。       50, 70, 90, 80, 50 (点)    (1) 偏差の2乗の平均値を求めることにより,分散s^2を求めよ。    (2) 標準偏差を求めよ。  (1) 平均値 点数総和 340なので,340/5=68(点)     偏差の平方の和 1280なので, s^2=1280/5=256  (2) 標準偏差 s=√256=16(点)  この256とか16点の数値の意味が教科書になく、16点だから何?という ことです。  分散は標準偏差をもとめる段階での数値と理解していいのでしょうか。

  • 正規分布の加法性について

    すいません。統計学初学者です。 正規分布の加法性でわからないことがございます。 1.N(u1, σ1^2) + N(u2, σ2^2) → N(u1 + u2, σ1^2+σ2^2) 2.N(u1, σ1^2) - N(u2, σ2^2) → N(u1 - u2, σ1^2+σ2^2) 正規分布を足しても引いても、 平均はそれぞれ、足されるあるいは引かれますが、 なぜ、分散だけはどちらも足されるのでしょうか? 分散は引くことは出来ないものなのでしょうか? よろしくお願いいたします。

  • 正規分布における平均値175、分散100の問題

    はじめまして。初心者で統計の勉強をしているのですが、わからない問題があって困っています。どなたかご教授おねがします。 測定値が、平均値175、分散100の正規分布にしたがっていたとして、 (1)測定値が185のとき、基準化した後の値はどうやって求めればいいでしょうか?基準化=(測定値-平均値)÷標準偏差 の数式がありますが、分散100の意味がわかりません。 また以下ははどうやって求めればいいでしょうか? (2)測定値が185以上となる確率 (3)測定値が、171≦ 測定値 ≦ 191 の条件を満たす確率 (4)Aさんが、測定値X以下となる確率を求めたら67%だったときのXの値

  • ワイブル分布の標準偏差

    統計初心者です。 ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか? 平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?) よろしくご教授願います。

  • 【統計学入門】正規回路模型について教えてください。

    【統計学入門】正規回路模型について教えてください。 今鳥居氏の「はじめての統計学」という本を頼りに、統計学の試験勉強を進めていますがわからないところがあったので質問いたします。最小2乗推定量の公式があると思いますが、そこから誤差Uiの分散の不偏推定量、^αの標準偏差の推定量、^βの標準偏差の推定量がどういう意味を持ち、なんでこの値が導き出されるのかがわかりません。 正直、厳密な式の証明というよりは、とりあえず使いこなせるようになるために、概略だけで結構ですので御回答頂けると幸いです。 あと不偏推定量というのはそもそもある統計量の期待値が母数と一致すると事をいうと解釈してよろしいでしょうか? 以上質問は2点なんですがよろしくお願いします。

  • 正規分布の標本標準偏差

    今、抵抗の正規分布の実験をしています。 ここで、1.6KΩの抵抗200本をLCRメーターを用いてKΩ単位で測り、これをエクセルに入力しました。 これをΩの単位に直すために1000倍して、これらの数値から標本標準偏差を出そうと思っています。 しかしながら、どう計算させても10.59という馬鹿大きい数値が出てきてしまいます。 最初はエクセルのSTDEV関数を用いて算出しましたが、どうにも信用できない数値なので、STDEV関数は使わず標本標準偏差の基本式を少しづつ崩してエクセル上で計算させたのですが、やはり10.59という数値になってしまいました。 試しに、KΩ単位のままで標本標準偏差を出してみたところ、0.01という、Ω単位の時の1000分の1倍の数値しか出てきませんでした。 標本平均は1590Ωと、少し低い値ですが、許容誤差範囲だと認識しています。 エクセルのシートを変えて計算させてもこの数値にしかなりません。 標本標準偏差は1に近いほど良いということですが、どのくらいの数値の範囲に収まるのが理想的なのでしょうか? また、このような経験のある方、こうじゃないか?と思われる方、エクセル、標本標準偏差に詳しい方がいらっしゃいましたら、ご回答をよろしくお願いします。

  • 統計学

    今、マセマの統計学を自習しているのですが 分散と標準偏差の説明で両方とも分布の広がり具合がわかると書いてあるのですが、これは分散と標準偏差が同じものと考えていいのでしょうか? また正規分布というもはどのように作られたのか簡単に説明をお願いします