• ベストアンサー

統計の標準化について教えてください!

大学院の学生です.データの標準化のことで教えていただきたいのですが,例えば1から10まであるデータをエクセルで標準化するにはどうすればよいのでしょうか.  また,標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか.  さらに,この標準化されたデータの統計学的有意差を見ることはできるのでしょうか?  教わったまま時が過ぎてしまい,理解出来てない部分が多いです. ですが教科書などを見ても簡単な表記(データ-平均値÷標準偏差)位で詳細がわかりません.先生に聞いても良くわかりません.長々とずうずうしくすみません,教えていただけましたら幸いです.宜しくお願いいたします.

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

 まず標準化についてですが、Excelには=standardize()という関数が用意されています。使い方は =standardize(X,平均,標準偏差) です。  データを標準化するのは、「平均が0、標準偏差が1になるように単位をそろえる」ためです。つまり、データを標準化することによって、標準正規分布を用いた推定や検定ができるというわけです。

その他の回答 (2)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 標準化の計算方法は、他の方が書かれていますので、まず標準化の目的を、入試を例にして。  入試の選択科目、例えば数学と国語が選択であるとします。国語の平均点は70点、数学が25点だと、国語を選択したほうが有利になることは明白です。これを補正するのに、平均値と標準偏差を用いた標準化が利用されます。 すなわち、どちらも正規分布するように補正するわけです。そうすると、得点分布を同じように変換できるので、選択科目による有利不利を解消できます。 >標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか。  正規分布に変換するので、その値から、何番目を推定できます。  すなわち、偏差値の場合は、平均を50点、標準偏差を10点なるような正規分布に変換するので、100人中、偏差値70の人は2~3番目、60点の人は16番目、50点の人は丁度平均点なので、50目と推算されます。 >この標準化されたデータの統計学的有意差を見ることはできるのでしょうか? 有意差の証明は、検定という作業です。検定は、平均値に差があることを証明するt-検定、分散の相違を調べるF検定が多用されますが、標準化すると平均値も分布同じになるので、有意差を出すことは数学的に不可能であり、検定は意味がありません。  通常「集団が異なるので、差がある」と証明します。「集団AとBに有意差があるか」というのは、データーを標準化する必要はありません。そのままのデータで可能です。    個々のデータで有意差があるというのならは、棄却検定に相当します。すなわち、そのデータは、有意とがあるので、その集団と考えるべきではなく、偶然であり、別の集団のデータなので、棄却してもよいと判断します。  偏差値なら、偏差値70より上の人と30以下の人を足すと、全体では正規分布の5%以内に入ります。5%以内の場合、危険率5%以下として、その集団ではない、すなわち、全体からは出来が非常に良いまたは悪いので、有意差がある、というように表現可能です。が、あまりそのような表現はしません。

kumanori
質問者

お礼

皆様丁寧なご返答ありがとうございました. 大変勉強になりました.

  • kazu-si
  • ベストアンサー率44% (39/88)
回答No.2

標準化されたデータとは偏差値のプロ版と考えていいのでは? 標準化されたデータを10倍して50を加えたものが偏差値です。 標準化   偏差値   0      50     平均値 2      70     正規分布で考えると上位約2% -2      30 正規分布で考えると下位約2% 個々のデータで統計学的有意差をかんがえるという話は、あまり聞いたことがありません。統計学的に利用するとしたら異常値の判定など位かな?

関連するQ&A