• ベストアンサー

統計の標準化について教えてください!

大学院の学生です.データの標準化のことで教えていただきたいのですが,例えば1から10まであるデータをエクセルで標準化するにはどうすればよいのでしょうか.  また,標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか.  さらに,この標準化されたデータの統計学的有意差を見ることはできるのでしょうか?  教わったまま時が過ぎてしまい,理解出来てない部分が多いです. ですが教科書などを見ても簡単な表記(データ-平均値÷標準偏差)位で詳細がわかりません.先生に聞いても良くわかりません.長々とずうずうしくすみません,教えていただけましたら幸いです.宜しくお願いいたします.

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

 まず標準化についてですが、Excelには=standardize()という関数が用意されています。使い方は =standardize(X,平均,標準偏差) です。  データを標準化するのは、「平均が0、標準偏差が1になるように単位をそろえる」ためです。つまり、データを標準化することによって、標準正規分布を用いた推定や検定ができるというわけです。

その他の回答 (2)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 標準化の計算方法は、他の方が書かれていますので、まず標準化の目的を、入試を例にして。  入試の選択科目、例えば数学と国語が選択であるとします。国語の平均点は70点、数学が25点だと、国語を選択したほうが有利になることは明白です。これを補正するのに、平均値と標準偏差を用いた標準化が利用されます。 すなわち、どちらも正規分布するように補正するわけです。そうすると、得点分布を同じように変換できるので、選択科目による有利不利を解消できます。 >標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか。  正規分布に変換するので、その値から、何番目を推定できます。  すなわち、偏差値の場合は、平均を50点、標準偏差を10点なるような正規分布に変換するので、100人中、偏差値70の人は2~3番目、60点の人は16番目、50点の人は丁度平均点なので、50目と推算されます。 >この標準化されたデータの統計学的有意差を見ることはできるのでしょうか? 有意差の証明は、検定という作業です。検定は、平均値に差があることを証明するt-検定、分散の相違を調べるF検定が多用されますが、標準化すると平均値も分布同じになるので、有意差を出すことは数学的に不可能であり、検定は意味がありません。  通常「集団が異なるので、差がある」と証明します。「集団AとBに有意差があるか」というのは、データーを標準化する必要はありません。そのままのデータで可能です。    個々のデータで有意差があるというのならは、棄却検定に相当します。すなわち、そのデータは、有意とがあるので、その集団と考えるべきではなく、偶然であり、別の集団のデータなので、棄却してもよいと判断します。  偏差値なら、偏差値70より上の人と30以下の人を足すと、全体では正規分布の5%以内に入ります。5%以内の場合、危険率5%以下として、その集団ではない、すなわち、全体からは出来が非常に良いまたは悪いので、有意差がある、というように表現可能です。が、あまりそのような表現はしません。

kumanori
質問者

お礼

皆様丁寧なご返答ありがとうございました. 大変勉強になりました.

  • kazu-si
  • ベストアンサー率44% (39/88)
回答No.2

標準化されたデータとは偏差値のプロ版と考えていいのでは? 標準化されたデータを10倍して50を加えたものが偏差値です。 標準化   偏差値   0      50     平均値 2      70     正規分布で考えると上位約2% -2      30 正規分布で考えると下位約2% 個々のデータで統計学的有意差をかんがえるという話は、あまり聞いたことがありません。統計学的に利用するとしたら異常値の判定など位かな?

関連するQ&A

  • 統計 基準値の標準偏差はなぜ1か

    統計の勉強をしていて、標準偏差とはデータの ばらつき具合、分散と書かれていました。 平均から比べてどのくらい差があるかという事は 理解しました。 しかし基準値を勉強していて、 本には基準値の平均は必ず0である。標準偏差は 必ず1であると書かれています。標準偏差は データのばらつき具合なのに、なぜ基準値の元では すべての標準偏差は1になるのでしょうか?

  • 統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本

    統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本平均9.1(標準偏差2.3、n=25)を平均値検定した結果、z=2.43で有意水準5%で有意差ありとなっていました。ところが、それぞれの母平均を区間推定すると95%信頼区間で推定幅に重なりを持ってしまいます。もし、有意差があるなら、重なりを持たないと理解していますが…。当方の計算法の誤りまたは計算違いでしょうか?計算方法は、例えば前者の場合、7.5±1.96×不偏分散の平方根/28の平方根でやってます。

  • 統計学問題【1】

    統計学の問題の解答をお願いします。大学の講義で統計学を学んでいます。大体の内容は、理解出来たのですが、一部分だけわからない箇所がありました。お願いします。 ある製造機で、先週に製造された部品200個の重さの平均は530g、標準偏差は6gであった。今週に製造された部品180個の重さの平均は528g、標準偏差は6gであった。この結果から、それぞれの週に製造された部品の平均重量に差がないと考えてよいか。有意水準5%で検定せよ。 この問題だけ、わかりません。お願いします。

  • 統計学の問題教えてください

    統計学の問題がわからないので教えてください。 平均勉強時間(分) 男子36.2 女子40.0 全体37.3 標準偏差       男子50.1 女子47.2 全体48.7 人数          男子520 女子457 全体977 以上より、平均勉強時間に男女差があるといえるか、t検定(両側検定)を行うという問題です。 有意水準は5%です。

  • 統計処理の仕方

    異なる二種類のカスタードクリームの色差(明度・彩度・色相)を測ったデータの統計処理について質問です。 例えば、明度でのデータを処理するとして、二種類のカスタードクリームで測定されたデータ(例えばそれぞれ30データづつ)の平均値と標準偏差を計算して平均値±標準偏差を求めて、「母集団の確立変数の68%が入ります」となると思うのですがどうでしょうか? さらに二種類のカスタードクリームの平均値の差をとって、それが0.05より小さいからp<0.05なので有意差があるから危険率5%とやれば、色差のデータ解析できますが、どうでしょうか? 難しくて困っています。どなたか、お分かりになられる方、どうか教えてください

  • どう検定すればよいか(具体的な統計データ有り)

    統計素人です。 論文作成にあたり、下記のとおりのデータがあります。 1,ある経験をしていないグループAと、したグループBでは、対象物Cに対する理解度は違うのか?を、ある態度尺度を用いて得点化しました。 2,Aの人数 13人    平均得点 59.38    分散 86.26 標準偏差 9.29 Bの人数 32人 平均得点 68.47    分散 55,61 標準偏差 7,46      です。 これら2つのグループ間に、統計的に理解度の有意な差があるのか検定するには、どのような方法をとればよろしいのでしょうか? まったくの素人で本当に申し訳御座いませんが、ご教授よろしくお願いいたします。

  • 統計学(標準偏差)について教えてください!

    標準偏差・平均・N数・合計のわかっているデータが30件あります。 そのデータを使用して30件全体の標準偏差を導きだすことは可能なのでしょうか?

  • 統計学問題【2】

    【2】統計学の問題の解答をお願いします。大学の講義で統計学を学んでいます。大体の内容は、理解出来たのですが、一部分だけわからない箇所がありました。お願いします。 2つの銘柄のタバコAとBのニコチン含有量について調べた。銘柄Aのタバコ10本について平均27.0mg、標準偏差1.7mgであり、銘柄Bのタバコ7本については平均29.3mg、標準偏差1.9mgであった。この2つの銘柄のタバコのニコチン含有量に差があるか。有意水準5%で答えよ。 もう1つ、同じような質問をお願いします。解答いただけたら幸いです。

  • 平均値、標準偏差、変動係数についての質問です

    例えば0.85,0.8,0.74,0.66,0.46の平均値と標準偏差(ばらつき)は 0.7±0.2で変動計数c.v値は21% 次に0.68,0.54,0.46,0.26,0.23,0.2の平均値と標準偏差(ばらつき)は 0.4±0.2で変動計数c.v値は49% でよいのでしょうか? あと上の二つの例の関係は統計的に有意差が観察されるといえるのでしょうか? どなたかご教授お願いします。

  • 有意差検定

    個々の計測値のわかっているA群(83.3、78.5、94.7、・・・・・)と平均値、標準偏差のみわかっているB群(80.0±3.0)で、統計学的有意差を検定する方法はありますでしょうか。用語の使い方も不正確かもしれませんが、すみませんがよろしくお願い致します。