- ベストアンサー
統計学の質問です
『高校数学でわかる 統計学』という本を読んでいるのですが、 標本集団の標準偏差S_Xについて、 ==== 標本の大きさ(データ数)をnとするとき S_X = 1/n Σ{x_i - E(X)}^2 (※Σは、i=1からnまで) です。 ==== と書いてあるのですが、前のページを見ても、 (私の見落としがなければ)それらしきものは書いておらず、 どのような考えからこの式(定義?)が生まれるのかがわかりません。 よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
ここで書かれている S_X は、E(X)を標本集団の平均値としたとき 標本集団{ x_i (i=1...n)}が平均 E(X) からどれだけ離れているかという”ばらつきの度合い” を表しています。 {x_i - E(X)}は各標本と平均値にどれだけ開きがあるかを表していますが、 これは正にも負にもなります。 なので、これらをΣでそのまま足してしまうと正負の値が相殺し合って、 本来平均からの差があったにも関わらず、結果として小さな値になり得ます。 これを防ぐために、あらかじめ{x_i - E(X)}を2乗して正の値にしておけば、 差分が大きい場合には足し上げたとき必ずS_Xは大きな値になります。 そしてこのS_Xが大きいほど標本のばらつきが大きいということを意味します。 ちなみに、ここで書かれているS_Xは「分散」と呼ばれるもので、 「標準偏差」はこの分散の平方根をとったものになります。 また分散のままだと測定単位が変わるため、 平方根をとることで測定単位を戻していることになります。 (分散だと、{x_i - E(X)}^2のように2乗しているので、 x_iの単位(メートルとかグラムとか)も2乗されていることになりますよね?)
その他の回答 (1)
- eclipse2maven
- ベストアンサー率32% (33/101)
正規分布が 平均と標準偏差で決まるからです。 正規分布を見つけたことが、ガウスの大きな発見でしょう。ガウス分布とも言われますから。
お礼
ありがとうございます。
お礼
ルートが抜けていたということですか。 式の意味も、恐らく理解できました。 ありがとうございます!