• ベストアンサー

なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。

なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。 標準正規分布表がそうだから、と言えば終わりですが。 それより根本的な話で。 この値は、どうやって決める事ができたのですか? 観測による当てはめ、なのか、理論的な計算、なのか。。。。 根拠を知りたいです。 文献も教えていただけると助かります。

質問者が選んだベストアンサー

  • ベストアンサー
  • puyo3155
  • ベストアンサー率34% (229/663)
回答No.2

うーん、どこから説明すべきか悩むところですが、まず、質問自体が少し間違っていて、おそらく 正規分布において、対象が、平均±標準偏差内に含まれる確率が約68%とはなぜか? という意味ですすめます。まず、正規分布が理解している前提でいうと、 >正規分布の式に、+標準偏差、-標準偏差を当てはめて、確率を計算すればそうなるから・・・・ ということになります。計算自体がわからない場合は、別途質問してください。この意味は、あることを実行すると、平均値に結構近い範囲に、7割ぐらい収まっちゃうもんだよ、ということで感覚に一致しないでしょうか? それではその正規分布は、どう求めたかというと、大雑把にいうと、 >平均値を持つような対象の値を、完全にランダムに発生させた場合の理論的な値を公式化したもの なので、観測ではなく理論値になります。平均値と、標準偏差によって、山の中心と、山のなだらかさが決まるよく知られたグラフになります。 それじゃ、全ての現象が、正規分布に従うのか・・・・ >それは違います。想定する現象が、完全にランダムで、平均値をもつような現象 という前提なので、その前提に近いような現象は、正規分布に近いと仮定して、事象を近似するのですね。よく知られた、テストの成績は、 ・ 平均点は、問題の難易度で、毎回変わる。 ・ 平均点を中心に、どれぐらいのばらつきがあるのかも、毎回変わる。 ・ その2つさえ、考慮すれば、偏差値によって、その人の、相対的実力が図れるだろう。 ということで、偏差値を、合否の難易度の目安にするわけですね。実際には、厳密には正規分布に従わなかったり、昔はしたがっていたが、事象が複雑化して、従わなくなったり、利用する際には、数学的知識以上に、対象とする現象に対して、専門的な知識が必要になります。

その他の回答 (3)

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.4

こんにちは。 >>>観測による当てはめ、なのか、理論的な計算、なのか。。。。 理論的計算です。 そして、それが(たまたま)この世の様々な分布(平均値とばらつき)に当てはめられるということです。 では、簡単な例を挙げましょう。 コイントスをして、表が出たら1点、裏が出たら-1点 そして、それを何回も続けてやったときの合計点を考えます。 1回目終了時 ・1点 確率1/2 ・-1点 確率1/2 2回目終了時 ・2点 確率1/4 ・0点 確率2/4 ・-2点 確率1/4 3回目終了時 ・3点 確率1/8 ・1点 3/8 ・-1点 3/8 ・-3点 確率1/8 4回目終了時 ・4点 確率1/16 ・2点 確率4/16 ・0点 確率6/16 ・-2点 確率4/16 ・-4点 確率1/16 これらの確率は、「二項分布」で表されます。(高校で習います) 実は、これを無限回行ったときの分布が「正規分布」なのです。 当然、正規分布の標準偏差は理論的に計算できます。 そして、 平均値 ± 標準偏差 の範囲に含まれる確率も理論的に計算できて、68%となります。 「理論的」とはいっても手計算は無理なので、コンピュータにやらせます。 その結果の一覧表が正規分布表です。 >>>文献も教えていただけると助かります。 非常に有名なことですので、ネット上にたくさん落ちています。 http://www.google.co.jp/search?hl=ja&q=%22%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83%22+%22%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83%22&aq=f&aqi=g2&aql=&oq=&gs_rfai= なお、 なぜ自然現象から人間の行動、工業製品に至るまで、様々なことが正規分布にしたがうのはなぜか? たとえば、こういうふうに考えてください。 長さがAの短い棒を継ぎ足して、長い棒を作るとしましょう。 ただし実際には、短い棒には、長さ A+t のものと A-t のものがあるとします。 1本のときは、 ・A+t の確率1/2 ・A-t の確率1/2 2本になると ・2A+2t の確率 1/4 ・2A の確率 2/4 ・2A-2t の確率 1/4 3本になると ・3A+3t の確率 1/8 ・3A+t の確率 3/8 ・3A-t の確率 3/8 ・3A-3t の確率 1/8 ・・・・・ 上のほうで見た、何かとそっくりだと思いませんか?

回答No.3

ANo2さんが書かれている通り、 標本が正規分布に従っている場合、標本中の68.26%が平均値±標準偏差の範囲に入る が正しいですね。 >この値は、どうやって決める事ができたのですか? 標準正規分布の確率密度関数が φ(t)=(1/√[2π])exp(-t^2/2) なので、標準正規分布は平均が0、標準偏差1なので、この密度関数を-1~1で数値積分して (1/√[2π])∫[-1 -> 1] exp(-t^2/2)dt =0.6826 を得ます。 ここでは標準正規分布を使いましたが、どんな正規分布でも平均±標準偏差の範囲で密度関数を積分すれば同じ結果になります。平均μ、標準偏差σとして、t=(x-μ)/σの変数変換をすれば、どの正規分布も標準正規分布になるので当然なんですが。

  • proto
  • ベストアンサー率47% (366/775)
回答No.1

>なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。 正規分布の標準偏差は約68.26と決まっているものではありません。 標準偏差として0以上のあらゆる値が考えられます。 正規分布と一言で言っても、平均と分散(標準偏差)を指定してはじめて分布が一つに確定するはずです。 具体的に正規分布N(μ,σ^2)は、μとσ値を決めて確率密度関数を   f(x) = exp(-((x-μ)^2)/(2σ^2))/(σ*√2) と書いてはじめて確定します。 そして、この分布の標準偏差はσです。68.26とは限りません。 標準正規分布ならば標準偏差は決まっていますが、その値は68.26ではなく1です。 (標準偏差が1となるような正規分布に標準正規分布と名前を付けた) >この値は、どうやって決める事ができたのですか? >観測による当てはめ、なのか、理論的な計算、なのか。。。。 観測値から分布を推定する場合には、平均をE(x)として   σ^2 = (Σ{(x-E(x))^2})/(n-1) から、不偏分散を計算します。 これはあくまでも推定値なので、計算から得られた値が妥当なのか、正規分布を仮定することが妥当なのかは別に議論する必要があります。 確率密度関数が、f(x)=exp(-((x-μ)^2)/(2σ^2))/(σ*√2)と分かっている場合には、分散の定義から   V = ∫[-∞,∞]{f(x)*((x-E(x))^2)}dx を計算することで分散の値が決まり、正規分布の場合V=σ^2となります。 こちらは、「f(x)の式が与えられていれば、分散の計算式自体はそれが定義式ですから、その結果も論理的に正しい」としか言いようがありません。観測という考えが入り込む余地はありません。 ただし、観測した事象の確率密度関数をf(x)として妥当なのかどうかはしっかりと議論する必要があります。

関連するQ&A

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • 正規分布の標準偏差

    「質問」 下記の画像に記述されている標準偏差の意味がわかりません。 「質問の経緯」 標準偏差や分散の意味については理解できているつもりです。 下記の画像の赤線の部分には正規分布nの分散は120^2 と書かれています。なので当然標準偏差は120です。 ところが、この後標準偏差を無作為標本の標本数で割っています。 正規分布の標準偏差を無作為標本の標本数で割った数のことを 標準偏差と書いているようなのですが、ここについてよく分かりません。 「質問のまとめ」 正規分布の標準偏差を標本数で割った数字を改めて 標準偏差としている意味がよく分かりません。 教えてほしいです。

  • 標準正規分布表の見方は?

     標準正規分布の表を使って、割合を求める計算をしています。  Zの値に対する値が表に書いてありますが、あの値って、Zを含んだ値でしょうか、それとも、Zを含んでいない値なんでしょうか。  それによって以下や未満というように言葉遣いが微妙に変わってくると思うので。

  • ワイブル分布の標準偏差

    統計初心者です。 ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか? 平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?) よろしくご教授願います。

  • 標準正規分布

    この問いで、なぜ0.2486 + 0.4495 になるのか理解できません。 標準正規分布表を見ましたが、この数字とは違っていました。計算方法を教えてください!

  • 標準正規分布の使い方

    標準正規分布の使い方 「あるデータが正規分布に従うと仮定できる場合、このデータを標準化することで標準正規分布表を用いて確率を求めることができる」とのことですが、あるデータが正規分布に従うかどうか?はどのように判断するのでしょうか? よろしくお願いします。 統計

  • 分布からみた 標準偏差、標準誤差について

    はじめまして。よろしくお願いします。 さまざまな標準偏差、標準誤差についての投稿をみましたが、 分布から見た場合標準偏差と標準誤差とはどのようになるのでしょうか? データのサンプルをとり、それを正規化し、分布にあらわすと正規分布に限りなく近づいてくると思います。(これには中心極限定理がかかわっていると思います) そこでその分布の山の幅(というのでしょうか?)が標準偏差になっていると思うのですが、標準誤差とはどこを表すものなのでしょうか? また標準誤差をあらわすにあたって、中心極限定理を使ってあらわすことはできるのでしょうか?

  • 正規分布の標準化について

    たとえば、Aという母集団で、変数X(あるテストの点数)は、正規分布(μ1、σ1^2)に従うとします。 Bという母集団は、変数Y(おなじテストの点数)は、正規分布(μ2、σ2^2)に従うとします。 ここで、母集団AとBに関わらずテストの点数の偏差値を比べることができるためには標準化を行えばいいわけですよね? Xについては、標準化を行い、(X-μ1/σ1)が標準正規分布(0,1)に従い、 Yについては、標準化を行い(Y-μ2/σ2)が標準正規分布(0.1)に従う。 として、(X-μ1/σ1)と(Y-μ2/σ2)を比較してどちらが偏差値が上か比較することは可能ですよね??? 私の考え(解釈)は合っていますか?どこか間違っていますか? 何か自信がないので訂正などあればアドバイスお願いします。

  • 標準正規分布表

    標準正規分布表でP(70≦Y≦85)=P(-1.44≦Z≦0.722)の値はいくつですか?

  • 正規分布の標本標準偏差

    今、抵抗の正規分布の実験をしています。 ここで、1.6KΩの抵抗200本をLCRメーターを用いてKΩ単位で測り、これをエクセルに入力しました。 これをΩの単位に直すために1000倍して、これらの数値から標本標準偏差を出そうと思っています。 しかしながら、どう計算させても10.59という馬鹿大きい数値が出てきてしまいます。 最初はエクセルのSTDEV関数を用いて算出しましたが、どうにも信用できない数値なので、STDEV関数は使わず標本標準偏差の基本式を少しづつ崩してエクセル上で計算させたのですが、やはり10.59という数値になってしまいました。 試しに、KΩ単位のままで標本標準偏差を出してみたところ、0.01という、Ω単位の時の1000分の1倍の数値しか出てきませんでした。 標本平均は1590Ωと、少し低い値ですが、許容誤差範囲だと認識しています。 エクセルのシートを変えて計算させてもこの数値にしかなりません。 標本標準偏差は1に近いほど良いということですが、どのくらいの数値の範囲に収まるのが理想的なのでしょうか? また、このような経験のある方、こうじゃないか?と思われる方、エクセル、標本標準偏差に詳しい方がいらっしゃいましたら、ご回答をよろしくお願いします。