• ベストアンサー
  • 困ってます

なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。

なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。 標準正規分布表がそうだから、と言えば終わりですが。 それより根本的な話で。 この値は、どうやって決める事ができたのですか? 観測による当てはめ、なのか、理論的な計算、なのか。。。。 根拠を知りたいです。 文献も教えていただけると助かります。

共感・応援の気持ちを伝えよう!

  • 回答数4
  • 閲覧数5781
  • ありがとう数12

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2

うーん、どこから説明すべきか悩むところですが、まず、質問自体が少し間違っていて、おそらく 正規分布において、対象が、平均±標準偏差内に含まれる確率が約68%とはなぜか? という意味ですすめます。まず、正規分布が理解している前提でいうと、 >正規分布の式に、+標準偏差、-標準偏差を当てはめて、確率を計算すればそうなるから・・・・ ということになります。計算自体がわからない場合は、別途質問してください。この意味は、あることを実行すると、平均値に結構近い範囲に、7割ぐらい収まっちゃうもんだよ、ということで感覚に一致しないでしょうか? それではその正規分布は、どう求めたかというと、大雑把にいうと、 >平均値を持つような対象の値を、完全にランダムに発生させた場合の理論的な値を公式化したもの なので、観測ではなく理論値になります。平均値と、標準偏差によって、山の中心と、山のなだらかさが決まるよく知られたグラフになります。 それじゃ、全ての現象が、正規分布に従うのか・・・・ >それは違います。想定する現象が、完全にランダムで、平均値をもつような現象 という前提なので、その前提に近いような現象は、正規分布に近いと仮定して、事象を近似するのですね。よく知られた、テストの成績は、 ・ 平均点は、問題の難易度で、毎回変わる。 ・ 平均点を中心に、どれぐらいのばらつきがあるのかも、毎回変わる。 ・ その2つさえ、考慮すれば、偏差値によって、その人の、相対的実力が図れるだろう。 ということで、偏差値を、合否の難易度の目安にするわけですね。実際には、厳密には正規分布に従わなかったり、昔はしたがっていたが、事象が複雑化して、従わなくなったり、利用する際には、数学的知識以上に、対象とする現象に対して、専門的な知識が必要になります。

共感・感謝の気持ちを伝えよう!

その他の回答 (3)

  • 回答No.4
  • sanori
  • ベストアンサー率48% (5664/11798)

こんにちは。 >>>観測による当てはめ、なのか、理論的な計算、なのか。。。。 理論的計算です。 そして、それが(たまたま)この世の様々な分布(平均値とばらつき)に当てはめられるということです。 では、簡単な例を挙げましょう。 コイントスをして、表が出たら1点、裏が出たら-1点 そして、それを何回も続けてやったときの合計点を考えます。 1回目終了時 ・1点 確率1/2 ・-1点 確率1/2 2回目終了時 ・2点 確率1/4 ・0点 確率2/4 ・-2点 確率1/4 3回目終了時 ・3点 確率1/8 ・1点 3/8 ・-1点 3/8 ・-3点 確率1/8 4回目終了時 ・4点 確率1/16 ・2点 確率4/16 ・0点 確率6/16 ・-2点 確率4/16 ・-4点 確率1/16 これらの確率は、「二項分布」で表されます。(高校で習います) 実は、これを無限回行ったときの分布が「正規分布」なのです。 当然、正規分布の標準偏差は理論的に計算できます。 そして、 平均値 ± 標準偏差 の範囲に含まれる確率も理論的に計算できて、68%となります。 「理論的」とはいっても手計算は無理なので、コンピュータにやらせます。 その結果の一覧表が正規分布表です。 >>>文献も教えていただけると助かります。 非常に有名なことですので、ネット上にたくさん落ちています。 http://www.google.co.jp/search?hl=ja&q=%22%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83%22+%22%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83%22&aq=f&aqi=g2&aql=&oq=&gs_rfai= なお、 なぜ自然現象から人間の行動、工業製品に至るまで、様々なことが正規分布にしたがうのはなぜか? たとえば、こういうふうに考えてください。 長さがAの短い棒を継ぎ足して、長い棒を作るとしましょう。 ただし実際には、短い棒には、長さ A+t のものと A-t のものがあるとします。 1本のときは、 ・A+t の確率1/2 ・A-t の確率1/2 2本になると ・2A+2t の確率 1/4 ・2A の確率 2/4 ・2A-2t の確率 1/4 3本になると ・3A+3t の確率 1/8 ・3A+t の確率 3/8 ・3A-t の確率 3/8 ・3A-3t の確率 1/8 ・・・・・ 上のほうで見た、何かとそっくりだと思いませんか?

共感・感謝の気持ちを伝えよう!

  • 回答No.3

ANo2さんが書かれている通り、 標本が正規分布に従っている場合、標本中の68.26%が平均値±標準偏差の範囲に入る が正しいですね。 >この値は、どうやって決める事ができたのですか? 標準正規分布の確率密度関数が φ(t)=(1/√[2π])exp(-t^2/2) なので、標準正規分布は平均が0、標準偏差1なので、この密度関数を-1~1で数値積分して (1/√[2π])∫[-1 -> 1] exp(-t^2/2)dt =0.6826 を得ます。 ここでは標準正規分布を使いましたが、どんな正規分布でも平均±標準偏差の範囲で密度関数を積分すれば同じ結果になります。平均μ、標準偏差σとして、t=(x-μ)/σの変数変換をすれば、どの正規分布も標準正規分布になるので当然なんですが。

共感・感謝の気持ちを伝えよう!

  • 回答No.1
  • proto
  • ベストアンサー率47% (366/775)

>なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。 正規分布の標準偏差は約68.26と決まっているものではありません。 標準偏差として0以上のあらゆる値が考えられます。 正規分布と一言で言っても、平均と分散(標準偏差)を指定してはじめて分布が一つに確定するはずです。 具体的に正規分布N(μ,σ^2)は、μとσ値を決めて確率密度関数を   f(x) = exp(-((x-μ)^2)/(2σ^2))/(σ*√2) と書いてはじめて確定します。 そして、この分布の標準偏差はσです。68.26とは限りません。 標準正規分布ならば標準偏差は決まっていますが、その値は68.26ではなく1です。 (標準偏差が1となるような正規分布に標準正規分布と名前を付けた) >この値は、どうやって決める事ができたのですか? >観測による当てはめ、なのか、理論的な計算、なのか。。。。 観測値から分布を推定する場合には、平均をE(x)として   σ^2 = (Σ{(x-E(x))^2})/(n-1) から、不偏分散を計算します。 これはあくまでも推定値なので、計算から得られた値が妥当なのか、正規分布を仮定することが妥当なのかは別に議論する必要があります。 確率密度関数が、f(x)=exp(-((x-μ)^2)/(2σ^2))/(σ*√2)と分かっている場合には、分散の定義から   V = ∫[-∞,∞]{f(x)*((x-E(x))^2)}dx を計算することで分散の値が決まり、正規分布の場合V=σ^2となります。 こちらは、「f(x)の式が与えられていれば、分散の計算式自体はそれが定義式ですから、その結果も論理的に正しい」としか言いようがありません。観測という考えが入り込む余地はありません。 ただし、観測した事象の確率密度関数をf(x)として妥当なのかどうかはしっかりと議論する必要があります。

共感・感謝の気持ちを伝えよう!

関連するQ&A

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • エクセル:平均値と標準偏差から正規分布図を簡単に作成したい。

    あるデータの集まりから平均と標準偏差はエクセル関数を使って出すことが出来ました。 その平均値と標準偏差の値を使って正規分布図を作成したいのですが、どうしたらいいのか分かりません。 何か言い方法がないでしょうか? 作成したいグラフは、Y軸に発生件数、X軸は得点がある棒グラフに、正規分布図を重ね合わせたいと考えています。

  • 正規分布に従わないと標準偏差の算出は向かないでしょうか?

    正規分布に従うとは、平均値の分布が多いという意味でしょうか? 日々変わるデータの点数が凸のような分布でなく、平均値付近が少ない 凹のようなデータの集合だと、標準偏差を算出し正規分布を使い 30%以下の人や70%以上の人を毎日抽出するような用途には 向かないのでしょうか?

  • 標準偏差について

    ある正規分布(標準偏差a)に従う集団からある正規分布(標準偏差b)に従う集団を引いたもの(または足したもの)の正規分布の標準偏差cは、aとbを用いてどのように表せるのでしょうか? 確か数式があったと思うのですが、ど忘れしました。 平均はただ足しただけだったと思うのですが、 標準偏差は足してルートとったりとかしてたような気が… ネットで調べてもうまく見つからないので、 覚えている方がいればお願いします。 稚拙な説明で申し訳ありません。

  • 正規分布に関する問題です。

    正規分布に関する問題です。 あるクラスの身長は、平均値174cm、標準偏差6cmの正規分布に従うとみなせる。このとき、身長が165cm以下の人は全体の約何%になるか求めよ。 という問題なんですが、どうやって計算したらいいかわかりません。教えてください。

  • 標準偏差の問題です

    平均値U=10、標準偏差α=2となる正規分布で、任意に取り出した1つが8と16 との間に入る確率を標準正規分布表より求めなさい。

  • 正規分布の標本標準偏差

    今、抵抗の正規分布の実験をしています。 ここで、1.6KΩの抵抗200本をLCRメーターを用いてKΩ単位で測り、これをエクセルに入力しました。 これをΩの単位に直すために1000倍して、これらの数値から標本標準偏差を出そうと思っています。 しかしながら、どう計算させても10.59という馬鹿大きい数値が出てきてしまいます。 最初はエクセルのSTDEV関数を用いて算出しましたが、どうにも信用できない数値なので、STDEV関数は使わず標本標準偏差の基本式を少しづつ崩してエクセル上で計算させたのですが、やはり10.59という数値になってしまいました。 試しに、KΩ単位のままで標本標準偏差を出してみたところ、0.01という、Ω単位の時の1000分の1倍の数値しか出てきませんでした。 標本平均は1590Ωと、少し低い値ですが、許容誤差範囲だと認識しています。 エクセルのシートを変えて計算させてもこの数値にしかなりません。 標本標準偏差は1に近いほど良いということですが、どのくらいの数値の範囲に収まるのが理想的なのでしょうか? また、このような経験のある方、こうじゃないか?と思われる方、エクセル、標本標準偏差に詳しい方がいらっしゃいましたら、ご回答をよろしくお願いします。

  • 正規分布を使う問題なのですが計算の方針がわかりません。

    正規分布を使う問題なのですが計算の方針がわかりません。 ある会社では製品を10万円で年間の需要量が平均10000個、標準偏差が1500個の正規分布を想定している。1個当たりの原価(変動費)が平均5万、標準偏差が0.5万の正規分布を見込んでいる。固定費は平均1.2億円、標準偏差が2000万である。この事業の利益はどのようになるか? と言う問題です。この問題はそれぞれの正規分布の表を足して計算すればできそうな感じがするのですが良く分かりません。誰か教えてください。

  • 正規分布について

    こんばんは 統計初心者でお聞きしたいことがあり質問させていただきました。 正規分布では、95%のものが平均値±標準偏差×2の中に収まるというのはわかりました。 そこでお聞きしたいのが、正規分布を使って「目標値に達していない人が何%いるのか」というのを算出できるかということです。以下の数値を使用する予定です。 目標値2.4 平均値2.61 標準偏差1.69 例えばここで、「2.0以下の人が何%いるか」ということがわかるのでしょうか。

  • エクセルで偏差値,標準偏差の意味について

    こんにちは。  STDEVAという関数はわかったのですが, A組 14.7 B組 14.9 などと標準偏差の値が計算されるとき,どのような読み取り すればいいのでしょうか?  また,分布表示はできますか? 正規分布であらわすには どのような方法があるでしょうか?