• ベストアンサー

分布からみた 標準偏差、標準誤差について

はじめまして。よろしくお願いします。 さまざまな標準偏差、標準誤差についての投稿をみましたが、 分布から見た場合標準偏差と標準誤差とはどのようになるのでしょうか? データのサンプルをとり、それを正規化し、分布にあらわすと正規分布に限りなく近づいてくると思います。(これには中心極限定理がかかわっていると思います) そこでその分布の山の幅(というのでしょうか?)が標準偏差になっていると思うのですが、標準誤差とはどこを表すものなのでしょうか? また標準誤差をあらわすにあたって、中心極限定理を使ってあらわすことはできるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.1

(1) 偏差と誤差は、まったく違う概念ですが、このサイトの投稿者の中には混用している方が多いので、注意して読みましょう。誤差というのは、サンプルを取って母数(母集団のパラメータ)の推定を行うときに、その正確さを表現する用語です。 (2) 標準偏差とは、ある分布の(母集団の)パラメータの一つであって、サンプルを取るなどの作業をする以前に存在しているものです。「山の幅」というのは、かなり非数学的な表現です。また、全体のバラツキ幅の約1/6などという不正確な覚え方をしている方が多いようです。 標準偏差は、母集団からサンプル1個を取るとき、[その値-母平均] の2乗の期待値(母分散)の平方根をいいます。または、サンプル無限個を取るとき、[各値-母平均] の2乗の平均値(母分散)の平方根といっても同じです。上記の「1個や無限個のサンプル」は、説明のための語であって、母数を調べるために採取するサンプルではありません。ここでは「誤差」という概念は出てきません。 (3) 一方、標準誤差とは、ある個数のサンプルを取り、その値からある統計量(断りがなければ平均値)を推定する場合に、その推定につきまとう誤差の標準値(このサンプルの平均値の母集団を考えるとき、その標準偏差)を指しています。 このように、一定個数のサンプルの平均値をもとの分布の母数推定に用いるときは「誤差」といいますが、サンプルの平均値の母集団を考えるときは、再び「標準偏差」という語を使うことが許されます。このような「相対性」も理解することが必要です。

FD3S-R
質問者

補足

回答ありがとうございます。 (1)、(2)についてはおおよそ理解できました。 しかし(3)の標準誤差についてがどうもしっくりきません。 ある個数のサンプルを取り、その平均値をとる。サンプルによって平均値のばらつきがあると思うのですが、そのばらつきではないのでしょうか?

関連するQ&A

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 物理学実験における標準偏差、標準誤差について。

    物理学実験における標準偏差、標準誤差について。質問お願いします。統計学かもしれません。 正規分布をするグラフにおいて、平均値、標準偏差と、標準誤差をもとめました その場合、平均値±標準誤差、平均値±標準偏差のそれぞれの2つの範囲の意味を説明しなさいという問題です。 私の考えでは、平均値-標準偏差~平均値+標準偏差の範囲は測定値のばらつきがこの範囲に68.3パーセントを占める。 平均値-標準誤差~平均値+標準誤差の範囲の意味は平均値のありそうな幅の推定でこの範囲に68,3パーセントを占める であってますでしょうか

  • 標準偏差と標準誤差

    標準偏差と標準誤差のちがいってなんですか? 両方とも正規分布(N、σ2/n)のσ2/nの正の平方根をとったものではないのですか?

  • 誤差分布について

    確率誤差とは50%の確率で生じる誤差の範囲のことですよね。 標準偏差をσとすると ε=0.6745σ で求められます。 ここからが本題で、 誤差分布の式および標準正規分布 上側分布表より 誤差が約30%の確率で生じる範囲はどのように求めれば良いのでしょうか。教えてください。

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • 中心極限定理と分布について

    中心極限定理により、不規則変数の加算によってできる不規則変数は、 平均値を中心に正規分布するようになるため z= y-6 は、平均:0、標準偏差:1の正規乱数となり、基本となる正規分布:N(0,1)と書く。 と書いてあるのですが、正規分布Nというのは山なりの感じの図でよろしいのでしょうか? 後これだけ見てz=y-6が平均0で標準偏差1というのもよくわかりません・・・ ノートを見てもzというのは書いてないのですが、数学関係でいう専門用語のzはなんでしょう。 また中心極限定理もよくわかりません、すいません・・・

  • 分布と中心極限定理

    あらゆる〇〇分布はサンプル数が増えると正規分布になるという中心極限定理を習いました。 (たとえポアソン分布) ではなぜ〇〇分布は〇〇分布と定義されるのですか? 全部の分布が中心極限定理に従うならすべての分布が正規分布と定義されるべきだと思うのですが その境はどこでしてるのですか?

  • ある値とその誤差の標準偏差が与えられていたら確率分布を出せる?

    ある値とその誤差の標準偏差が与えられていたら、確率分布を出せるのでしょうか?例えば、値と確率のグラフを出すことが出来るのでしょうか? 出せる場合、式や出し方はどのようになるのでしょうか?

  • 統計学における標準化について

    A)標準化は、次のページの https://bellcurve.jp/statistics/course/19647.html サンプルxー平均値/標準偏差 であり、これで正規分布のz値と照らし合わせて確率を求めるというのは理解できました。 B)ただ、実践において、統計量Zを求める際に、次のサイトでは、 https://bellcurve.jp/statistics/course/9317.html z=x⁻(xの平均) -μ / √σ² * √n とあります。 分母が標準誤差です。 C)一方次のページでは、 https://bellcurve.jp/statistics/course/9490.html z=X-np / √np(1-p) とあり、こちらは標準偏差で割っています。 以下質問ですが、 1)Aは何も推定しておらず、すなわち記述統計で全サンプルが分かっている、すなわち母集団での話で、あるサンプルxiの全体のうちでの発生確率を示すために標準化してZ値を求めている、という考え方で正しいですか? 2)Bは標準誤差で割っているのは、母集団σ²から抽出した標本であり、抽出した確率変数Xについて、母集団が正規分布に従うのであれば、X~N(μ、σ²/n)に従うので、この分散の√を使っている(すなわち標準誤差を使う)という認識で正しいですか? 3)Cは二項分布のnが大きいときに中心極限定理で正規分布と近似させて解くという計算の話なのかと思いますが、これは、Aと同じように、変数Xから平均を引き、標準偏差で割っています。これは抽出した標本だと思うのですが、Aと同じ方法でいいのでしょうか?かといって。正規分布から抽出していませんが……。 それぞれの用語とかも良く調べましたが、いまいち使いこなせていません。A,B,Cそれぞれ分子も違うので、標準化を基本に色々やっているのだろうと思うのですが、使い分けというか、それぞれの出てくる場面とかも教えてほしいです。 よろしくお願いいたします。

  • ワイブル分布の標準偏差

    統計初心者です。 ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか? 平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?) よろしくご教授願います。