• ベストアンサー

標準誤差の求め方について

生物実験において例えば 1回の実験につき3つのデータを取り、同じ実験を3回繰り返して 以下のようなデータが出たとします。 実験1回目)120, 130, 110 実験2回目)75, 80, 70 実験3回目)105, 120, 90 それぞれの実験の平均値は以下の値です。 実験1回目)120 実験2回目)75 実験3回目)105 この実験から母集団の平均値のありそうな範囲を求めたいので 標準誤差(SE)を出すと思うのですが、 SE=標準偏差/√データ数 ということから、 平均値mは実験1~3)の平均値から m=(120+75+105)/3 =100 標準偏差σは σ=√Σ(m-それぞれの実験の平均値)^2/(標本数-1) =√[{(100-120)^2 + (100-75)^2 + (100-105)^2}/(3-1)] =√(1050/2) (分母は標本数なのかもしれませんが) よって SE=√(1050/2)/√3 でいいのでしょうか? 以下に書いてあるように、 http://oshiete1.goo.ne.jp/kotaeru.php3?q=1514110 「平均値の標準偏差」が「平均値の標準誤差」ということなら、 SE=√(1050/2) なのかなとも思っていまして。誤解していたらすみません。 標準誤差についての説明は多く見受けられましたが、 具体的な計算方法が載っているものがほとんどなかったので (探せられなかっただけかもしれません)質問させて 頂きました。上記の計算方法が間違っていたら、 ご指摘くださいますようよろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.7

#2のコメントへ 前後の文脈がなくその英文だけでは何をさしているのかわかりません。 本当に平均値の標準偏差を取るのかもしれませんし。 話を整理します。 1. 中心極限定理 母集団について平均をμ、標準偏差をσとします。 この母集団からn個の標本を取り出し平均値を求めると、その平均値の分布は、nが十分に大きければ、平均がμ、標準偏差がσ/√nの正規分布に近づきます。これが中心極限定理です。(厳密にはn無限大の極限で一致ですが、n=10程度になれば、そこそこ近い分布になります。) この定理により、1セットの実験を繰り返して多数個の平均値を求めなくても、平均値の分布を求めることができます。 2. 不偏分散 母集団の平均や標準偏差が求められればいいのですが、現実には求めることができません。そこで、代用品として推定量を使うことになります。この推定量は、一つの値単独では母集団の値とずれるのは仕方ありませんが、期待値を取ったとき(要するに多数回の実験を繰り返して平均を求める)に母集団の値と一致するような量を選びます。これが不偏推定量で、分散の不偏推定量を特に不偏分散と呼びます。 一回の測定で求められる平均と標準偏差をMとSとすると、定義どおり計算すれば、測定値をxとして1回の実験ごとに M =Σx/n, S^2 = Σ(x-M)^2/n が求められます。m回の実験を繰り返すと、それぞれ M1, M2, M3, ・・・・, Mm, S1^2, S2^2, S3^2,・・・・,Sm^2 とm個のMとS^2が得られ、それぞれの平均、 (M1+ M2+M3+ ・・・・+Mm)/m, ( S1^2+ S2^2+ S3^2+・・・・+Sm^2)/m を計算することができます。 幸いなことに、Mについてはm→∞の極限でこの平均値の平均が母集団平均μに一致するので、標本平均Mを平均値の不偏推定量として使うことができます。 ところが、S^2については、この分散の平均はm→∞の極限でも母分散σ^2には一致しないので、不偏推定量としては使えません。しかし、その極限値は(n-1/n)σ^2になるので、はじめからS^2の定義に(n/n-1)をかけた量 (n/n-1) S^2 = (n/n-1)Σ(x-M)^2/n = Σ(x-M)^2/(n-1) を考えておけば、この量の平均はm→∞の極限で母分散σ^2に一致することになります。これが不偏分散です。 3. 平均の実験標準偏差 上のことを考えれば、一回の実験のn個の測定値から平均値の標準偏差を推定することができます。つまり、2の不偏分散をnで割ってやれば平均値の分散の推定値を得ることができ、標準偏差は分散の正の平方根なので、平均値の標準偏差は √[Σ(x-M)^2/(n-1)/n] で求められることになります。GUMでは、この量に対し、平均の実験標準偏差という名前が与えられています。 質問の文章や上の回答の中に出現している「平均値の標準偏差」や「平均値の標準誤差」というものは、このような手順で導出される量を指しています。したがって、質問にあるように複数個の平均が求められている場合に、その公式を平均値に使うのは誤りです。 ただし、これが質問者が書いているような「同じ実験」ではなく、制御できない要因が入り込んだことによる別の実験の個々の測定値であるとするのであれば、おそらく、質問の計算は間違いでもないと思われます。が、本当にそれに意味があるかどうかは別途考察が必要だろうと思います。たとえば、求めたいものが制御不能な変動の巾であるのだとしたら、最後にnで割らず、 √[Σ(M-<M>)^2/(n-1)] または√[Σ(M-<M>)^2/n] で求める方が適切です。

vaccinium
質問者

お礼

hitokotonusiさんへ 勉強不足のため、質問が適切でないにもかかわらず 詳しい親切な回答ありがとうございました。 まだ理解していない部分もありますが、 回答を参考にしながら勉強させていただきたいと思います。

その他の回答 (6)

  • backs
  • ベストアンサー率50% (410/818)
回答No.6

> 誤差の定義は、測定値と真の値との差です。 なるほど、そういう言い方をすれば確かに誤差と呼ぶのはよくないのかもしれません。 > BIPMとISOが90年代に取りまとめた『計測における不確かさの表現ガイド』(通称GUM)のなかに標準誤差という言葉が間違って使われていると書いてあります。 私にはこれがどれほど信用できるものなのか判断できないのですが、標準誤差は標準誤差で当たり前のようにどの教科書、論文でも使われている用語なので、それが間違いだとしても覆すのは難しいのでしょうね(^_^;) 標準誤差の使い方や理解のしかたに誤りがあったとしても、この用語自体が誤り問うのには少し疑問が残りますね。ちょっと詳しく調べてみます。

vaccinium
質問者

お礼

backsさんへ 回答ありがとうございました。 人によってわからないまま(わかったつもりで?) 標準誤差という言葉を使っていたりするんでしょうね。 僕自身もまだはっきり理解していないところがあるので、 回答を参考にしながら勉強させていただきたいと思います。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

我田引水ですが、 http://oshiete1.goo.ne.jp/qa3484149.html >SE=√(1050/2)/√3 でいいのでしょうか? そのとおりです 標準誤差は、標本の平均値のバラツキ(=標本標準偏差、あるいは不偏標準偏差というらしい)の平均値を表します。平均値は、データ数で割るので、この場合平均値は3つなので、3で割ります。

参考URL:
http://oshiete1.goo.ne.jp/qa3484149.html
vaccinium
質問者

お礼

kgu-2さんへ 回答ありがとうございました。 今後の勉強の参考にさせていただきます。

回答No.4

#3さんへ 誤差の定義は、測定値と真の値との差です。 偏差の定義は、測定値と母平均との差です。 したがって、不偏分散 Σ(m-それぞれの実験の平均値)^2/(標本数-1) で求めているのは、母平均周りの二次のモーメントの推定値ですから 誤差と呼ぶべきものではありません。 これは私が勝手に言っていることではなくて、BIPMとISOが90年代に取りまとめた『計測における不確かさの表現ガイド』(通称GUM)のなかに標準誤差という言葉が間違って使われていると書いてあります。

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

横レス失礼します。 > 標準誤差という言い方は学生実験のテキストなどで広くみられる言葉ではありますが、明らかな誤用なので使うべきではない というのはどういうことでしょう?

回答No.2

この場合なら、各実験ごとの値が離れすぎているので、私ならそのまま平均を取ることは躊躇します。 実際の測定でこのデータが出たら、測定数を増やすなど、系統誤差分が各実験ごとに大きく違っていないか確認をすると思います。 が、質問にあるデータは明らかにつくられたデータなので、問題作成者の意図を斟酌して上記の点に目をつぶってしまえば(非常に気持ち悪いですが)、計算は質問の1番目にある。 >SE=√(1050/2)/√3 で正しいです。(数字は確認してません) なお、標準誤差という言い方は学生実験のテキストなどで広くみられる言葉ではありますが、明らかな誤用なので使うべきではないと、先生に言っておいてください。 また、 σ=√Σ(m-それぞれの実験の平均値)^2/(標本数-1) は標準偏差そのものではなく、母集団標準偏差の推定値です。

vaccinium
質問者

補足

hitokotonusiさん、ご回答ありがとうございます。 例題が悪くてすみません。 本来ならデータからこういうことを示したいから この計算をするというふうにするのだと思いますが (逆で、あることを示したいならどんなデータを出せばいいか、 そしてデータをある解析方法で示すためにはどんな実験を 組み立てればいいかってするのが本来かな? ちょっと違うような。閑話休題。)、 文献の中に the standard deviation of the mean of at three different experiments; three samples were used in a given experiment と書いているものがあったのでこれを参考にし、 「平均値の標準偏差」=「平均値の標準誤差」 と思って質問欄に書いてあるような計算をしました。 他には SD of three different experiments; three samples were used in a given experiment と書いてあるものもありましたが意味することは同じだと考えました。 質問欄に書いてある計算方法「SE=標準偏差/√データ数」から出た値は、 上記の英語の意味することと同じと考えていいと思われますか?

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 具体的な計算方法が載っているものがほとんどなかった s.e. = sqrt(s^2 / n)で標準誤差を計算できます。s^2は分散、nはサンプルサイズです。 > 母集団の平均値のありそうな範囲を求めたい それならば、95%の信頼区間、あるいは99%の信頼区間を求めることです。 > 上記の計算方法が間違っていたら、ご指摘ください 計算方法が間違っているかどうかは、webサイトや参考書の例題と照らし合わせてみるとよいでしょう。 ちなみに、1回目の標準誤差は5.77、2回目の標準誤差は2.89、3回目の標準誤差は8.66ですよ。 標準偏差と標準誤差について、詳しくはhttp://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc038/00236.htmlを参照のこと。

vaccinium
質問者

補足

標準誤差は繰り返した実験の平均値から出すのかと思っていたのですが、 1回の実験で出た値から出してもいいんですね。 でも1回の実験から標準誤差が出るならこの実験の標準誤差は 3回の平均を取って (5.77+2.89+8.66)/3=5.77 とするのは間違っているんですよね。 質問欄に書いたような方法で出すのが正しいんですよね。 まだよくわかっていないので勉強します。

関連するQ&A

  • 標準誤差の式について

    標準誤差を求める式、SE = SD / √nについて質問がございます。 現在、標準誤差を勉強しております。 標準誤差が標本平均の標準偏差だと知り、 下記母集団を単純な例にして標準誤差を求めました。 ■1 母集団「2,3,4」 標本集団「2,3」「3,4」「2,4」 ■2 母平均:μ=3 母標準偏差:σ=√[{(2-3)^2 + (3-3)^2 + (4-3)^2} / 3] = √(2/3) ■3 標本平均:μ1=2.5、μ2=3.5、μ3=3 標本平均の平均:x=3 標本平均の標準偏差(標準誤差): s=√[{(2.5-3)^2 + (3.5-3)^2 + (3-3)^2} / 3] = √(1/6) ■4 標準誤差の式にあてはめ SE = SD / √n =√(2/3) / √3 =√(2/9) 3は標準偏差の公式に当てはめました。 4は標準誤差の公式に当てはめました。 計算間違いあるいは値の代入間違いでなければ、 3の標準誤差と4の標準誤差は同じになるはずだと思うのですが、 なっておりません。 何故なのでしょうか? 3の計算方法が間違っているのでしょうか? お教えていただければ幸いです。 以上、宜しくお願いいたします。

  • 標準偏差と誤差

    初めて質問します。 一般に標準偏差の計算は,母集団=標本集団とすると (測定値-平均値)の2乗の和をデータ数で割ったものの平方根だと思います。 (EXCELのSTDEVP関数もこの計算をしているようです。) ところで,大学のときに習った平均自乗誤差は, 母集団=標本集団の場合 (測定値-平均値)の2乗の和をデータ数の2乗で割ったものの平方根 ただし,母集団>標本集団の場合は, (測定値-平均値)の2乗の和を (データ数*データ数-1)で割ったものの平方根 以上のように習いました。 そこで質問です。 1.分母が標準偏差は1乗で,平均自乗誤差は2乗なのはなぜでしょうか? 2.母集団>標本集団の場合は,(データ数*データ数-1)になるのはなぜでしょうか? 3.EXCELには母集団=標本集団のSTDEVP関数と 母集団>標本集団のSTDEV関数がありますが,母集団>標本集団の場合の標準偏差の計算というのはどんな計算をしているのでしょうか。 よろしくお願いします。

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準平均Xバーの標準偏差について

    たびたびすみません。 http://oshiete1.goo.ne.jp/qa3484149.html を質問させていただいたものです。 まず、「標準平均Xバーの標準偏差」というのは「標本誤差」という のですか? そもそもこの標本誤差というのは何に役立つのでしょうか? 高校の数学の教科書の問題で、下記のようなものがありました。 「ある県の17歳男子の体重の平均値は62kg、標準偏差は9kgである。  この県の17歳男子100人を無作為抽出で選ぶとき、100人の体重の  平均Xバーの期待値と標準偏差を求めよ。」 この標準誤差?というのは9/√100で0.9kgとなると思うのですが、 この0.9kgはどんな意味をもつのでしょうか? 100人全体の標準偏差は、「標本標準偏差」というものになり本来は 分母をn-1にして、これが母標準偏差の推定値ということなんです よね?それでこれはだいたい9kgに近いということですよね? (分母をnにしたものを標本標準偏差と呼ぶの?) 文章下手ですみません。 よろしくお願いします。

  • 誤算の伝搬式から求まる標準誤差について

    3つの集団A,B,Cがあります。それぞれの集団の平均値(標本平均)をxa,xb,xcとします。その集団の標準偏差をそれぞれΔxa,Δxb,Δxcとします。 3つの標本平均xa,xb,xcの標準誤差(SE)は誤差の伝搬式から SE=√(Δxa^2+Δxb^2+Δxc^2)/3 となります。 しかし、Δxa=Δxb=Δxc=SDとなり SE=SD/√3 となる事がイマイチ理解できません。 なぜ、別々の集団A,B,Cの標準偏差が全て等しくみなせるのでしょうか?

  • 標準誤差とその性質

    標準誤差(SEM)が標本平均の標準偏差であることは,分かったのですが,母集団から標本集団Aと標本集団Bをとった場合に,AとBの標準誤差の関係が分かりません。 具体的には,例えば貨幣を製造したときに基準をパスする貨幣の重さのSEMが1つの貨幣あたりsだとした場合に,n個の貨幣を無作為抽出したときに得られる総和の標準誤差と貨幣の重さの平均の標準誤差が求められるものでしょうか。

  • 標準偏差およびt-分布表について

    教えてください。 本に下記の例題がありました。 「取り出した標本が10、20、30、40であった と仮定します。この平均値の信頼区間をt表でもとめてください。」 回答は以下のようです 「平均xは(10+20+30+40)/ 4=25 標準偏差sは SQR{((10-25)^2+(20-25)^2 ・・・+(40-25)^2)/4)}=11.2 このxとsを下記の式に代入して t=(x-μ)/(s/SQR(n-1)) と記述して計算しますとあります。 質問1 標本から取り出したサンプルからの標準偏差の分母は 標本数nでなく、標本数nから1を引いた値n-1を分母として計算すると習ってきましたが、なぜこの問題ではsを求めるのにn-1でなくnで割ってあるのでしょうか? t分布表を使うときの標本の標準偏差はnで計算した値を利用しておこなうと考えるのでしょうか? 質問2 標本の標準偏差の分母はn-1とすると習ってきましたが、標本数が2のときには2-1ではなく2のままで標準偏差を計算すのですか? 標本が3を超えたときn-1を適応するのでしょう か?

  • エクセルでの標準誤差の求め方を教えてください

    教えてgooで検索したところ、以下のような質問をなさった方がいらっしゃったのですが、この質問に対する回答のURLを見たところ存在しないとの事でした。 標準誤差(Standard Error; SE)の計算が必要になったのですが、なんとExcelの関数の中にSEが無いことに気が付きました。いや正確には"STEYX"と称するものがあることはあるのですが、これはどうも少し違うようで平均や標準偏差(SD)でするように1列(行)のデータから計算しようとするとエラーが出てうまく行きません。本当にExcelではSEが計算出来ないのでしょうか?それとも前述の"STEYX"から計算出来るものなのでしょうか? ご存知の方いらっしゃったら教えてください。

  • 測定したデータの誤差を計算する方法

    集めたデータのばらつきを求めるときに使う計算法として、標準偏差がありますが、「誤差=平均値±標準偏差」と考えていいのでしょうか? ほかに標準誤差というのがあるようなのですが、説明を読んでも何を意味している誤差なのか理解できません。 ちなみに、データは以下の通りです。 データ数:60 最高値:39.00 最低値:11.00 平均値:22.56 標準偏差:5.261 標準誤差:0.679(5.261/√60) 標準偏差を誤差と考えると22.56±5.261で、総データの70.0%が含まれます。 標準誤差を誤差と考えると22.56±0.679で、総データの10.0%が含まれます。 回答よろしくお願いします。

  • 物理学実験における標準偏差、標準誤差について。

    物理学実験における標準偏差、標準誤差について。質問お願いします。統計学かもしれません。 正規分布をするグラフにおいて、平均値、標準偏差と、標準誤差をもとめました その場合、平均値±標準誤差、平均値±標準偏差のそれぞれの2つの範囲の意味を説明しなさいという問題です。 私の考えでは、平均値-標準偏差~平均値+標準偏差の範囲は測定値のばらつきがこの範囲に68.3パーセントを占める。 平均値-標準誤差~平均値+標準誤差の範囲の意味は平均値のありそうな幅の推定でこの範囲に68,3パーセントを占める であってますでしょうか