- ベストアンサー
エラーバーについて教えて下さい。
エラーバーには何を表示するかについて、調べたところ95%信頼区間、標準誤差、標準偏差の3種類があるそうなのですが、 これはどうやって使い分ければ良いのでしょうか? また一般的にもっともよく使われるものについて教えて下さい。 それと例えば、標準偏差をエラーバーに表した場合、両側に標準偏差を値を代入してしまうとエラーバー全体としては標準偏差の2倍になってしまうと思います。これも全体として標準偏差にするか標準偏差の2倍にするかは好みで選んで良いものなのでしょうか? いろいろと調べてみましたが分かりませんでした。 よろしくお願い致します。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
こんばんは。おっさんです。 標準偏差をσと書くことにします。 >>>調べたところ95%信頼区間 95%信頼区間は、正規分布で言えば、±2σ です。 >>>これはどうやって使い分ければ良いのでしょうか? >>>また一般的にもっともよく使われるものについて教えて下さい。 私の経験上、 ・工業で製品や部品の特性値を集計するときは、通常、±3σ を用います。 (たまに、±2σ や ±6σ を使っているケースも目にしますが) ・学問の世界では、±σ が最も多く使われているはずです。 σを2倍、3倍・・・してみたところで、学問としては、あまり意味がないですから。 ±σ から はみ出すものは32%もありますから、工業では実用性があまりありません。 ・標準誤差は、サンプル数や計測時間が異なるデータ同士を付き合わせる場合にのみ使います。 たとえば、 1分当り400個の放射線を出す放射性物質があるとして、 1分計れば、400個/分 やその前後のカウントがあるわけですが、 これのσは、理論的に √400 = 20個 です。 つまり、400個±20個 とも言えるし、 400個±5% とも言えるわけです。 今度は、同じ放射性物質を100分間測定することにしましょう。 すると、カウントは、40000個ぐらいになります。 これのσは、理論的に √40000 = 200 です。 つまり、40000個±200個 とも言えるし、 40000±0.5% とも言えます。 前者のデータと後者のデータを比較するとき、 当然ながら、同じ時間当たりのカウントで比べなければいけません。 そこで後者を100で割るわけですが、それは、 400個/分±20個/分 vs 400個/分±2個/分 あるいは、 400個/分±5% vs 400個/分±0.5% という比較になります。 これが、標準誤差の考え方であるわけです。 「同じ実験や測定を繰り返すと、データの精度は上がる」 ということは誰でも直感的に思うことですが、理屈としてそうなっているわけです。 >>>標準偏差をエラーバーに表した場合、両側に標準偏差を値を代入してしまうとエラーバー全体としては標準偏差の2倍になってしまうと思います。 2倍の長さでよいのです。 上に σ、下に -σ、合わせて ±σ です。 >>>これも全体として標準偏差にするか標準偏差の2倍にするかは好みで選んで良いものなのでしょうか? その世界の習慣に従ってください。 もしも学生さんであれば、指導されている先生に相談してください。 社会人さんであれば、先輩、上司、お客さんなど、データを見る立場の人からの意見を聞いてください。 エラーバーは、データを作る人のためではなく、データを見る人のためのものですから。 以上、ご参考になりましたら。
その他の回答 (1)
標準偏差か標準誤差のどちらを使うかは、あなたがその図で示したいことは何なのかを考えて決めてください。 データがどれだけばらつくのかを示したい。→標準偏差 平均値がどのあたりにあるのか示したい。→標準誤差 また、それの1倍を使うか2倍を使うかについては好みでよいと思います。 ただし、どの場合もその図で使用しているエラーバーが何を意味しているのか説明することを忘れてはいけません。