こんばんは。おっさんです。
標準偏差をσと書くことにします。
>>>調べたところ95%信頼区間
95%信頼区間は、正規分布で言えば、±2σ です。
>>>これはどうやって使い分ければ良いのでしょうか?
>>>また一般的にもっともよく使われるものについて教えて下さい。
私の経験上、
・工業で製品や部品の特性値を集計するときは、通常、±3σ を用います。
(たまに、±2σ や ±6σ を使っているケースも目にしますが)
・学問の世界では、±σ が最も多く使われているはずです。
σを2倍、3倍・・・してみたところで、学問としては、あまり意味がないですから。
±σ から はみ出すものは32%もありますから、工業では実用性があまりありません。
・標準誤差は、サンプル数や計測時間が異なるデータ同士を付き合わせる場合にのみ使います。
たとえば、
1分当り400個の放射線を出す放射性物質があるとして、
1分計れば、400個/分 やその前後のカウントがあるわけですが、
これのσは、理論的に √400 = 20個 です。
つまり、400個±20個 とも言えるし、 400個±5% とも言えるわけです。
今度は、同じ放射性物質を100分間測定することにしましょう。
すると、カウントは、40000個ぐらいになります。
これのσは、理論的に √40000 = 200 です。
つまり、40000個±200個 とも言えるし、 40000±0.5% とも言えます。
前者のデータと後者のデータを比較するとき、
当然ながら、同じ時間当たりのカウントで比べなければいけません。
そこで後者を100で割るわけですが、それは、
400個/分±20個/分 vs 400個/分±2個/分
あるいは、
400個/分±5% vs 400個/分±0.5%
という比較になります。
これが、標準誤差の考え方であるわけです。
「同じ実験や測定を繰り返すと、データの精度は上がる」
ということは誰でも直感的に思うことですが、理屈としてそうなっているわけです。
>>>標準偏差をエラーバーに表した場合、両側に標準偏差を値を代入してしまうとエラーバー全体としては標準偏差の2倍になってしまうと思います。
2倍の長さでよいのです。
上に σ、下に -σ、合わせて ±σ です。
>>>これも全体として標準偏差にするか標準偏差の2倍にするかは好みで選んで良いものなのでしょうか?
その世界の習慣に従ってください。
もしも学生さんであれば、指導されている先生に相談してください。
社会人さんであれば、先輩、上司、お客さんなど、データを見る立場の人からの意見を聞いてください。
エラーバーは、データを作る人のためではなく、データを見る人のためのものですから。
以上、ご参考になりましたら。