• ベストアンサー

エラーバーについて教えて下さい。

エラーバーには何を表示するかについて、調べたところ95%信頼区間、標準誤差、標準偏差の3種類があるそうなのですが、 これはどうやって使い分ければ良いのでしょうか? また一般的にもっともよく使われるものについて教えて下さい。 それと例えば、標準偏差をエラーバーに表した場合、両側に標準偏差を値を代入してしまうとエラーバー全体としては標準偏差の2倍になってしまうと思います。これも全体として標準偏差にするか標準偏差の2倍にするかは好みで選んで良いものなのでしょうか? いろいろと調べてみましたが分かりませんでした。 よろしくお願い致します。

  • 科学
  • 回答数2
  • ありがとう数42

質問者が選んだベストアンサー

  • ベストアンサー
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.1

こんばんは。おっさんです。 標準偏差をσと書くことにします。 >>>調べたところ95%信頼区間 95%信頼区間は、正規分布で言えば、±2σ です。 >>>これはどうやって使い分ければ良いのでしょうか? >>>また一般的にもっともよく使われるものについて教えて下さい。 私の経験上、 ・工業で製品や部品の特性値を集計するときは、通常、±3σ を用います。  (たまに、±2σ や ±6σ を使っているケースも目にしますが) ・学問の世界では、±σ が最も多く使われているはずです。  σを2倍、3倍・・・してみたところで、学問としては、あまり意味がないですから。  ±σ から はみ出すものは32%もありますから、工業では実用性があまりありません。 ・標準誤差は、サンプル数や計測時間が異なるデータ同士を付き合わせる場合にのみ使います。  たとえば、  1分当り400個の放射線を出す放射性物質があるとして、  1分計れば、400個/分 やその前後のカウントがあるわけですが、  これのσは、理論的に √400 = 20個 です。  つまり、400個±20個 とも言えるし、 400個±5% とも言えるわけです。  今度は、同じ放射性物質を100分間測定することにしましょう。  すると、カウントは、40000個ぐらいになります。  これのσは、理論的に √40000 = 200 です。  つまり、40000個±200個 とも言えるし、 40000±0.5% とも言えます。  前者のデータと後者のデータを比較するとき、  当然ながら、同じ時間当たりのカウントで比べなければいけません。  そこで後者を100で割るわけですが、それは、  400個/分±20個/分 vs 400個/分±2個/分  あるいは、  400個/分±5% vs 400個/分±0.5%  という比較になります。  これが、標準誤差の考え方であるわけです。  「同じ実験や測定を繰り返すと、データの精度は上がる」  ということは誰でも直感的に思うことですが、理屈としてそうなっているわけです。 >>>標準偏差をエラーバーに表した場合、両側に標準偏差を値を代入してしまうとエラーバー全体としては標準偏差の2倍になってしまうと思います。 2倍の長さでよいのです。 上に σ、下に -σ、合わせて ±σ です。 >>>これも全体として標準偏差にするか標準偏差の2倍にするかは好みで選んで良いものなのでしょうか? その世界の習慣に従ってください。 もしも学生さんであれば、指導されている先生に相談してください。 社会人さんであれば、先輩、上司、お客さんなど、データを見る立場の人からの意見を聞いてください。 エラーバーは、データを作る人のためではなく、データを見る人のためのものですから。 以上、ご参考になりましたら。

その他の回答 (1)

noname#227064
noname#227064
回答No.2

標準偏差か標準誤差のどちらを使うかは、あなたがその図で示したいことは何なのかを考えて決めてください。 データがどれだけばらつくのかを示したい。→標準偏差 平均値がどのあたりにあるのか示したい。→標準誤差 また、それの1倍を使うか2倍を使うかについては好みでよいと思います。 ただし、どの場合もその図で使用しているエラーバーが何を意味しているのか説明することを忘れてはいけません。

関連するQ&A

  • エクセルでのエラーバーの入れ方

    3つデータがあって、それぞれにエラーバーを入れたいのです。 関数でそれぞれ標準偏差を計算し、それをY誤差範囲の標準偏差のところに数値をいれても何も表示されません。どうしたらよいのですか教えてください。お願いします。

  • エクセルで出した標準偏差をグラフで使う方法

    エクセルで、STDEVとかを使って出した標準偏差(?)の値を、グラフ上でエラーバーとして出す場合、平均値に対して誤差範囲を「両方向」として示せばいいんでしょうか?STDEVとかを使って出した標準偏差(?)は「両方向」の片側の値ではなくて、「両方向」の全体の値でしょうか?

  • 統計に関する基礎的質問

    (1)標準偏差や標準誤差をエラーバーとして示して、95%の信頼区間が推定できるようにすることが多いですが、これらは母集団が正規分布しているという前提のときのみ成り立つものなのですか?(お忙しい中ご回答頂くので、回答は「はい」あるいは「いいえ」のみで大丈夫です。ありがとうございます!) (2)「統計手法を選択する際の6チェックポイント」というのを見ていましたら、「正規分布」か否かという項目がありました。母集団が正規分布するか否かというのはどうやって分かるのでしょうか?

  • Fold Changeで表すグラフにする際のエラーバーの付け方(統計学)

    統計学初心者です. 実験データをFold Changeで表すグラフにする際の,エラーバーの付け方がわかりません. 具体的には,たとえば, 非刺激群Aの平均値が100,標準誤差1.5 刺激群Bの平均値が200,標準誤差2.0 治療群Cの平均値が140,標準誤差1.2 というデータがあり, Aが1に対してBが2,Cが1.4というグラフを作りたいのですが,その誤差(すみません,統計的に,正しくは何と言うのかわかりません)をエラーバーで示さなくてはなりません. どのような計算が必要なのでしょうか? 追; グラフをローデータで表せない理由は,A,B,Cの実験が,実際には別々の実験で行われているため(実際はABCだけでなくもっとたくさんのサンプルを持っています),各々の実験のcontrolに対してのFold Changeをとらなくてはいけないからです.質問を簡便にするため,上記のような例・値とさせていただきました. よろしくお願いいたします.

  • 統計学(信頼区間)

    信頼区間が95%の時、平均±(2×標準偏差)の範囲に値が収まると覚えたのですが、 なぜ信頼区間を求める際には、平均±1.96標準誤差を用いるのでしょうか。 1.96はどこから来た数字なのでしょうか? 2で計算するのではなく1.96で計算するのはなぜでしょうか?厳密には1.96みたいな感じですか? この質問をわかる人が見たら質問の意図も分かりづらいと思うのですが、よろしくお願いします。 (分からないことを質問するって難しい。。)

  • 困っています。標準誤差(エラーバー)について教えてください。

    統計グラフについての質問させてください。  変化率の経時的グラフを作っています。x軸に時間、y軸に治療に よって改善した二つのファクター(症状と検査値)をプロットして います。  具体的には、治療開始一日目、母集団の症状のスコアの平均が3→1に減ったとして変化率をスコアの変化÷ベースラインの値; 3-1/3=66.7%と計算しています。検査値も同じように変化率を求めます。  この場合、グラフに標準誤差のエラーバーをつけることは可能ですか?どのような計算式で求めるのでしょうか?  卑近な方法ですが、エクセルで標準誤差を自動的に表すことができたのですが、標準誤差の統計的な意味を考えると、変化率だけで、元データの実際値を使わずに求められるのがおかしい気がします。 統計初心者で、質問がわかりにくかったらすみません。どなたか教えていただけますか。これを考えてもう2週間以上経過し、答えがでません。よろしくお願いします。

  • 偏差値のもつ誤差

     とある本に以下のような記述がありました。(完全に正確ではないかもしれません。)  偏差値のもつ誤差=標準偏差×((1-信頼性係数)の平方根)で計算できる。偏差値は標準偏差が10だから,信頼性係数?を0.9と仮定すると,以上の式に代入することによって±3.2ぐらいの誤差をもっていることが分かる。  そこで質問です。 1.この式は正しいでしょうか? 2.私のもっている高校のころの教科書にはこの式の記述が見あたりませんが,有名な式なのでしょうか。 3.この式で得られる誤差と標準誤差(標準偏差を標本数の平方根で割ったもの)との関係はどうなるでしょうか?  要領を得ない質問になってしまいましたが,よろしくお願いいたします。

  • 誤差はほんとに「1.96×標準偏差」?

    某問題集で次のような問題がありました。 母標準偏差を20として信頼度95%で誤差2以内で推定するには標本の大きさをいくら以上にする必要があるか。 自分の解答も問題集の解答も一致していて、「1.96×20/√n≦2」を解いて、n≧385」を得ました。ただ、これの解説を求められたときに、この「誤差」という意味をうまく説明できませんでした。なぜなら例えば母平均が30だったとして誤差2の推定は、「誤差」を上記解答の意味でとらえると信頼度95%の推定区間は、「大きさnの標本から推定区間を作るという調査を何度も繰り返すと、区間として[25,29]や[28,32]などいろいろありうるが、95%くらいの割合で間に30をはさんでいる」という意味になると思うのですが、もちろんそこには[26,30]や[30,34]の場合も含んで言っているわけです。しかし、そうするとこの場合区間の中で母平均との差が最大4あることになります。これで誤差2ということになるのでしょうか。つまり、本来は「誤差」という言葉を実質「信頼区間の幅」と置き換えて解釈して、「2×1.96×20/√n≦2」として解かなければならないのではないかと思うのです。 標準誤差という意味は全く違う単語だし、はっきり数学的に定義されていない中で「誤差」をどう解釈すればうまく「1.96×標準偏差」という意味になるか、うまい説明があれば教えていただきたいと思います。

  • 信頼区間推定方法

    95%信頼区間の推定方法に付いての質問です。 信頼区間推定の計算式として下記の2通りの式を見掛けます。 1)信頼区間 = 標本平均 ±(t(95%) × 標本標準誤差 ) 2)信頼区間 = 標本平均 ±( 標準偏差 × 1.96 ) 2通りの式で同一標本の信頼区間推定してみるとそれぞれ 異なる区間が算出されます。 どちらの式を用いるべきなのでしょうか? また、なぜ結果の異なる計算式が並存するのでしょうか?

  • 信頼区間 正規分布しない場合

    信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか? 具体的には以下の2群のそれぞれについて95%信頼区間を知りたいのです。 統計については素人なので的はずれな質問かも知れません。 X 209.1 280 91 124 80.57884211 67 152.2 88.584 138.0215385 112.43 115.71 97 128 144 Y 145.035 113.2352941 143.5 117.25 62 78 58 79.5 68.49975 73.85728571 81.61222222 190.5 58 179.25 84 76.6665 168.92 76.76