- ベストアンサー
確率と平均値と標準偏差
教えてください。 確率で数値を出した場合に、その確率の値から標準偏差は出せますか? barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。 で、標準偏差の値は平均値にそのまま足したり引いたりしたのが範囲となるのですよね? 標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが)
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。 なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。 データが複数あって、平均や標準偏差が計算できます。 barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか? varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。 2乗のデータをそのまま足すことに意味はありません。 長さに面積を足すようなものです。 通常、varのルートを取ったものを平均に足します。 これで同じ次元のデータになります。 これが標準偏差の考え方です。 また、 平均値±標準偏差(√分散) はデータの最大値と最小値の範囲を指すものではありません。(通常、範囲といえば最大値と最小値の差になります) "平均的な存在範囲"とでも表現するのが適切だと思います。 標準偏差で出た数字は範囲ですので >標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね? という考えは合っています。 標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。 (この説明では確率を単に割合として観測されたデータとして解釈しています。確率にはもっと違う意味がありますので、適当に使うと誤解を生みやすい表現になります。) 以上、確率や統計の世界に少しでも興味をもっていただけたらなぁ・・・と期待するharisenbonでした。
その他の回答 (4)
- kgu-2
- ベストアンサー率49% (787/1592)
下の続きです。 標準偏差は、データが正規分布している場合、データのバラつき具合の目安になります。 平均値±標準偏差の中に、データの68%が入ります。平均値±2×標準偏差には、95%入ります。 偏差値を例に取ると、偏差値は平均値を50、標準偏差は10ですので、50±10、すなわち40~60の間の人は68%ということになります。同様に、50±2×10、すなわち、30~70の人が95%です。したがって、100人中では、偏差値70の人は上から2、3番、30の人は上から97、98番ということになります。 ちなみに、標準誤差は、平均値のばらつきを表しています。
- kgu-2
- ベストアンサー率49% (787/1592)
>標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね? 標準偏差の計算式をご覧いただければ、標準偏差を求めるときに、平均値から各データを差し引き、その2乗をデータ数で割って平方根を求めます。すなわち、平均値を算出しないで標準偏差を計算するのは不可能化と。 先に平均値があって、その±として標準偏差をグラフに書き加えますので、先に標準偏差を書くのは不可能化と。 >barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。 生物系のデータをグラフ上で表す場合の平均値±標準偏差の場合でしょうか。 これは、0%や100%を超える場合があります。バラつきが大きい場合です。データが正規分布していない場合は、可能性が高くなります。外国の論文では、±標準偏差ではなく、標準誤差でグラフ化しているのを見かけます。『標準偏差なら、平均値よりもマイナスになるなあ』と感じることもあります。 この場合に意味があるか否かは、ケースバイケースで、具体例でないとなんとも言えません。たとえば、測定が技術的に難しくて、誰がやってもバラつきが大きい場合は許されるでしょう。 ご質問の意味の取り違えの場合は、ご容赦を
- he-goshite-
- ベストアンサー率23% (189/802)
1.データの値が確率であっても, 複数のデータの値で標準偏差を計算することはできます。 2. >barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。 わたしには,この文は解読できません。 3.「範囲」はデータの最大値から最小値を引いたものです。標準偏差とは関係ない数値です。 4. >標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが) これも,わたしには意味不明の文章で,お手上げです。
お礼
ありがとうございました。 確率でも複数の値があれば標準偏差は出せるということで、安心です。
標準偏差はばらつきの大きさを表しているはずです。 確率とは次元の違う話です。 さいころの目のでる確率から、標準偏差はでないと思います。 標準偏差のプラスマイナス3倍の中に全体の99.7%が 入るはずだったと思います。 100%は入りません。
お礼
ありがとうございます。数字はとことん苦手のようで。 丁寧にありがとうございました。
補足
ありがとうございます。下の部分についてもうすこし教えてください。 標準偏差で出た数字は範囲ですので >標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね? という考えは合っています。 標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。 つまり、標準偏差は範囲であるので、グラフを描く場合には平均値に標準偏差を足したもの、引いたものの間が範囲になるのではなく、標準偏差の値の2分の1を足したもの引いたものの間がその誤差範囲と考えていいですか? 理解力なくてすみません。