• ベストアンサー

確率と平均値と標準偏差

教えてください。 確率で数値を出した場合に、その確率の値から標準偏差は出せますか? barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。 で、標準偏差の値は平均値にそのまま足したり引いたりしたのが範囲となるのですよね? 標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが)

質問者が選んだベストアンサー

  • ベストアンサー
noname#12673
noname#12673
回答No.3

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。 なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。 データが複数あって、平均や標準偏差が計算できます。 barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか? varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。 2乗のデータをそのまま足すことに意味はありません。 長さに面積を足すようなものです。 通常、varのルートを取ったものを平均に足します。 これで同じ次元のデータになります。 これが標準偏差の考え方です。 また、       平均値±標準偏差(√分散) はデータの最大値と最小値の範囲を指すものではありません。(通常、範囲といえば最大値と最小値の差になります) "平均的な存在範囲"とでも表現するのが適切だと思います。 標準偏差で出た数字は範囲ですので >標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね? という考えは合っています。 標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。 (この説明では確率を単に割合として観測されたデータとして解釈しています。確率にはもっと違う意味がありますので、適当に使うと誤解を生みやすい表現になります。) 以上、確率や統計の世界に少しでも興味をもっていただけたらなぁ・・・と期待するharisenbonでした。

myahmyah
質問者

補足

ありがとうございます。下の部分についてもうすこし教えてください。 標準偏差で出た数字は範囲ですので >標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね? という考えは合っています。 標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。 つまり、標準偏差は範囲であるので、グラフを描く場合には平均値に標準偏差を足したもの、引いたものの間が範囲になるのではなく、標準偏差の値の2分の1を足したもの引いたものの間がその誤差範囲と考えていいですか? 理解力なくてすみません。

その他の回答 (4)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

下の続きです。  標準偏差は、データが正規分布している場合、データのバラつき具合の目安になります。  平均値±標準偏差の中に、データの68%が入ります。平均値±2×標準偏差には、95%入ります。  偏差値を例に取ると、偏差値は平均値を50、標準偏差は10ですので、50±10、すなわち40~60の間の人は68%ということになります。同様に、50±2×10、すなわち、30~70の人が95%です。したがって、100人中では、偏差値70の人は上から2、3番、30の人は上から97、98番ということになります。  ちなみに、標準誤差は、平均値のばらつきを表しています。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

>標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?  標準偏差の計算式をご覧いただければ、標準偏差を求めるときに、平均値から各データを差し引き、その2乗をデータ数で割って平方根を求めます。すなわち、平均値を算出しないで標準偏差を計算するのは不可能化と。  先に平均値があって、その±として標準偏差をグラフに書き加えますので、先に標準偏差を書くのは不可能化と。 >barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。  生物系のデータをグラフ上で表す場合の平均値±標準偏差の場合でしょうか。  これは、0%や100%を超える場合があります。バラつきが大きい場合です。データが正規分布していない場合は、可能性が高くなります。外国の論文では、±標準偏差ではなく、標準誤差でグラフ化しているのを見かけます。『標準偏差なら、平均値よりもマイナスになるなあ』と感じることもあります。  この場合に意味があるか否かは、ケースバイケースで、具体例でないとなんとも言えません。たとえば、測定が技術的に難しくて、誰がやってもバラつきが大きい場合は許されるでしょう。  ご質問の意味の取り違えの場合は、ご容赦を

回答No.2

1.データの値が確率であっても, 複数のデータの値で標準偏差を計算することはできます。 2. >barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。 わたしには,この文は解読できません。 3.「範囲」はデータの最大値から最小値を引いたものです。標準偏差とは関係ない数値です。 4. >標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが) これも,わたしには意味不明の文章で,お手上げです。

myahmyah
質問者

お礼

ありがとうございました。 確率でも複数の値があれば標準偏差は出せるということで、安心です。

noname#10263
noname#10263
回答No.1

標準偏差はばらつきの大きさを表しているはずです。 確率とは次元の違う話です。 さいころの目のでる確率から、標準偏差はでないと思います。 標準偏差のプラスマイナス3倍の中に全体の99.7%が 入るはずだったと思います。 100%は入りません。

myahmyah
質問者

お礼

ありがとうございます。数字はとことん苦手のようで。 丁寧にありがとうございました。

関連するQ&A

  • (仮の?)標準偏差の計算方法について

    あるデータで、 上限・下限の範囲のみわかっているータがあります。(n数は不明) 例 下限データ 2.4   上限データ 4.4 この時、平均は(上限+下限)/2     標準偏差(上限ー下限)/4 で良いのでしょうか?(平均はわかるのですが、標準偏差が・・・) 理由もわからず、このように言われたのですが・・・ 説明もわかりずらいと思いますが、補足説明もしますので よろしくお願いします。

  • 確率(平均と標準偏差)について

    こんにちは。確率の問題で平均と標準偏差を求める問題なのですが、平均は求める事が出来たのですが、そこから、標準偏差を求める方法が分かりません。問題は「4個の観測値の平均は3.13で標準偏差は0.15である。これに、更に6個の観測、3.19 2.86 2.93 3.15 3.14 3.21が追加された。これら、10個の観測値の平均と標準偏差を求めよ」と言う問題です。平均は式は省略しますが3.1と求まりました。その後、分散を求めて割った数が標準偏差なのですが求め方が分かりません。分かる方はご回答お願いします。

  • サンプルの平均値と上限値と下限値から標準偏差を推定することはできますか。

    サンプルの平均値と上限値と下限値から標準偏差を予測することはできますか。 平均値と標準偏差を用いて統合解析を行いたいのですが、標準偏差の代わりに上限値と下限値が記された文献情報の取り扱いに苦慮しております。 確度は低くても一般的にこんなのがあるよ、というような情報をご教授下さい。

  • 確率分布 不適合の発生確率

    上限規格と下限規格 、平均と標準偏差がわかっている。 不適合の発生確率は、以下のように求められている。 P[X≧上限規格]+P[X≦下限規格] =P[X-平均値/標準偏差≧上限規格-平均値/標準偏差]+P[X-平均値/標準偏差]≦下限規格-平均値/標準偏差] =P[U≧2]+P[U≦-3]=答え この式について、小学生にでもわかるような説明(専門的知識を使わずに行う説明)を求めています。 可能な方がいれば、宜しくお願いします。

  • 母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

    (聞きたいのは、最後の3行がメインです) http://oshiete1.goo.ne.jp/qa3478996.html の質問をしたものです。 標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」 の2種類があることはわかりました。 母標準偏差であっても標本標準偏差であっても「n」で求められる が、標本から母標準偏差を推定するときが「n-1」を使うという ことで理解しました。 ところで、「n」にしても「n-1」にしてもそんなに値としては 変わらないということなんですよね? 高校の時の教科書で、「標本平均(Xバー)の標準偏差」という のがありました。  「母平均m、母標準偏差sの母集団から大きさnの無作為標本  抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」 というのがありました。  「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの は全然違うものなんですよね?(値も全然違うものになってしま うと思います。)

  • 確率・標準偏差について

    こんにちは。確率(標準偏差)の勉強をしています。平均と標準偏差を求める問題なのですが標準偏差の求める方法が分かりません。問題は、「中学校の3年生は女子263人、男子282人からなり、女子生徒の身長の平均は155.5で標準偏差は4.0。男子は身長の平均は163.0で標準偏差は4.4である。この学校の3年生の全員の身長の平均と標準偏差を求めよ」と言う問題です。各男女の生徒数と平均身長をかけて、男女を足し、それを全体人数で割ると全体平均が出たのですが、そこからの標準偏差の出し方が分かりません。ご回答お願いします。

  • ワイブル分布の標準偏差

    統計初心者です。 ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか? 平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?) よろしくご教授願います。

  • 累計の標準偏差の計算方法とは?

    統計学的な計算について教えてください。 前提: ある商品Aの出荷量は毎日変動があり、過去のデータから計算したら平均50個で±5個の標準偏差でした。 標準偏差を2倍(=2シグマ)し、約95%の確率で、明日の出荷量の変動は、±10個の標準偏差の値に収まると予測しました。 質問: では、7日後の累積の出荷量は、95%の確率で、どれほどになるでしょうか。 予想では、95%の確率で、 ・累積出荷量が50個×7日 = 350個、 ・標準偏差は、 [10個の分散である100個]×[7日]の平方根で = 約26.5個 よって95%の確率で、350個に上限のぶれが26.5ぐらいの範囲に収まる 上記の計算で合っているでしょうか? 合っていない場合、正しい計算式を教えて頂けますと幸いです。 よろしくお願いします。

  • 標準偏差について

    下記、アドバイスをお願いします。 前提:標準偏差=データの各観測値と平均との差の2乗の平均を取って、その平方根を取った値。正規化された形で表されたデータのばらつきを示す数値。 1.0.86 2.4.4 3.-0.72 4.0.44 5.1.57 6.1.13 7.-1.70 8.-0.58 上記の平均は、0.86←これは、理解できます。 上記の標準偏差は、1.86←これが、分かりません。 上記の標準偏差に対する比率0.36←これも、分かりません。 標準偏差・標準偏差に対する比率の出し方の指南をお願いします。 宜しくお願いします。

  • エクセルの標準偏差について

    はじめまして。 標準偏差についての質問です。 エクセルであるものの長さのバラつきをしらべなければいけなくなり、 標準偏差を使って求めようと思ったのですが、ヘルプで標準偏差の求め方の式をだしたら、たくさんの式がでてきてしまいました。 一般的なのは、、STDEV、STDEVA、STDEVPのようなのですが、何がどう違うのかわかりません。 求めたいのは、その値全体の平均(100個の長さの平均)からどのくらいのばらつきがあるかを、 株のチャートグラフのような感じで、表したいと考えています。 その場合は、STDEVPになるのでしょうか? また、式の説明に「数値1, 数値2,... 母集団の標本に対応する数値を 1 ~ 30 個までの範囲で指定します。」 とありました。私の標本数は100個です。30以下のものでないと出せないということなのでしょうか? くわえて、もし、その標準偏差の値が24.00などとでた場合(長さの単位がmmだったとしたら)この100個のデータの平均から24mmの間でばらつきがあるということなのでしょうか? また、引数という言葉もあり、イマイチ良く式の意味が汲み取れません。 また、最終的にはエクセルを用いてグラフ化し、平均値とばらつきとの関係を株のチャートのようにあらわしたいのですが、 (平均を棒グラフで表し、バラつきを棒グラフから伸びる、株で言うところの高値、安値を示すような形であらわしたい) いまいち、うまくできません。 たぶん、標準偏差というものを理解できていないのだと思います。 わたしのような素人にもわかりやすいようなサイトの紹介や、説明などを教えてください。 よろしくお願いします。