• ベストアンサー

標準偏差に「通常の範囲」はありますか?(初心者の質問です)

現在、仕事で必要のため大変困っています。 大量のデータ(物件の見積金額)のばらつきを出すために「STDEVP」関数を用いて「標準偏差」を出しました。 この標準偏差というのは、よくある「山のようなグラフ」(すみません、名前がわかりません)の平均からどれだけ離れているか・・・ということをみるものでよかったでしょうか? また、この標準偏差に「通常の範囲」というのはありますか?たとえば「マイナス」にはならないとか100以上の数値はない・・・など そしてこのデータを「山のようなグラフ」にして見た目にすぐにわかるようにしたいのですが、どのようにしたら良いですか? くだらないご質問だとはお思いでしょうが、なんとかお力を貸してください。

質問者が選んだベストアンサー

  • ベストアンサー
  • imogasi
  • ベストアンサー率27% (4737/17068)
回答No.6

>よくある「山のようなグラフ」 ●正規分布グラフのことでしょう。 ●標準偏差は、1峰の山型分布に限らず、平均を出せるデータがあれば(また平均はどんな場合でも出せますから) (データ-平均)の2乗を全てのデータに亘って加えた (Σ)もの(分散)から計算するからです。その平方根(+の方を採る約束)です。(不偏分散に付いては略) ●正規分布かそれに近い分布でないと、「もの」(推論)が言えないだけです。(例えば「平均値 ± 1 標準偏差の範囲内には全データの 68.27% が含まれる」など) 誤差に関係するようなものは使えます。正規分布以外の分布は沢山あります。むしろ正規分布が特殊でしょう。 >この標準偏差に「通常の範囲」というのはありますか プラス値であることだけです。値について、1より小とかの原理的範囲はありません。公式から判ります。データが2個しかないと仮定して、仮定で平均を決め、平均+α、平均-αのαの値を大きくすればいくらでも「分散」値は大きくなることで判ります。 >そしてこのデータを「山のようなグラフ」にして 現実データの現実分布の形によるのです。無理に山のような形に出来るものでもなく、して良いものでもありません。 現実の分布の形が「まずありき」であって、現実をモデル 分布に強引に当てはめては、本末顛倒です。 経験的に理論的に正規分布をするはずのものが、そうなっていない時には、QC活動でおなじみの、何か外因的作用(機械の故障)や何かの要因が加わっていると、疑うわけです。試験成績であれば、あるクラスではその出題関連単元を教え、他のクラスでは教えなかったとか、カンニングが行われたのではないか、問題があまりにも易しすぎたのではないかなど。 パチンコの例の解説がありました。 http://www.yi-web.com/~ps/java/kakuritu_syoho11.htm http://www.yi-web.com/~ps/ 小生はダメですが、この方面に興味があれば理解のキッカケが掴めるかも。

kunikunichan
質問者

お礼

ありがとうございます。 標準偏差の値というものの「算出方法」が参考になりました。

その他の回答 (5)

  • tnt
  • ベストアンサー率40% (1358/3355)
回答No.5

補足拝見しました 標準偏差は、ある特定の数値の集合に対して そのばらつき具合を与えるものです。 ですから、平均値が同じ物同士なら比較する事が できます。 でも、 たとえば、ある地域の平均価格が100円、 別の地域だと50円というときに、 それぞれの地域毎にばらつき具合を 調べる時にはそのままでは使えません。 一方、偏差値は、この標準偏差と平均を利用して 平均的なもの=50 に固定することで 平均値が違う物同士でも平均値からのばらつきを 比較できるようにするものです。 どちらが良いかは一長一短ありますが、 ご質問の例では、これらにとらわれずに 積み上げ折れ線グラフで良いのでは?と思います。 具体的には、 縦軸は%で、最大は100%、 販売してくれる会社の割合となります。 横軸は価格です。 こうすると、安いところは左に、高い所は右に出ます。 で、一番高い価格を提示すればどの会社からも 買えますから、そこが100%です。 つまり、グラフの傾き=散らばり具合     グラフの位置=全体的な価格の高低 という形になります。 これを標準偏差を用いて表す場合は、 単純に数値にして 平均=価格の高低 標準偏差=価格の散らばり具合 ということになりますが、 散らばり具合だけだと、 最低価格(これは誰でも興味あるでしょう)が 見えて来ないという欠点があります。

kunikunichan
質問者

補足

何度もありがとうございます。 アドバイスにありましたような「積み上げ折れ線グラフ」というのを試してみようと思ったのですが、 >具体的には、 >縦軸は%で、最大は100%、 >販売してくれる会社の割合となります。 >横軸は価格です。 この縦軸の「%」というのは「会社の割合」とありますがどのように算出されるものでしょうか? また、今回は最低価格というのを見るわけではなく 平均からどれだけ離れているか・・・というのが 見たいのだそうです。 よろしくお願いします。

  • tnt
  • ベストアンサー率40% (1358/3355)
回答No.4

標準偏差は統計的には優れたものですが、 普通の範囲を比較する時には ちょっと直感的では無いようで、 こういう場合は受験で有名な 偏差値の方がわかりやすいです。 偏差値=(X-平均値)/標準偏差*10+50 という式になります NO.3の方の標準偏差の上下3倍というのは、 偏差値では80~20に相当します。 偏差値で80以上、または20以下というのは 普通ありえませんね。 受験で言えば、偏差値70以上、30以下 つまり標準偏差の2倍を超えた数値は もう、母集団の形で数値が変ってしまうので 事実上つかえません。 ここらへんは何の「通常の範囲」なのかで 変ると思います。  

kunikunichan
質問者

補足

ご回答ありがとうございます。 具体的に「標準偏差」と「偏差値」の違いというのはあるのでしょうか? 今回出したいのは、 たとえば 愛知県にある5社の会社がA商品について見積金額を出しました。 その見積金額というのは、5社の平均と比べてみてどれだけばらけているものなのか・・・ということを出したいのです。 そしてそれを視覚的に訴えるために、「ヒストグラム」のようなグラフにできないか・・・ A商品は愛知県だけでなく岐阜県でも三重県でも見積をとるので各県での違いというのもみてみたい。 ご回答いただいてずうずうしいとは思いましたが、もし何かアドバイスがありましたらお願いいたします。

  • ice_rif
  • ベストアンサー率20% (68/325)
回答No.3

平均値+/-3σなら通常の範囲と言えると 思います。例えば、赤ちゃんの体重が小さ い場合も平均値より3σ以内であればあまり 心配する必要がありません。3σをはずれる 値とは、小学校の一学年に一人もいないよう な値と思ってください。 グラフは平均値をゼロとして、横軸の目盛り をσにすれば良いと思います。これ以上は、 統計学の本を読んでください。

kunikunichan
質問者

お礼

アドバイスありがとうございます。 「統計学」は難しいですね。。。 なんとかがんばってみます。

noname#4692
noname#4692
回答No.2

#1です。何度もすみません。下記回答に誤りがありました。平均±標準偏差の範囲に含まれるのは68.26%だそうです。(参考URL) ちなみに標準偏差についての考え方ですが、参考URLに正規分布表が載っています。標準偏差(σ:シグマ)とは、平均から正規分布表の変曲点までの距離を示しています。ですから、完成した度数分布表がきれいな正規分布を示していたら、そのグラフの変曲点が標準偏差であると視覚的にとらえることが可能です。(もちろんSTDEVで計算された標準偏差が正確な値です。)

参考URL:
http://procgtw.mach.bio.mie-u.ac.jp/Seminar/Seminar2001/NormalDistribution/NormalDistribution.htm
noname#4692
noname#4692
回答No.1

専門家でも何でもないのですが、お困りのご様子なので来てしまいました。間違っている情報もあるかも知れませんので、必ず他の方の回答も参考にしていただければ幸いです。 標準偏差は、集団のデータのばらつきを示す数値です。 たとえば、2つのグループA・Bに、0から100までのデータがそれぞれ150個・200個あったとして、両グループとも平均値が50だったとします。 Aグループの平均±標準偏差が50±10 Bグループの平均±標準偏差が50±20 である場合、Bグループの方がばらつきが大きいと評価されます。ということで、プラスとマイナスの両方のデータがありますし、平均値の大きさによって100とか1000とか小数点の数値ももちろんありえます。 グループのデータの分布が正規分布を取る場合、平均±標準偏差の範囲に、全体の個数のうち66%のデータが入ると考えられます。つまり、Bグループは50±20ですから、30から70というデータ範囲内に132件のデータが分布しているといえます。 さて、山のようなグラフは「度数分布表(ヒストグラム)」といいます。これは標準偏差の算出とは無関係です。エクセルをお持ちでかつアドインがインストールされていれば、ツール→分析ツール→ヒストグラムで書くことが出来ますが、アドインを使用しなくても、frequency関数を使うことで度数分布表をグラフで書くことが出来ます。詳細は参考URLをご覧下さい。 ただし、きれいな山形にするには階級値の設定が重要で、たとえば上記のデータの場合、階級値を5にするか、10にするかでできあがるグラフの形が全く異なります。この点はある程度の経験が必要になるそうですので、山形にならない場合は何度か階級値幅を適当に変えて試してみてください。

参考URL:
http://www.tokuyama.ac.jp/home/~n-harada/statistics/enshu/enshu1.html
kunikunichan
質問者

お礼

まだしっかり内容は把握しておりませんが、とりあえずお礼をさせていただきます。 グラフは「ヒストグラム」ですね。アドインで分析ツールはありますのでとりあえずやってみます。 ありがとうございました。

関連するQ&A

  • エクセルの標準偏差について

    はじめまして。 標準偏差についての質問です。 エクセルであるものの長さのバラつきをしらべなければいけなくなり、 標準偏差を使って求めようと思ったのですが、ヘルプで標準偏差の求め方の式をだしたら、たくさんの式がでてきてしまいました。 一般的なのは、、STDEV、STDEVA、STDEVPのようなのですが、何がどう違うのかわかりません。 求めたいのは、その値全体の平均(100個の長さの平均)からどのくらいのばらつきがあるかを、 株のチャートグラフのような感じで、表したいと考えています。 その場合は、STDEVPになるのでしょうか? また、式の説明に「数値1, 数値2,... 母集団の標本に対応する数値を 1 ~ 30 個までの範囲で指定します。」 とありました。私の標本数は100個です。30以下のものでないと出せないということなのでしょうか? くわえて、もし、その標準偏差の値が24.00などとでた場合(長さの単位がmmだったとしたら)この100個のデータの平均から24mmの間でばらつきがあるということなのでしょうか? また、引数という言葉もあり、イマイチ良く式の意味が汲み取れません。 また、最終的にはエクセルを用いてグラフ化し、平均値とばらつきとの関係を株のチャートのようにあらわしたいのですが、 (平均を棒グラフで表し、バラつきを棒グラフから伸びる、株で言うところの高値、安値を示すような形であらわしたい) いまいち、うまくできません。 たぶん、標準偏差というものを理解できていないのだと思います。 わたしのような素人にもわかりやすいようなサイトの紹介や、説明などを教えてください。 よろしくお願いします。

  • 統計学-母集団が少ない場合の標準偏差について-

    はじめまして。よろしくお願いします。 現在、70個ほどのデータの標準偏差と平均をグラフにしてまとめている作業をしています。(エクセルで、まず平均の棒グラフをつくり、その後、y誤差範囲に標準偏差を代入してグラフ化しています。)母集団もすくなく、データも明らかにばらつきがある、たとえて言うと、1のものもあれば、1000のものあるのに、データは70前後。 もちろん、標準偏差もものすごく大きくなります。 エクセルで作成しているのですが、STDEVPという母集団全部を考慮に入れる(標本としないで)式でやっています。 本題ですが、そのばらつきのある標準偏差をどうにかして縮めたいのです。「誤差を範囲に入れるような感じでやればもっと標準偏差のバーが小さくなるだろう。それを考えろ。」と上司は言ってきますが、私にはさっぱりわかりません・・・。 母集団がすくなく、明らかにばらつきが見て取れる場合の標準偏差の式が何か別にあるのでしょうか・・・。

  • Excel2007 標準偏差

    標準偏差を求める関数はSTDEVPで良いのでしょうか。 また、データが0が29個、10が2個あった場合、平均は0.64516129、標準偏差は2.456701002になりますでしょうか。 この標準偏差2.456701002は何を意味するのでしょうか。 これを見て、考察できることはあるのでしょうか。

  • excel 標準偏差の求め方

    よろしくお願い致します。 標準偏差を求める関数を作製したいのですが、 STDEVP関数を使えばいいのですが、 空白のセルもあるため、使えません。 COUNTAを使って、数値が入っているセルのみで 標準偏差を求められますでしょうか? 平均と、(X-Xi)^2は既に求めてあります。 よろしくお願い致します。

  • 標準偏差について

    実績がトータルで40 目標がトータルで30で 標準偏差が0.471405 達成率平均 1.333333 とアクセスで計算された結果があるのですが、 どのように計算されているかわかりません。 標準偏差がどのように計算されたわかりません。 アクセスのクエリをみると 達成率の平均をSTDEVPという関数で算出しているみたいですが。。 数値が0.471405なりません。 抽象的で申し訳ございませんがご教授頂ければ幸いです。

  • 標準偏差について!!

    いつもお世話になってます! 心理学の実験したあと標準偏差を出したのですが、(ExcelのSTDEVPの関数で) 標準偏差の意味がいまいち分かりません。 出したのは4件法の得点の平均値と標準偏差です。平均が2.24で標準偏差値が0.81ととりあえず出たのですが(n=34)このときの標準偏差の0.81は何を表していて、どのような意味なのでしょうか・・・ 初歩的な質問で申し訳ないのですが、よろしくおねがいします・・・。

  • 標準偏差について

    下記、アドバイスをお願いします。 前提:標準偏差=データの各観測値と平均との差の2乗の平均を取って、その平方根を取った値。正規化された形で表されたデータのばらつきを示す数値。 1.0.86 2.4.4 3.-0.72 4.0.44 5.1.57 6.1.13 7.-1.70 8.-0.58 上記の平均は、0.86←これは、理解できます。 上記の標準偏差は、1.86←これが、分かりません。 上記の標準偏差に対する比率0.36←これも、分かりません。 標準偏差・標準偏差に対する比率の出し方の指南をお願いします。 宜しくお願いします。

  • 標準偏差の求め方

    現在,Oracleを使って開発を行っています。 そこで、標準偏差を求めたいのですが・・・ Excelでいう「STDEVP」と同じ機能を持つ関数などはないのでしょうか? Oracleには「STDEV」という関数しかありません。 「Excelにデータを書き込んで、STDEVP関数を使う」という方法では 時間がかかりすぎるので、使えません。 何かよい方法をご存知でしたら、教えてください。 よろしくお願いしますm(_ _)m

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。

  • 偏差値について教えてください!!

    職場で「偏差値」を求めることになりました。 本を調べると、 偏差値=(個々の値-平均)/標準偏差×10+50 と出ていました。 そして標準偏差の求め方として「STDEVP」関数の紹介がしてありました。 とりあえず、上記の関数と計算式を利用して求めました。 「偏差値」というのは常にこの求め方でよいのでしょうか? 元データは1つの「物件」について各社から出された見積の金額がだいたい100件ほどあります。(2~3件のものもある) 基準の値というのが1つ決まっているのですが、 この「値」が上記の式の中の「個々の値」ということで良いのでしょうか? また、上記の式で標準偏差を求めたところ、3件の見積金額が全く同じ場合は、標準偏差が「0」となってしまいました。 当然、偏差値の式にあてはめると「#DIV/0」のエラーが出てしまいました。どうしたらいいですか? まったく知識がない状態で、始めなくてはならず大変焦っています。 皆様よろしくお願いいたします。 ちなみに偏差値の「値」というのは通常どんな「値」になりますか? (大体「45.5」・・・というような値なんですが、いきなり「-695」という値が出てきてしまったりしたのですがいいのでしょうか?)

専門家に質問してみよう