• 締切済み

正規分布の判断方法

ばらつきのあるデータをサンプリングして入力します。ある一定量取り込んだ値が正規分布になっているか(ヒストグラムを作成し見た目で判断するのではなく。)判断したいのですが、どの様な計算で正規分布になっているかの判断方法を教えて下さい。データの平均値、標準偏差を計算する事は可能です。 宜しくお願い致します。

  • f105
  • お礼率66% (4/6)

みんなの回答

  • Climb-AI5
  • ベストアンサー率63% (14/22)
回答No.1

標本分布の正規性を検定したいということでよろしいでしょうか? Jarque-Bera検定を紹介します。 http://en.wikipedia.org/wiki/Jarque-Bera_test データの平均値と標準偏差を計算できるということですので、 ついでに尖度(Kurtosis)と歪度(Skewness)も計算して下さい。 尖度 http://ja.wikipedia.org/wiki/%E5%B0%96%E5%BA%A6 歪度 http://ja.wikipedia.org/wiki/%E6%AD%AA%E5%BA%A6 Excel関数ではそれぞれ、"kurt"と"skew"です。 Jarque-Bera検定統計量 = n/6*(s^2+(k-3)^2/4) n:標本数、s:歪度、k:尖度 もし標本分布が正規分布であれば、この検定統計量は 自由度2のカイ二乗分布に従いますので、有意水準が5%として、 この数値が大体6よりも小さければ、正規分布と見做して構わない と思います。 その他には以下のような検定もありますので、ネットで検索する等してご利用下さい。 シャピロ=ウィルク検定 Shapiro-Wilk test コルモゴロフ・スミルノフ検定 Kolmogorov-Smirnov test 以上です。

f105
質問者

お礼

ご回答有難う御座います。 難しい演算式で難易度が高いです。当方で使用で使用していますコントローラーでこの様な演算を行うのは命令語の問題もありますが、演算実行処理時間がかかり実用的ではなさそうです。簡易的に判断できる方法(簡易演算)または低機能電卓レベルでも出来るような方法があれば教えて下さい。高精度は求めません。 宜しくお願い致します。

関連するQ&A

  • 正規分布に従うときの母平均と母分散の求め方

    今、数千件のデータを解析しています。 ヒストグラムから、それぞれの時点のデータが正規分布に従うことが分かりましたので、母集団も正規分布に従う、という仮定の下で話を進めます。 各時点での平均と標準偏差をプロットしたところ、右上がりの一次関数になり、一定の値にはなりませんでした。 そこで、このような場合(標本平均も標本分散も一定の値にならない)、どうやって全体の母集団のパラメータを推定するのでしょうか。 教えてください。

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • データが正規分布しているか判断するには???

    初歩的なことですが。。急いでいます。 おわかりになる方 教えてください。 サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。 素人でも分かるように説明したいのですが。。 定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

  • 正規分布を使う問題なのですが計算の方針がわかりません。

    正規分布を使う問題なのですが計算の方針がわかりません。 ある会社では製品を10万円で年間の需要量が平均10000個、標準偏差が1500個の正規分布を想定している。1個当たりの原価(変動費)が平均5万、標準偏差が0.5万の正規分布を見込んでいる。固定費は平均1.2億円、標準偏差が2000万である。この事業の利益はどのようになるか? と言う問題です。この問題はそれぞれの正規分布の表を足して計算すればできそうな感じがするのですが良く分かりません。誰か教えてください。

  • 正規分布とヒストグラフ

    現在、得られたデータをヒストグラムにして、正規分布と比べています。 得られたデータ(100個)の度数分布をヒストグラフにし、計算により、標準偏差と平均を求めました。 さらに、正規分布の式、f(x)=1/(σ*√2π)exp(-(x-μ)^2/(2σ^2))へ求めた標準偏差と平均を入れ、計算し、f(x)のグラフを描きました。 この二つのグラフを比較し、ズレがないことを視覚的に確認しようとしています。 ですが、エクセルにて比較したところ、概形は同じですが縦軸の目盛りが異なります。 正規分布は縦軸がf(x)で、ヒストグラフは縦軸が度数です。 概形は同じですが縦軸が一桁ほど違う形となっています。 具体的には、ヒストグラフの縦軸をちょうど10倍ほどすると正規分布の縦軸と同じになり、グラフがちょうどよく重なります。 ですが、合わせるためにちょうどいい数字の倍数していいとは思えませんし、軸の数字が違うものを比べるということ自体ができないと思います。 ということは比べる前に何かしらの比較するための計算を(何かをかけるとか)していないということになるのでしょうか。 そのままf(x)と度数を比べられるとは思いませんが、比べるためにはどういった計算処理をしなければいけないのでしょうか。 参考書や過去の質問も参照しましたが、なかなか理解できず質問させていただきました。 わかりづらい質問で恐縮ですが、ご教授よろしくお願いします。

  • 最大値(最小値)の分布

    ある母集団は、平均値がAの正規分布又はポアソン分布であり、その標準偏差は√Aで表されます。その母集団から、N個サンプリングしたとします。(正規分布とポアソン分布のどちらで考えてもいいです。) N個サンプリングしたデータについて、最大値と最小値の標準偏差はどのように表されるでしょうか。平均値Aとサンプリング数Nで表されるはずなのですが、どうしても分かりません。 よろしくお願いいたします。

  • 正規分布について

    こんばんは 統計初心者でお聞きしたいことがあり質問させていただきました。 正規分布では、95%のものが平均値±標準偏差×2の中に収まるというのはわかりました。 そこでお聞きしたいのが、正規分布を使って「目標値に達していない人が何%いるのか」というのを算出できるかということです。以下の数値を使用する予定です。 目標値2.4 平均値2.61 標準偏差1.69 例えばここで、「2.0以下の人が何%いるか」ということがわかるのでしょうか。

  • 正規分布

    どうやって解いていけばよいのでしょうか。よろしくお願いいたします。 作業1を完了するのに必要な時間は平均時間は75分、標準偏差は15分の正規分布に従う。作業2に関しては平均100分、標準偏差10分の正規分布であるとする。作業2の平均所要時間よりも、より長くかかる1の割合は如何ほどか?一方、1の平均所要時間よりも、短い時間ですむ2の割合は如何ほどか?

  • 正規分布に関する問題です。

    正規分布に関する問題です。 あるクラスの身長は、平均値174cm、標準偏差6cmの正規分布に従うとみなせる。このとき、身長が165cm以下の人は全体の約何%になるか求めよ。 という問題なんですが、どうやって計算したらいいかわかりません。教えてください。

  • なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。

    なぜ正規分布の標準偏差は約68,26と言えるのでしょうか。 標準正規分布表がそうだから、と言えば終わりですが。 それより根本的な話で。 この値は、どうやって決める事ができたのですか? 観測による当てはめ、なのか、理論的な計算、なのか。。。。 根拠を知りたいです。 文献も教えていただけると助かります。

専門家に質問してみよう