• ベストアンサー

データのヒストグラムに、特定の分布関数を当てはめる意味について。

ksugaharの回答

  • ksugahar
  • ベストアンサー率19% (7/36)
回答No.1

僕の分野では、測定データは測定データのままあまり加工をせずに表示する気がします。したがって、分布関数に載っていることが意味を持つからではないでしょうか?

science_zero
質問者

お礼

ご回答ありがとうございました。

関連するQ&A

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • Excelを使った度数分布表の作り方

    Excelを用いて下記の問題を回答せよ。 問1ある鉄板の束から40枚の鉄板を取り出して、厚み(単位はmm)を測定したところ次のようになった。 8.2 6.7 2.1 7.8 8.3 4.7 8.5 5.8 3.4 7.2 5.1 2.3 8.9 3.8 5.3 1.7 9.6 6.2 5.6 9.4 0.7 1.3 5.9 0.8 4.3 3.7 1.6 8.2 9.6 6.4 2.1 7.3 8.8 4.8 7.3 0.7 9.7 5.2 5.6 4.8 (1)度数分布表を作り、ヒストグラムを図示せよ。 (2)上記データそのものを利用した平均と分散と標準偏差を求めよ。 (3)度数分布表を利用した平均と分散と標準偏差を求めよ。 度数分布表の作り方を教えてください、また(2)と(3)のExcelを使った計算のやり方と答えを教えてください。 回答宜しくお願いします。

  • Excelで "重み付けをした度数分布" を求める

    Excel 2003 を使用しています。データの度数分布を求めたいのですが、単なる度数分布ではなく、"度数に重み付けをする" 必要があります。(数学や統計で用語があるのかもしれませんが、小生には分かりません) 具体的な例を挙げると、左のマトリックスの数字の度数分布に右のマトリックスの重みを乗じた度数分布表やヒストグラムを作りたいと考えています。 42   3  32     1  2  2 21  15  11     3  3  5 10  21   5     5  1  3 通常の度数分布では、 区間 0<x≦10 の度数は2(データ3と5の2個)となりますが、それぞれのデータに右のマトリックスの対応する位置の数字を掛け算した和、3×2+5×3 を度数としたい、ということです。 これを Excel の 分析ツール - ヒストグラム のように、入力範囲とデータ区間を指定するだけで簡単に計算したいのですが、良い方法はないでしょうか。

  • ガウス関数と正規分布と関係について教えて下さい。

    Wikiによれば正規分布はガウス関数の部分集合だそうですけど、 ではこれらはどうやって使い分ければ良いのでしょうか? 例えば論文を見ていると結構ガウシアンフィッティングというのを行っていますが、これっておかしくないでしょうか? 実験データの統計をとるためにはガウシアンフィッティングではなく 正規分布フィッティング(?)みたいなものを使う必要があると思うのですが・・・

  • 正規分布へのfitting

    ある実験データがあり、正規分布に近い形をしています。しかし近いとはいえ、少々ズレているため分散と平均値を求め正規分布の曲線を実験データに重ねて描くと、、、なぜか大幅にずれてます。原因は、平均から大きく離れたところにデータが少ないとはいえポツポツとあり、分散が大きくなるからです(平均値はほぼ正しい値と思われます)。 分散を求める際に正規分布おかまいなく求めるため過大になるのかと思い、正規分布にfittingしようと考えました。つまり最小二乗法により実験データに近い正規分布を求め、分散を求めるのです。 この方法は意味ありますか?おそらく太古の昔から用いられてるような誰でも思い付く方法と思いますが。。。また、実際に計算する場合、エクセル等で関数は用意されてますか?それともlogを取り2次関数に展開しfittingする必要がありますか?

  • Excel VBAでヒストグラム計算

    Excel2003で1000個のデータのヒストグラムを 計算したいと思っています。 シート上でFrequency関数を用いて計算はできるの ですが、どうしてもマクロで実行したいのですが、 どのような表記をすれば良いのでしょうか? 区間をマクロでインプット形式にして、区間を 入れれば自動的にその区間と度数分布が出てくる ような仕組みにしたいのですが・・。 説明が不十分で補足等あれば随時したいと思います。 よろしくお願いします。

  • 分布形の決定と確率密度関数の算出

    こんにちは。 統計について質問させていただきます。 10,000個のデータ(平均値5.4E-05、標準偏差2.5E-04)を ヒストグラムに変換したところ、その分布形が対数正規分布とみなせそうです。 そこで、ks検定で分布形の推定を行っているのですが、ヒストグラムに対応しそうな 確率密度関数(pdf)と累積分布関数(cdf)の算出が分からず困っております。 ここ何日か、書籍やネットなどで調べてみたものの、何度やってもうまくいきません・・・。 ヒストグラムのデータ区間が小さすぎるのが問題ではないかと考えておりますが。 恥ずかしながら、統計学に関してはあまり学んだことがありませんので、 言葉足らで分かりにくいかと思いますが、 どなたか詳しい方、説明して頂けませんでしょうか。 少しでも分かりやすいように、画像を添付しておきます。 よろしくお願いいたします。

  • ヒストグラムのとがり具合の比較

    2つのヒストグラムが与えられていた場合 どちらが尖っているか(もしくは広く分布しているか)を 数値で比較するには尖度を求めればよいのでしょうか。 例えばA:(1,0,1,6,1,0,1)という度数とB:(1,1,1,3,2,1,1)という度数を グラフ描画するとAの方が尖っているように見えます。 エクセルのKURT関数によるとA=5.91 B=2.36となり Aの方が尖度が大きいためAが尖っていると言える。 この考え方で合っていますか。 やりたいことは異なる2つのビットマップ画像のヒストグラムを比較して どちらがより多くの階調域を使用しているのかを単純な数値で比較したいためです。 よろしくお願いいたします。

  • 都合で、度数分布表しか手にないらないデータがあります。このデータから、

    都合で、度数分布表しか手にないらないデータがあります。このデータから、正規分布グラフを書き、かつ平均や分散を近似でも良いのでより正確に求める方法はありますでしょうか。できれば無料ソフトでそういうものがあればよいのですが、有料でもかまいません。

  • 検定について

    ヒストグラムの分布の形状が、ヒストグラムか否か判定する方法がわからず困っております。 以下に示しますヒストグラムの形状が、正規分布か否かを判定したいと思っております。 【X=1.00・0.8・0.6・0.4・0.2・0.0の6項目の離散分布】のヒストグラムを描くと、X=1.00に偏った分布になります。この分布の形状が正規分布とみなせるかどうかを、検定により判別したいのですが、いい方法がわかりません。。  x  Y(度数) 1.00 1000 0.8  800 0.6  200 0.4  100 0.2  50 0.0  10 ヒストグラムを描くと、”X=1.00が最頻値となる偏った分布になるので、これは正規分布として扱わない”といったことを、検定により判別できるのでしょうか?また、判別するための方法も併せて教えて下さい。よろしくお願いします。