異なるヒストグラムのとがり具合を比較する方法は?

このQ&Aのポイント
  • 異なる2つのヒストグラムを比較して、どちらが尖っているか(または分布が広いか)を知りたい場合、尖度を求めることができます。
  • 例えば、ヒストグラムAの度数が(1,0,1,6,1,0,1)で、ヒストグラムBの度数が(1,1,1,3,2,1,1)の場合、グラフを描画するとAの方が尖っているように見えます。
  • エクセルのKURT関数を使うと、ヒストグラムAの尖度は5.91、ヒストグラムBの尖度は2.36となります。したがって、尖度が大きいAの方がより尖っていると言えます。
回答を見る
  • ベストアンサー

ヒストグラムのとがり具合の比較

2つのヒストグラムが与えられていた場合 どちらが尖っているか(もしくは広く分布しているか)を 数値で比較するには尖度を求めればよいのでしょうか。 例えばA:(1,0,1,6,1,0,1)という度数とB:(1,1,1,3,2,1,1)という度数を グラフ描画するとAの方が尖っているように見えます。 エクセルのKURT関数によるとA=5.91 B=2.36となり Aの方が尖度が大きいためAが尖っていると言える。 この考え方で合っていますか。 やりたいことは異なる2つのビットマップ画像のヒストグラムを比較して どちらがより多くの階調域を使用しているのかを単純な数値で比較したいためです。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

どういう指標が適切かは、評価の目的に合うように設計して決めることです。「どちらがより多くの階調域を使用しているのか」ではいささか曖昧すぎだなあ。  まずは、使われている階調の最大値と最小値の差を見る。ノイズを考慮すれば「ある閾値以上の頻度で使われている階調」の最大値と最小値の差、という方が現実的かも知れません。  「どちらがより多くの階調域を使用しているのか」じゃなくて「どちらが、集中的に狭い階調域を使っていてるか」ならばピークの高さを見てはどうでしょう。階調域を最大限利用するための画像処理法 「ヒストグラム平準化 (histogram equalization)」が時々使われます。これをやると、画像中にどの階調も(ほぼ)同じ頻度で現れるようになる。このような意味で「どちらが階調域をよりうまく活用しているか」を測りたい場合には、頻度の最大値と最小値の差であるとか、頻度の標準偏差を見るのが良いということになるでしょう。  なお、尖度はトンガリ度ですが、トンガってる山そのものの絶対的な幅じゃなくて(これを知りたければ、たとえば半値幅FWHM(full width at half maximum)を使う)、標準偏差が同じになるようにグラフをタテヨコに伸び縮みさせて規格化して比べたときのトンガリ度。トンガってるほど「一見正規分布風だけど、正規分布に比べて裾野の頻度の下がり方が少ない」というようなことを測るのに使われます。だから、「どちらがより多くの階調域を使用しているのか」とはあんまり関係ないように思われます。

ponpon231
質問者

お礼

冗長になってしまいそうなので例や説明をだいぶ省いてしまっていたのですが まさに「どちらが、集中的に狭い階調域を使っていてるか、よりうまく活用しているか」 といったことで、解釈にどのような指標を使うべきかで考えていたところでした。 十分な背景・目的の説明もせずに自分に都合のいい回答を得ようとしていたのは 大変失礼な行為でしたね。反省しています。 色々考えてみましたが、やはり今回の評価を解釈するには 標準偏差が良さそうなので試してみようと思っています。 尖度の解説や、はるか昔に学習して忘れてしまっていた 半値幅といった言葉も思い出させていただきました。 大変丁寧に説明いただきありがとうございました。

その他の回答 (1)

  • my3027
  • ベストアンサー率33% (495/1499)
回答No.1

バラツキ(標準偏差や分散)で比較すれば良いのでは?

ponpon231
質問者

お礼

そうなんですよね。 ただ、すぐに用意できるデータが度数のみで 大量のデータを整理するのが大変だったため 度数だけで何とかできないかなと考えていました。 面倒がらずに分散や標準偏差で考えてみたいと思います。

関連するQ&A

  • OpenCv ヒストグラム比較について

    OpenCv ヒストグラム比較について 画像の色を比較するためにヒストグラムを比較する関数cvCompareHistを使って比較しています。 ですが↓の画像の図形でRGB成分を分けてからそれぞれを比較したのですが、必ずどの成分も一致とでます。 ヒストグラムは色の分布を持っていてその分布を比較しているんですよね? cvCompareHistがいまいちなにを比較しているのかがはっきりとわからない状態です。

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • データのヒストグラムに、特定の分布関数を当てはめる意味について。

    データ解析で、度数分布表をヒストグラムにした後、正規分布などの関数でフィッティングした曲線を、そのヒストグラムに付け加えた図をよく見ます。 1. 何故、ヒストグラムを特定の分布関数でフィッティングするんでしょうか?分布関数に含まれる、平均や分散などの値を求めるためでしょうか?それとも、得られたヒストグラムが、特定の分布に従っていることを主張するためでしょうか? 2. また、ヒストグラムに、フィッティングして得られた曲線を付け加えて、学会のポスターや論文の図にしているのは、そうした方が見やすいためでしょうか?または、本来はそのような連続的な曲線になっていると予想されるが、実際のデータは離散的であるので、理想的な曲線を付加しているという意味でしょうか? 自分で考えただけで、人には聞いたことがなく、思い違いしているかもしれないので、回答お願いします。

  • ヒストグラム

    研究者です。 電気泳動で細胞の末端のDNAの長さを調べております。 この場合、正規分布からは少し外れます。 ヒストグラムで長さの分布をプロットして、A群とB群で差が有るかどうかを検査したいのですが、平均値と中央値、最頻値で比較するのが妥当なのでしょうか? この方法ですと同じ実験を3回以上繰り返して、P値を求めなければなりません。 上司によると別の方法が有るらしいのですが、見つかりません。 ご教授をよろしくお願い致します。

  • TOEIC試験のスコア分布のグラフ化

    TOEIC試験は、平均点は数値でわかるのですが、スコアの分布状態を 知りたく、スコアの分布グラフ、または、ヒストグラムを書ける かたがおられましたら、描画欲しく。

  • Excel VBAでヒストグラム計算

    Excel2003で1000個のデータのヒストグラムを 計算したいと思っています。 シート上でFrequency関数を用いて計算はできるの ですが、どうしてもマクロで実行したいのですが、 どのような表記をすれば良いのでしょうか? 区間をマクロでインプット形式にして、区間を 入れれば自動的にその区間と度数分布が出てくる ような仕組みにしたいのですが・・。 説明が不十分で補足等あれば随時したいと思います。 よろしくお願いします。

  • ヒストグラムの作り方

    ヒストグラムの作り方で困っております。 何かおわかりになる方はお願い致します。 名前  身長    身長    人数 A   170   160 {=FREQUENCY(sheet1!A2:A100,A2:A100)} B   180   161       ・ C   164   162       ・ D   168   163       ・ ・    ・     ・        ・ ・    ・     ・        ・ ( sheet1  )(    sheet2              ) 関数を入力するときにはshift ctrl enterを同時に押しています。 関数のエラー表示で「このセルにある数式は、隣接したセル以外の           範囲を参照します」と表示されてしまいます。 おわかりになります方は、何卒、アドバイスのほど よろしくお願い致します。

  • エクセルの複合グラフ作成について

    エクセル2000で、ヒストグラムと正規分布を1つのグラフ上に作成することは可能なのでしょうか? 過去のFAQを検索してみて、 個別の作成方法や、データの求め方までは分かったのですが、 1つのグラフ上に作成する方法が分かりません。 今の状況は、 (1)データを元にエクセルの分析ツールを使ってヒストグラムを作成しました。 (2)次に正規分布を求める数式(下記)を使って、データを元に数値を求めました。  数式:1/SQRTPI(2)*EXP((-1)*(B2^2/2)) (3)正規分布のデータをコピーして、ヒストグラム上にペーストで追加しました。 (4)数値軸が追加され、イメージとは全く異なるグラフが出来上がってしまいます。 データの追加方法が間違っているのでしょうか? どなたか教えていただけないでしょうか。 よろしくお願いいたします。

  • 正規分布とヒストグラフ

    現在、得られたデータをヒストグラムにして、正規分布と比べています。 得られたデータ(100個)の度数分布をヒストグラフにし、計算により、標準偏差と平均を求めました。 さらに、正規分布の式、f(x)=1/(σ*√2π)exp(-(x-μ)^2/(2σ^2))へ求めた標準偏差と平均を入れ、計算し、f(x)のグラフを描きました。 この二つのグラフを比較し、ズレがないことを視覚的に確認しようとしています。 ですが、エクセルにて比較したところ、概形は同じですが縦軸の目盛りが異なります。 正規分布は縦軸がf(x)で、ヒストグラフは縦軸が度数です。 概形は同じですが縦軸が一桁ほど違う形となっています。 具体的には、ヒストグラフの縦軸をちょうど10倍ほどすると正規分布の縦軸と同じになり、グラフがちょうどよく重なります。 ですが、合わせるためにちょうどいい数字の倍数していいとは思えませんし、軸の数字が違うものを比べるということ自体ができないと思います。 ということは比べる前に何かしらの比較するための計算を(何かをかけるとか)していないということになるのでしょうか。 そのままf(x)と度数を比べられるとは思いませんが、比べるためにはどういった計算処理をしなければいけないのでしょうか。 参考書や過去の質問も参照しましたが、なかなか理解できず質問させていただきました。 わかりづらい質問で恐縮ですが、ご教授よろしくお願いします。

  • 資料の整理の問題です。

    下の図は,ある高校の1年1組の数学の小テスト(30点満点)の結果をヒストグラム(度数分布のようすを表したグラフ)に表したものである。次の問に答えなさい。 (1)下の度数分布表を完成させなさい。 (2)25点以上30点未満の階級の相対度数を求めなさい。 (3)メジアン(中央値)の入る階級を答えなさい。 (4)モード(最頻値)を答えなさい。 お願いしますm(_ _)m