• ベストアンサー

このヒストグラムの意味することを教えてください。

このヒストグラムの意味することを教えてください。 エクセル2007です。 顧客の来店頻度の数値をヒストグラムにしました。 次の級とか意味がわかりません。。。この図の意味するものを教えてくださいmm

質問者が選んだベストアンサー

  • ベストアンサー
  • MackyNo1
  • ベストアンサー率53% (1521/2850)
回答No.1

まず気になるのは、通常ならデータ区間はご自分できりの良い数字を設定するのが普通だと思うのですが・・・ 基本的にヒストグラムは、データ区間ごとの出現頻度の表を作成しますが、作成時にグラフ作成以外の「累積度数分布の表示」などにチェックを入れるとご質問のような表とグラフが作成されます。 グラフ作成にチェックを入れておけば、表の左側だけのデータで棒グラフを作成するのでもう少しわかりよいグラフが作成できると思います。 現在のグラフは、表の右半分のデータを使って出現頻度が高い順にグラフ化されています。 この場合「次の級」は一番大きい区間データの数値を超えるデータの数です。 通常はデータ区間を決める場合に、例えば0~10日、~30日、~50日、~70日、~90日などにしますが(セルに10,30,50,70,90などと入力しこの範囲をデータ区間にします)、例示のデータでは次の級である100.4を超えるデータが2番目に多いため、あまり良い集計方法とは言えません。 このような場合は、最大の区間を110などにしてそれ以上になるデータの集計数字があまり多くならないようにする必要があります。

rescue99
質問者

お礼

ありがとうございます。 お客さんが来ないと110日とか余裕で出現するので、ないようにはできません。。。 100を越えているので次の級になるのですね。なるほど。

関連するQ&A

  • ヒストグラムの項目軸

    いつもお世話になっております。 Excel2003でヒストグラムをつくったのですが、項目軸の数字が斜めになっています。これをまっすぐに変えることはできるのでしょうか?また、最後に出ている「次の級」という字も消したいのですが、消すことはできますか?? ご存知の方、教えてください。よろしくお願いしますm(__)m

  • データのヒストグラムに、特定の分布関数を当てはめる意味について。

    データ解析で、度数分布表をヒストグラムにした後、正規分布などの関数でフィッティングした曲線を、そのヒストグラムに付け加えた図をよく見ます。 1. 何故、ヒストグラムを特定の分布関数でフィッティングするんでしょうか?分布関数に含まれる、平均や分散などの値を求めるためでしょうか?それとも、得られたヒストグラムが、特定の分布に従っていることを主張するためでしょうか? 2. また、ヒストグラムに、フィッティングして得られた曲線を付け加えて、学会のポスターや論文の図にしているのは、そうした方が見やすいためでしょうか?または、本来はそのような連続的な曲線になっていると予想されるが、実際のデータは離散的であるので、理想的な曲線を付加しているという意味でしょうか? 自分で考えただけで、人には聞いたことがなく、思い違いしているかもしれないので、回答お願いします。

  • Rでデータファイルからヒストグラムを作成したい。

    以下の様なデータファイルをRで読み込んでヒストグラムを書きたいのですが、どのようにすれば良いのか、途中で詰まってしまいました。 hist() を使いたいのですが、なぜかうまくいきません。 まず、ファイル("/test.txt")があります。 a1|302.46|235.56|53.697|39.4994|821.3049 a2|85.866|2.6232|133.33|13.6709|51.0768 a3|217.666|23.4868|0.458|678.454|67.545 ・・・・ ・・・・ (一番右に行名、その右に5つ、'|'で区切られた数値が並ぶ。 これが1万行程度続くファイルです。) 1列目のデータをすべて集めてヒストグラムに。 次に2列目のデータを集めてヒストグラムに。次も、、、という段取りで x軸は値,y軸は列番号,z軸は頻度という多次元ヒストグラムを 書くのが最終目標ですが、とても到達できそうにありません。 どなたか、お助けいただけませんでしょうか。 以下が私が行った操作です。 ## ファイル内容をRにて読み込みます。 > dataset <- read.table("/test.txt", header=FALSE, sep="|") ## 次に2列目のみdata2に格納します。 > data2 <- dataset[c(2)] ## 最後にヒストグラムを書かせようとします。 すると、エラーを吐いてしまいます。 > hist(data2) 以下にエラー hist.default(data2) : 'x' は数値でなければなりません データの並び(?)が問題なのかと思って > array <- c(data2) > hist(array) としましたが、これも同じエラーを吐いてしまいました。 データの数値に問題があるのかと思い、以下のようにしてみたのですが これはエラーを吐かずにヒストグラムをつくってくれました。 > list <- c(5.43624 2.061215 1.0185 1.0622) > hist(list) どなたか、よろしくお願いいたします。

  • ヒストグラムのとがり具合の比較

    2つのヒストグラムが与えられていた場合 どちらが尖っているか(もしくは広く分布しているか)を 数値で比較するには尖度を求めればよいのでしょうか。 例えばA:(1,0,1,6,1,0,1)という度数とB:(1,1,1,3,2,1,1)という度数を グラフ描画するとAの方が尖っているように見えます。 エクセルのKURT関数によるとA=5.91 B=2.36となり Aの方が尖度が大きいためAが尖っていると言える。 この考え方で合っていますか。 やりたいことは異なる2つのビットマップ画像のヒストグラムを比較して どちらがより多くの階調域を使用しているのかを単純な数値で比較したいためです。 よろしくお願いいたします。

  • (excel)生物の調査で区画法(コドラート法)によって集計したデータからヒストグラムを作成するには?

    植物の垂直分布調査を区画法(コドラート法)で行い、5cm間隔で高さごとの階級値を設定し、 出現した方形区数/調査した方形区数×100(%) の式で頻度を出しました。このデータからエクセルでヒストグラムを作成したいのですが、どうしたらいいのでしょうか?それともできないんでしょうか(ヒストグラムでこの頻度を使うのはおかしいでしょうか)?またはできない場合はどのようにして集計したデータをまとめればいいでしょうか?何かアドバイスはありませんか?

  • エクセルの関数式について

    例えば O1 P1 Q1 R1・・・と来店日を入力し 下記の項に関数式を用いて個々に数値で出力されているとします A1:初回来店日 B1:最終来店日 C1:来店回数 D1:来店頻度(直近3回の平均値) E1:最終来店日~本日までの経過日数 F1:E1-D1 ※(1):本日が来店頻度の1日前 1:本日が来店頻度を1日経過        このように出力されています D1:来店頻度×2.5倍の日数経過直後の顧客に「おさそいDM」を出したいのですが 2.5倍~後日2.5倍以上になった数値をG1に出力させる数式を教えていただけませんか? よろしくお願いいたします

  • アルゴリズムのフローチャート(ヒストグラム)

    0以上10以下の整数を入力として繰り返し受けつけ、階級の幅が3であるようなヒストグラムを出力する。 終了記号は-1とする。     始     ↓    i←0 ↑→→↓ ↑  X[i]←0 ↑   ↓ ↑←←i≧4  NO ↓     ↓YES     ↓    入力:N     ↓ ↑→→↓YES ↑   ↓ ↑  N=-1 →YES→出力:X→終 ↑   ↓ ↑   ↓NO ↑   ↓ ↑  N←N/3 ↑   ↓ ↑  X[N]←X[N]+1 ↑   ↓ ↑←←↓ 見にくい図で申し訳ありません。 このようなフローチャートがあるのですが、全体の流れの意味がよくわかりません。 特に後半の「N←N/3」以降はどういった意味なのでしょうか? よろしければ解説をお願い致します。

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • エクセルでリピート率

    エクセルで顧客のリピート率を調べたいんですがやり方が分かりませんのでやり方を教えてください。 現在、来店した順にエクセルに会員番号を入力しているんですがその中で2回来店した顧客が何人、3回来店した顧客が何人・・・と調べたいので方法を教えてください。 ピポットテーブルでできると聞いて調べてみたんですが分かりません(泣)初心者の為わかりやすくお願いします。 よろしくお願いします。

  • Excel2007で図の数値による移動がしたい

    パソコンが新しく(Windows7)なったことでExcelも2007(SP3)に最近なったんです。 それでExcelを使い始めたのですが、図を動かしたい時(移動) マウスではなく、諸都合で数字(mm)で動かしたいんです。 たしかExcel98(97だったかな?)では図の設定ダイアログの中に数値入力で 位置を決めることができたような気がするんですが 2007だと数値入力するメニューが見当たりませんでした。 図のサイズ変更は数値入力できるようですけど・・・ 「折り返し」の様にメニューの場所が変わって見つけきれてないだけなのでしょうか? それとも移動はマウスだけになってしまったのでしょうか? ご存知の方、教えてください。m(_ _)m

専門家に質問してみよう