• ベストアンサー

度数分布表の階級幅の決め方

度数分布表を作成するときの「階級幅」の決め方についての質問です。 JIS規格には 「R(レンジ)を1,2,5(または10,20,50や0.1,0.2,0.5など)で除し、その幅が5~20になるものを選ぶ。これが2通りになった場合、サンプル数が100以上のときに級幅の小さいほうを、99以下のときに級幅の大きいほうを用いる。」 とあるらしいのですが、いまいちよくわかりません。 サンプル数100個 R=6.4 の場合どのようになるのでしょうか? よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • noocyte
  • ベストアンサー率58% (171/291)
回答No.4

#1 です. > JIS 規格は > 『1,2,5(または10,20,50や0.1,0.2,0.5など)の3つから適切な階級幅を > 選びなさい (中略)』と言っていると考えてもいいんでしょうか? 要するに JIS 規格が言いたいのは, 「階級幅は10進数で切りのよい値にせよ」 ということですね.1,2,5 はどれも10の約数ですから. 階級幅を一般的に書くと,次のようになります. m × 10のn乗 (仮数部mは10の約数 (つまり1,2,5),指数部nは任意の整数) したがって,JIS 規格の要旨は次のようになるでしょう. ・階級幅は10進数で切りのよい値にする. ・階級数が 5~20 の範囲内に収まるようにする. (この5と20も10進数で切りのよい値だ….) ・1つの階級に含まれるサンプル数があまり変動しないようにする. (サンプル数が多ければ階級幅を小さくし,少なければ大きくして 変動を抑える.) >(今回の場合、0.2,0.5,1.0から1つを選ぶ。0.2は問題外。)』 「問題外」というと語弊があると思いますが.(笑) 今回の場合は JIS の基準に照らして「範囲外」ですね. ■余談 JIS Z 9041-1 は10進法が前提となっていますが,それ以外の場合の規格は ないんでしょうか? 例えばコンピュータがらみの統計だったら2進法ベースの方が都合がいいですし. その場合,mは常に1だから,階級幅は2の冪乗ということになりますね.

sisuado
質問者

お礼

何度もありがとうございます。 >JIS 規格の要旨は次のようになるでしょう. とてもわかりやすいです!

その他の回答 (3)

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.3

#2です。 級幅を決定する時には3,4,6,7,8,9などを用いるなと言っているのだと 思いますよ。それを表現で表したのが 『1,2,5(または10,20,50や0.1,0.2,0.5など)』なのでしょう。 ・・・0.01,0.02,0.05,0.1,0.2,0.5,1,2,5,10,20,50,・・・ これらから分類数が5-20になるものを選びなさいと言っているのではないですか。 で、2つ候補が出たときは、サンプル数が多い時は分類数が多いほう(幅が狭い方)を、 サンプル数が少ない時は分類数が少ない方(=幅が広い方)を選べと言ってますね。

sisuado
質問者

お礼

何度もありがとうございます。 >級幅を決定する時には3,4,6,7,8,9などを用いるなと言っているのだと 思いますよ。 私が#1さんに言いたかったことです!!ありがとうございます。

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

#1さんが言われる通りでしょう。 JIS Z 9041-1:1999 5.2.2 a) 2)級幅の決定 最小値と最大値を含む級を5~20の等間隔の級に分けるように区間の幅を決める。 級幅はRを1,2,5(又は10,20,50;0.1,0.2,0.5など)で除し、その値が5~20に なるものを選ぶ。これが・・・以下省略。 要は5~20個に分割して集計できるように幅を決定せよと言うことですね。 測定値が幾つだったかは書いてませんが、例えば0.7-7.1だったのなら 0.5-1未満,1-1.5未満,・・・,7-7.5未満 と分ければいいのではいいのではないですか。

sisuado
質問者

お礼

回答ありがとうございました。 正しいJIS規格を教えていただきありがとうございました。

  • noocyte
  • ベストアンサー率58% (171/291)
回答No.1

> R(レンジ)を1,2,5(または10,20,50や0.1,0.2,0.5など)で除し、 > その幅が5~20になるものを選ぶ。 この「幅が5~20」という部分は「階級数が5~20」の間違いではないでしょうか? 何の度数分布かにより,レンジの値はオーダーさえ異なってくると思うのですが. 例えば「人の体重分布」と「リンゴの重さの分布」では全然桁が違います. さらに「釣った魚の体長分布」となると,桁どころか物理的次元も異なります. 以下,「階級数が5~20」という前提で書きます. 階級幅を Wc,階級数を Nc とすると, 5 ≦ Nc = R / Wc ≦ 20 ∴ R / 20 ≦ Wc = R / Nc ≦ R / 5 R = 6.4 なので 0.32 ≦ Wc ≦ 1.28 Wc の取り得る値は > 1,2,5(または10,20,50や0.1,0.2,0.5など) だから,Wc=0.5 または Wc=1.0. サンプル数が100だから,階級幅の小さい Wc=0.5 の方を選ぶことになります. もし「幅が5~20」が正しいとすると,上の計算で Nc と Wc を入れ替えて, 0.32 ≦ Nc ≦ 1.28 したがって Nc=1 (したがって Wc=6.4) となり,度数分布表を作る意味がなくなります. 度数分布にも JIS 規格があるというのは初めて知りました. 丁度今,画像処理でヒストグラムを扱っているので私も勉強になりました.

sisuado
質問者

補足

回答ありがとうございました。 noocyteさんにうまく伝わるかわかりませんが JIS 規格は 『1,2,5(または10,20,50や0.1,0.2,0.5など)の3つから適切な階級幅を選びなさい(今回の場合、0.2,0.5,1.0から1つを選ぶ。0.2は問題外。)』 と言っていると考えてもいいんでしょうか?

関連するQ&A

  • 度数分布表・推計

    表1は、ある学級の体重の度数分布表である。 これについて次の各問に答えなさい。 1、表の中の、(1)、(2)、(3)にあてはまる数を求めなさい。 2、人数のもっとも多い階級を示しなさい。 3、この学級の体重の平均を求めなさい。   (四捨五入、小数第一位まで求めなさい。) 表1  階級    階級値    度数    (階級値)×(度数)   累積度数    (体重kg)   (kg)     (人)             --------------------------------------------------------------   以上  未満    40~45             4    45~50            14         (2)    50~55     (1)      11    55~60             9                     (3)    60~65             2    ---------------------------------------------------------------     合計              40 です。お願いします。

  • 累積度数分布表の書き方教えてください!

    あるスポーツチームで選手の体重(単位 kg)を測定したところ、次の結果が得られた。 これから累積度数分布表を作れ。 階級:54以上58未満 度数:4 :58~62 :4 :62~66 :7 :66~70 :13 :70~74 :8 :74~78 :4 上記の問題での階級値、累積度数、累積相対度数の求め方を教えてください>_<

  • 度数分布表の『階級』の設定について

     60点満点のテストをしました。この結果を整理するため、度数分布表を利用しようと考えています。   そこで、『階級』を以下のようにしていきました。     0点以上10点未満  10点以上20点未満  ・・・・・・  ・・・・・・  50点以上60点未満   すると、満点の60点をとった4人は、どの階級にも属せません。  また、60点以上70点未満   とすることもできませんよね。  どうしたら良いのでしょう。お教え下さい。

  • 度数分布表の『階級』の設定について

    60点満点のテストをしました。この結果を整理するため、度数分布表を利用しようと考えています。   そこで、『階級』を以下のようにしていきました。     0点以上10点未満  10点以上20点未満  ・・・・・・  ・・・・・・  50点以上60点未満   すると、満点の60点をとった4人は、どの階級にも属せません。  また、60点以上70点未満   とすることもできませんよね。  どうしたら良いのでしょう。お教え下さい。

  • 度数分布表・推計の問題

    表1は、ある学級の体重の度数分布表である。 これについて次の各問に答えなさい。 1、表の中の、(1)、(2)、(3)にあてはまる数を求めなさい。 2、人数のもっとも多い階級を示しなさい。 3、この学級の体重の平均を求めなさい。   (四捨五入、小数第一位まで求めなさい。)

  • 正規分布 理論度数について

    度数分布表(前日比) 級 級下限値 級上限値 級中央値 度数 理論度数 差 累積度数 1 -0.06 -0.047 -0.054 3 0.396 2.604 3 2 -0.047 -0.034 -0.041 5 4.431 0.569 8 3 -0.034 -0.021 -0.028 22 25.854 -3.854 30 4 -0.021 -0.008 -0.015 59 75.63 -16.63 89 5 -0.008 0.005 -0.001 134 111.263 22.737 223 6 0.005 0.018 0.012 83 82.415 0.585 306 7 0.018 0.031 0.025 27 30.709 -3.709 333 8 0.031 0.044 0.038 4 5.74 -1.74 337 9 0.044 0.057 0.051 0 0.536 -0.536 337 上記の場合の理論度数と度数の差はどのように解釈すればよろしいでしょうか? 差がマイナスだと○○、プラスだと○○など、初歩的な解説をおねがいします。

  • チェックシート(度数表)の階級値はどんな場合に必要?

    初級シスアド試験の「業務改善」の項目で、 工程管理のためのチェックシート(度数表)が出てきます。 この度数表の中の「階級値」はどんな場合に必要になるのですか? 初級シスアドの試験的にはデータの分布・ばらつきを説明するだけなので テキストには「その階級の中間値」としか書かれていません。 実際の業務上、どんな場合に必要な値なのでしょうか?

  • 階級値 度数 平均

     下の図の表から平均値を求める場合、(階級値×度数の和)/度数の合計で求める、とあったのですが、階級値×度数の和でなぜ、全体が求まるのかがわかりません。実際の数字ではないので、だいたい、といったところなのでしょうか。

  • エクセルで度数分布と正規分布を重ね合わせて表示する方法

    エクセルで度数分布と正規分布を重ね合わせて表示する方法 あるサンプルデータから求められる平均と標準偏差を用い、正規分布曲線をエクセルで作成することはできます。また、そのサンプルデータの度数分布を作成することもできます。エクセルでこの両者を重ね合わせて表示することはできるのでしょうか? グラフの種類>ユーザー設定>2軸上の折れ線と縦棒でやってもうまくできません。 ご存じの方がおられましたら、ご教示ください。

  • 度数分布と累積度数分布

     各科目別に5点刻みで人数を集計した棒グラフをつくった場合、山の形が最もなだらかになるのは、国語である。正か誤か、という問題。 正解は誤なのですが、 本の解説としては 数学は接線の傾きの変化が少ないので、他の二科目(国語、英語)に比べ、 度数分布のグラフがもっともなだらかになるため。 棒グラフを5点刻みに作ったもの(度数分布表)のグラフは、累積度数分布のグラフの接線の傾きに同じ、ということがイメージできません。