• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ヒストグラムから求める第一四分位数と中央値について)

ヒストグラムから求める第一四分位数と中央値について

このQ&Aのポイント
  • ヒストグラムから求める第一四分位数と中央値がわかりません。講義で配られたものの解答の仕方が独特なので理解ができないです。
  • X:11、14、17、20、23、26、29、32、35、38、41、44、47、50、53 F: 2、1、2、1、6、7、11、12、12、17、19、9、0、0、1 (数字見づらくて申し訳ございません。左から順に対応しています) X:週辺りの労働時間 F:人数 です。
  • 私は、階級の幅を5に設定してヒストグラムを作りました。しかし、四分位数は全体の面積が1/4になる点なので25と26番目のデータの平均が四分位点だと思ったのですが...

質問者が選んだベストアンサー

  • ベストアンサー
  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.3

句点が2個続く箇所が解りにくいのだけれど、 表の位置合わせなのでしょうか? だとすると、 データは (X,F) = (11,2), (14,1), (17,2), (20,1), (23,6), (26,7), (29,11), (32,12), (35,12), (38,17), (41,19), (44,9), (47,0), (50,0), (53,1) でよいのかな? F の合計が 100 だから、中央値は 50 番目の値と 51 番目の値の平均です。 X の値が下から 50 番目人も 51 番目の人も X=35 だから、X の中央値は 35。 四分位数については、定義に文献ごとの揺らぎがある(参考↓) http://www.h6.dion.ne.jp/~ooya/Suugaku/Shibunisuu.pdf のですが、概ね下から 25 番目の人の X の値と考えてよく、 今回は X=29 で間違いないでしょう。 勝手に階級の幅 5 を設定して、階級代表値を作ってしまった ことが、間違いの原因でしょうね。 そのオカシな「解答」の言っていることは、解らないなあ。

その他の回答 (3)

回答No.4

No3さんの回答通り、中央値は35です。その上で、そのオカシな解答を想像すると、No2さんの言っていることが関係します。 すなわち、32時間を申告している人が12人で32時間までの累積人数がが42人、35時間を申告している人が12人で35時間までの累積人数が54人です。 ここで、35時間の申告時間というのは代表値で本当は33.5(33と35の中間)から36.5(35と38の中間)時間働いている人の事だとします。 つまり、与えられたデータがすでに3時間刻みのヒストグラムだと考えてみます。すると、中央値は、33.5+8/12*3=35.5 という計算をしているのだと推測できます。 ここで、8=100/2-42(32時間までの累積が42なので全人数100の半分に達するまで残り8人の意味)、12は35時間を申告した人数で区間幅が3時間なので、8/12*3を区間の下限値33.5に足しているわけです。 あくまで推測です。問題を良く読み直してみてください。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.2

実際のヒストグラムを見ないといけないんだけど, 実は X の値の 11 とか 14 とかが対応する階級の代表値 (中央値) だったりしませんか? もしそうなら, 「27.5という値と33.5という値は対象となる階級内の平均なのでは」は完全に的を外していますよ. この部分は文章では全くわからないので, ヒストグラムで 11 とか 14 とかの書かれている場所から読み取ってください. そして, 「ここで与えられた X は何を意味するのですか」ってのは, つまりこういうことです: 例えば X=29時間に対して F=11人とありますが, これは ・ちょうど 29時間働いた人が 11人いる. すべての人が「3時間で区切られる」ちょうどいい時間だけ働いており, それ以外 (28時間とか 30時間15分とか) の労働時間はあり得ない ということなのですか? それとも, ・働いた時間が「29時間」で代表される人が 11人いる. 28時間働いた人や 30時間15分働いた人もいるかもしれないが, それらはすべて「29時間働いた」ことにする ということなのですか?

mauluru
質問者

補足

回答有難うございます。 実際のヒストグラムは自分で作成するもので無いです。 X=29 f=11というのは、 29時間ぴったり働いている人が11人います。 ということです。 すべての人が「3時間で区切られる」 というのはよくわかりませんが... 28時間とか30時間15分とかの労働時間はあり得ないという条件です。 この部分だけみると労働時間の合計は 一人あたり29時間なので 29×11=319時間ということです。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

まず「私は、階級の幅を5に設定してヒストグラムを作りました」とはどういうことでしょうか? この問題とどのような関係があるのか, さっぱりわかりません. また, 「27.5という値と33.5という値は対象となる階級内の平均なのでは」についてですが ・「対象」とはどういうことですか? ・どうしてこれらの値が「階級内の平均なのでは」と思ったのですか (あるいは, ここで与えられた X は何を意味するのですか)? 実際には, 「ヒストグラムから中央値 (など) を求める」手法はいくつか存在します.

参考URL:
http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/median.html
mauluru
質問者

補足

>私は、階級の幅を5に設定してヒストグラムを作りました 問題には関係ありませんが、私自身が解こうと思ったところ 階級の幅が5あたりならきれいなヒストグラムが かけるのではと考えたからです。 >27.5という値と33.5という値は対象となる階級内の平均なのでは? すいませんでした。分かりづらいですよね。 気になさらなくて大丈夫です。 >どうしてこれらの値が「階級内の平均なのでは」と思ったのですか。 答えにそれらしき値があったからです。 >ここで与えられた X は何を意味するのですか X:週辺りの労働時間 と書いたはずなのですが... 今回では11時間働いた人は2人ということです。 同じく14時間働いた人は1人 17時間働いた人は2人です。 いろんなサイトを回りましたが解答が一致しないため質問をしております。 わたしは、この問題に対しての解答方法及び途中式が知りたいのです X:11、14、17、20、23、26、29、32、35、38、41、44、47、50、53 F: 2、、1、、2、1、、6、、7、、11、12、12、17、19、、9、、0、0、、1 (数字見づらくて申し訳ございません。左から順に対応しています) X:週辺りの労働時間 F:人数 です。

専門家に質問してみよう