• 締切済み

中央値を導く公式について

筑波大学OCWのサイトで中央値を求める公式を見つけたのですが、難しくて理解できませんでした。 そこで、今回以下の公式でなぜ中央値が求められるのか、 式のそれぞれの部分は何を意味しているのか、この2点をお教え頂きたいと思います。 公式は以下の通りです。 Median=L+C{(1/2n-F)/fm} よろしくお願い致します。 参考URL: http://ocw.tsukuba.ac.jp/25a0ii-2-56fd969b7dcf54085b66985e/7d718a0879d15b66/8b1b7fa91/view

みんなの回答

回答No.3

No2は完全に忘れてください。度数分布表の数値が間違っていました。すいません。 (1)まず標本から直接に中央値を求めてみます。度数分布表は一切必要ありません。 標本:23,26,27,29,32,33,34,37,41,42,44,46,47,49,51,52,53,55,58,65 データ数20個ですから、中央値は小さい方から数えて、10番目(=42)と11番目(=44)の平均値 (42+44)/2=43kg これが正確な中央値です。 (2)次に5kg範囲で度数分布表を作ってみます。 下限値以上~上限値未満:度数 --- 累積値 20~25:1   --- 1 25~30:3   --- 4 30~35:3   --- 7 35~40:1   --- 8 40~45:3   --- 11 45~50:3   --- 14 50~55:3   --- 17 55~60:2   --- 19 60~65:0   --- 19 65~70:1   --- 20 上の度数分布表だけ拠り所とします。(標本は一切忘れてください。) 度数の累積は20ですからデータは20個あったことが分かります。中央値は10番目と11番目の間ですから、度数の累積値から 40~45の範囲にあったと判断できます。 L=中央値のある階級の下限値=40 C=階級幅=5 n=標本数=20 F=中央値のある階級までの累積度数=8 (20~40までの累積です) fm=中央値のある度数=3  (40~45の度数です) 中央値=40+5*(20/2-8)/3=43.333≒43kg 補足:C*(n/2-F)/fm の意味ですが、中央値が入る区間にfm個のデータが入っているが、この区間に等間隔で入っていると考えるわけです。 すると、5/3,(5/3)*2,(5/3)*3→1.666,3.3333,5 です。下限値を足すと 41.666,43.333,45 の3個のデータと考えます。 (n/2-F)はこの3つのうちの何番目を採用するかを決めています。 注意)(1)と(2)でたまたま一致しましたが、まったく偶然です。(四捨五入もしていますし)

全文を見る
すると、全ての回答が全文表示されます。
回答No.2

(1)まず標本から直接に中央値を求めてみます。度数分布表は一切必要ありません。 標本:23,26,27,29,32,33,34,37,41,42,44,46,47,49,51,52,53,55,58,65 データ数20個ですから、中央値は小さい方から数えて、10番目(=42)と11番目(=44)の平均値 (42+44)/2=43kg これが正確な中央値です。 (2)次に5kg範囲で度数分布表を作ってみます。 下限値以上~上限値未満:度数 --- 累積値 20~25: 1   --- 1 25~30: 3   --- 4 30~35: 3   --- 7 35~40: 2   --- 9 40~45: 3   --- 11 45~50: 3   --- 14 50~55: 3   --- 17 55~60: 2   --- 19 60~65: 0   --- 19 65~70: 1   --- 20 上の度数分布表だけ拠り所とします。(標本は一切忘れてください。) 度数の累積は20ですからデータは20個あったことが分かります。中央値は10番目と11番目の間ですから、度数の累積値から40~45の範囲にあったと判断できます。 L=中央値のある階級の下限値=40 C=階級幅=5 n=標本数=20 F=中央値のある階級までの累積度数=9 (20~40までの累積です) fm=中央値のある度数=3  (40~45の度数です) 中央値=40+5*(20/2-9)/3=41.666≒42kg 補足:C*(n/2-F)/fm の意味ですが、中央値が入る区間にfm個のデータが入っているが、この区間に等間隔で入っていると考えるわけです。 すると、5/3,(5/3)*2,(5/3)*3→1.666, 3.3333, 5です。下限値を足すと 41.666, 43.333, 45の3個のデータと考えます。 (n/2-F)はこの3つのうちの何番目を採用するかを決めています。

全文を見る
すると、全ての回答が全文表示されます。
回答No.1

度数分布表から中央値を求める(推定)方法ですね。 本来、度数分布表はまず標本X1,X2,..,Xnを抽出した後作られるものです。(まず標本あり) で、中央値はこの標本から直接求められるものです。中央値の定義をお調べください。 では、中央値を度数分布表から求めるという状況とは、どういうことでしょう? 端的に言えば、度数分布表を作った後で、標本データをほかした(捨てた)のです。 標本データそのものはないけれど、度数分布表は手元にある。この時中央値は何になるという式です。 ですから、実際に標本データを想定して、度数分布表を作成されたら分かるかもしれません。 例: (1)標本20人の体重をサンプルしたデータを作ってみる。(適当に) (2)度数分布表を作成する。区間の幅は5kg単位とかにして。 (3)(1)のデータから直接中央値を求めてみる。 (4)(2)のデータから問題の式に当てはめて中央値を求めてみる。 これを面倒くさがらずに1度はやってみてください。その上でさらに質問があればまたお答えします。

XJ13
質問者

お礼

丁寧なご回答ありがとうございます。 アドバイス頂いた通り実際に標本データを想定して計算してみました。ただ、中央値の求め方を正しく理解できているか自信がありません。 具体的には、データから直接中央値を求めるやり方と、今回L、C、n、F、fmに代入した数値は正しいのか(L、C、n、F、fmの定義を正しく理解しているか)、また公式でなぜ中央値が求められるのかについて不安が残ります。 そこで厚かましいお願いではありますが、私の理解が正しいのか確認するため、再度ご回答お願い致します。 今回用意したサンプルは以下の通りです。 (23,26,27,29,32,33,34,37,41,42,44,46,4749,51,52,53,55,58,65) また、階級の幅は5kg間隔で (21~25, 26~30, ... 61~65) の様に設定しました。 階級値は、その階級に含まれる度数が奇数の場合は真ん中の値を取り、その階級に含まれる度数が偶数の場合は算術平均で出した平均の値を使用しました。 上記の手順から中央値を直接求めたところ、9つに分けられた階級の真ん中に位置する、5番目の階級の階級値47が中央値になると考えました。 次に、 L=中央値のある階級の下限値=41 C=階級幅=5 n=標本数=20 F=中央値のある階級までの累積度数=8 fm=10 (3)と(4)で求められた答えは共に42でした。 お時間のある時で構いませんので、どうぞよろしくお願い致します。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • Excel2003 条件付き中央値

    Excel2003で条件付きの中央値を算出したいです。 例)A列が「男」の場合のB列の中央値  Excel2007では =MEDIAN(IF(A2:A20="男",B2:B20,"")) 等になるかと思いますが、  2003で算出する手段はありますでしょうか?

  • ラグランジュの公式

    ラグランジュの公式 (a×b)・(c×d)=(a・c)(b・d)-(a・d)(b・c) 特に、a=c,b=dのとき 公式 ∥X×Y∥^2=∥X∥^2∥Y∥^2-(X・Y)^2 になる。 (^2は2乗、a,b,c,dはベクトルです) ということを授業で習ったのですが、どうしてこうなるのでしょうか? インターネットで検索したのですが、見つからず困っています。 よろしかったら、アドバイス、サイトなど教えて頂けたら助かります。 よろしくお願いします。

  • 高校数学、指数対数で分からない問題があります。

    教えてください。 添付写真中央の231です。方針・解法が全く思いつきません。よろしくお願いします。 よろしければ、回答を紙に書いて貼って頂けると凄く嬉しいです。 (数研出版 メジアン数学演習I・II・A・B 受験編より)

  • 質的データの中央値の求め方

    質的データの中央値の求め方を教えてください。 例えば、[2,4,3,2,2,1,3,5]の中央値は[2.5]ということはわかるのですが [b,d,c,b,b,a,c,e]の中央値だと何になるのでしょうか。 統計学はまったくの初心者です。 よろしくお願いします。

  • なんの公式でしょうか?

    こんばんは。数学ど素人の私がろくに調べずに質問を投げてしまい恐縮ですが、この場を借りさせていただきます。 情報処理資格の教本で、題材として以下の例題が取り上げられていました。とりあえずそのまま引用します。 ********************************************** 二次方程式 ax二乗+bx+c=0の解は、判別式 D=b二乗-4acの値によって、以下の3通りになる。 1.D=0のとき  実数解を持ち、その値は x=-b/2a 2.D>0のとき  実数解を二つもち、その値は x=-b±√D/2a 3.D<0のとき  虚数解を二つもち、その値は x=-b±√Di/2a 出典「アルゴリズムの切り札」高田美樹著 技術評論社刊 -p24 冒頭で提示された条件と、1,2,3の法則は何かの公式なのか、 それとも、筆者が算出したものなのか気になってしまいした。 たしかに、abcに任意の数を代入したら示された法則が成り立つのです。 この参考書はあくまで資格試験対策なので、こういう枝葉のところに疑問を持つのは邪道なのでしょうが、、 ちなみにこの設問は、この公式を前提とした「アルゴリズムを考えてください」というものでした(分岐条件を選択するだけの平易なもの)め)。

  • Excelで条件付き平均値、中央値、最頻値算出

    ・『A列 顧客名』『B列 出荷日』『C列 返却日』『D列 個数』となるリストを作成 ・G列の対応したセルに『G2セル 顧客名』『G3セル 出荷日』『G4セル 返却日』を入力すると対応する『D列 個数』の『G5セル 中央値』『G6セル 最頻値』『G7セル 平均値』『G8セル 最大値』『G9セル 最小値』を算出 上記をできるようにしたいです。 まずは検索内容を『検索顧客名 A』『検索出荷日 2018/1/1』『検索返却日 2020/4/20』とした場合の中央値の計算式をいかにしたのですが (1) =MEDIAN(IF(B3:B21>=G3,IF(B3:B21>=G3,IF(A3:A21=G2,D3:D21,""),""),"")) この場合の結果が『4』となりましたが、確認のため別数式で (2) =MEDIAN(D3,D6,D7,D8,D13,D18,D20) とした場合の結果が『6』となりました。 おそらく(1)の数式に問題があるかと思うのですが原因を特定できませんでした。 皆さんに理由と正しい数式をご教授いただきたいです。 また、同様に不具合があった為、最頻値、平均値、最大値、最小値も教えていただきたいと思います。 よろしくお願いいたします。

  • 空間のヘロンの公式??

    三角形の3辺が分かっていれば、ヘロンの公式で面積が求まるように、6辺の長さがa,b,c,d,e,fで与えられただけで四面体の体積(三角錐)を求められるということを知りました。調べたところ、下記のような式で表されるようです。(空間のヘロンの公式?)  しかし、これを示す方法が分かりません。どうやって証明したら良いのか困っています。もしよろしければ教えていただければ幸いです(長ければ指針などでも有難いですm(_ _)m) (12Δ)^2=a^2d^2(b^2+c^2+e^2+f^2-a^2-d^2)+b^2e^2(c^2+a^2+f^2+d^2-b^2-e^2)+c^2f^2(a^2+b^2+d^2+e^2-c^2-f^2)-a^2b^2c^2-a^2e^2f^2-d^2b^2f^2-d^2e^2c^2

  • 乗法公式

    乗法公式 (a+b)(c+d)=ac+ad+bc+bd (a+b)(c+d)=ac+bc+ad+bd どちらのやり方が一般的(メジャー)ですか?どちらのやり方が好きですか?

  • 中央値をもとめる

    このプログラムだとたとえば 1、100、99を入力したときに間違った値を出します。どうすればいいでしょうか?おねがいします。 #include <stdio.h> int main(void) { int a, b, c, m; int max; printf("1個目の数値:"); scanf("%d", &a); printf("2個目の数値:"); scanf("%d", &b); printf("3個目の数値:"); scanf("%d", &c); max = a; if(max < b) max = b; if(max <= c) m = max; printf("%d, %d, %d の中央値は%dです。\n", a, b, c, m); }

  • http://xria.biz/(公式HP)に

    アクセスできますか? 私の場合「名前をつけて保存(例:a947031c-1ac1-4d46-81fd-eb1a85f9667d.tmp)」になり、サイト自体が閲覧できません。 公式だけだけじゃなく個人サイトもそうです。 問い合わせをしたあとからなのでアクセス拒否されたのかもしれません。 公式にあった?ソース確認ページのみアクセスできます。http://xria.biz/xria/source.cgi