中央値の大小関係について

このQ&Aのポイント
  • n個のデータの中央値について説明します。奇数の場合は中央の値、偶数の場合は中央の2つの値の平均です。
  • また、n個のデータをn1個とn2個に分割し、それぞれのデータの中央値をm1とm2とします。
  • 質問者はm1 < m かつ m2 < m が成り立つことに疑問を持っています。
回答を見る
  • ベストアンサー

中央値の大小関係について

中央値の大小関係について n個のデータがあるとき、データの中央値 m を以下のように定義します。 中央値= 小さい方から (n+1)/2 個目のデータ 〔nは奇数〕   小さい方から n/2 個目のデータと n/2+1 個目のデータの平均 〔nは偶数〕 次にn個のデータを n1個とn2個のデータに分割(n1+n2=n)し、 n1個のデータの中央値を m1 n2個のデータの中央値を m2 とします。 このとき、  m1<m かつ m2<m となることは有り得るのでしょうか? 某プログラム言語を使ってデータ分析をしていたところ上記のような結果が発生しました。 直感的にはないと思うのですが。プログラムミスでしょうか?よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • R_Earl
  • ベストアンサー率55% (473/849)
回答No.1

> このとき、 >  m1<m かつ m2<m > となることは有り得るのでしょうか? あり得ないと思います。 n個のデータの「m未満の値のデータの集合」をL、 「m以上の値のデータの集合」をHとおきます。 中央値の求め方を考えると、 Lの要素数 < Hの要素数 … (*) となる事が分かると思います。 ここでデータを、m1 < mかつm2 < mが成り立つように、 n1個のグループとn2個のグループに分割する事を考えます。 [方法1] n1個のデータの方の中央値m1をmより小さくしたければ、 まず「Lからk個、Hからk個未満のデータを選ぶ」という方法が思い浮かびます。 こうすればとりあえずm1 < mが実現できます。 ここで選ばなかったデータ群が、 もうひとつのデータのグループ(n2個のデータのグループ)となります。 n1個のデータを選ぶ時に、HよりもLから多めにデータをとってしまっていました。 この事と(*)式より、n2個のデータのグループには 「Hの要素」が「Lの要素」より多く含まれることが分かります。 つまりこの時、n2個のデータのグループの中央値m2はmより大きくなってしまいます。 よって 「n1個のデータを選ぶときはLからk個、Hからk個未満のデータを選ぶ」 という方法ではm1 < mかつm2 < mは実現できません。 同様の理由で、 「n2個のデータを選ぶときはLからk個、Hからk個未満のデータを選ぶ」 という方法でもm1 < mかつm2 < mは実現できません。 [方法2] [方法1]より、m1 < mかつm2 < mを実現するためには 「n1個のデータを選ぶ時はLからk個、Hからk個のデータを選ぶ」 「n2個のデータを選ぶ時はLから(n/2)-k個、Hから(n/2)-k個のデータを選ぶ」 という選択肢しか残されていません。 この時総データ数は偶数となるため、中央値mは (max(L) + min(H)) / 2 で計算されます。 n1個のデータ総数は2k個なので、やはりデータ数は偶数個となります。 よってn1の中央値m1は m1 = ((Lから選んだk個のデータの最大値) + (Hから選んだk個のデータの最小値))/2 で計算することになります。 ここでm1 < mが実現できるようにn1個のデータを選ぶ事を考えてください。 そのためにはLからk個要素を取ってくるときに、 max(L)未満の値のデータのみを選ぶ必要があります (逆にmax(L)の値を持つデータをLから選んでしまうと、 m1 < mとならない事がすぐ分かると思います)。 しかしそうするとn2個のデータを選ぶ際、 Lからデータを選ぶ時に必ずmax(L)の値をもつデータを選ぶ事になります。 なのでm2 < mが実現できなくなります。 よってどんな方法でデータを分割しても m1 < mかつm2 < mが成り立つ事はあり得ないと思います。

deep_4_
質問者

お礼

詳細な説明ありがとうございました。 解決いたしました。

その他の回答 (3)

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.4

質問者様のプログラムの中で、浮動小数点型データを使っていないでしょうか? ANo.1様、ANo.2様のとおり、「m1<m、m2<m」はあり得ませんが、「m1<m、m2<=m」はあり得ます。浮動小数点型では、数学的にm2 = mであっても、プログラムがm2 < mと判定することがよく起きるのです。これは、浮動小数点型が、原則として誤差を伴っているためです。 なお、10進法表記で誤差がないように見える数値でも、コンピュータ内部には2進法で格納されるため、実際は誤差が発生している場合が多いことに注意する必要があります。 次のBasicプログラムを見てください。   Function Test() As String     Dim X As Single      'Xは、単精度浮動小数点型(32ビット)     Dim i As Integer     X = 1     For i = 1 To 3       '0.1を3回加える       X = X + 0.1     Next i      If X < 1.3 Then       Test = "X < 1.3"     ElseIf X = 1.3 Then       Test = "X = 1.3"     ElseIf X > 1.3 Then        Test = "X > 1.3"     End If   End Function X = 1.3 のはずですが、私のパソコンでは、X > 1.3 という答が返ってきます。

deep_4_
質問者

お礼

VBA例までを示していただきありがとうございます。 プログラムで誤差を極小化した数値計算を行うことは難しいのですね。 そこらへんの知識も知っておかなければとは思っているのですが、なかなか…

  • R_Earl
  • ベストアンサー率55% (473/849)
回答No.3

ANo.1ですが訂正です (誤) Lの要素数 < Hの要素数 … (*) (正) Lの要素数 ≦ Hの要素数 … (*) それから方法2を使おうとしてできるのは (Lの要素数) = (Hの要素数)の時のみです。 (Lの要素数) < (Hの要素数)の時は 「n1個のデータを選ぶ時はLからk個、Hからk個のデータを選ぶ」 という事はできます。 しかしn2個のデータを選ぶ時、LとHから同じ個数のデータを取ることができません。 かならずHの方から多めにデータを取ります(式(*)より)。 なのでこの場合、m2 < mを満たす事ができないことが分かります。

  • mikeyan
  • ベストアンサー率41% (19/46)
回答No.2

ありえないと思います。 全データの半分は中央値m以上の数ですから、 m1<m、m2<=mとなる場合はあります。

deep_4_
質問者

お礼

簡潔な説明ありがとうございました。 解決いたしました。

関連するQ&A

  • 中央値の求め方の証明

     n個の整数が存在したとき、nが偶数である場合の中央値は(n/2 + n/2+1)*1/2であり、nが奇数である場合の中央値はn+1/2であることを証明せよ。  という問題を自分で作ってみたのですが、この問題の証明の仕方でいい解答をいくつか自分で考えてみたのですが、皆さんならどう証明するか(証明の仕方)を教えてください。

  • 証明

    m,nが奇数のとき、(m^2)-(n^2) は8で割り切れることを証明するには m=2α+1 n=2β+1 (α、βは整数とおくと) (m^2)-(n^2)=(m+n)(m-n) m+n=2(α+β+1) m-n=2(α-β) (m^2)-(n^2)=4(α+β+1)(α-β) までは考えたのですが そのあと、 (1)αが奇数,βが奇数⇒α+β+1が奇数,α-βが偶数   (2)αが奇数,βが偶数⇒α+β+1が偶数,α-βが奇数   (3)αが偶数,βが奇数⇒α+β+1が偶数,α-βが奇数   (4)αが偶数,βが偶数⇒α+β+1が奇数,α-βが偶数 となり,(α+β+1)(α-β)は偶数です. よって、8の倍数といえる これでも合ってますか? 以前、回答がこなかったのでもういちどおねがいします

  • 偶数と奇数の和は奇数になることを説明しなさい

    中2の数学の問題です。 問題: 偶数と奇数の和は奇数になることを説明しなさい。 問題集の解答で疑問に思う点がありましたので質問させていただきます。 解答: m,nを自然数とすると偶数は2m、奇数は2n-1と表せる。 2数の和は、 2m+2n-1=2(m+n)-1 m+nは自然数だから2(m+n)は偶数になり、2(m+n)-1は奇数になる。 よって偶数と奇数の和は奇数である。 (証明終わり) 上記証明でわからない点が2点あります。 (1)m,nをなぜ自然数に限定しているのか。 m,nは一般に整数ではないのでしょうか?中学レベルではマイナスの数も 偶数、奇数が定義できると思うので、私はこのm,nは整数と置くのが正しい 答え方だと思うのですが、いかがでしょうか? (2)もしm,nが自然数と置くのが正しいとしたとき、奇数を2n+3とおいてしまうと 3(n=1)から始まる奇数になり一般に自然数全体で証明したことにならないの ではないかという疑問があります。 2m+2n+3=2(m+n+1)+1 このような解答も見かけます。 文字式の計算上は奇数といえますが、nが自然数で奇数を2n+3とおいても 問題ないのでしょうか?  ご回答よろしくお願いします。   

  • 数列の和。偶数奇数に分かれる場合

    よろしくお願いいたいます。 数列の数列の和。偶数奇数に分かれる問題で a2m=4m^2+m a2m-1=4m^2-3m+1 となりました。このn項数までの和を求める問題なのですが、、 項数の設定が良くわかりません。 偶数、奇数とも項数をNでおき、和の公式に当てはめる流れになるのですが 最終的にn項に戻すときに 偶数はn=2Nだから N=1/2nを代入。 奇数はn=2N-1だから N=n+1/2を代入。 まず、項数をn=2N、n=2N-1と置くところがわかりません。 偶数奇数なのだから半分ずつ、1/2nずつではないのですか? また項数をn=2N、n=2N-1と置いたとしいても足す数は最終的にnなのだから 1/2n+n+1/2とnで換算したときに合計がnにならないとおかしいと 感じます。 私は何が理解できていないのでしょうか? 丁寧なご説明をいただけたら幸いです

  • 論証 証明の仕方

    命題 m+n,mnが共に偶数ならばm,nは共に偶数である が真であることの証明法を質問します。 逆の命題はm=2k,n=2l(k,lはともに整数)とおいてm+n=2(k+l),mn=2×2klで証明終でしたが,上記のも直接証明できませんか?(lは小文字のエル) 対偶で m,nの少なくとも片方が奇数ならばm+n,mnの少なくとも片方は奇数である は 1)mが偶数m=2k,nが奇数k=2l-1(mnは偶数だがm+nは2k+2l-1となるので奇数) 2)m,n共に奇数 m=2k-1,l=2l-1(m+nは偶数だがmnは4kl-2k-2l+1となるので奇数) 3)mが奇数m=2k-1,nが偶数n=2l(1)と同様) としてそれぞれm+n,mnを示せばよいのでしょうが,そうではない方法でお願いします。 m+n=2k,mn=2lとおいてnを消去したらmの2次式となってしまい,解の公式で解いたら m=l±√ となり,偶数であることを示せませんでした。

  • 高校数学です。「 円周を n等分する点を、~」

    高校数学です。次の問題の解と解法がわかりません。どなたか教えていただけないでしょうか。 「 円周を n等分する点を、A1, A2, …, An とする。 この n個の点から異なる3個の点を選び、それらを頂点とする三角形を作ったとき、 鋭角三角形となるような選び方は何通りあるか? (1) n=5 のとき (2) n=6 のとき (3) n が偶数2m のときと、n が奇数2m+1 のとき 」

  • 因数分解の証明

    m,nが奇数のとき、(m^2)-(n^2) は8で割り切れることを証明するには m=2α+1 n=2β+1 (α、βは整数とおくと) (m^2)-(n^2)=(m+n)(m-n) m+n=2(α+β+1) m-n=2(α-β) (m^2)-(n^2)=4(α+β+1)(α-β) までは考えたのですが α、βが奇数のとき 例えばα=3,β=1のとき 40になります α、βが偶数のとき 例えば、α=4、β=2のとき 48になって 8の倍数ということが証明できるで合ってますか?

  • 数学Iの集合と論証について教えてください

    集合と論証が全く分からないので、教えてください。 (問題)nが自然数のとき、次の命題が真であることを証明しなさい。 (命題)(n+1)^2は偶数⇒nは奇数 (証明) 与えられた命題の対偶 nは偶数⇒(n+1)^2は奇数 が真であることを証明する。 nを正の偶数とすると、mを自然数として n=2m+2 と表すことができる。このとき、 n+1=?? ??が分かりません。普通に2m+2+1で良いんですか? あと上の証明は合ってますか?

  • 背理法について

    次の命題を考えます n^2が偶数⇒nは偶数 「これを証明するために背理法を用いてこの命題の否定であるn^2が偶数∧nは奇数が真であると仮定して、 矛盾を導く。 今、nは奇数なのであるkが存在して2k+1と表せる。(2k+1)^2=2(2k^2+2k)+1より、n^2は奇数。 よってn^2が偶数∧nは奇数のn^2が偶数という条件と矛盾。 よって命題はただしい。(方針はこれでお願いします)」 ここで、n=2のとき、上同様に証明してみるとおかしなことに命題の否定が真になってしまいます。 2^2が偶数⇒2は偶数を証明するためにこの命題の否定である2^2が偶数∧2は奇数が真であると仮定して、2が奇数なので2^2=4より偶数よって2^2が偶数∧2は奇数はしんになり、2^2が偶数⇒2は偶数は偽になる(?) これはどこがいけないのでしょうか。 一般のnが証明できたからn=2の時も成り立つのではないのでしょうか。 よろしくお願いします。

  • 数学 データ 中央値の求め方

    未知数aを含むデータでの中央値の求め方についてです。 aを含め偶数個あるデータの中央値の求め方は問題集で理解しました。 ですがaを含め奇数個あるデータの中央値の求め方の問題がなくてわかりません。 偶数個の方の私の求め方です↓ A,B,C,D,E,F,G と未知数a (1)a抜きのデータで中央値となる値(D)の前の値(C)≦aのとき D+a/2 (2)a抜きのデータで中央値となる値(D)の後ろの値(E)≧aのとき E+a/2 (3)C+1≦a≦E-1のとき 2+{(E-1)-(C+1)+1}=[答え] なんというか自分的に勝手に求め方を作った感じでわかりにくくてすみません。 奇数個のとき必ずしもこういう風で求めたいとかではありません。 よろしくお願いします。