• ベストアンサー

統計:クロス表に関して

クロス表に対してX2検定を行う場合でも明確な理由がない限り両側検定を行うべきなのでしょうか。 また、同じデータであれば、2標本データを対応のあるデータと暑かった方が対応のないデータとして扱うよりも帰無仮説を棄却出来る可能性は高いのでしょうか。 答えられず困っています。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.1

> クロス表に対してX2検定を行う場合でも明確な理由がない限り両側検定を行うべきなのでしょうか。 両側検定を行う必要がある場合は、予想した値に近すぎる結果がでるのを除きたいときです。 どんなに頑張っても、誤差というものがある限りデータはばらつき、理論値どおりにはでません。 そのため、予想した値に近すぎる結果があった場合、予想が正しいと結論付けられるようにデータを改ざんしたのではないかと疑われる可能性もあります。 クロス表に対するカイ二乗検定の場合、検定統計量が0に近いほど理論値(帰無仮説の期待値)どおりの値が得られたということになりますので、両側検定でそれを除くのです。 > また、同じデータであれば、2標本データを対応のあるデータと暑かった方が対応のないデータとして扱うよりも帰無仮説を棄却出来る可能性は高いのでしょうか。 温度の差を調べたのかと少し悩んでしまいました。 冗談はさておき、ご質問の答えとしてはそのとおりです。 例えば、下記のようにAとBの二群の平均の差を検定したいとします。 同じデータについて、初めは対応なしとしてt検定を行うと、帰無仮説は棄却されませんが、次に対応ありとして検定を行うと棄却されてしまいます。 A B 1 3 2 5 3 4 4 6 5 6 > t.test(x$A, x$B, paired = F) Welch Two Sample t-test data: x$A and x$B t = -1.964, df = 7.72, p-value = 0.08644 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.9269095 0.3269095 sample estimates: mean of x mean of y 3.0 4.8 > t.test(x$A, x$B, paired = T) Paired t-test data: x$A and x$B t = -4.8107, df = 4, p-value = 0.008581 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.8388506 -0.7611494 sample estimates: mean of the differences -1.8

関連するQ&A

  • 統計学の仮説検定は、両側検定しかありえないのでは?

    統計学の仮説検定では、両側検定しかありえないのではないかと考えますが、ご意見をお聞かせ下さい。 コイン投げにおいて、表が出る確率をP(H)、裏が出る確率をP(T)とします。 帰無仮説が「P(H)=0.5」である場合、対立仮説を「表が出やすい。P(H)>0.5」とすると片側検定、「コインに偏りがある。P(H)>0.5またはP(T)>0.5」とすると両側検定と説明されます。帰無仮説は同じだでれども、対立仮説が何であるかによって片側検定か両側検定かが決まる、という説明が少なくとも2つの教科書に書かれています。 しかし私は、帰無仮説と対立仮説は互いに排反で、かつ2者で標本空間をカバーし尽くせる(起こりうる全ての事象をカバーできる)ものでなければいけない、と思います。 帰無仮説「P(H)=0.5」に対する対立仮説は「コインに偏りがある。P(H)>0.5またはP(T)>0.5」であるべきだと考えます。そして、「P(H)=0.5」とP(H)の値が特定の1つの値であれば、コインを投げる回数が決まれば(例えば10回)、表が出る回数(0~10回)の確率分布を得ることが可能なので、検定できるわけです。 対立仮説を「表が出やすい。P(H)>0.5」とするのであれば、帰無仮説は「P(H)<=0.5」であるべきだと思います。そうでないと標本空間をもれなく考慮したことになりません。ところが、P(H)=0.5はさておき、P(H)<0.5のもとでは、P(H)の値が無数にあります。ということは、例えば10回中表が0回の確率は無数にあります。10回中表が1回の確率も同様です。したがって、表が出る回数(0~10回)の確率分布を得ることができないので、検定できません。 以上の理由で、統計学の仮説検定では、両側検定しかありえないのではないかと考えますが、ご意見をお聞かせ下さい。

  • 統計学3

    以前にも似たような質問をして今回もその回答のようにやってみましたが、やっぱりうまくいきません。毎度申し訳ありませんがまた教えてください。 課題 8.  S 社の14インチ液晶ディスプレイ(A-xyz) 13 台の寿命を測定したところ,次の結果を得た.   寿命時間が指数分布に従うものと仮定して,平均寿命時間 t に関する 帰無仮説 H0: t=7942.00,対立仮説 H1: t<7942.00 を,有意水準 0.04 で検定せよ. また,平均寿命時間 t に関する下側信頼区間を信頼度 0.96 で構成せよ.    27847 6482 18846 8828 1778 6545 15847 5200 5443 9570 9870 1999 4086 検定統計量= 臨界値(棄却域の端の値)= 帰無仮説 H0は 棄却される,or棄却されない 信頼区間 ( 0 , ] ただし,検定統計量=2×標本数×標本平均÷(帰無仮説の元での平均寿命)

  • 統計学に関する質問です

    統計学の仮説検定に関する質問です。 表の出る確率がpのコインを10回投げる時、表の出る回数を確率変数Xとする。 表の出る回数Xをもとに、仮説 帰無仮説:p = 1/2 対立仮説:p ≠ 1/2 を有意水準5%で検定するとき、棄却域を求めよ。 という問題です。 簡単な問題らしいのですが統計初心者なんでよくわかりません・・・ 二項分布B(10、1/2)をN(5、0.5^2)の正規分布にして (T - 5)/0.5 ~ N(0、1) よって棄却域はT≦4.02 T≧5.98 であってますか?汗

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 統計学の検定のもんだいです。

    前回分 すいません、タイプミスがございました、ご容赦をおねがいします。 検定の問題です。答えも知りたいですけど 自身の考え方が正解かどうか 知りたいです。ご指導宜しくお願いします。 健常者のIgG値の平均値は1180(mg/100ml)であることが知られているとする。A病院における透析患者のIgG値(mg/100ml)の平均値は健常者の平均値と異なっていると言えるか、[A]のデータを用いて有意水準0.05で検定せよ A:1326 1418 1820 1516 1635 1720 1580 1452 1600 (1)帰無仮説と対立仮説を記すこと。 (2)有意水準0.05として、この検定の棄却域を求める(両側検定を行う)。 (1)棄却域を求めるためのRのコマンドを記すこと。 (2)求められた棄却域を T>a, T<b という形で記すこと。ここで、a,bは具体的な値。 (3)検定のための統計量の値を求めるRのコマンドを記すこと。 (4)統計量の値を記すこと。 (5)棄却域と比較することにより帰無仮説を棄却するか採択するか決め、結果を記すこと。 (6)最初に与えられた質問(最初の文章)に解答せよ。 (7)p値を求めるRのコマンドと結果の値を記すこと。 (8)p値の結果の値から帰無仮説を棄却するか採択するか決め、結果を記すこと。

  • 適合度の検定について教えてください!

    統計を学んでいます。 先生がおらず誰かに聞くことができないので、 参考書等を参考に学んでいますが、 適合度の検定にて煮詰まっています(><) 以下の(1)(2)についてご教示いただけますでしょうか。 (1)【仮説の設定】 帰無仮説…差(違い)がない、という内容を持ってくることが一般的 対立仮説…差がある【両側検定】、検定量AよりBの方が大きい(小さい)【片側検定】 ■カイ二乗値が理論値より大きい場合→帰無仮説の棄却 小さい場合→帰無仮説は棄却できない ということで間違っていないでしょうか。 (2)【適合度の検定】 標本調査の調査とりまとめにおいて、国勢調査の年齢別人口構成比率と有効票の年齢別構成比率対象者の年齢分布を比較し、有効票の回答者が調査対象を代表しているかを確認したい。 ■帰無仮説…有効票の回答者が調査対象を代表している(国勢調査の構成比率と差がない) ■カイ二乗値が理論値より大きい場合→帰無仮説の棄却→国勢調査の構成比率と差がある 小さい場合→帰無仮説は棄却できない→差があるとは言えない 年齢・■国勢調査 ・■標本調査結果 ■期待値 20-29歳■169,369 14.8%■ 3,236 15.0% ■ 3189.6 30-39歳 ■193,792 17.0% ■3,703 17.2% ■3649.5 40-49歳 ■172,233 15.1% ■3,291 15.3% ■3243.5 50-59歳 ■219,559 19.2% ■3,723 17.3% ■4134.8 60-64歳 ■103,743 9.1% ■2,024 9.4% ■1953.7 65歳以上 ■283,479 24.8% ■5,531 25.7%■5338.5 合計 ■1,142,175 100.0%■ 21,510 100.0% ■21,510 カイ二乗値:52.7 理論値(自由度5、危険率5%):11.07 結果 帰無仮説を棄却(国勢調査の構成比率と差がある) カイ二乗値ですが、標本数が多ければ多いほど、帰無仮説を棄却せざるを得ないように思うのは、単なる思い込みでしょうか。一般的にサンプルが多いほど、母集団に値が近づくと思う(思いたい)ですが…(この例も、割合だけみれば「母集団を代表している」と言いたいのですが…)。 「母集団を代表している」というのはかなりハードルの高い精度(期待値と回答者数の差が限りなく小さい)が求められるということなのでしょうか。。 (1)(2)に関し、ご意見を頂ければと思います。 (1)も関連しますが特にお伺いしたいのは(2)です。 (2)に関して回答とその理由をお教え頂けると大変助かります。 よろしくお願いします。

  • 数理統計の問題です

    X_1,X_2,....,X_nは指数分布に従う無作為標本。H:μ=1(帰無仮説)A:μ=2(対立仮説)を有意水準α= 0.10で検定する最強力検定とそのときの検出力を求めよ。お願いします。

  • 統計の問題です。

    統計の問題です。 答えがなく困っています。よろしくお願いします。 x1,x2,…,xnが平均μ、分散1の正規分布N(μ,1)をしている母集団からの大きさnの無作為標本であるとする。xバー=Σ[i=1→n](xi/n)と置く。 標準正規分布上側確率0.025の点は1.96であることを用いよ。 1)xバーの標本分布を与えよ。 2)μの95%信頼区間を求めよ。 3)帰無仮説H0:μ=μ0を対立仮説H1:μ≠μ0に対して有意水準0,05で検定するときの棄却域を求めよ。 4)3)の検定問題において、xバーの値を固定した時、棄却されないμ0の値の全体と2)の信頼区間との関係を述べなさい。 一応解いた答えを載せますが、全部自信がないです。 1)f(xバー)=1/√2πexp(-(x-μ)^2/2) 2)P(|(xバー-μ)/1|=0.95 よって、μ-1.96≦xバー≦μ+1.96 3)棄却域Rは、R<-1.96,1.96<R

  • t検定について教えてください

    t検定に関する質問はたくさんあるのですが、今、頭がこんがらがっており、 誠に勝手ながら新しく質問させてください。それではよろしくお願いします。 2標本の分布が等しいと仮定。t検定の基礎を教えてください。 帰無仮説は、「2標本の平均が等しい」ですか? 帰無仮説が上記の場合、 危険率1%で仮説が棄却されず、5%で棄却されることはありますか? 上記の判定がなされた場合、 これら2標本はどのような関係にありますか? 1~5%の確率でうんぬん???よくわからなくなってしまいました。 駄文のみの状況説明で、申し訳ありませんが、ご教授願います。 それではよろしくお願いします。補足要求があれば、つたない説明ながら加えさせていただきます。

  • 統計の問題【至急お願いします】

    統計の問題にほとんど手が出ません。 お恥ずかしいですがよろしくお願いします。 x1,x2,…,xnが平均μ、分散1の正規分布N(μ,1)をしている母集団からの大きさnの無作為標本であるとする。x^-=Σ[i=1→n](xi/n)と置く。帰無仮説H0:μ=0を有意水準0,05で検定する。回答に必要な記号は適宜説明して用いよ。 標準正規分布上側確率0.025の点は1.96であることを用いよ。 1)対立仮説H1:μ≠0とした場合およびμ>0とした場合の棄却域を与えよ。 2)検出力について一般的に説明し、2)で与えた2つの棄却域についてμ>0の時の検出力と比較せよ。 3)x^-の値が正であることを観測してから対立仮説をμ>0とする方法について考えを述べよ。 自作解答 2)検出力とは、対立仮説H1が正しい時に正しく仮説を棄却する確率のことを言う。 検出力=1-(第二種の過誤を犯す確率)