仮説検定とカイ二乗検定の使い分けについて

このQ&Aのポイント
  • 仮説検定とカイ二乗検定の使い分けについて、質問者は混乱しています。
  • 仮説検定ではHoを立てて実際に調べたい事項の逆接をHoとし、H1が棄却されれば実際の事項が証明されます。
  • カイ二乗検定では実際に調べたい事項をHoとし、結果が棄却されるか否かを検定します。
回答を見る
  • ベストアンサー

仮説検定とカイ二乗検定の使い分けについて

すみません、統計学を学び始めたばかりで、仮説検定とカイ二乗検定の使い分けについて少々混乱しております。 私の理解では、 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。 カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する だと思っているのですが、間違っているでしょうか? なお、これにより、p値から判断する基準が、 仮説検定→p値が小さいほどHoが正しくない可能性が高い カイ二乗検定→p値が大きいほどHoが正しくない可能性が高い ということになると思うのですが、合っていますでしょうか。。。? 問題が出たときの仮説の立て方がだんだんとわからなくなってきてしまい、ますます頭がこんがらがっています。 どなたかアドバイスをいただけるとありがたいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

> 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。  「仮説検定」とは検定のこと、「逆接」とは否定のこと、「Ho」とは帰無仮説のことですね。それなら仰る通りです。  なお、 (1) 帰無仮説Hoが棄却されなかったときには何も言えない(つまり、話は無に帰す。「帰無仮説Hoを採用する(認める)」なんてのは間違い。) (2) 帰無仮説Hoが棄却された時には、Hoの否定(¬Ho)が言える。  だったら「実際に調べたい事項」の否定を帰無仮説にすればいいかというと、いつもそう旨く行くとは限らなくて、 (3) 帰無仮説Hoは統計に関する具体的な予言を導くものでなくては使い物にならない。例えば、「ラーメン屋Aとラーメン屋Bのラーメンは量が同じだ」や「ラーメン屋Aの量はラーメン屋Bの量の1.2倍以上ある」ならば帰無仮説として使えますが、「ラーメン屋Aとラーメン屋Bのラーメンは量が異なる」ではだめ。 ってことには注意すべきです。 > 仮説検定→p値が小さいほどHoが正しくない可能性が高い  その通りです。p値とは『「Hoが棄却できる(ゆえにHoの否定(¬Ho)が成り立つ)」という判断が間違っている確率』のことです。 > カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する  違います。上記(1)(2)の通り、帰無仮説Hoは否定(棄却)されるか無視される(無に帰す)かのどちらかしかありえませんから、「実際に調べたい事項」(つまり結論として言いたいこと)をHoにしても駄目です。 > 仮説検定とカイ二乗検定の使い分け  「仮説検定」と「カイ二乗検定」をわざわざ区別する必要はありません。検定において、帰無仮説から「×××は、あるカイ二乗分布に従う」という予言が導けて、それを使って検定する場合を「カイ二乗検定」と呼ぶ。つまり「カイ二乗分布を使った検定」を略して言ってるだけのことです。 =========================  例えば、「お昼にカレーを食べると、午後の講義で居眠りするような気がする」という意見について考えます。  ランダムにサンプリング調査をして x[1,1] = お昼にカレーを食べ、午後の講義で居眠りした回数 x[1,2] = お昼にカレーを食べ、午後の講義で居眠りしなかった回数 x[2,1] = お昼にカレーを食べず、午後の講義で居眠りした回数 x[2,2] = お昼にカレーを食べず、午後の講義で居眠りしなかった回数 のデータを得たとします。 帰無仮説Ho:「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は独立である(無関係である)。 を立てると、この帰無仮説から a[i]=x[i,1]+x[i,2] b[j]=x[1,j]+x[2,j] N = a[1]+a[2] χ^2 = Σ((x[i,j]-a[i]b[j]/N)^2)/(a[i]b[j]/N)  (Σはi=1,2、j=1,2の総和) とすると、χ^2が自由度1のχ二乗分布に従う、という予言が得られます。 Case 1: 計算してみたらχ^2が3になったとすると、自由度1のχ二乗分布に従うものが偶然3以上になる確率は10%以下である。つまり「Hoが成り立っている場合に、データの偶然のばらつきでたまたまχ^2が3になった」ということが起こる確率(p値)は10%以下である。なので、有意水準10%でHoは棄却でき、Hoの否定: Ho: 「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は関係がある が言えます。  両者の関係が正の相関であっても、負の相関であっても、χ^2は大きな値になる。(χ^2が大きいんだから、データを見ればどっちなのか簡単に区別できる訳ですが。)  また、「お昼にカレーを食べるのが原因で、その結果、午後の講義で居眠りする」とまでは言えない。というのは、両方に共通の原因(例えば、「寝不足でだるくてさー。お昼に並ぶのがいやだから、一番手っ取り早い激マズカレーにしよっと」)があるのかもしれない。あるいは、因果関係が逆(例えば、「今日の午後の講義は寝てても大丈夫だし少々遅刻してもOK。よおし、超人気激ウマカレーの長蛇の列に並ぼう!」)かもしれない。 Case 2: χ^2が0.45になったとすると、自由度1のχ二乗分布に従うものが偶然0.45以上になる確率(p値)は50%ぐらい。なので有意水準10%ではHoは棄却できず、何も言えない。せいぜい「お昼にカレーを食べることと、午後の講義で居眠りすることの関係は、このデータからは分からん。関係があるとしても、その程度の弱い関係しかない。」としか言えない。 Case 3: χ^2が0.02になったとすると、自由度1のχ二乗分布に従うものが0.02以上になる確率は90%ぐらい。ちっとも珍しいことではない。  しかし、自由度1のχ二乗分布に従うものが0.02以下になる確率は10%ぐらいしかない訳で、これは珍しい。Hoが正しいと仮定しても説明できないほどχ^2が小さすぎるのです。だから、有意水準10%でHoは棄却でき、その否定 ¬Ho: 「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は関係がある が言える。でも、2つの事象の相関が強いほどχ^2は大きくなるのですから、ここで言う「関係がある」というのは相関関係ではありえない。そうじゃなくて、「χ^2が小さくなるように(x[1,1]x[2,2] ≒ x[2,1]x[1,2] となるように)行動している。そうなるような何らかの調節なり規則なりが働いている」という関係なんです。たとえば、「学食のメニューはいつも月火水はカレーだけ、木金はラーメンだけ。月曜と木曜の午後の講義は出席点だけで単位が貰えるのでいつも全員居眠りする」なら、こういうことが起こります。

akk729
質問者

お礼

とても分かりやすく、例題も身近な感じで理解しやすく教えていただき本当にありがとうございました! はやり私の理解に誤解が大分あったようなので、とても助かりました!

関連するQ&A

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • カイ二乗検定で処理したいのですがデータのとり方がわからず困っています。

    左利き手と右利き手の被験者における、左右の耳の聴力低下度を調べています。 目的は、左と右の利き手の被験者で利き手の違いに意味があるかどうかどうかを知りたいので、統計はカイ二乗検定を用いています。 聴力低下度の指標は、高音域、低音域の2項目あり、さらに左右の耳があるので、計4項目からなります。データは順位尺度です。 データ入力は、被験者が重複するいわゆる複数回答形式です。 統計処理するデータの扱い方をお教えいただけないでしょうか。 統計に用いるデータは生データを処理するのでしょうか? 順位尺度の生データ(例数)の統計結果は、 自由度   3 カイ二乗値 23.33 危険率   p=0.0001 生データのカイ二乗検定を行うと、検定は棄却され両グループ間で有意差が見られました。 表にして示す場合、生データはn(総例数)が異なるため両グループ間の比較にならないので、構成比率(例数/n*100)で示します。 構成比率のデータで検定すると 自由度   3 カイ二乗値 6.15 危険率   p=0.150 構成比率のデータを用いカイ二乗検定を行うと、検定は採択され両グループ間は差がありません。 統計処理は、生データ比較でしょうか? それとも表にあらわすような構成比率の比較でしょうか? どちらが適切なのでしょうか? どうぞ、よろしくお願い申し上げます。

  • カイ二乗検定及びG検定について

    カイ二乗検定もしくはG検定を用いて適合性の検定を行おうと思っているのですが、以下の判断が出来ず困っております。 ・自由度が大きすぎる(10000以上)場合もカイ二乗検定及びG検定を用いて良いか なお、帰無仮説で想定する分布は多項分布、サンプル数は30から100程度を想定しています。 ご回答をよろしくお願いいたします。

  • カイ2乗検定

    ある乱数を危険率1%のひん度検定を行え。 ただし、自由度49のカイ2乗分布の1%点は74.9とする。 という課題が出たのですが、このときというのは、 検定統計量vが79.4よりも小さければ受容される、という考え方良いのでしょうか??

  • カイ2乗検定

    牛乳の好き嫌い(好き・嫌い・どちらでもない)と給食の牛乳の摂取状況(必ず飲む・時々飲む・飲まない)を Pearson のカイ 2 乗検定で算出したところ、 P=0.036<0.05となりました。これは何の意味があるのでしょうか? 「牛乳が好きな子どもは牛乳を必ず飲み、嫌いな子どもは飲まない」 と証明したいのですが、カイ2乗検定では証明できないでしょうか? 全くの初心者でわからず困っています。お願いします!

  • エクセルでのカイ二乗検定の仕方について

    いつもご利用させて頂いております。 大変、親切に教えて頂けますので、ありがたいです。 さて、エクセルで、統計のカイ二乗検定のやり方を教えてください。 行いたいことは、 はじめる前と、終わりでの変化です。 カイ二乗検定で、「有意さがある」とうことは、どういうことでしょうか?? よろしくお願い致します。6才の子どもでも分かるようにお願い致します。 よろしくお願いします。

  • カイ二乗検定について

    サイコロがフェアであるかどうか、カイ二乗検定を行いたいのですが テキストには、自由度5で理論度数で割るやり方で解答がなされているのですが これを、自由度6で、二項分布の分散で割るやり方で解くのは間違いなのでしょうか? 具体的には p=1/6 nは理論度数*6=全試行回数 [(標本度数-理論度数)/√np(1-p)]二乗 を1の目から6の目まで足して、それを自由度6のカイ二乗検定に掛けるやり方です。 もし分かる方がいらっしゃったら、教えていただけるとありがたいです。

  • カイ2乗検定って何??;;

    タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<)) 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。 知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。