カイ2乗検定のなぞ

このQ&Aのポイント
  • 統計素人のため、カイ2乗検定について理解が深まりません。A群とB群の陽性・陰性の結果に対して、どのような設定が正しいのか説明していただけますか?また、期待値が40~60ならばフィッシャー法を使わずに適切な検定方法はありますか?
  • カイ2乗検定についての疑問です。A群とB群の結果が陽性・陰性のどちらかであり、設定によって期待値が異なる場合、どの設定が正しいのでしょうか?また、期待値が40~60であれば他の検定方法を使用する必要はあるのでしょうか?
  • 初心者のため、カイ2乗検定についてわからないことがあります。A群とB群の陽性・陰性の結果に対して、設定方法によって結果が異なるのでしょうか?また、期待値が40~60であれば他の検定方法が必要なのでしょうか?
回答を見る
  • ベストアンサー

カイ2乗検定のなぞ

統計素人です。なんだかよくわからなくなってしまったので教えてください。 疫学調査をおこないました。 A群、B群あったとして結果は陽性、陰性のどちらかです。 このときのカイ2乗検定で A群(陽性数、陰性数) B群(陽性数 陰性数) と設定する場合(期待値は20~40くらいになります)と A群(A群全体数、陽性数) B群(B群全体数、陽性数) と設定(期待値は40~60)になります。 両方できると思うのですが当然結果が変わってきます。 どっちが正しいやり方なんでしょうか? あと期待値が40~60なんですが、もっと適切な検定方法がありますか? 期待値5以上であればフィッシャー法を使わなくてもよいと本には書いてありますが・・・。

noname#40064
noname#40064

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

正確にはカイ自乗検定ではなく、独立性の検定といいます。それで、この独立性の検定は「A要因(グループ)とB要因(陰性・陽性)は独立である」という帰無仮説を検定するというものです。ですから、 > A群(A群全体数、陽性数) > B群(B群全体数、陽性数) などということはやる必要がないというか、誤りです。 それから、どのような場合においてもFisher's exact testを行った方が良いのです(正確なp値が計算されるのでね)。コンピュータの普及がなかった時代にはこれによる計算が大変で独立性の検定(カイ自乗検定)を行っていたので、統計学の教科書などには古典的な方法として載っているということでしょう。

noname#40064
質問者

お礼

なるほど。よくわかりました。 確かに確率をちゃんとだすFishier検定の方が正確なのは当たり前のことですね。勉強になりました。ありがとうございました(`・ω・´)ゞ

関連するQ&A

  • SPSSを使ったカイ2乗検定について教えて下さい。

    SPSSを使ったカイ2乗検定について教えて下さい。 ある遺伝子の型AとB、肥満群と非肥満群でカイ2乗検定を行い、その後年齢あるいは性別で補正して下さい。との指示がありました。 統計の本を読む限りカイ2乗検定後に他の因子で補正を行う場合はMantel-Heanszel検定を用いるのだと思われます(この時点で間違っているかもしれません)。 この方法で性別(男は1、女は2と入力)についてやってみたところ本と同じような表示の結果が出ました。 しかし、年齢での補正についてがこの検定方法で合っているのかがわかりません。 一応やってみましたが、性別のときのような結果の表示ではありませんでした。 この場合、どのような解析方法を用いればよいのでしょうか。

  • カイ二乗検定の期待値について

    統計学について教えてください。 例えば・・・ 初回治療において副作用が弱く現われた人が19人、強く現われた人が16人 3回目治療において副作用が弱く現われた人が4人、強く現われた人が16人 (初回と3回目で全体数が違うのは副作用にて3回できなかった人がいるとする場合) とした場合、この初回と3回目の治療において副作用出現の仕方に有意差があるかみる場合、 カイ二乗独立性の検定がよいのでしょうか?それともフィッシャーの直接確率計算法が よいのでしょうか?期待値によって使い分けると書かれている本がありましたが、 期待値の考え方がいまいちわかりません。 どなたかご教授いただけないでしょうか???

  • --- カイ二乗検定 ---

    ある学校のA組・B組・C組で、インフルエンザの罹患者数について有意な差があるのか、また有意差があるのであれば、どの組とどの組に有意差があるのかを確認したいとします。 検定方法は次の通りで合っているでしょうか。 まず3群全体でPearsonのカイ二乗検定を行う(p<0.05で有意)。有意差があれば、A-B、B-C、A-Cで同様にカイ二乗検定を繰り返す。 このとき有意とするのは Bonferroni の補正により p<0.0166…(=0.05/3)の場合とする。    (例)ABC組におけるインフルエンザ罹患有りと無しの人数               有  無           A組  9   21            B組  5    25           C組  14   16

  • カイ2乗検定

    ご存知の方がおられましたら教えてください。 以下のような2×3表でカイ2乗検定を行う際に、 単純にA群とB群の差の有無を検定するだけでなく、 どこに差があるか検定する方法はあるのでしょうか? (例:好きという回答は有意差があって、普通の回答には有意差はない)    好き 普通 嫌い A群  100  120 30 B群  80  140 10

  • 3群間の検定について(カイ二乗検定→事後比較)

    A 群、B 群、C 群の 3 群をカイ二乗検定により同時に比較し、少なくともどれかの群は多の群と異なることが分かったとします。 その後それぞれの群間(A vs B、B vs C、C vs A)で再びカイ二乗検定を行い、A 群のみが B、C 群と異なることが分かった、といった解析を行いました。 このような解析方法は統計学的に妥当なものでしょうか(間違った方法ではないでしょうか)? なお、それぞれの群間での対比較の際はボンフェローニ法により有意水準を補正してあります。

  • カイ2乗検定

    初めての投稿です。失礼があるかもしれませんがなにぶんよろしくお願いします。現在看護研究でカイ2乗が必要になっています。 ですがデータが少なすぎ?てうまくいきません。      A      効果有  効果なし B 効果有   4   0   8  効果なし  0   1   1        4   5 9 です。それから対象は同じ患者様なので対応あり?するとマクマネーの 検定?フィッシャーについても実施してみましたが・・・。 いったい何の検定を使えばいいものやら??? 教えてください

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • 2×2分割表の数値が0の場合・・・

    論文作成のため統計処理を行おうと思っていますが、知識が少ないため困っています。よろしくお願いします。 Aという検査を行ったところ、ある患者群では、陽性8、陰性0でした。また、Bという検査を行ったところ、別の患者群では陽性6、陰性0でした。A,Bどちらもそれぞれの患者群で100%陽性と示したことになります。ここで、統計的に分析する場合、フィッシャー正確確立検定を用いることは可能でしょうか?ちなみに持っている統計ソフトでフィッシャー検定を行ってもエラーが出ます。仮に統計的処置ができなくても、このような場合、統計学的な意味としてどのように扱ったらよいか教えていただければ非常に助かります。

  • A/Bテストの検定方法(カイ二乗検定)につい

    仕事でweb制作を行っておりまして、A/Bテストの検定方法について質問です。 統計学超初心者です。 特定のwebページの特定箇所の文言について4パターンを作成し、 コンバージョン率の高いものを見つけるためにテストしています。 その結果が例えば下記のような形だったとします。 <結果> パターン名 / クリック数 / コンバージョン数 / コンバージョン率 A / 10000 / 20 / 0.200% B / 10500 / 23 / 0.219% C / 10800 / 25 / 0.231% D / 9980 / 21 / 0.210% ■質問1 4パターン同時に有意差を確認するには カイ二乗検定で4×2列の表で検定する、と理解していますが合っていますでしょうか? ■質問2 カイ二乗検定で4×2列の表で有意差があった場合、 4パターンでやった場合にバラつきがあった、というだけで、 各パターン個別の有意差については何も言及出来ない、と認識しています。 そこから最もコンバージョンが低いものだけを除いて、 3パターンだけの数字で再度カイ二乗検定(自由度2)したり(上記の結果だと、Aを除いた3パターン)、 上位2パターンだけを取り出し(上記の結果だとCとBだけ→自由度1)カイ二乗検定を行うことは意味があるでしょうか? カイ二乗検定という統計手法を使う上で、数学的な前提が崩れるため意味が無い計算なのか、 それとも、上記のようなパターンで4パターンでの検定を行った後に、 個別に検定を行うことが出来る/意味がありますでしょうか? ■質問3 二項検定・Z検定・二群の比率の差の検定は、 2パターンの比較にだけしか使えないという理解で良いでしょうか?