• 締切済み

「カイ二乗検定」と「比率の差の検定」って同じものですか?

 「カイ二乗検定」と「比率の差の検定」って同じものですか? もし違うとすればどのように違いますか?数年前に勉強したのですがわからなくなってしまいました。ご教授いただければ幸いです。 また、参考になりそうなサイト等ありましたら合わせてお願いいたします。

みんなの回答

noname#227064
noname#227064
回答No.2

訂正 > 自由度1のカイ二乗分布に従うことを利用して検定します。 > 標準正規分布に従うことを利用して検定します。 両方とも「近似的に~分布に従う」としてください。

noname#227064
noname#227064
回答No.1

母集団1から大きさmの標本、母集団2から大きさnの標本を得て、標本の比率がそれぞれp, qであったとき、母集団1と2の母比率が同じかどうか検定したいとします。 検定方法1 χ^2 = (mp-mr)^2/(mr)+{m(1-p)-m(1-r)}^2/{m(1-r)}+(mq-mr)^2/(mr)+{m(1-q)-m(1-r)}^2/{m(1-r)} (ただしr=(mp+nq)/(m+n)) が自由度1のカイ二乗分布に従うことを利用して検定します。 検定方法2 z = (p-q)/√{(1/m+1/n)r(1-r)} (ただしr=(mp+nq)/(m+n)) が標準正規分布に従うことを利用して検定します。 上記の2つの検定方法は、χ^2 = z^2であることからどちらも同じ検定結果になります。 (ただし両側検定のみ) あなたの言うところの「カイ二乗検定」が上記の検定方法1で、「比率の差の検定」が検定方法2のことであるなら、同じ結果が得られるという意味で同じ検定といっていいでしょう。

関連するQ&A

  • カイ二乗検定 比率の多重比較

    ストレスチェックのアンケートを実施しました。 その中に「お酒を飲み始めるととまらないことがある」「落ち込んで悲しいことがある」など約20項目について「はい・いいえ」で答えてもらっているところがあります。 どの年代が多く「はい」と答えているかについて知りたく、年齢を6つのカテゴリーに分けカイ二乗検定をしました。 全体で差があることは分かったのですが、発生比率についてどの郡間に差があるか多重比較したいと思っています。 使用しているのはSPSSです。 どのような方法を使えば、カイ二乗検定後の比率の多重比較ができるのでしょうか?

  • 二つの母比率の差の検定について

    現在、二つの母比率の差の検定について行っています。 その結果は、「有意性が出なかった(P>0.05)」 もし、消極的に少なくとも「差がない」と言いたい場合 どうしたらよろしいでしょうか。 カイ二乗検定とフィッシャーの正確確率検定を両方とも行ったが 有意性が出なかった。 その上に、「カイ二乗区間推定」を行ったらっというアドバイスを頂いたが、その意味はわかりません。 アドバイスをよろしくお願いいたします。

  • 二つの母比率の差の検定について

    二つの母比率の差の検定について、 カイ二乗検定には、やはり「2X2クロス集計表の4つのセルのいずれかの期待度数が5以下の時には不適切である」という制限があるでしょうか。 比較する二つの母比率の内に、一つはサンプル数が少ないので(n<35) カイ二乗検定より、フィッシャーの正確確率検定の方が適切でしょうか? アドバイスを頂けるとうれしく思います。 よろしくお願いいたします。

  • カイ2乗検定を使ってよいか。

     よろしくお願いいたします。ソフトバンククリエイティブという会社から出ている「仕事に役立つExcel 統計解析」という本を見ながら勉強している最中の者です。  データ分布を検定する節に次のような例が掲載されています。 「日用雑貨品の半年間の売り上げ実績をもとに月別売り上げに差があるかどうか検定する。(モデルデータは4月の売り上げが突出している。)なお,日用品であるので理論的には月ごとの売り上げに差はないとする。(=期待値は,6ヶ月間の平均値)」  以上の例をもとにカイ2乗検定(5%,自由度5)を行っています。  そこで質問です。 1 入学直後に行ったテストの平均点が今年度も含めて10年分あったとします。今年度入学してきた生徒と差があるかどうかをカイ二乗検定で検定することは妥当でしょうか。(同じ学校なので理論的には同質の生徒が入学してくると仮定し,期待値は10年分の平均を使うつもりです。) 2 私が参考にしている本だとカイ二乗検定の前節に書いてあるのですが,t検定(平均値の差の検定)との違いが分かりません。例えば,今年度を除く過去9年分の平均点の平均とその標準偏差を求めておき, (過去9年分の平均±自由度8のt値×標準誤差)の範囲に今年度の平均が収まるかどうかを見るというのは数学的に妥当でしょうか。 3 そもそも過去9年間の平均点と今年度の平均点及び今年度の標準偏差のみから過去9年間の生徒と今年度の生徒に差がある(若しくはない)ことを言うことはできるのでしょうか。  なにしろ初心者ですので,要領を得ない質問になってしまいがちですがよろしくお願いします。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗検定で処理したいのですがデータのとり方がわからず困っています。

    左利き手と右利き手の被験者における、左右の耳の聴力低下度を調べています。 目的は、左と右の利き手の被験者で利き手の違いに意味があるかどうかどうかを知りたいので、統計はカイ二乗検定を用いています。 聴力低下度の指標は、高音域、低音域の2項目あり、さらに左右の耳があるので、計4項目からなります。データは順位尺度です。 データ入力は、被験者が重複するいわゆる複数回答形式です。 統計処理するデータの扱い方をお教えいただけないでしょうか。 統計に用いるデータは生データを処理するのでしょうか? 順位尺度の生データ(例数)の統計結果は、 自由度   3 カイ二乗値 23.33 危険率   p=0.0001 生データのカイ二乗検定を行うと、検定は棄却され両グループ間で有意差が見られました。 表にして示す場合、生データはn(総例数)が異なるため両グループ間の比較にならないので、構成比率(例数/n*100)で示します。 構成比率のデータで検定すると 自由度   3 カイ二乗値 6.15 危険率   p=0.150 構成比率のデータを用いカイ二乗検定を行うと、検定は採択され両グループ間は差がありません。 統計処理は、生データ比較でしょうか? それとも表にあらわすような構成比率の比較でしょうか? どちらが適切なのでしょうか? どうぞ、よろしくお願い申し上げます。

  • 比率の差の検定について

    よろしくお願いします。 2つのデータの比率の差の検定になると思うのですが,どのように考えたらいいか教えていただければ幸いです。 1つのデータ(I)は実際に調査をし,A群,B群,C群の実測値を得ました。 もう1つのデータ(II)は他の所で調査された全国的なデータで,正確な実測値はわからず,A群~C群に該当する人の割合のみが示されています。 このIとIIの調査のA~C群の割合に差異があるかについて検討したいと思います。 この場合,カイ二乗検定ではなく,比率の差の検定を用いればいいのでしょうか? 初歩的な質問で申しわけありませんが,ご教示ください。

  • カイ二乗検定について

    ここのサイト内で検索をしたのですが、わからないことがあったのでよろしくお願いします。 もうすぐ卒論の提出期限が迫っているというのに、検定に行き詰ってしまい、進まずにいます。 391 249 205 274 137 403 98 242 のカイ二乗検定をおこなったところ、結果が 181.81という数が出てしまいました。 こんなに大きな数が結果として出ることはありえるのでしょうか?

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。