• 締切済み

カイ2乗検定の使い方とp値について

アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

みんなの回答

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.2

基本的な方向性は間違っていませんよ。 要するに,開始時期の違いによって,成績に有意差が出るかどうかを統計的に検討するということですね。ちなみに「優位差」ではなく,「有意差」です。χ二乗検定する場合,χ二乗値よりもp値が重要だということもその通りです。もっともχ二乗値が350あれば,それだけで有意差有りと分かりますけれど。 出てきた数字の意味ですが,これは#1の方がおっしゃる通りで,十分に小さいものです。5%,1%(α=0.01)を下回っていますから,あなたの出した結論「開始時期が早いほど成績がよい」は言えるはずです。 ただし,もう少し詳しく検討するならば,クロス集計で11項目×12項目だとすると,「どの成績と,どの要因」という,あなたの考える >11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 という点を考慮する必要があります。このためには,まずセルごとのχ二乗値を算出してください。データ(調査した被験者の数)が十分にあるならば,セルごとのχ二乗値も有効なはずです。大雑把に言うならば,その中で一番χ二乗値が大きいセルが,影響を与えていると考えて結構です。それぞれのセルのχ二乗値を値の大きい順に並べてみると,分かってくるはずです。

jokergreen
質問者

補足

丁寧な回答ありがとうございます! これから細かなカイ2乗検定を行いたいと思います。 そこで1つ質問なのですが、 >まずセルごとのχ二乗値を算出してください。 とありますが、どういった意味なのでしょうか? 2列×2行以上でないと検定できないと思いますが、どの2項目を検定すればいいか分かりません。 上手く説明できているか不安なのですが、分かりましたら教えていただけないでしょうか?

  • tnishi
  • ベストアンサー率0% (0/0)
回答No.1

カイ2乗検定の細かいことはわかりませんが、出てきた数値の、たとえば「8.89E-13」というのは、「有効数字8.89×(10のマイナス13乗)」の意味です。例えば、1.23E-2は1.23×0.01です。

関連するQ&A

  • カイ二乗検定の多重比較について

    SPSSで4×4の名義尺度のカイ二乗検定を行ったところ、Pearsonのカイ二乗検定で5%水準で有意差が出たと出力されました。 そこで質問です。 1.この結果は4×4のデータのどこかの組み合わせに差があるということを表している、と解釈していいのでしょうか? 2.差があるとすれば、どれとどれのデータの間の差なのか知りたいので、分散分析のように多重比較をする方法があるのでしょうか? ご指導お願いします。

  • カイ二乗検定 求めた値の扱い方

    2×2分割表のカイ二乗検定を行います。 手元のカイ二乗分布表では, 有意水準 10% 2.706 5% 3.841 2.5% 5.024 1% 6.635 となっています。 これらの値は片側検定で使用できるのでしょうか? それとも両側検定で使用できるのでしょうか? また,使用できない方で検定したい場合,どうすればよいのでしょうか?

  • spssのカイ二乗、有意差検定について

    SPSSでカイ二乗検定をしたところ、 『0セル(0%)は期待度が5未満です。』とのメッセージがありました。 この場合有意差はfisherの直説法の数値でよいのでしょうか? 『●セル(100%)は期待度が5未満です。』となった場合、 peasonのカイ二乗の数値が有意差となるということでしょうか? セルとその%表示が理解できていません。 お手数をお掛けしますが教えてください。 よろしくお願い致します。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • カイ2乗検定を使ってよいか?

    よろしくお願いいたします。 同一対象者にて、ある年と、その翌年の肥満者の割合を比較したいのですが(ある年には10%だったが、翌年は12%、有意に増加したかが知りたい)、その場合の検定方法はどのようにしたらよいのでしょうか。 自分で考えたのが、肥満の有無でクロス集計をかけてカイ2乗検定、なのですが、解釈のしかたがおかしいかな?と思い、質問させていただきました。 ソフトはSPSSを用いています。 教えていただけますと幸いです。 よろしくお願いいたします。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • SPSS McNemar検定

    SPSSの「McNemar検定」 検定統計量の見方について質問です。 McNemar検定を行った場合,検定統計量(表)では通常N,カイ2乗,漸近有意確率が算出されると思います。 私の行った項目の中で,Nと正確有意確率(両側)は算出されているものの,カイ2乗値と漸近有意確率が表示されていない項目がありました。ちなみにこのときのNは64,正確有意確率(両側)は .125b [b.使用された2項分布]でした。これは,McNemar検定では,有意差が見られなかったという捉え方で良いのでしょうか? SPSSに関する文献を拝見しましたが,McNemar検定について触れているものは少なく,さらに漸近有意確率以外の見方について書かれているものが見つけられませんでした。どうか教えていただけますようよろしくお願いいたします。

  • --- カイ二乗検定 ---

    ある学校のA組・B組・C組で、インフルエンザの罹患者数について有意な差があるのか、また有意差があるのであれば、どの組とどの組に有意差があるのかを確認したいとします。 検定方法は次の通りで合っているでしょうか。 まず3群全体でPearsonのカイ二乗検定を行う(p<0.05で有意)。有意差があれば、A-B、B-C、A-Cで同様にカイ二乗検定を繰り返す。 このとき有意とするのは Bonferroni の補正により p<0.0166…(=0.05/3)の場合とする。    (例)ABC組におけるインフルエンザ罹患有りと無しの人数               有  無           A組  9   21            B組  5    25           C組  14   16

  • SPSSのカイ二乗検定について

    初歩的な質問になりますがもうしわけありません。 卒論で分析をしているのですが知識がありません。 ある尺度によって分けた高群と低群の間に、質問に対する回答(質問が4つで回答が5つの選択肢からひとつを選ぶもの、のそれぞれについて)に有意な差があるかどうかを調べるために、SPSSを使ってカイ二乗検定を行いました。 結果で有意な差があるかどうかはどこを見ればよいのでしょうか。 統計の授業など取っておらず、大変初歩的な質問かと思うのですが申し訳ありません。 超文系人間で数字が苦手なので優しく教えていただけるとありがたいです。

  • カイ2乗検定

    ご存知の方がおられましたら教えてください。 以下のような2×3表でカイ2乗検定を行う際に、 単純にA群とB群の差の有無を検定するだけでなく、 どこに差があるか検定する方法はあるのでしょうか? (例:好きという回答は有意差があって、普通の回答には有意差はない)    好き 普通 嫌い A群  100  120 30 B群  80  140 10