• 締切済み

カイ2乗検定の使い方とp値について

アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

みんなの回答

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.2

基本的な方向性は間違っていませんよ。 要するに,開始時期の違いによって,成績に有意差が出るかどうかを統計的に検討するということですね。ちなみに「優位差」ではなく,「有意差」です。χ二乗検定する場合,χ二乗値よりもp値が重要だということもその通りです。もっともχ二乗値が350あれば,それだけで有意差有りと分かりますけれど。 出てきた数字の意味ですが,これは#1の方がおっしゃる通りで,十分に小さいものです。5%,1%(α=0.01)を下回っていますから,あなたの出した結論「開始時期が早いほど成績がよい」は言えるはずです。 ただし,もう少し詳しく検討するならば,クロス集計で11項目×12項目だとすると,「どの成績と,どの要因」という,あなたの考える >11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 という点を考慮する必要があります。このためには,まずセルごとのχ二乗値を算出してください。データ(調査した被験者の数)が十分にあるならば,セルごとのχ二乗値も有効なはずです。大雑把に言うならば,その中で一番χ二乗値が大きいセルが,影響を与えていると考えて結構です。それぞれのセルのχ二乗値を値の大きい順に並べてみると,分かってくるはずです。

jokergreen
質問者

補足

丁寧な回答ありがとうございます! これから細かなカイ2乗検定を行いたいと思います。 そこで1つ質問なのですが、 >まずセルごとのχ二乗値を算出してください。 とありますが、どういった意味なのでしょうか? 2列×2行以上でないと検定できないと思いますが、どの2項目を検定すればいいか分かりません。 上手く説明できているか不安なのですが、分かりましたら教えていただけないでしょうか?

  • tnishi
  • ベストアンサー率0% (0/0)
回答No.1

カイ2乗検定の細かいことはわかりませんが、出てきた数値の、たとえば「8.89E-13」というのは、「有効数字8.89×(10のマイナス13乗)」の意味です。例えば、1.23E-2は1.23×0.01です。

関連するQ&A

専門家に質問してみよう