• 締切済み

検定について教えてください。

検定について教えてください。 アンケート調査をクロス集計し、χ2乗検定を行ったのですが、期待度数が5未満のセルが多く検定にかけられませんでした。 カテゴリーを結合するとよいと知り、5つあったカテゴリーを2つにして検定をし有意差5%未満となったのですが、この場合、最初の5つのカテゴリーのクロス集計表の扱いはどうなりますか? 有意差がなくても、クロス表をグラフにしたものはこういう結果でした。と結果だけ出しても差し支えありませんか? 内容: あることの継続を望む人と継続を望まない人と、体調をクロス集計しました。 体調は質問票では「良好である」「まあまあ良好である」「あまり良好でない」「少し不調である」「とても不調である」の5つとしましたが期待度数5未満が33%だったため 「良好である-まあまあ良好である」「あまり良好でない-とても不調である」の2つに振り分けなおしました。 統計についてよくわかっておらず、なんとかχ2乗検定までたどりつきましたが、これからがすすみません。 的外れでわかりにくい質問かもしれませんが、よろしくお願いします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>的外れでわかりにくい質問 何が的外れか、お分かりになっていないと想います。アンケートをする場合は、統計処理を考えてから、するべきです。アンケートをしてから統計処理の方法でウロウロするのは、統計の基本的な誤りです。  具体的には、層別化するのなら、層別化を想定したアンケートをとるべきです。カイ2乗検定なら、良いと悪い、なら簡単にできます。ただ、簡単にできるので、有意差が出やすい、とは言えませんが。  統計処理を考えた上で、アンケートをやりなおすのが普通です。この場合、どちらでもない、というのが入っていませんが。それから、5段階の回答(奇数)は、真ん中が多いので、最近は偶数でするようです。 >これからがすすみません。 たぶん、比較する群が分からないから 。2群の検定は、A群とB群を比較します。男と女、都会の人と田舎の人、など。患者と正常者などで、正常者は対象群とかコントロール群とか統計学では定義します。使用前と後、というのもあります。   何かの研究の匂いがします。指導者がいるのに横から口出しするのは、ルール違反なので、グレーゾーンで止めときます。

関連するQ&A

  • ノンパラメトリック検定

    心理学でカイ2乗のノンパラメトリック検定分析をしたのですが、結果の書き方が分かりません。 どれも有意差が認められるものでしたが、普通なら「AよりBのほうがCの割合が有意に大きいことが示された」ですがこの場合はどう書けばいいのでしょうか? 観測度数と期待度数と残差や検定統計量は出ています。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • 二つの母比率の差の検定について

    二つの母比率の差の検定について、 カイ二乗検定には、やはり「2X2クロス集計表の4つのセルのいずれかの期待度数が5以下の時には不適切である」という制限があるでしょうか。 比較する二つの母比率の内に、一つはサンプル数が少ないので(n<35) カイ二乗検定より、フィッシャーの正確確率検定の方が適切でしょうか? アドバイスを頂けるとうれしく思います。 よろしくお願いいたします。

  • 統計学の適合度検定についての質問です

    統計学初心者です。 観測度数が理論度数の誤差の範囲内かどうかを調べたいのですがどうしたらいいでしょうか? 適当な数値ですが、画像データのAの実測度数が理論度数の誤差の範囲内かどうかを検定するための具体的な計算方法を教えてください。 有意水準は5%、カイ二乗分布 カイ二乗検定で”全体”の検定は x^2=(60-50)^2/50+(20-30)^2/30+・・・+(2-1)^2/1 =6.8444・・・ となり、自由度4のカイ二乗分布、有意水準5%が9.49なので x^2<9.49 有意差はない(誤差の範囲内) というのでまずは合ってますでしょうか? 次にAのみの観測度数と理論度数を検定(誤差の範囲内かどうかを知りたい)したいのですが、 x^2=(60-50)^2/50+(40-50)^2/50 =4 自由度2-1=1のカイ二乗分布、有意水準5%が3.84なので x^2>3.84 有意差はあり(誤差の範囲外) AとB~Eの2個に分けて計算してみましたが、そもそもこの方法が合っているのかどうか分かりません。 アドバイスよろしくお願いします。

  • χ二乗検定とサンプルの比率の差の検定

    統計学を学びはじめたばかりの者です。 現在アンケートの分析(主に調査結果を読み解くこと)について学んでいますが、クロス集計のデータを読み取る際どのように考えたらよいのでしょうか。 例えば性別(男女)を表側に、会社の満足度(満足、普通、不満)を表頭にしたクロス集計結果があったとします。調査結果が男性では満足40%、女性では満足35%、比率の検定を行って男性と女性では「有意な差がある(ない)」と、いきなり語っていいのでしょうか。 というのは、まずχ二乗の検定を行い、性別と、満足度には「なんらかの関係がある」ことを示す必要があるのではないでしょうか。 参考書等をいろいろ見ましたが、このような点に触れているものがありませんでした。私自身に何か根本的な見落とし、考え方に誤りがあるのでしょうか・・・。 答えをお持ちの方、どうかお教えください。 参考書などもご紹介いただけると幸いです。 よろしくお願いします。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。

  • spssのカイ二乗、有意差検定について

    SPSSでカイ二乗検定をしたところ、 『0セル(0%)は期待度が5未満です。』とのメッセージがありました。 この場合有意差はfisherの直説法の数値でよいのでしょうか? 『●セル(100%)は期待度が5未満です。』となった場合、 peasonのカイ二乗の数値が有意差となるということでしょうか? セルとその%表示が理解できていません。 お手数をお掛けしますが教えてください。 よろしくお願い致します。

  • 全数調査でもカイ二乗検定?

    社会調査法のテキストで、「統計的検定」なるものをお勉強しています。いま「クロス集計の検定」のところまできました。 それで、「カイ二乗検定」なるものが出てきたんですが、これは全数調査のデータでも使えるんでしょうか? 私の理解では、そもそもカイ二乗検定が必要なのは、標本でみられた数値の特性が、そのまま母集団にもあてはまるかどうかを確率的に確かめるため、ですよね。 なら、標本調査でクロス集計をしたときだけ、やるんですよね? 母集団すべてを調べた全数調査では、この検定をする必要は、ないんですよね? 初歩的な質問ですいません。「期待度数で周辺度数を、なんちゃら、かんちゃら・・・」と計算する前に、この素朴な疑問に、テキストは答えていない・・・。すみません、どなたか教えてください。

  • 大学の統計学について

    カイ二乗検定の問題でわからないものがあったので教えてください。 標準データのクロス集計表におけるすべてのセルの期待度数が、母集団における属性ごとの比率と完全に一致している時、カイ二乗値はいくつか? 上記の問題の回答をよろしくお願いいたします。