- ベストアンサー
全数調査でもカイ二乗検定?
- カイ二乗検定は全数調査のデータでも使えるのか疑問です。
- カイ二乗検定は標本調査でクロス集計をした場合に行う必要があるのか疑問です。
- 初歩的な質問ですが、全数調査でカイ二乗検定をする必要はあるのか教えてください。
- みんなの回答 (2)
- 専門家の回答
関連するQ&A
- カイ二乗検定について
サイコロがフェアであるかどうか、カイ二乗検定を行いたいのですが テキストには、自由度5で理論度数で割るやり方で解答がなされているのですが これを、自由度6で、二項分布の分散で割るやり方で解くのは間違いなのでしょうか? 具体的には p=1/6 nは理論度数*6=全試行回数 [(標本度数-理論度数)/√np(1-p)]二乗 を1の目から6の目まで足して、それを自由度6のカイ二乗検定に掛けるやり方です。 もし分かる方がいらっしゃったら、教えていただけるとありがたいです。
- 締切済み
- 数学・算数
- カイ2乗について
カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。 (↓行頭「|」の行はサイトからの抜粋です。) | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない. | 血液型 A型 B型 AB型 O型 計 | 観測度数 370 250 120 260 1000 | 期待度数 400 200 100 300 1000 | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ. この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか? | χ2<7.81 だから有意水準5%で「有意差はない」と言える. もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。
- ベストアンサー
- 数学・算数
- カイ二乗による適合度検定におけるカイ二乗値の分布
カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。
- ベストアンサー
- 数学・算数
- カイ2乗検定を使ってよいか?
よろしくお願いいたします。 同一対象者にて、ある年と、その翌年の肥満者の割合を比較したいのですが(ある年には10%だったが、翌年は12%、有意に増加したかが知りたい)、その場合の検定方法はどのようにしたらよいのでしょうか。 自分で考えたのが、肥満の有無でクロス集計をかけてカイ2乗検定、なのですが、解釈のしかたがおかしいかな?と思い、質問させていただきました。 ソフトはSPSSを用いています。 教えていただけますと幸いです。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数
- カイ2乗検定の使い方とp値について
アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。
- 締切済み
- その他(学問・教育)
- 正規性の検定でのカイ2乗検定の自由度について
エクセル統計p051に記されているものです。 標準化値(-1.2,-0.4,0.4,1.2,∞) 理論確率(0.1151,0.2295,0.3108,0.2295,0.1151) 観察度数(4,10,6,9,3) 期待度数(3.6822,7.3443,9.947,7.3443,3.6822)を 列に変換してください。 n=32のデータです。その正規性の検定をするためカイ2乗検定を行ったのですが、自由度が2になることが分かりません。よろしくお願いします。
- 締切済み
- 数学・算数
- 「重み付け」 と 「カイ二乗検定」 のことを教えてください。
SPSSで心理学研究のデータ解析をしておりますが、とても基本的なことを教えていただきたいです。 質問がとんちんかんだったら申し訳ありませんm(_ _)m 1.「重み付けする」というのは、結局どういうことなのでしょうか?ふつうSPSSでは、変数データのパターンの度数をクロス集計で出し、それを「ケースの重み付け」で度数変数に設定するのだと思いますが、これをやると1つ1つの値はどのように算出されて出てくるということですか?度数変数を設定したケースの1つ1つの値は重みが付いたものに変換されるということですよね? 2.1つの名義変数(カテゴリーデータ)と1つの量的変数、これの組み合わせ(のパターン?)から、別の1つの変数を算出する方法はありますか? 2.2列×2行のデータではない(例えば5×5とか、3×2×5とか…?)場合、カイ二乗検定をするのは正しい手法ですか? どうぞよろしくお願いいたします。
- 締切済み
- 数学・算数
- 検定について教えてください。
検定について教えてください。 アンケート調査をクロス集計し、χ2乗検定を行ったのですが、期待度数が5未満のセルが多く検定にかけられませんでした。 カテゴリーを結合するとよいと知り、5つあったカテゴリーを2つにして検定をし有意差5%未満となったのですが、この場合、最初の5つのカテゴリーのクロス集計表の扱いはどうなりますか? 有意差がなくても、クロス表をグラフにしたものはこういう結果でした。と結果だけ出しても差し支えありませんか? 内容: あることの継続を望む人と継続を望まない人と、体調をクロス集計しました。 体調は質問票では「良好である」「まあまあ良好である」「あまり良好でない」「少し不調である」「とても不調である」の5つとしましたが期待度数5未満が33%だったため 「良好である-まあまあ良好である」「あまり良好でない-とても不調である」の2つに振り分けなおしました。 統計についてよくわかっておらず、なんとかχ2乗検定までたどりつきましたが、これからがすすみません。 的外れでわかりにくい質問かもしれませんが、よろしくお願いします。
- 締切済み
- 数学・算数
- カイ二乗検定を行いました。正しいでしょうか?
Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。
- ベストアンサー
- 数学・算数
- EP-M553Tのバッファロールーター設定時にSSIDの選択ができない問題が発生しています。
- プリンター本体ではルーターの機種が表示されるものの、パスワードの入力ができない状況です。
- EP-M553Tのバッファロールーター設定に関してどうすれば問題が解決するかアドバイスをお願いします。
お礼
テキストなんかには書いてない、知的興味をそそるご回答、ありがとうございます。 アンケートの回収率が100%でないかぎり、検定は必要・・・なるほど。しかし、「統計的に有意≠現実的な価値」というあたり、なんか、心苦しいですね。 どうやら、統計的な結果が、実際の行動や生活では何を意味しているのかを理解するには、統計学以外の考え方が必要なようです。