χ二乗検定(分析)の方法と結果

このQ&Aのポイント
  • ゲームの重要度・必要性に関する仮説を検証するために、χ二乗検定を使用しました。
  • 分析の結果、自由度12でカイ二乗値が42.19という結果が得られました。
  • 今後の検定方法についてアドバイスをいただきたいです。
回答を見る
  • ベストアンサー

χ(カイ)二乗検定(分析)の方法

「小さい頃からゲームをしている人の方が、 ゲームに対する重要度・必要性が高い。」という仮説で 分析をしたいのですが、実現度数・期待度数を計算し 自由度も計算したら結果が凄いことになってしまいました。 カイ二乗検定で分析していることが間違っているのかもわかりません…。 分析したいのは a.1歳~5歳 b.6歳~10歳 c.11歳~15歳 d.16歳~20歳 e.21歳~ と a.困らない b.あまり困らない c.やや困る d.困る の結果です。 ・独立変数=ゲームを始めた年齢 ・従属変数=重要度・必要性の高さ これで計算をしたら自由度12で カイ二乗値は42.19と出てしまいました。 どの方法で検定するのがいいのでしょうか…。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 表を見ても0.001までしか載っていないので…。 なるほど!たしかに表ならそれほど大きい値はないですね(^_^;) > それとももっと先がある表はあるのでしょうか? 要するに、自由度12のカイ自乗分布において、カイ自乗値42.19という値が起こりうる確率は0だということです(正確には限りなく0に近い)。だから表に書く必要もないわけです。 コンピュータで計算してみると、 > 1 - pchisq(42.19, 12) [1] 3.094033e-05 となりますから、これはもうほとんど0とみなしても良い値ですよね。 3.094033e-05 = 0.00003094033 機会があれば、Rという統計ソフト(無料)を使って、自由度12のカイ自乗分布を描いてみると分かりやすいでしょう。 > DF <- function(x) dchisq(x,12) > plot(DF,0,40) > abline(h=0)

u76tkans
質問者

お礼

詳しくお答えして下さってありがとうございました! 限りなく0に近いということで、計算ミスや 間違った結果というわけではないことを確認することができました。 本当にありがとうございます。 とても助かりましたm(__)m

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> これで計算をしたら自由度12でカイ二乗値は42.19と出てしまいました。 よく分かりませんが、なんだからそういう値が出てしまったのが"よくない"と考えているように受け取れるのですが? 正しい計算(プログラム)によってそのようになったのなら良いも悪いもないでしょう。それが結果なのですから(別に珍しいあたいでもないですし、、、)。

u76tkans
質問者

補足

回答ありがとうございます。 自由度12でカイ二乗値は42.19ですと 危険率がわからないのです…。 χ二乗検定の表を見ても0.001までしか 載っていないので…。 それとももっと先がある表はあるのでしょうか?

関連するQ&A

  • カイ二乗検定について

    サイコロがフェアであるかどうか、カイ二乗検定を行いたいのですが テキストには、自由度5で理論度数で割るやり方で解答がなされているのですが これを、自由度6で、二項分布の分散で割るやり方で解くのは間違いなのでしょうか? 具体的には p=1/6 nは理論度数*6=全試行回数 [(標本度数-理論度数)/√np(1-p)]二乗 を1の目から6の目まで足して、それを自由度6のカイ二乗検定に掛けるやり方です。 もし分かる方がいらっしゃったら、教えていただけるとありがたいです。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • A/Bテストの検定方法(カイ二乗検定)につい

    仕事でweb制作を行っておりまして、A/Bテストの検定方法について質問です。 統計学超初心者です。 特定のwebページの特定箇所の文言について4パターンを作成し、 コンバージョン率の高いものを見つけるためにテストしています。 その結果が例えば下記のような形だったとします。 <結果> パターン名 / クリック数 / コンバージョン数 / コンバージョン率 A / 10000 / 20 / 0.200% B / 10500 / 23 / 0.219% C / 10800 / 25 / 0.231% D / 9980 / 21 / 0.210% ■質問1 4パターン同時に有意差を確認するには カイ二乗検定で4×2列の表で検定する、と理解していますが合っていますでしょうか? ■質問2 カイ二乗検定で4×2列の表で有意差があった場合、 4パターンでやった場合にバラつきがあった、というだけで、 各パターン個別の有意差については何も言及出来ない、と認識しています。 そこから最もコンバージョンが低いものだけを除いて、 3パターンだけの数字で再度カイ二乗検定(自由度2)したり(上記の結果だと、Aを除いた3パターン)、 上位2パターンだけを取り出し(上記の結果だとCとBだけ→自由度1)カイ二乗検定を行うことは意味があるでしょうか? カイ二乗検定という統計手法を使う上で、数学的な前提が崩れるため意味が無い計算なのか、 それとも、上記のようなパターンで4パターンでの検定を行った後に、 個別に検定を行うことが出来る/意味がありますでしょうか? ■質問3 二項検定・Z検定・二群の比率の差の検定は、 2パターンの比較にだけしか使えないという理解で良いでしょうか?

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。

  • 正規性の検定でのカイ2乗検定の自由度について

    エクセル統計p051に記されているものです。 標準化値(-1.2,-0.4,0.4,1.2,∞) 理論確率(0.1151,0.2295,0.3108,0.2295,0.1151) 観察度数(4,10,6,9,3) 期待度数(3.6822,7.3443,9.947,7.3443,3.6822)を 列に変換してください。 n=32のデータです。その正規性の検定をするためカイ2乗検定を行ったのですが、自由度が2になることが分かりません。よろしくお願いします。

  • カイ2乗検定って何??;;

    タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<)) 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。 知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

  • カイ2乗検定

    ある乱数を危険率1%のひん度検定を行え。 ただし、自由度49のカイ2乗分布の1%点は74.9とする。 という課題が出たのですが、このときというのは、 検定統計量vが79.4よりも小さければ受容される、という考え方良いのでしょうか??

  • カイ二乗検定及びG検定について

    カイ二乗検定もしくはG検定を用いて適合性の検定を行おうと思っているのですが、以下の判断が出来ず困っております。 ・自由度が大きすぎる(10000以上)場合もカイ二乗検定及びG検定を用いて良いか なお、帰無仮説で想定する分布は多項分布、サンプル数は30から100程度を想定しています。 ご回答をよろしくお願いいたします。