• ベストアンサー

カイ二乗検定の表の見方を教えてください

カイ二乗検定の表の見方を教えてください こんにちは。僕は理系の大学生です。論文を読んでいるのですが,検定についてわからないところがあります。専門書やネットの説明では感覚的なことがわからないので,ここで質問させて頂きました。 以下の3点について教えていただけないでしょうか?よろしくお願いします。 Ovserved…期待値との差が大きい場合,どういう意味に捉えるべきですか? Expected…期待値は理論的に推定される値ですよね?何のために出すのですか? X2 for deviation from random (df = 1)…すいませんわかりません。どういう項目ですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

感覚的なことではなくて、本が読めていないだけのように思われます。 2x2分割表のカイ二乗検定のこととして説明します。次のような表です。 /////|Bあり Bなし | 計 -----+---------+---- Aあり | X_11 X_12 | X_1. Aなし | X_21 X_22 | X_2. -----+---------+---- ______ 計| X_.1 X_.2 | X_.. > Ovserved…期待値との差が大きい場合,どういう意味に捉えるべきですか? それは、二つの要因AとBに関連性があるということです。Observedは上の分割表ではまさにX_11,X_12,X_21,X_22のことになります。 > Expected…期待値は理論的に推定される値ですよね?何のために出すのですか? 二つの要因AとBに関連がないときの期待値を計算します。関連がないときに分割表の各セルの度数がどうなるか知るため。 AとBが独立なときに「Aあり」かつ「Bあり」の比率は、全体に対する「Aあり」率 (X_1./X_..) と全体に対する「Bあり」率 (X_.1/X_..) の積なので、(1,1)セルの期待値としては X_..*(X_1./X_..)*(X_.1/X_..) = X_1.*X_.1/X_.. のようになる。他のセルの期待値も同様に求められる。 > X2 for deviation from random (df = 1)…すいませんわかりません ランダムであるという仮定でカイ二乗値を計算しています。この値が大きければ、ランダムであるという仮定から離れていく、ということになります。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗検定について

    サイコロがフェアであるかどうか、カイ二乗検定を行いたいのですが テキストには、自由度5で理論度数で割るやり方で解答がなされているのですが これを、自由度6で、二項分布の分散で割るやり方で解くのは間違いなのでしょうか? 具体的には p=1/6 nは理論度数*6=全試行回数 [(標本度数-理論度数)/√np(1-p)]二乗 を1の目から6の目まで足して、それを自由度6のカイ二乗検定に掛けるやり方です。 もし分かる方がいらっしゃったら、教えていただけるとありがたいです。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • カイ二乗検定 求めた値の扱い方

    2×2分割表のカイ二乗検定を行います。 手元のカイ二乗分布表では, 有意水準 10% 2.706 5% 3.841 2.5% 5.024 1% 6.635 となっています。 これらの値は片側検定で使用できるのでしょうか? それとも両側検定で使用できるのでしょうか? また,使用できない方で検定したい場合,どうすればよいのでしょうか?

  • カイ2乗検定結果の書き方

    卒業論文作成中です。 2*2のカイ2乗検定をしました。 結果を論文に載せたいのですが、書き方が分かりません。 クロス表を書くのかどうか、また何をどの位置(クロス表の下?)に書けばいいか、教えてください。

  • カイ二乗分布の「カイ二乗値」について

    カイ二乗分布について、下記のような説明がよく見受けられます。 (a)カイ二乗値=Σ{(観測値)-(期待値)/期待値} (b)カイ二乗値=(標本サイズ*標本分散)/母分散 どちらもカイ二乗値という同じ値を表す数式だと思うのですが、 この二つはどのような関係にあるのでしょうか? 「カイ二乗値って何?どうやって求めるの?」と聞かれたとき、どちらが正解なのでしょうか? 漠然とした聞き方で申し訳ありませんが、宜しくお願いします。

  • 正規性の検定でのカイ2乗検定の自由度について

    エクセル統計p051に記されているものです。 標準化値(-1.2,-0.4,0.4,1.2,∞) 理論確率(0.1151,0.2295,0.3108,0.2295,0.1151) 観察度数(4,10,6,9,3) 期待度数(3.6822,7.3443,9.947,7.3443,3.6822)を 列に変換してください。 n=32のデータです。その正規性の検定をするためカイ2乗検定を行ったのですが、自由度が2になることが分かりません。よろしくお願いします。

  • カイ2乗検定を使ってよいか。

     よろしくお願いいたします。ソフトバンククリエイティブという会社から出ている「仕事に役立つExcel 統計解析」という本を見ながら勉強している最中の者です。  データ分布を検定する節に次のような例が掲載されています。 「日用雑貨品の半年間の売り上げ実績をもとに月別売り上げに差があるかどうか検定する。(モデルデータは4月の売り上げが突出している。)なお,日用品であるので理論的には月ごとの売り上げに差はないとする。(=期待値は,6ヶ月間の平均値)」  以上の例をもとにカイ2乗検定(5%,自由度5)を行っています。  そこで質問です。 1 入学直後に行ったテストの平均点が今年度も含めて10年分あったとします。今年度入学してきた生徒と差があるかどうかをカイ二乗検定で検定することは妥当でしょうか。(同じ学校なので理論的には同質の生徒が入学してくると仮定し,期待値は10年分の平均を使うつもりです。) 2 私が参考にしている本だとカイ二乗検定の前節に書いてあるのですが,t検定(平均値の差の検定)との違いが分かりません。例えば,今年度を除く過去9年分の平均点の平均とその標準偏差を求めておき, (過去9年分の平均±自由度8のt値×標準誤差)の範囲に今年度の平均が収まるかどうかを見るというのは数学的に妥当でしょうか。 3 そもそも過去9年間の平均点と今年度の平均点及び今年度の標準偏差のみから過去9年間の生徒と今年度の生徒に差がある(若しくはない)ことを言うことはできるのでしょうか。  なにしろ初心者ですので,要領を得ない質問になってしまいがちですがよろしくお願いします。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • カイ二乗検定について

    例えば、2x2クロス集計表で期待値が5以下であれば、フィッシャーの直接確率計算法を使うと思います。 2x3以上の集計表であれば、例え5以下があってもカイ二乗検定で問題ないでしょうか。 例えば、 100 3 70 30 100 3 という集計表の場合です。 宜しくお願いします。

このQ&Aのポイント
  • キヤノン製品のTS8430で印刷すると、横向きの空白スジが入る問題が発生しています。
  • インクカートリッジの交換やクリーニングを行なっても改善されず、正しく印刷することができません。
  • どのような対策を取ればこの問題を解決することができるのでしょうか?
回答を見る