• 締切済み

カイ二乗検定と分散分析の違い

二つの使い方の違いがわかりません。見ることは二つとも差があるかというのであってるんでしょうか? 一例として、4グループあり(グループごとの人数は異なります)、いくつかの調査項目ごとにグループで差があるかを見る時、カイ二乗なのか分散分析(一元配置)なのかが謎です・・・ 例えば、質問項目例1:食事回数 a.3回 b.2回 c.1回以下         例2:身長  (  cm) などあったとすると 例1はクロス表4x3(3x4?)でカイ二乗でできそうなのですが、身長はどうやってするんでしょうか? また、項目ごとでカイ二乗にしたり分散分析にしたりというのは統計学的にありなんでしょうか? 統計については初心者です。色々似たような質問が出ていましたがやはりわかりません。すみませんが、よかったら助言お願いいたします。

noname#99249
noname#99249

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

No1です。  統計をする場合は、「練習をしよう」ではなく、研究計画またはデータはあるがどうしてよいやら、という方がかなりいます。学生や院生も少なくないので、「マナー違反」と書き込みます。少なくとも2名の方は、ご質問を取り下げられました。  この管理者にも「問題が多い」と指摘したのですが、音沙汰なし、です。何故問題なのか理解されていれば、それには抵触しない、と書き込んでから質問があると思っているので。  ある教科書によると、論文誌の検定についてチェックしたところ、t-検定、F-検定、カイ2乗検定、相関分析で80%は処理できるとか。初心者がいきなり4群の多重比較というのは、大胆としか言いようがありません。パソコンを使えば数値はでるし、危険率の計算もできます。しかし、結果の解釈すなわち説明をきちんとできるか、については疑問があります。  「有意差があります」と主張して、「全体ではなく、どの群とどの群に差があるのか」と突っ込まれ、「何故その群間だけに差があるのか」と問い詰められ立ち往生した人も学会で見ました。  2群より多い検定は、2群間の検定の延長ですから、まず2群間の検定でなれることが出発点です。2群間の身長については、t-検定で処理できますから、何度か練習して検定に慣れてください。  そのうち、「検定なんぞはくだらない」ということが分かってきます。まあ「イワシの頭も信心から」ですから。と、書きながら論文を通すために有意差を出すのに悪戦苦闘していますが。

noname#99249
質問者

お礼

説明不足で申し訳ありませんでした。 私はいくつかの例の中からこの回答項目はどうやって処理するんだろと思い、実際に統計処理をしてみようと考えました。参考にしたのは3群だったのですが、2以上は同じ検定なのかと考え4群にしていれば3群でも応用できると思ったので4群比較を例として質問しました。 詳しい回答感謝いたします。学会など専門的な方なのですね。 アドバイスを元に、2群間の検定からまずはしっかり理解することを頑張りたいと思います。ありがとうございました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

 指導者がいる時に、横から口を出すのは、マナー違反です。私も違反ですし、質問者も違反です。いないのなら、その旨を書いて下さい。 >項目ごとでカイ二乗にしたり分散分析にしたりというのは統計学的にありなんでしょうか? 検定法の選択は、研究者の自由です。適正な方法を選ぶ必要はあります。「データがあるので、検定法を教えて」なんぞの、切符を買ったがどうやって行くの、という質問よりは、真っ当ですが。 >統計については初心者です。 初心者なら、2グループで始められてはどうですか。2群なら、t-検定が使えますが、4グループとなるとH検定とか。  身長は簡単ですが、食事回数となると工夫が必要かも、というのは、独り言です。

noname#99249
質問者

お礼

統計の指導者はいません。他の方も統計について質問されている方たちも皆さん聞く方がいないから聞いてるものだと思っていました。なのでそれが当たり前だと思っていたので。説明をせず申し訳ありませんでした。 上記は一例で、私はまだデータなどはとっておらず計画段階の練習といった感じです。初心者なので2群に分けれる研究を探して見ます。 的確な回答感謝いたします。

関連するQ&A

  • 等分散性が仮定されない分散分析、およびカイ二乗検定

    (誤って「生物学」カテゴリーで質問してしまったため再投稿します) SPSSを利用しています。 クラスター分析により4つのグループに分けた後、 30の質問項目について、1間配置分散分析でグループ間の平均値の比較を行おうとしています。各グループのサンプル数は、42、75、62、36です。 (1)グループごとのサンプル数はどの位あればよいのでしょうか? 上記サンプル数では問題がありますか? (2)ルビーンの等分散性の検定をしたところ、.05以下になる項目が7つほど見つかりました。 となると、普通はこれは分散分析ではなくノンパラ検定にすべきなのですよね? 他の方の質問で、Games-Howellなら分散分析のままで大丈夫とあったのですが本当でしょうか。 (3)もし(2)でGames-Howellで大丈夫とすると、その後の多重比較は、 ・等分散が仮定された項目は分散分析で有意であればTurkey-HSDで多重比較し、 ・等分散が仮定されなかった項目は分散分析で有意であればGames-Howellで多重比較する ということになるのですか? この場合、質問項目により多重比較の方法が分かれてしまいます。 それとも、全項目についてGames-Howellの方を見るのでしょうか? (4)あと、これは(1)~(3)と独立の問題かもしれませんが、 一部の質問にはNAデータがあるので、 全ての項目についてサンプル数が同じではありません。 これは分析上問題がありますか? 以上の4つについていずれでもよいので お分かりの方どうぞ教えてください。よろしくお願いします。

  • カイ二乗検定の多重比較について

    SPSSで4×4の名義尺度のカイ二乗検定を行ったところ、Pearsonのカイ二乗検定で5%水準で有意差が出たと出力されました。 そこで質問です。 1.この結果は4×4のデータのどこかの組み合わせに差があるということを表している、と解釈していいのでしょうか? 2.差があるとすれば、どれとどれのデータの間の差なのか知りたいので、分散分析のように多重比較をする方法があるのでしょうか? ご指導お願いします。

  • カイ二乗検定で処理したいのですがデータのとり方がわからず困っています。

    左利き手と右利き手の被験者における、左右の耳の聴力低下度を調べています。 目的は、左と右の利き手の被験者で利き手の違いに意味があるかどうかどうかを知りたいので、統計はカイ二乗検定を用いています。 聴力低下度の指標は、高音域、低音域の2項目あり、さらに左右の耳があるので、計4項目からなります。データは順位尺度です。 データ入力は、被験者が重複するいわゆる複数回答形式です。 統計処理するデータの扱い方をお教えいただけないでしょうか。 統計に用いるデータは生データを処理するのでしょうか? 順位尺度の生データ(例数)の統計結果は、 自由度   3 カイ二乗値 23.33 危険率   p=0.0001 生データのカイ二乗検定を行うと、検定は棄却され両グループ間で有意差が見られました。 表にして示す場合、生データはn(総例数)が異なるため両グループ間の比較にならないので、構成比率(例数/n*100)で示します。 構成比率のデータで検定すると 自由度   3 カイ二乗値 6.15 危険率   p=0.150 構成比率のデータを用いカイ二乗検定を行うと、検定は採択され両グループ間は差がありません。 統計処理は、生データ比較でしょうか? それとも表にあらわすような構成比率の比較でしょうか? どちらが適切なのでしょうか? どうぞ、よろしくお願い申し上げます。

  • t検定と1×2の分散分析の違い

    ある統計の本に、t2乗=Fであり、 t検定と1要因2水準の分散分析は同じだ、と書かれていました。 そうすると、t検定が存在する意味がなくなってしまう (分散分析だけですんでしまう)ことになると思うのですが、 なぜt検定をするのでしょうか。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗検定について

    例えば、2x2クロス集計表で期待値が5以下であれば、フィッシャーの直接確率計算法を使うと思います。 2x3以上の集計表であれば、例え5以下があってもカイ二乗検定で問題ないでしょうか。 例えば、 100 3 70 30 100 3 という集計表の場合です。 宜しくお願いします。

  • SPSSのカイ二乗検定について

    初歩的な質問になりますがもうしわけありません。 卒論で分析をしているのですが知識がありません。 ある尺度によって分けた高群と低群の間に、質問に対する回答(質問が4つで回答が5つの選択肢からひとつを選ぶもの、のそれぞれについて)に有意な差があるかどうかを調べるために、SPSSを使ってカイ二乗検定を行いました。 結果で有意な差があるかどうかはどこを見ればよいのでしょうか。 統計の授業など取っておらず、大変初歩的な質問かと思うのですが申し訳ありません。 超文系人間で数字が苦手なので優しく教えていただけるとありがたいです。

  • 統計の質問:分散分析?カイ二乗?

    統計に詳しい方、お助け願います。私はほぼ初心者です。 例えば100名の協力者に対し、あるテストを行いました。解答は3パターン(仮にA・B・Cとします)に分類でき、どれかが正解というわけではありません。そういう意味ではアンケートに近いです。調べたいのはこのA・B・Cの解答の頻度(仮にA:20名、B:65名、C:15名とします)に有意差があるかどうかなのですが、A-B、B-C、C-Aのどこに差があるかまで見たい時は、 カイ二乗検定とその後の多重比較(ボンフェローニ法など)を行うべきでしょうか? それとも、100名の解答をA・B・Cに振り分けるとき、それぞれに1点ずつ加算していって平均点を出し(A:0.2、B:0.65、C:0.15)、ABCの平均点の差について対応なしの分散分析とその後の多重比較(t検定など)を行うべきでしょうか? 見当はずれなことを聞いているかもしれませんが、誰かアドバイスをお願いします。