• ベストアンサー

カイ二乗結果の見方 SPSS

今、例としてタバコを吸う人、吸わない人に分けています。 吸う人105人(期待度数102.5残差2.5)、吸わない人100人(期待度数102.5残差-2.5) 検定統計量の表を見ると タバコをすうかどうか カイ二条 .122a 自由度 1 漸近有意確率 .727 と出てきたのですが、この結果の見方が分かりません。 タバコを吸う人のほうが多いというのはなんとなく分かりますが、 残差に-がついているのはどういう意味かとか 検定統計量の表の見方とかが分かりません。 どなたかこんな初心者に分かりやすく教えてくれる人いますか キーワード 統計学 数学 心理学 SPSS 名義尺度 χ2乗

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.5

> 数字だけで見ると、半々ですけど、 > それが統計的に見ると、 > いつでもそういう結果が出るわけではないということも分かりました。 「そういう結果」とはどういう結果のことを言っているのかはわかりませんが、ご質問の事例ですと帰無仮説が棄却されず、「タバコを吸う人の割合は1/2ではない」ということが言えないので、「帰無仮説は棄却されなかった」とか「タバコを吸う人の割合は1/2であるとも違うとも言えない(わからない)」というような言い方しか出来ないということです。 検定の結果としては、帰無仮説が棄却されるかされないかのどちらかで、帰無仮説が棄却されれば対立仮説が支持され、棄却されなければどちらが正しいかはわからないというだけなのです。

pahonen
質問者

お礼

ありがとうございました。 仮説が棄却されなかった場合、はっきりとした結果は得られなかったが、 仮説が支持されなかったという結果だけが分かり、 それだけのことしか、それ以上のことは何も言えないということですね。 で、これは論文に書いてもいいんですよね。

その他の回答 (4)

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.4

>結果が論外ということは、 >結局これはデータとして使えないということでしょうか。   そのとおりです。使ってはいけないのです。ところが平気で使っちゃっている例が何と多いことか (>_<)   統計処理では答えは行列式がゼロにならない限り、答えが必ず出て来るのです。でもその答えが使えるかどうかが別問題だということを知らない人が多すぎるのです。

pahonen
質問者

お礼

コメントありがとうございます。 データとして使えないということは分かりました。 quaestioさんが言っていますように、 仮説は支持されなかったというような形で使用することはできますよね?

noname#227064
noname#227064
回答No.3

ANo.2の 「この検定は、1標本の比率の差の検定で、それのカイ二乗分布近似を利用した検定を行っております。」 を 「この検定は、母比率の検定で、それのカイ二乗分布近似を利用した検定を行っております。」 に訂正します。

noname#227064
noname#227064
回答No.2

> どなたかこんな初心者に分かりやすく教えてくれる人いますか 入門書等で検定の基本位は勉強するか、身近な統計に詳しい人に教えてもらうことをお勧めしますが、簡単に説明してみましょう。 > 吸う人105人(期待度数102.5残差2.5)、吸わない人100人(期待度数102.5残差-2.5) 母集団のタバコを吸う人と吸わない人の割合に差がないとすると、母集団から無作為に205人選ぶと、205/2は吸う人で残りが吸わない人になるというのが期待度数のことで、実際に得られた度数105と100から期待度数の102.5を引いた値が残差となります。 > タバコをすうかどうか > カイ二条 .122a > 自由度 1 > 漸近有意確率 .727 この検定は、1標本の比率の差の検定で、それのカイ二乗分布近似を利用した検定を行っております。 帰無仮説は「タバコを吸う人の割合は1/2である」で対立仮説は「タバコを吸う人の割合は1/2ではない」としています。 カイ二乗の数値は、 (105-102.5)^2/102.5+(100-102.5)^2/102.5 = 0.122 で求められますが、帰無仮説が正しい場合にはこのカイ二乗の数値は極端に大きな値にはなりません。 (期待値ピッタリの値が得られれば0になります。もっとも度数なのでピッタリの数値になることはありませんが) もしここで大きいカイ二乗の数値が得られた場合、「タバコを吸う人の割合は1/2である」というより、「タバコを吸う人の割合は1/2ではない」という仮説の方が確かなように思われます。 とはいえ、どの程度大きければ「タバコを吸う人の割合は1/2ではない」と言っていいのかがわかりません。 そこで、帰無仮説が正しいと仮定したときに5%しか起きないこと(極端に大きなカイ二乗の数値)が起きたら、仮説が間違っていたと結論付けることにします。 (この5%という値は有意水準と呼ばれますが、場合によっては1%や10%に設定することもあります) 帰無仮説が正しい場合で、それぞれの期待度数が5以上であれば、このカイ二乗の数値は近似的に自由度1のカイ二乗分布に従う確率変数となることがわかっています。 自由度1のカイ二乗分布において、3.841459以上の値をとる確率が5%なので、今回の例は滅多に起きないことが起きたわけではありません。 従って、帰無仮説すなわち「タバコを吸う人の割合は1/2である」が間違いとは言えません。 (正しいとも言っていないことに注意してください) 0.727という数値は、自由度1のカイ二乗分布で0122以上の値をとる確率が0.727ということです。 これが5% = 0.05よりも大きいので滅多に起きないことが起きたわけではないことがわかります。 結論としては、「帰無仮説は棄却されなかった」とか「タバコを吸う人の割合は1/2であるかどうかはわからない」等になります。

pahonen
質問者

お礼

詳しい解説ありがとうございます。 なんとなく?は分かりました。 数字だけで見ると、半々ですけど、 それが統計的に見ると、 いつでもそういう結果が出るわけではないということも分かりました。 もしここで大きいカイ二乗の数値が得られた場合、「タバコを吸う人の割合は1/2である」というより、「タバコを吸う人の割合は1/2ではない」という仮説の方が確かなように思われます。 ↑確かにこの方がいいかもしれませんね。 どのような結果が出たとしても、それはそれで、「帰無仮説は棄却されなかった」とか「タバコを吸う人の割合は1/2であるかどうかはわからない」などというように、締めくくることができるということですね。 本当は、仮説が支持されたという結論で締めくくることができればよいですが、予想外の結果がでたとしたら出たで、しっかりと結果を書くことが大事という事ですよね?

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.1

 有意確率はデータから得た結果が信頼に値するものかどうかを現わす尺度です。通常は90%以下では仮説却下、つまり得た結果を使用するのは危険ということになります。厳しいときには95%をボーダーラインにすることもあります。それが73%というのは通常の常識では結果が論外ということです。たとえば、回帰直線を作って検査したとすると、その直線は使用してはいけないということになります。  統計データから推論するときにはこの検定をやることが極めて重要で、往々にしてこれを省略し、とんでもない結論を堂々と発表している論文を度々見かけるのは嘆かわしいことです。わかりやすい例を挙げると、平均値というのはどんなデータでも簡単に計算できます。しかしそれが使えるか使えないかを検討し、信頼性があるという保証を得てからその平均値を使わなければならないということです。

pahonen
質問者

お礼

よく分からないのですが、 結果が論外ということは、 結局これはデータとして使えないということでしょうか。 使えないとしたら結果の欄になんてかけばいいのでしょうか 仮説が却下されましたと書くのでしょうか すいません、よく分かってなくて

関連するQ&A

  • SPSS McNemar検定

    SPSSの「McNemar検定」 検定統計量の見方について質問です。 McNemar検定を行った場合,検定統計量(表)では通常N,カイ2乗,漸近有意確率が算出されると思います。 私の行った項目の中で,Nと正確有意確率(両側)は算出されているものの,カイ2乗値と漸近有意確率が表示されていない項目がありました。ちなみにこのときのNは64,正確有意確率(両側)は .125b [b.使用された2項分布]でした。これは,McNemar検定では,有意差が見られなかったという捉え方で良いのでしょうか? SPSSに関する文献を拝見しましたが,McNemar検定について触れているものは少なく,さらに漸近有意確率以外の見方について書かれているものが見つけられませんでした。どうか教えていただけますようよろしくお願いいたします。

  • SPSSのカイ二乗検定について

    初歩的な質問になりますがもうしわけありません。 卒論で分析をしているのですが知識がありません。 ある尺度によって分けた高群と低群の間に、質問に対する回答(質問が4つで回答が5つの選択肢からひとつを選ぶもの、のそれぞれについて)に有意な差があるかどうかを調べるために、SPSSを使ってカイ二乗検定を行いました。 結果で有意な差があるかどうかはどこを見ればよいのでしょうか。 統計の授業など取っておらず、大変初歩的な質問かと思うのですが申し訳ありません。 超文系人間で数字が苦手なので優しく教えていただけるとありがたいです。

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。

  • カイ二乗検定と下位検定 SPSS

    質問文が長く、そして多く大変恐縮ですが、自分でいろいろ調べていてもなかなか解答が見つかりません。どなたかアドバイスをお願いしますm(_ _)m 回答パターンが4つある質問(例えばア・イ・ウ・エ)をして、それぞれに対して得られた回答数が期待度数を有意に上回っているかを検定するのはカイ二乗ですよね? では下位検定としてア・イ・ウ・エのどれがどれを(有意に)上回っているかを調べるためには、観測度数を目で見るだけはダメですか?竹原卓真(2007)「SPSSのススメ」(p.202)には「ライアンの方法」や「ボンフェローニの方法」が下位検定の方法として紹介されています(確立した手法ではないようですが)。 ボンフェローニは分散分析の下位検定で多重比較をする際などに有意確率の補正をする方法だと思っていました。SPSSで上記のようなデータを用いてカイ二乗検定を行った後にボンフェローニ法を使った下位検定をするにはどうしたらいいのでしょうか?どこのタブをクリックしてもボンフェローニの「ボ」の字も出てきません。シンタックスの入力が必要ですか?またテューキーは使えますか? よろしくお願いしますm(_ _)m

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • ノンパラメトリック検定

    心理学でカイ2乗のノンパラメトリック検定分析をしたのですが、結果の書き方が分かりません。 どれも有意差が認められるものでしたが、普通なら「AよりBのほうがCの割合が有意に大きいことが示された」ですがこの場合はどう書けばいいのでしょうか? 観測度数と期待度数と残差や検定統計量は出ています。

  • spssのカイ二乗、有意差検定について

    SPSSでカイ二乗検定をしたところ、 『0セル(0%)は期待度が5未満です。』とのメッセージがありました。 この場合有意差はfisherの直説法の数値でよいのでしょうか? 『●セル(100%)は期待度が5未満です。』となった場合、 peasonのカイ二乗の数値が有意差となるということでしょうか? セルとその%表示が理解できていません。 お手数をお掛けしますが教えてください。 よろしくお願い致します。

  • 質問紙のデータ分析について カイ二乗? 正確確率? Q?

    質問紙の検定で何を使えばよいのか困っています。 ご指導お願いいたします。 複数回答の質問形式なのですが,それぞれについて5つのグループ間で有意差があるかどうかを検定したいと思っております。 無制限質問形式なので,二項選択にてそれぞれ検定を行うつもりです。 検定法として,カイ二乗検定,フィッシャーの正確確率検定を考えたのですが,質問によっては度数が5以下のものもありますので,すべてにカイ二乗検定が使えるとはいえません。 かといって,正確確率検定も分割表が5×2になってしまうので使えない気がします。L×M分割表でやってみたのですが,結局カイ二乗ですし,残差分析についても二項選択で独立ではないので意味があるのかどうか。。。 そんなときに,先行研究で無制限質問形式・2グループ間の有意差の検定で,Q検定を使っているものがありまして,さらに混乱してしまいました。 統計の解説書や統計に関連したwebで,できる範囲で調べてみたのですが,どうにも判断しかねます。 どうかどうかご指導のほどよろしくお願いいたします。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • SPSSを使ったカイ2乗検定について教えて下さい。

    SPSSを使ったカイ2乗検定について教えて下さい。 ある遺伝子の型AとB、肥満群と非肥満群でカイ2乗検定を行い、その後年齢あるいは性別で補正して下さい。との指示がありました。 統計の本を読む限りカイ2乗検定後に他の因子で補正を行う場合はMantel-Heanszel検定を用いるのだと思われます(この時点で間違っているかもしれません)。 この方法で性別(男は1、女は2と入力)についてやってみたところ本と同じような表示の結果が出ました。 しかし、年齢での補正についてがこの検定方法で合っているのかがわかりません。 一応やってみましたが、性別のときのような結果の表示ではありませんでした。 この場合、どのような解析方法を用いればよいのでしょうか。