• 締切済み

統計の初歩の初歩です(文系)

すみません、教えていただけますか?社会学、心理学系のアンケート調査の結果を分析しています。統計の初歩のことを伺いたいのですが… 2つの変数を使って、まずクロス集計を出した時にカイ二乗検定をみると有意ではありませんでした。 でも次に相関分析をして、 相関係数を出してみる有意になるんですが、良いのでしょうか?? つまり、カイ二乗検定が有意でなくても、相関分析で相関係数が有意であれば、 関連がありそうだと考えてよいですか?? よろしくお願いいたします。

みんなの回答

  • toukeier
  • ベストアンサー率75% (3/4)
回答No.1

カイ二乗検定か、相関係数かどちらかがデータの尺度とあっていないのではないかと思います。というのもカイ二乗検定と属性相関係数の検定は、統計学的有意性に関して等価だからです。 データが名義尺度同士であれば、カイ二乗検定と属性相関係数(クラメール係数)がよいと思いますし、データが順序尺度同士であれば、Spearmanの順位相関係数だけが適切と思います。

chikomomo
質問者

お礼

toukeierさま 早速にご回答くださいましてありがとうございます! ソフトはSPSSを使っております。 まず、クロス表を作る時にカイ2乗検定も表示されるようにして 相関係数はPearsonにしました。 変数は一つが5段階の順序尺度、もう一つは3段階の順序尺度です。 Spearmanでもう一度ためしてみます。 ありがとうございます。 

関連するQ&A

  • Excelでクロス集計の検定

    アンケート調査を実施しました。 結果をクロス集計し、カイ二乗検定で検定したいのですが・・・ エクセルや、統計・解析に関わる書籍を買ったり、借りたりして勉強しているのですが、 今ひとつ理解できません。 簡単に検定することはできないのでしょうか? 自分で計算しなくてはいけませんか? 二変数以上の相関関係を調べたいのですが、 簡単な方法はありませんでしょうか?

  • 文系の統計学

     当方文系ですが、文理融合の専攻に進学することになりました。「数理統計学」が必修となっているのですが、初めて取り組むことになります。シラバスには「微積分と線形代数をよく復習してから受講すること」と記載されていますが、どちらも全く経験ありません。現在、公文式に行って、やっと因数分解ができるようになりました。(公文式は質問ができない雰囲気なので、近々やめる予定です。) そこでご質問ですが、1.このような段階から、どのように「微積分と線形代数」を経て、数理統計学へ学習を進めていけばよいのか。2.予備校や学習塾で学ぶとしたら、どこがよいか。以上の2点について、ぜひ教えていただきたいです。どうぞよろしくお願いします。因みに数理統計学の内容は、以下のとおりです。 ●基礎礎統計(集合基礎論、確率、確率変数、確率密度関数、種々の確率分布、中心極限定理、母集団と標本、点推定、区間推定、推定法、有意水準、第一・二種の誤り、片側・両側検定、正規分布の平均・分散の検定、連続変数の相関(散布図、今日分散、相関係数、検定、離散変数の相関(クロス集計、関連性係数、検定) ●重回帰分析(単回帰分析、目的関数の定式化(最小自乗法、最尤法など)パラメーターの推定と検定、回帰診断、説明変数の選択、構造変数) ●その他(クロス表の多変量解析、様々な多変量解析)

  • 統計学について

    統計学の無相関検定について 無相関検定について理解ができておらず、 どなたか教えてください。 理解できていない場所を理解したいので、 非常にまとまりがありませんが、箇条書きとしました。 番号ごとに箇条書きしたので、 番号に対応するように回答を頂けると幸いです。 よろしくお願いします。 (1)無相関検定により、帰無仮説が採択されると、相関係数の数値の大小に関係なく、一律で統計結果自体を無効にする。 (2)統計結果自体の無効とは、すなわち相関係数ゼロのことを指す。 (3)相関係数ゼロとは、すなわち無相関のことを指す。 (4)「相関の強さ」と「有意」は別個の考え方である。 (5)「相関が強いこと」=「相関係数が1または-1に近いこと」である。 (6)相関が強い場合でも、有意でない場合は、「統計自体が無効だった」ということになる。 言い換えれば、「統計結果は無相関だった」という解釈になるのだろうか? (7)相関が弱い場合で、かつ有意である場合は、「弱い相関があった」ということになる。 (8)「統計自体が無効だったこと」=無相関なのか? (9)「相関の強さが弱過ぎる」=無相関なのか? (10)相関があるという仮説の数は無限であり、相関が無いという仮説の数は1つである。 11.相関係数がゼロであることは、無相関検定をやること以外の方法では生じない。 つまり、変数が2つのとき「偏差積の平均÷標準偏差X÷標準偏差Y」の計算結果によって、相関係数がゼロという答えが出ることはない。(無相関検定をやる前から無相関であるという答えが導き出されることはない) 非常にまとまりが無くて申し訳ありませんが、よろしくお願いします!

  • 検定について教えてください。

    検定について教えてください。 アンケート調査をクロス集計し、χ2乗検定を行ったのですが、期待度数が5未満のセルが多く検定にかけられませんでした。 カテゴリーを結合するとよいと知り、5つあったカテゴリーを2つにして検定をし有意差5%未満となったのですが、この場合、最初の5つのカテゴリーのクロス集計表の扱いはどうなりますか? 有意差がなくても、クロス表をグラフにしたものはこういう結果でした。と結果だけ出しても差し支えありませんか? 内容: あることの継続を望む人と継続を望まない人と、体調をクロス集計しました。 体調は質問票では「良好である」「まあまあ良好である」「あまり良好でない」「少し不調である」「とても不調である」の5つとしましたが期待度数5未満が33%だったため 「良好である-まあまあ良好である」「あまり良好でない-とても不調である」の2つに振り分けなおしました。 統計についてよくわかっておらず、なんとかχ2乗検定までたどりつきましたが、これからがすすみません。 的外れでわかりにくい質問かもしれませんが、よろしくお願いします。

  • 統計に関して質問です。

    アンケートを用いて数量化二類を行おうと考えています。目的変数のカテゴリーは3つで説明変数を25こ用意しています。つまり3群数量化二類を行ないます。説明変数が多いため変数選択を行うために分割表によるカイ2乗検定を行い、有意な差があった説明変数を選び、数量化2類を行って、そのモデルが正しいかどうかをチェックするというやり方であってるでしょうか?

  • 統計学、何検定を使えばいいですか?

    統計学初心者です。 正常ラットと飢餓ラットの臓器の重量や長さを統計処理し、有意差があることを示したいのですが、何検定を使えばいいのか分かりません。 カイ2乗検定かとも思いましたが、違うような気がします。 何検定を使えばいいですか?教えてください、お願いします。

  • 統計についての文を添削してください

    統計のことはぜんぜん理解していないものです。 どなたか私の文を添削していただけないでしょうか? 言葉遣いがおかしいとか、意味が違うとか指摘していただけると助かります。 サービスの品質改善というテーマで翻訳をしていたのですが、調査をおこないデータを整理して結論をだすために、統計の手法を使うことができる、という部分がでてきて困っています。 ネットでいろいろ学習??しましたが、あっているかどうかまったく自身がありません。 よろしくお願いいたします。 カイ二乗‐2つの変数の間での関連を決めるための統計技術。(1)観察されたデータが期待とマッチするかどうかを見る、(2)一方の変数の分布がもう一方の分布と関係があるかみる。 t-検定-サンプルが同じ人口から選べれているかを見るため、2つの個別サンプルの平均や割合を比較する統計技術。(3つ以上のサンプルの平均をテストするには、分散分析が使われます) 重回帰-複数の変数の値の変化によって、1つの変数の変化の値を予測するための統計技術です。 クラスタ分析-対象(学校/場所/物など)を特定された数の排他的グループ(内部的に同種)に分ける統計技術。 因子分析‐相関関係をもつ変数の大きなセットの要因を決める統計技術。 判別分析-人や物を2つ以上のカテゴリーに分類するための統計技術。 カイ二乗による相互作用の自動検出方法(CHAID)‐分岐方法を使って、因数のなかの相関と見つける統計技術。 以上です。

  • 相関係数と有意差

    統計で相関をみるときに相関係数と有意差とどちらが重要なのかよくわかりません。たとえば、Spearman検定で、有意差があるのに相関係数が低い、といったときは統計的に有意な相関があるといっていいのでしょうか?統計素人でここがよくわからず困っています。すみません、ご存知の方おられたら教えてください。よろしくおねがいいたします。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • ノンパラメトリック検定

    心理学でカイ2乗のノンパラメトリック検定分析をしたのですが、結果の書き方が分かりません。 どれも有意差が認められるものでしたが、普通なら「AよりBのほうがCの割合が有意に大きいことが示された」ですがこの場合はどう書けばいいのでしょうか? 観測度数と期待度数と残差や検定統計量は出ています。