• 締切済み

離散的なデータの相関

 たとえば、ある2つのテーマ(例えば 物覚えと熟睡度)について 4 大変良い  3 良い  2 悪い  1 ひどく悪い から選んでもらうアンケートがあるとします。真ん中(例えば 普通)はわざと入れていません。この2つのテーマについて明らかに相関があるように思え、項目の番号を値と見て相関があるか調べるため相関係数を求めてみたら、たいした数値になりませんでした。  その原因はあまりに離散的だったからだと思うのですが、こういう場合はどのように相関を調べればいいでしょうか。  同じことで、英語のテストと数学のテストの点数の相関にしても、 5 80点以上  4 60点以上  3 40点以上  2 20点以上  1 20点未満 という集計の仕方をすると、どのように相関を調べればいいでしょうか。

みんなの回答

回答No.3

No.1です。 相関係数はどのように求めましたか? 「項目の番号を値」と見てとのことですが、データはどのようなものでしょうか。また、「明らかに相関があるように思え」たのはどのように見たからでしょうか? 例えば項目別の人数を集計したとして、物覚えの項目1と熟睡度の項目2の両方に当てはまる人数、のような形でしょうか?それとも物覚えと熟睡度は独立に項目別に人数をとっているのでしょうか。 前者なら少し詳しく、例えば縦、横軸にそれぞれの項目番号をとって平面を格子を書き、各格子内に対応する人数を書いて(あるいは立体的な方向へ人数の軸を取って点を書くか棒グラフにする)、回帰分析をすることができます。 後者だと二つのテーマ間の人数の対応がつかないので、それぞれに横軸に項目、縦軸に人数をとった棒グラフ等の分布を書いて重ね合わせ、分布の形の類似を見ることになります(項目の数は同じとして)。もちろん項目の順序をそれぞれ任意に入れ替えれば分布の形は変わるわけですから、人数を小さい順にならべて項目の対応を見ることもできるでしょう。 両者の方法に共通することですが、項目別人数は統計変動を含んでいるので、その点に注意を払う必要があります。各項目は択一なので人数は概ね平均値のまわりで多項分布に従った変動をします。

yanasawa
質問者

お礼

ありがとうございました。また考えてみます。

yanasawa
質問者

補足

 ありがとうございます。  相関係数はエクセル任せです。で、値は0に近くなります。また、2次元表にするとどこかの欄が多くなり、グラフをつくると点の重なりになりますよね。でもあまりに離散的なので、相関係数に反映されないようなのです。などと言うこと自体もよく分かっていないんですが・・・。

  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.2

連続か離散かではなく、定量か順位かの区別が重要なのでは? 定番なのは、これ↓でしょうね。 http://aoki2.si.gunma-u.ac.jp/lecture/Soukan/spearman.html テキストとしては、放送大学の印刷教材なんかが、 結構簡単によくまとまっていますよ。

yanasawa
質問者

お礼

ありがとうございました。また考えてみます。

yanasawa
質問者

補足

 遅くなってすみません。  サイトを見ました。それぞれの人が番号をただ一つ選ぶアンケートなので、私にはサイトに書いてあるものと同じようなものだと判断できませんでした。もう少し判断材料をください。

回答No.1

英語のテストと数学のテストの場合はすでに点数が1点ごとに離散かされているので、さらに大雑把に離散化する必要はないでしょう。それぞれのテストの点数を x、y として y = ax + b の回帰分析で充分だと思います。当然一人一人が両方の点数を持っているとします(そうでないと相関は調べられません)。 さて、物覚えと熟睡度については、熟睡度は睡眠時間数で一応測るとしても、物覚えは多分に主観的な概念ですからこれを自己申告させて客観的数値にするのは難しそうです。何かを忘れた回数を数えても良いですが、忘れたことさえすぐ忘れれば回数はあやふやになります。一番よいのは何らかの記憶テスト、例えば簡単なものを数多く覚えさせて、一定時間後にいくつ覚えているかを調べる、などのようにして数値化する方法でしょう。同時に睡眠時間を調べれば、二つの数値の相関を直接調べることができます。

yanasawa
質問者

補足

 遅くなりすみません。  いや、そういうことではなくて、もうデータをとってしまった後の話です。いい案はありませんか。

関連するQ&A

専門家に質問してみよう