• 締切済み

離散的なデータの相関

 たとえば、ある2つのテーマ(例えば 物覚えと熟睡度)について 4 大変良い  3 良い  2 悪い  1 ひどく悪い から選んでもらうアンケートがあるとします。真ん中(例えば 普通)はわざと入れていません。この2つのテーマについて明らかに相関があるように思え、項目の番号を値と見て相関があるか調べるため相関係数を求めてみたら、たいした数値になりませんでした。  その原因はあまりに離散的だったからだと思うのですが、こういう場合はどのように相関を調べればいいでしょうか。  同じことで、英語のテストと数学のテストの点数の相関にしても、 5 80点以上  4 60点以上  3 40点以上  2 20点以上  1 20点未満 という集計の仕方をすると、どのように相関を調べればいいでしょうか。

みんなの回答

回答No.3

No.1です。 相関係数はどのように求めましたか? 「項目の番号を値」と見てとのことですが、データはどのようなものでしょうか。また、「明らかに相関があるように思え」たのはどのように見たからでしょうか? 例えば項目別の人数を集計したとして、物覚えの項目1と熟睡度の項目2の両方に当てはまる人数、のような形でしょうか?それとも物覚えと熟睡度は独立に項目別に人数をとっているのでしょうか。 前者なら少し詳しく、例えば縦、横軸にそれぞれの項目番号をとって平面を格子を書き、各格子内に対応する人数を書いて(あるいは立体的な方向へ人数の軸を取って点を書くか棒グラフにする)、回帰分析をすることができます。 後者だと二つのテーマ間の人数の対応がつかないので、それぞれに横軸に項目、縦軸に人数をとった棒グラフ等の分布を書いて重ね合わせ、分布の形の類似を見ることになります(項目の数は同じとして)。もちろん項目の順序をそれぞれ任意に入れ替えれば分布の形は変わるわけですから、人数を小さい順にならべて項目の対応を見ることもできるでしょう。 両者の方法に共通することですが、項目別人数は統計変動を含んでいるので、その点に注意を払う必要があります。各項目は択一なので人数は概ね平均値のまわりで多項分布に従った変動をします。

yanasawa
質問者

お礼

ありがとうございました。また考えてみます。

yanasawa
質問者

補足

 ありがとうございます。  相関係数はエクセル任せです。で、値は0に近くなります。また、2次元表にするとどこかの欄が多くなり、グラフをつくると点の重なりになりますよね。でもあまりに離散的なので、相関係数に反映されないようなのです。などと言うこと自体もよく分かっていないんですが・・・。

全文を見る
すると、全ての回答が全文表示されます。
  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.2

連続か離散かではなく、定量か順位かの区別が重要なのでは? 定番なのは、これ↓でしょうね。 http://aoki2.si.gunma-u.ac.jp/lecture/Soukan/spearman.html テキストとしては、放送大学の印刷教材なんかが、 結構簡単によくまとまっていますよ。

yanasawa
質問者

お礼

ありがとうございました。また考えてみます。

yanasawa
質問者

補足

 遅くなってすみません。  サイトを見ました。それぞれの人が番号をただ一つ選ぶアンケートなので、私にはサイトに書いてあるものと同じようなものだと判断できませんでした。もう少し判断材料をください。

全文を見る
すると、全ての回答が全文表示されます。
回答No.1

英語のテストと数学のテストの場合はすでに点数が1点ごとに離散かされているので、さらに大雑把に離散化する必要はないでしょう。それぞれのテストの点数を x、y として y = ax + b の回帰分析で充分だと思います。当然一人一人が両方の点数を持っているとします(そうでないと相関は調べられません)。 さて、物覚えと熟睡度については、熟睡度は睡眠時間数で一応測るとしても、物覚えは多分に主観的な概念ですからこれを自己申告させて客観的数値にするのは難しそうです。何かを忘れた回数を数えても良いですが、忘れたことさえすぐ忘れれば回数はあやふやになります。一番よいのは何らかの記憶テスト、例えば簡単なものを数多く覚えさせて、一定時間後にいくつ覚えているかを調べる、などのようにして数値化する方法でしょう。同時に睡眠時間を調べれば、二つの数値の相関を直接調べることができます。

yanasawa
質問者

補足

 遅くなりすみません。  いや、そういうことではなくて、もうデータをとってしまった後の話です。いい案はありませんか。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 相関係数??

    あるアンケートの集計の方法について質問です。 質問1~10について、1~20点の点数をつける。 これを100人に行いました。 この場合の、質問1~10の関連性を見るのは相関係数というのでよいのでしょうか? たとえば、質問1で点数が高い人は、質問5でも点数が高い、逆に質問3の点数は低い、という傾向がある・・・というようなことを調べたいのです。 ちなみに統計ソフトはSPSSを使用しています。 SPSSの中の相関分析というのを使用すればよいのでしょうか? 初心者なので簡単な言葉でお願いします。。

  • 相関係数の表現について

    相関係数をコトバで表す場合に、下記のようになるとあります。 ±0.7~±1 強い相関がある ±0.4~±0.7 中程度の相関がある ±0.2~±0.4 弱い相関がある ±0~±0.2 ほとんど相関がない このような、”~”を使った範囲の場合、例えば、0.2、0.4、0.7の数値は、どの範囲となるのでしょうか。出来ましたら「以上」「以下」「未満」「越え」で説明すると、どのように表現されるのかを教えて下さい。

  • 相関係数の高い項目が多いのはどのような時でしょうか

    いつもこちらのサイトで勉強させてもらっています。 色々なキーワードで検索してみたのですが見当たらなかったので質問させてください。 お菓子の試食アンケートを解析しています。 お菓子は3品あり、アンケート項目は共通です。(そう思う~そう思わないの5段階評価)。 「おいしい」と味(甘い、しょっぱい、すっぱいなど)や食感(やわらかい、しっとり、さくさく、とろけるなど) との相関を見たいと思い、相関係数をエクセルで算出しました。(分析ツール-相関) 「おいしい」と相関の高い項目は3品で共通していたのですが、 相関係数の高い項目が多いお菓子と、そうでないお菓子がありました。 (相関係数が0.7以上を「高い」として、「おいしい」と相関の高い項目を抽出しました)。 この場合、「おいしい」と相関係数の高い項目が多いお菓子は特徴がなく、 相関が高い項目が少ないお菓子は特徴的である、といったようなことが言えるのでしょうか。 このように、相関係数の高い項目数に差が出るのはどのような場合が考えられるか教えてください。 なお、試食は一人1回なので、違う人が食べています。 母集団の違いも影響するものでしょうか。(各お菓子を60人ずつに試食していただきました)。 拙い文章で、とんちんかんな質問をしているかもしれませんが、 統計学初心者にも分かるようにご回答いただけますと大変ありがたいです。 どうぞよろしくお願いいたします。

  • 統計の初歩の初歩です(文系)

    すみません、教えていただけますか?社会学、心理学系のアンケート調査の結果を分析しています。統計の初歩のことを伺いたいのですが… 2つの変数を使って、まずクロス集計を出した時にカイ二乗検定をみると有意ではありませんでした。 でも次に相関分析をして、 相関係数を出してみる有意になるんですが、良いのでしょうか?? つまり、カイ二乗検定が有意でなくても、相関分析で相関係数が有意であれば、 関連がありそうだと考えてよいですか?? よろしくお願いいたします。

  • 数学の宿題なんですがわかりません。

    数学の宿題でわからないことがあるので 教えてください(/_;)/~~ (1)右の表は、生徒5人の英語の小テストの結果x点と、5日後の結果y点である。xとyの相関係数を求めよ。 X(4.6.7.8.5)Y(5.1.7.9.3) お願いします。

  • 相関係数の問題

    あるテストの結果次のような成績を得た。(仮想データ) 指定された欄の小数点以下第3位までの相関係数を求めよ。 例)0.356 必ず表と、途中の計算過程を書く事。(部分点あり) 児童教育学科 英語4 8 4 5  5 8 6 6 8 4 理科5 3 7 10 9 4 4 5 8 8 児童教育学科以外 国語6 10 4 3  7 5 8 6 9 3  理科5 3  7 10 9 4 4 5 8 8 このような問題なのですが、まったく分かりませんでした… 心優しい方お願いいたします。 

  • 目的のデータを抽出してカウントする関数

    今塾の生徒のテスト結果の集計をしていて、「テストの点数が60~80点の男子」の人数を数えたいのですが、どんな関数を使ったら良いでしょうか? エクセルのデータとしては男女の性別が書かれた列と、その隣に点数が書かれた列の2列が対になっています。 COUNTIFSを使ったところ、「男子の60点以上の人数」もしくは「男子の80点以下の人数」は数えられたのですが、60~80点の人数を一発で出す関数は無いでしょうか?

  • 評定者信頼係数(2人の場合):どの点数を採用すべきでしょうか?

    お忙しいところ恐縮ですが、1つご教示頂きたいのですが、 2人の採点者が採点をしたライティングテストの点数間に、高い相関 があり(いわゆる、inter-rater reliabilityの相関が9.0以上あり、 その採点に信頼性がある場合)、「データとして採用する点数」は、 1) 2人の合計点 2) 2人の点数の平均点 3) どちらか一方の採点者の点数  の3つの内どれになるのでしょうか?

  • 相関係数の解釈

    ピアソンの相関係数の解釈について基本的なことを教えてください。 サンプルの大きさが160個ほどで、市町村の人口規模(最大124万人, 最低3千人)を 20万人以上 10万人以上20万人未満 10万人未満 の3つのカテゴリーに分け、また各市町村毎のある水質汚濁の程度を1,2,3,4(ここでは1を最悪とする)の4段階に分けて表を作りました。 その結果、 MS-EXCELのcorrel(配列,配列)を使って数値を出しますと、 人口20万人以上の市町村------------ -0.2840... 人口10万人以上20万人未満の市町村--  0.0389... 人口10万人未満の市町村------------ -0.3939... という結果が得られました。すなわち、人口10万人以上20万人未満の市町村についてだけが正の数で、人口20万人以上の市町村と人口10万人未満の市町村については負の数になりました。 またサンプル全体では、-0.1716の数値を得ました。 この結果をどう解釈すればよいのか教えてください。 例えば、人口20万人以上の市町村では、その数値  -0.2840...を以って「人口が多いため、ある程度水質も悪い」または「人口が多いため、水質の改善が進みにくい」と解釈すべきなのでしょうか?  (逆に、人口10万人未満の市町村については、その数値  0.3939...を以って「小規模な人口が幸いし、ある程度水質も良い」または「人口が少ないことが幸いし、水質改善で成果が上がっている」と解釈すべきなのでしょうか?) それとも、「絶対値がこの程度の数値では、はっきりとした傾向が認められない」と考えるべきでしょうか?

  • 自己相関関数とパワースペクトル密度関数、フーリエ変換について

    パワースペクトル、パワースペクトル密度と自己相関関数についての質問です。 (tは時間、hは次数、fは周波数として) ある信号x(t)の自己相関関数r(h)をフーリエ変換すると、その信号のパワースペクトル密度関数p(f)になるとネットにあったのですが、パワースペクトル密度関数p(f)と、信号x(t)をそのままフーリエ変換して得たパワースペクトルX(f)はどう違うんでしょうか。 ちなみに数学的な話というよりはコンピュータ上の処理(離散値)で考えています。 もともとパワースペクトルが『自己相関関数の離散フーリエ変換として定義される』と本にはあったのです。 しかし同じ本の中に、『自己相関関数のフーリエ変換は正しくはピリオドグラムと言い、パワースペクトルとはピリオドグラムの平均値で求められる』とも書いてありました。 パワースペクトルとパワースペクトル密度関数はいったいどう違うのか…?とずっと考えているのですが分かりません。 あと自己相関関数と自己相関係数の関係も謎です。 何がどうなっているのか混乱しているので、教えて頂きたいと思いこちらに投稿いたしました。回答よろしくお願いします。

このQ&Aのポイント
  • sc-px1vのディスクトレイを紛失した場合、新しいディスクトレイを購入することが可能です。
  • ディスクトレイのみの購入も可能なため、本体を買い替える必要はありません。
  • EPSON社製品のサポートセンターに問い合わせることで、正確な対応方法や価格を確認できます。
回答を見る