• 締切済み

相関係数と項目数について教えて下さい。

テストA(項目数80問)とテストC、テストB(項目数40問)とテストCの得点の相関をそれぞれ比べて見たかったのですが、問題数が倍あっては相関係数に影響して問題であると先輩に指摘されました。そんなことは全くしらず実験を既に終了してしまったのですが、このような場合何か解決策はあるのでしょうか? どなたか良い方法をよろしくお願いします。

みんなの回答

  • vzb04330
  • ベストアンサー率74% (577/778)
回答No.2

#1です。 補足してくださり、ありがとうございました。 相関係数の場合、例数が多いと相関値が高くなったり、無相関の検定を実施すると相関係数=0という帰無仮説が棄却されやすくなります(大数の法則による)。 Pearsonの積率相関係数で言えば、その公式に項目数は含まれません。 これは、統計学の教科書をご覧いただければ、直ちにお分かりになると思います。 Nという文字が出てくるとは思いますが、このNは、あくまでも対象者数(例数)ですので、先輩のご指摘は何か勘違いではないかと思います。 Cronbachのα係数は、おっしゃるような傾向があることが言われています。

yoshihero
質問者

お礼

ありがとうございます。思い切ってこちらのサイトにお願いして良かったです。 3つのテストともにそれぞれ総合得点でしかSPSSに入力していないのに、なぜ何問試験問題があったのかまでが分かるのかとずっと疑問に思っていました。これで研究が続けられます。 今後ともご指導よろしくお願いします。

  • vzb04330
  • ベストアンサー率74% (577/778)
回答No.1

ご質問内容が、今ひとつ、意味が分かりにくいので、下記の点について補足してくだされば、助言できるかも知れません。 1)どのような問題があると、具体的に指摘されたのか 2)相関係数を求めたいのは、テストA、B、Cの、それぞれ総得点の間の創刊でしょうか、それとも、各項目間の相関でしょうか 3)差し障りがなければ、あるいは、差し障りのない範囲で、それぞれのテストが測定しているものをご説明ください、あるいは、既存の尺度であれば、その名称をご教示ください 以上です。

yoshihero
質問者

補足

ご指摘をありがとうございます。 正確には英語の並べ替え問題80問と文法の穴埋め問題を40問と長文読解問題の3つのテストを実施ました。この後、それぞれの相関表を出して相関係数を見て、穴埋め問題と長文問題の相関係数と並べ替え問題と長文問題の相関係数を比べて、どちらが相関が強いかを主張しようとしたのですが、問題数が倍あっては、係数に影響するといわれました。私は知らなかったのですが、問題項目数が多いと相関係数は高くなるのでしょうか?クロンバックαは大きくなると授業で習った覚えはあるのですが、同じことでしょうか?よろしくお願いします。

関連するQ&A

  • 相関係数の高い項目が多いのはどのような時でしょうか

    いつもこちらのサイトで勉強させてもらっています。 色々なキーワードで検索してみたのですが見当たらなかったので質問させてください。 お菓子の試食アンケートを解析しています。 お菓子は3品あり、アンケート項目は共通です。(そう思う~そう思わないの5段階評価)。 「おいしい」と味(甘い、しょっぱい、すっぱいなど)や食感(やわらかい、しっとり、さくさく、とろけるなど) との相関を見たいと思い、相関係数をエクセルで算出しました。(分析ツール-相関) 「おいしい」と相関の高い項目は3品で共通していたのですが、 相関係数の高い項目が多いお菓子と、そうでないお菓子がありました。 (相関係数が0.7以上を「高い」として、「おいしい」と相関の高い項目を抽出しました)。 この場合、「おいしい」と相関係数の高い項目が多いお菓子は特徴がなく、 相関が高い項目が少ないお菓子は特徴的である、といったようなことが言えるのでしょうか。 このように、相関係数の高い項目数に差が出るのはどのような場合が考えられるか教えてください。 なお、試食は一人1回なので、違う人が食べています。 母集団の違いも影響するものでしょうか。(各お菓子を60人ずつに試食していただきました)。 拙い文章で、とんちんかんな質問をしているかもしれませんが、 統計学初心者にも分かるようにご回答いただけますと大変ありがたいです。 どうぞよろしくお願いいたします。

  • 相関係数について教えて下さい

    算出された相関係数の見方について疑問があります。 知識のある方、教えて頂ければ幸いです。 下のようなデータがあるとします A 100→200→400→800 B 50→100→200→400 C 50→150→350→750 AとB AとC、の数列の相関について考えるとします。 *BとC の相関については考えません。 Aの数列は100からスタートして次は2倍、その次は前の数字の2倍と、倍、倍で増加します。Bの数列は、50からスタートして、次は2倍、その次は前の数字の2倍と、倍、倍で増加します。 AとBは数の増加率が同じ場合です。ここでA,Bの相関係数を 計算すると、1と算出されました。 次にCですが、Cの数列はAの数列の増加する値と同じ値を 加算していきます。Aは最初の100に対して、次は200なので、 100の増加、するとCも、最初の50に対して100増加させています。 2行目以降も同じです。このAとCの相関係数を計算しても、1と算出されました。 AとB の相関係数は1 AとC の相関係数も1 Bと、C の数の増加は明らかに違うのに、両方共に Aに対する相関係数が1と出てきてしまいました。 どのように解釈して良いのか困っています。 私が素人判断で勝手に考えていたのは、 AとBは相関が一致していて、 AとCは増加する傾向は同じであるが、変化量の割合に違いがある為、 AとBほどには相関が高くない数字が出るとばかり思っていました。 相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか?   

  • 項目ー全体相関について

    勉強していますが、要するに何をするものかということがはっきりしません。 項目を識別する方法であるとは思いますが、本には、「得られた相関係数 が、合計得点との相関が低い項目は、全体の尺度得点との傾向が関係が なく異質であるとして除外する」と書いていますが異質とはどういうこと なのでしょうか?関係がないかどうかはどのような判断するのでしょうか? また、項目ー全体得点相関の名前の由来、意味はなんでしょうか? わかりましたらお願いします。

  • SPSS 信頼係数のケース数について

    手持ちのパイロットテスト結果で、クロンバックアルファ係数をSPSSで産出しようと思ったのですが、「ケース数が少なすぎて計算不可能 too few cases」という結果が出てしまいました。 項目数が137、ケース数35です。 テストは、A(58問)、B(20問+24問)、C(35問)からなり、それぞれ有意な相関がでています。 質問は、 1)A、B、Cそれぞれだと係数は出て、>0.8ですが、それでreliabilityが十分高いと言えるのでしょうか。 2)A,B,Cのそれぞれの合計得点(つまり項目を3つに絞る)でも、>0.8でしたが、この数値は意味があるものでしょうか。 どなたかご教示下さいませ。 あるいは、本やサイトなどを教えていただければ幸いです。 アメリカの標準テストでアメリカ国内では十分な信頼性と妥当性が認められていますが、日本で日本人に使ってもまあいいでしょう、ということを示したいのです。 どうぞよろしくお願いします!

  • 相関係数 却求め方

    初めてなんですけどぜひ皆様の力を貸してください。 問題が皆様にうまく伝わるかちょっと心配ですが・・・ たとえば今までは三つの数字a、b、cの相関係数がエクセルのCORRELなどの関数を使えばYになるのは分かったんですけど却に3番目の数字Cが幾つになれば相関係数がYになるかを求めたいんですがその求め方法を分かっている先生方がいらっしゃればぜひ教えで頂ければありがたいです。 ちなみに手書きではなくPCかエクセルを使っての方法であれば幸いです。 例:(1) 50,100,150の相関係数は1ですね。(CORREL関数)     50,100、?が幾つになれば相関係数が1になるんですか?   (2) 110,130,180の相関係数は0.970725ですね。(CORREL関数)    110,130、?が幾つになれば相関係数が0.970725になるんでか?という問題ですが・・・  ぜひよろしくお願い致します。

  • 点双列相関係数とは

    点双列相関係数Rj={(Xj-X)/σ} √Pj/(1-Pj) √以降はルートの中 Xj:該当項目を肯定した回答者についての尺度得点の平均 X:尺度得点の全回答者の平均 σ:尺度得点の標準偏差 Pj:該当者項目の項定率 この式はどういう形で出来た式なんでしょうか? 式の意味がわかりません。 だれか相関係数について詳しい方はいませんか? できましたらできるだけ詳しく教えてください。

  • 相関係数について

    お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

  • 相関係数の求め方

    うまく質問内容が伝わるか不安ですが、聞いてください。 ある地区の10年分の雨量の記録があります。 これに対して違う地区の2年分の雨量の記録があります。 この両者の相関係数を求めたい場合に、データ数が違いますが、 どうやって求めたらよいのでしょうか? 2年の値を5倍して単純に10年分のデータ数にすればよいのか、 別の方法があるのかわかりません。 ご教授ください。

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • 相関係数の問題

    あるテストの結果次のような成績を得た。(仮想データ) 指定された欄の小数点以下第3位までの相関係数を求めよ。 例)0.356 必ず表と、途中の計算過程を書く事。(部分点あり) 児童教育学科 英語4 8 4 5  5 8 6 6 8 4 理科5 3 7 10 9 4 4 5 8 8 児童教育学科以外 国語6 10 4 3  7 5 8 6 9 3  理科5 3  7 10 9 4 4 5 8 8 このような問題なのですが、まったく分かりませんでした… 心優しい方お願いいたします。