• 締切済み

相関係数について

お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

みんなの回答

noname#227064
noname#227064
回答No.1

非常に危ういことをしているように見受けられます。 貴方の周りにおられる統計に詳しい方に相談されることを強く勧めます。 > 以下のような、関連性のない2変数に関して、 > 両変数間の総合的な類似度を計算する方法に、 > ピアソンの積率相関係数及び、スピアマンの順位相関係数を > 使用したいと思っております。 そもそも関連がないなら相関係数を計算する意味がありません。 また、対応がない場合も同様です。 さらに、昇順に並び替えるというのも意味がありません。 項目数が違うというのは、例示されたデータのようにそれぞれデータ数が違うということでしょうか? そうであるならば、この場合は相関係数は計算できません。 ひょっとして貴方のいう類似度というのは相関のことではなく、同じ分布であるか否かを知りたいのではないのでしょうか? 分布の差を検定したい場合は、コルモゴロフ・スミルノフ検定(参考URLやWikipediaを参照)があります。 これは貴方がしたいことと合っていますでしょうか?

参考URL:
http://aoki2.si.gunma-u.ac.jp/lecture/Average/kstest.html

関連するQ&A

  • スピアマンの順位相関係数の導出過程を教えてください

    スピアマンの順位相関係数ρ=1-{6D/n(n^2-1)} // D=Σ(xi-yi)^2 の導出過程を教えてください。ピアソンの積率相関係数から導くそうですが、私には分かりませんでした。 また、以下の導出過程も教えて頂けると光栄です。 Cov(x,y)=Σxiyi-(ΣxiΣyi/n)

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • 相関係数について

    相関係数(ピアソンの積率相関係数)のp値とは何ですか? 文献の解釈をする上で、このことが分からなくて困っています。統計学の本などを調べてみたのですが、分かりませんでした。回答お願いします。

  • 積率相関係数がわかりません

    ある2変数の共分散は30.0 2つの変数それぞれの分散は81.0 49.0 ピアソンの積率相関係数を求めよ 答えは0.48になるそうです 公式はr=Sxy/SxSyを使うんだと思うんですけれど いくらやっても0.48になりません もしかしたら答えが間違っているのかもわからないので できれば途中式みたいなのをつけてくれると助かります。

  • 相関係数の違いについて

    はじめまして、maro77と申します。 現在、学生と社会人に関する公共政策に対する意識調査のアンケートを各1000通づつ、2000通回収し、そのデータ分析をしております。 具体的には、属性(年齢、性別、職業〔学部〕など)と各設問の関係性を分析したり、設問の回答結果同士の関係性を分析しております。 現在、相関関係をみようと思っているのですが、ちょっと調べてみたところ、いろんな分析手法があり、困っております。 そこで、相関係数について質問があります。相関係数には、ピアソンの相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数のほか、クラメールの連関係数、ファイ係数、コンティンジェンシー係数、ケンドールのタウなどいろいろあることを知りました。 ピアソンの相関係数については、2変数が、数字のもの(年齢、年収、身長、体重など)の数値ではないと、求めていけないことを知りました。 しかし、そのほかの分析方法については、あまりよく違いがわかりません。 アンケート結果で得られたカテゴリーデータと順位データがある場合は、どの分析方法を使うのが正しいのでしょうか。また、これらは、どうゆう基準で使いわければよいのでしょうか?いろいろ調べたのですが、いまいち、頭の中のモヤモヤが晴れません。 お手数ですが、ご教示頂ければ幸いです。 宜しくお願い致します。

  • 2つのスピアマン順位相関係数の差の有意差検定

    データが正規分布していない2つの相関係数の間に有意差があるかどうかを調べたいのですが、2つのスピアマン順位相関係数の間に有意差があるかどうかを調べる検定というものは存在しますか?ピアソンのがあることは教えて頂いたのですがスピアマンのことは見つかりませんでした。よろしくお願いします。 (SPSSは手元にあります。)

  • エクセルで相関係数

    『AとB』、『AとC』の相関係数を エクセルで出したいのですが、 どうしたらいいのかわかりません。 Aの数値は、0.24、0.44、0.32、0.42、0.21、0.33で、 Bの数値は、2.60、2.53、2.71、2.48、1.63、1.98で、 Cの数値は、1.79、1.56、2.13、1.98、1.37、1.37です。 ピアソンの積率相関係数というものを使って 出したいのですがさっぱりわかりません。 分かる方教えてください。 よろしくお願いします。

  • スピアマンの順位相関係数について教えてください

    論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。

  • ピアソンの積率相関係数は不偏推定量ですか?

    こんにちは。 ピアソンの積率相関係数は,母相関係数の不偏推定量ですか? あと,このことに関する文献があれば教えてください。 よろしくお願いします。

  • KaleidaGraphの相関係数について

    KaleidaGraphで回帰曲線を描く際に算定される相関係数について, ご質問させて頂きます。 ヒューリンクスのテクニカルサポート(下記,URL)より, https://www.hulinks.co.jp/support/kaleida/curvefit.html 相関係数は,”ポアソンのR”という方程式を使用しているそうですが, これは”ピアソンの積率相関係数”(所謂R)と同じなのでしょうか。 定義式が異なるようにみえてなりません。 また,テクニカルサポート内にある, ”相関は、計算された曲線がどれだけよく元のデータに当てはまっているかを示します。” という文言も気になります。 相関と回帰は異なるものと理解しているのですが, 「回帰式と元データの相関を表す相関係数」というものが存在するのでしょうか。 ご存知のかたがいらっしゃいましたら,ご教授頂けますと幸いです。 よろしくお願いいたします。