- ベストアンサー
スピアマンの順位相関係数の導出過程を教えてください
スピアマンの順位相関係数ρ=1-{6D/n(n^2-1)} // D=Σ(xi-yi)^2 の導出過程を教えてください。ピアソンの積率相関係数から導くそうですが、私には分かりませんでした。 また、以下の導出過程も教えて頂けると光栄です。 Cov(x,y)=Σxiyi-(ΣxiΣyi/n)
- kanade1127
- お礼率43% (7/16)
- 数学・算数
- 回答数1
- ありがとう数1
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
> Cov(x,y)=Σxiyi-(ΣxiΣyi/n) まずはこちらから、といいたいところですが、Cov(x,y)は共分散ということでよろしいでしょうか? Cov(x,y)が共分散ということであれば、この式は間違いです。 正しくは、 Cov(x,y) = Σxiyi/n-(ΣxiΣyi/n^2) です。 以下、表記を簡単にするために、x、yの平均をそれぞれu,vとします。 u = Σxi/n v = Σyi/n 共分散は、 Cov(x,y) = Σ(xi-u)(yi-v)/n で定義されます。 これは次のように変形することができます。 Σ(xi-u)(yi-v)/n = Σ(xiyi-vxi-uyi+uv)/n = Σxiyi/n - vΣxi/n - uΣyi + Σuv/n = Σxiyi/n - uv - uv + uv = Σxiyi/n - uv = Σxiyi/n-(ΣxiΣyi/n^2) では、本題のスピアマンの順位相関係数ρ=1-{6D/n(n^2-1)} // D=Σ(xi-yi)^2 について説明します。 xiもyiも順位であり、それぞれ1~nの値で重複がないことに注意しましょう(タイがない場合)。 従って、 Σxi = Σyi = n(n+1)/2 Σxi^2 = Σyi^2 = n(n+1)(2n+1)/6 であることから、 u = v = (n+1)/2 また、 Σ(xi-u)^2 = Σxi^2-n・u^2 = n(n+1)(2n+1)/6-n・((n+1)/2)^2 = n(n+1)(n-1)/12 であり、同様に Σ(yi-v)^2 = n(n+1)(n-1)/12 です。 相関係数は ρ = Σ(xi-u)(yi-v)/√(Σ(xi-u)^2・Σ(yi-v)^2) となりますが、これの分母は、 √(Σ(xi-u)^2・Σ(yi-v)^2) = n(n+1)(n-1)/12 分子は、 Σ(xi-u)(yi-v) = √(Σ(xi-u)^2・Σ(yi-v)^2) - √(Σ(xi-u)^2・Σ(yi-v)^2) + Σ(xi-u)(yi-v) = n(n+1)(n-1)/12 - Σ(xi-u)^2 + Σ(xi-u)(yi-v) = n(n+1)(n-1)/12 - Σ(xi-u)^2/2 - Σ(yi-v)^2/2 + Σ(xi-u)(yi-v) = n(n+1)(n-1)/12 - (Σ(xi-u)^2 + Σ(yi-v)^2 - 2Σ(xi-u)(yi-v))/2 = n(n+1)(n-1)/12 - Σ((xi-u)^2 + (yi-v)^2 - 2(xi-u)(yi-v))/2 = n(n+1)(n-1)/12 - Σ((xi-u)-(yi-v))^2/2 = n(n+1)(n-1)/12 - Σ(xi-yi)^2/2 = n(n+1)(n-1)/12 - D/2 ですので、 ρ = {n(n+1)(n-1)/12 - D/2}/{n(n+1)(n-1)/12} = 1-6D/{n(n+1)(n-1)} となります。
関連するQ&A
- 相関係数について
お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。
- 締切済み
- 数学・算数
- 2つのスピアマン順位相関係数の差の有意差検定
データが正規分布していない2つの相関係数の間に有意差があるかどうかを調べたいのですが、2つのスピアマン順位相関係数の間に有意差があるかどうかを調べる検定というものは存在しますか?ピアソンのがあることは教えて頂いたのですがスピアマンのことは見つかりませんでした。よろしくお願いします。 (SPSSは手元にあります。)
- ベストアンサー
- 心理学・社会学
- 相関係数について
相関係数(ピアソンの積率相関係数)のp値とは何ですか? 文献の解釈をする上で、このことが分からなくて困っています。統計学の本などを調べてみたのですが、分かりませんでした。回答お願いします。
- ベストアンサー
- その他(学問・教育)
- 正規分布でないときピアソンの相関係数を使いたいのですが。
文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。
- ベストアンサー
- その他(学問・教育)
- スピアマンの順位相関係数の関数化
タイトル通り、スピアマンの順位相関係数の関数化ができずに困っています。 統計ソフトのRを使っています。本来ならcor(a,b)で0.02857143とでます。これを関数化せよ、ということです。 自分で以下のようにやってみましたが上手くいきません。どこが違って、どのようにしたらいいか、アドバイスをお願いします。 > a <- c(3,2,1,5,4,6) > b <- c(2,6,3,5,1,4) > n <- length(a) > test <- function(a,b,n){ 1-(6*sum(a-b)^2)/ (n*(n+1)*(n-1))}
- 締切済み
- 数学・算数
- 相関係数の違いについて
はじめまして、maro77と申します。 現在、学生と社会人に関する公共政策に対する意識調査のアンケートを各1000通づつ、2000通回収し、そのデータ分析をしております。 具体的には、属性(年齢、性別、職業〔学部〕など)と各設問の関係性を分析したり、設問の回答結果同士の関係性を分析しております。 現在、相関関係をみようと思っているのですが、ちょっと調べてみたところ、いろんな分析手法があり、困っております。 そこで、相関係数について質問があります。相関係数には、ピアソンの相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数のほか、クラメールの連関係数、ファイ係数、コンティンジェンシー係数、ケンドールのタウなどいろいろあることを知りました。 ピアソンの相関係数については、2変数が、数字のもの(年齢、年収、身長、体重など)の数値ではないと、求めていけないことを知りました。 しかし、そのほかの分析方法については、あまりよく違いがわかりません。 アンケート結果で得られたカテゴリーデータと順位データがある場合は、どの分析方法を使うのが正しいのでしょうか。また、これらは、どうゆう基準で使いわければよいのでしょうか?いろいろ調べたのですが、いまいち、頭の中のモヤモヤが晴れません。 お手数ですが、ご教示頂ければ幸いです。 宜しくお願い致します。
- 締切済み
- 数学・算数
- スピアマンの順位相関係数について教えてください
論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。
- 締切済み
- 数学・算数
- ピアソンの積率相関係数は不偏推定量ですか?
こんにちは。 ピアソンの積率相関係数は,母相関係数の不偏推定量ですか? あと,このことに関する文献があれば教えてください。 よろしくお願いします。
- ベストアンサー
- 数学・算数
お礼
懇切丁寧な ご回答、ありがとうございました。 また、Cov(x,y)=Σxiyi-(ΣxiΣyi/n)はとあるサイトで見て、それが間違いである事を確認できて良かったです。