• ベストアンサー

相関係数についてです

「原則、単位は無く、-1 から 1 の間の実数値をとり、1 に近いときは2 つの確率変数には正の相関があるといい、-1 に近ければ負の相関があるという。0 に近いときはもとの確率変数の相関は弱い」 とwikiにのっていたんですが、相関が弱いとか正負の相関ってどういう意味なんですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • c_crimer
  • ベストアンサー率34% (12/35)
回答No.2

身長と体重は、相関がプラスに高いとか、テストの点と携帯の使用時間は、マイナスに相関がある?って感じですよ。 (正比例・反比例みたいなもの? 相関が弱いっていうのは、関連が低い事をいいます。 全くのランダムは、相関が0にはるはず。 つまり、相互の関連がないことです。 考えてみれば、なんで1なんだろう。 100倍して、100にした方が、分かりやすいのに。w (きっと小数点以下が大事なんだろうけど

saifhgfhw
質問者

お礼

ありがとうございます。 理解できました♪

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • info22
  • ベストアンサー率55% (2225/4034)
回答No.1
saifhgfhw
質問者

お礼

ありがとうございました。 さっき自分で同じサイト見つけました^^

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 共分散と相関係数について

    ファイナンス(証券投資)の勉強をしているのですが、共分散と相関関数でどうしても理解できない部分があるので、こちらのカテゴリで質問させて頂きます。 1.具体例(前提) A証券とB証券のポートフォリオ効果を調べるために、両者の相関性を計算します。 A証券の環境変化(期待収益率=平均収益率:20%*0.4+10%*0.4+5%×0.2=13%) 為替相場:円高→確率:0.4→収益率:20%→偏差:7% 為替相場:不変→確率:0.4→収益率:10%→偏差:-3% 為替相場:円安→確率:0.2→収益率:5%→偏差:-8% A証券の標準偏差:7*7*0.4+(-3)*(-3)*0.4+(-8)*(-8)*0.2の平方根=6% B証券の環境変化(期待収益率=6%) 為替相場:円高→確率:0.4→収益率:3%→偏差:-3% 為替相場:不変→確率:0.4→収益率:7%→偏差:1% 為替相場:円安→確率:0.2→収益率:10%→偏差:4% B証券の標準偏差:≒2.68% 2.質問 (1)共分散について この場合に、共分散は、Σ(A証券の偏差×B証券の偏差×確率)で求められると記述があります。 A証券の偏差×B証券の偏差の平均をとったものだと思います。 上述の例では、共分散は、結果的に-16になります。 この際、共分散の数値が正(+)である場合は、同方向、負(-)である場合は、逆方向の相関性があるというのは、掛け算の性質から理解できます。 その上で、共分散の絶対値は、2つの証券の相関性の程度であって、絶対的が大きい程、相関性は高いと記述がありまして、ここで理解できずにいます。 なぜ、両者の偏差を掛け合わせることで、両者の相関性の程度が計算できるのでしょうか? 例えば、一定条件のA証券の偏差が1%、B証券の偏差が2%の場合は、1*2=2と計算されますが、仮にA証券の偏差が19%、B証券の偏差が20%の場合は、19*20=380になります。 相関性というならば、両者は同方向に1%しか差がないにもかかわらず、相関性として計算される数値は雲泥の差です。 この点についてご教示頂ければと思います。 (2)相関係数について 相関係数は、共分散/(A証券の標準偏差×B証券の標準偏差)で求められると記述されています。 上記の例の場合は、-16/6%*2.68=-0.995と非常に高い負の相関性があります。 そしてこの式は、共分散(A証券の偏差×B証券の偏差の平均)を両証券の標準偏差(偏差の正数値の平均)で割ったもので、これが-1~1の間で推移することは理解できます。 ただ、上記の共分散と同様に、両者の偏差(及び標準偏差)を掛け合わせることで、両者の相関性の程度が計算できる理屈がわかりません。 この点についてご教示頂けないでしょうか? ご回答よろしくお願い致します。

  • 相関係数で。。

    相関関係は計量値に対して言えることであって、計数値にたいしては言えないことである。。。。というのは何を意味するんですか。 分かりやすく例えをあげながら説明お願いします!!!

  • 相関がないのに相関係数が1???

    相関係数の意味を考えていて、理解できないことが出てきたので教えて下さい。 変数Xと変数Yの相関係数の求め方は、データ数がnの時、  1.変数X,Yの平均値を求める。ここでは、X^、Y^と書くことにします。  2.変数X,Yの標準偏差を求める。ここでは、σx、σyと書くことにします。  3.変数X,Yを基準化する。     基準化したX=(X-X^)/σx、 基準化したY=(Y-Y^)/σy  4.基準化したX,Yの積の平均が相関係数である。     r=1/n・Σ{(基準化したX)・(基準化したY)} となります。 基準化したXと基準化したYの積が全て1のデータの場合、 例えば、(1,1)、(0.5,2)、(0.4,2.5)、(0.1,10)、(0.01,100)、(-1,-1)、(-0.5,-2)、(-0.4,-2.5)、(-0.1,-10)、(-0.01,-100)‥‥‥ 双曲線になりますが、平均値と標準偏差で元のデータに戻しても、双曲線みたいなデータの散布図になります。つまりXが大きければYも大きいという関係がないにもかかわらす相関係数は1になってしまいます(というか1になるようにデータを選んだ)。 考え方に間違いがありますか。

  • 相関係数とt検定についてお伺いします

    相関係数についての質問をさせてください すいませんエクセルで相関係数をもとめたところ,2つの集団の間に負の相関がみられました。 そこで2つの集団の間に本当に差があるのかを確認したいのですが,その場合は t検定を使用してもよろしいのでしょうか。 質問がわかりずらくて申しわけありません。 よろしくお願いします。

  • 変数AとBは相関あり、BとCも相関あり…のときにAとCに相関がないというのはどう解釈すれば良いでしょうか。

    3つの変数があり、変数Aと変数Bの間には有意な正の相関がありました(P<0.01)。BとCの間にも同様に正の相関がありました(P<0.05)。 しかし変数AとCの間で回帰分析をすると、有意な相関は認められませんでした(P=0.23)。 この様な結果になることは理論上あるのでしょうか。また、理論上あり得るとしても、結果の解釈が難しくて困っています。Aは、Cと相関のあるBと相関がある以上、AとCの間は全く無関係と言い切れるのでしょうか。 ご回答・アドバイスをお待ちしております。

  • 相関係数の違いについて

    はじめまして、maro77と申します。 現在、学生と社会人に関する公共政策に対する意識調査のアンケートを各1000通づつ、2000通回収し、そのデータ分析をしております。 具体的には、属性(年齢、性別、職業〔学部〕など)と各設問の関係性を分析したり、設問の回答結果同士の関係性を分析しております。 現在、相関関係をみようと思っているのですが、ちょっと調べてみたところ、いろんな分析手法があり、困っております。 そこで、相関係数について質問があります。相関係数には、ピアソンの相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数のほか、クラメールの連関係数、ファイ係数、コンティンジェンシー係数、ケンドールのタウなどいろいろあることを知りました。 ピアソンの相関係数については、2変数が、数字のもの(年齢、年収、身長、体重など)の数値ではないと、求めていけないことを知りました。 しかし、そのほかの分析方法については、あまりよく違いがわかりません。 アンケート結果で得られたカテゴリーデータと順位データがある場合は、どの分析方法を使うのが正しいのでしょうか。また、これらは、どうゆう基準で使いわければよいのでしょうか?いろいろ調べたのですが、いまいち、頭の中のモヤモヤが晴れません。 お手数ですが、ご教示頂ければ幸いです。 宜しくお願い致します。

  • 重相関係数のF検定について

    お世話になります。 重相関分析について教えてください。 ●質問1 観測された分散比(F値)はFの臨界値より大きく, 重相関係数は5%の危険率で,「相関無しではない」と判定されました。 しかし,ここの説明変数に対する係数のt検定結果はすべてが有効ではないという結果になりました。予測式を立てる上で問題はないけれど,説明変数に対する係数には意味がないと解釈してよいのでしょうか? -基本的にエクセルの分析ツールを使用してます-- ●質問2 説明変数同士が相互に相関を持つ場合,分析として不適切だと聞きました。(重相関分析の仮定は個々の説明変数に相関がないこと)これを確認するために,スワップ式というのがあると聞きました。これはどこで調べるのがよいでしょうか?また,基本的な教科書やサイトを紹介いただけると幸いです。

  • 相関係数の解釈

    ピアソンの相関係数の解釈について基本的なことを教えてください。 サンプルの大きさが160個ほどで、市町村の人口規模(最大124万人, 最低3千人)を 20万人以上 10万人以上20万人未満 10万人未満 の3つのカテゴリーに分け、また各市町村毎のある水質汚濁の程度を1,2,3,4(ここでは1を最悪とする)の4段階に分けて表を作りました。 その結果、 MS-EXCELのcorrel(配列,配列)を使って数値を出しますと、 人口20万人以上の市町村------------ -0.2840... 人口10万人以上20万人未満の市町村--  0.0389... 人口10万人未満の市町村------------ -0.3939... という結果が得られました。すなわち、人口10万人以上20万人未満の市町村についてだけが正の数で、人口20万人以上の市町村と人口10万人未満の市町村については負の数になりました。 またサンプル全体では、-0.1716の数値を得ました。 この結果をどう解釈すればよいのか教えてください。 例えば、人口20万人以上の市町村では、その数値  -0.2840...を以って「人口が多いため、ある程度水質も悪い」または「人口が多いため、水質の改善が進みにくい」と解釈すべきなのでしょうか?  (逆に、人口10万人未満の市町村については、その数値  0.3939...を以って「小規模な人口が幸いし、ある程度水質も良い」または「人口が少ないことが幸いし、水質改善で成果が上がっている」と解釈すべきなのでしょうか?) それとも、「絶対値がこの程度の数値では、はっきりとした傾向が認められない」と考えるべきでしょうか?

  • 相関を見る統計について

    小学生15人の一日の歩数を調べて、年齢との相関があるかどうかを調べたいと思います。 ExcelのCORRELを使用すると、負の相関(-0.6)となりました。 (1)この場合、学年が高いほど歩数は少なくなる、というのでいいのでしょうか。 (2)X軸にはどちらの変数をおけばよいですか。 (3)相関を見る場合、ピアソンとスピアマンがあるようですが、Excelの場合はどちらにあたるのでしょうか (4)15人の場合、ExcelのCORRELを使って相関を見ても良いのでしょうか。 おわかりになる方、ご回答もしくは、この答えがわかるサイト等ありましたら教えて下さい。

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

このQ&Aのポイント
  • ヘキサンに臭素を加えると、2層に分かれる。上層はヘキサンと臭素が溶けたもの、下層は水となる。
  • ヘキサンの密度が水より小さいため、ヘキサンの方が上に浮かびます。
  • 臭素が溶けたことにより、ヘキサンの密度は重くなりません。
回答を見る