- 締切済み
相関係数に関わる話
相関係数というのはどういうときに使う統計手法なんでしょうか?そこから何が分かって、何は言えないのでしょうか? 教えてもらえませんか。。?
- みんなの回答 (3)
- 専門家の回答
みんなの回答
まず.相関分析と回帰分析の違いから。話を簡単にするために2次元にします。 回帰分析は.特定の値を測定者が決めて.その値に対応する値を測定し.両者の関係から.回帰線を求める方法です。この場合に「測定者が決めた値に誤差がまったくない」ということが統計処理の前提になっています。測定値については.「平均値を持つ」ことが前提になっています。つまり.測定値は平均付近にガウス分布をで存在する事になります。又.多くの場合に測定値の間隔がほぼ等しい事.最大測定値と最小測定値の間だけ意味を持ち.外装した場合には誤差が大きすぎて実質的に意味を持たない事が多いです。 次に相関分析についてですが.これは.任意の点を測定した場合に得られる2つの測定値の関係を示します。したがって.測定点それぞれが誤差を持ちます。 2つの測定値は.平均値を持つ必要があります。つまり.平均値の左右にガウス分布で適当にばらついている必要があります。もし.ガウス分布以外の分布を示した場合には.相関曲線の意味を持ちません。度数分布を取ると.前者(通常横軸にとる)の真ん中あたりに中心を持つ相関曲線を中心とする楕円状の分布を取ります。 この測定法を使う場合には.なんだかの理由で特定の値に設定できない場合(外気温の影響など)に使用します。 相関分析に使われる相関曲線のそばにどの程度測定値が集まっているかを示すのが.相関係数です。注意点としては.「Xとyとの間に相関はある」という検定は出来ます。しかし.「相関はない」とする検定は実質的に出来ません。したがって「相関がある」という結論を出す事はかのうですが.相関係数が低く有意でない場合においては「わからない」ということになります。特に心理学のような分野においては.危険率5%検定で優位となる相関係数が0.9以上のような場合でさえ.相関係数0.5もあって意味があるという議論がなされています。「相関がある」場合と.「相関があるかどうか分からない」場合の2つに分ける事ができるのが.相関係数(と派生して計算できる数値を含めた)検定です。「相関がある」という言葉は(正確さが欠けますが)「従属する」という意味に近い面があります。 相関係数単体では計算できませんが.その他の数値を使うと信頼限界も計算できます。 相関分析も回帰分析も計算方法はほぼ同じなのですが.前提とする誤差と分布が異なります。両者の違いを理解してください。
- ymmasayan
- ベストアンサー率30% (2593/8599)
統計的には、回帰式と相関係数の2つが重要です。 とりあえず、(X,Y)の2次元で話をすすめます。 得られたデータでグラフ上に点を打ちます。(散布図) ここで、データが円状になっていれば仕方がありませんが、右上がりとか右下がりの傾向が出ていれば、回帰式を仮定し係数を計算します。(最小二乗法) ところが、データが楕円状の時と、データがほぼ直線状になっているときでは同じ回帰式であっても、意味合いが全く違います。 この回帰式の信頼度(確からしさ)を示すのが相関係数です。データが直線になれば相関係数は1、円になれば0、楕円なら0.5くらいと言う事になります。 良く、回帰式だけ計算して結論を導くと言う事をやりますが、相関係数が小さければ、誤った結論を導いてしまう事にもなりかねません。それを防ぐのが相関係数です。
- may-may-jp
- ベストアンサー率26% (324/1203)
「確率・統計入門」(岩波書店)によると、 相関係数というのは、xとyがどれくらい関連しているかを表す指示数であり・・・ と書かれています。つまり、xとyが独立なら、相関係数は0になり、相関係数が1であれば、yはxの一次関数で表すことができる、ということです。