• ベストアンサー

相関係数と回帰直線の使い分け

相関係数は2つの変数とも無作為型であること、回帰直線は片方の変数は固定型であること・・・ということが、統計の本には書いてあります。 なぜでしょう? 片方の変数が固定型であった場合、相関係数を求めてはいけないのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
noname#21649
noname#21649
回答No.4

>教えていただけませんか 回帰線は.水準を通常.等間隔に5-10点とり水平軸に記載し.その測定値を垂直軸に記載します。各水準ではそれぞれ水準別に.平均値が存在し.平均値を中央値とするガウス分布になっている場合に限って.回帰線を求めることができます。 (回帰線からの計算値-測定値)の度数分布を求めて.正規分布になっているときに限って.回帰線が意味を持ちます(誤差分析という作業です)。信頼限界を計算してみればわかるとは思いますが.等間隔でなかった場合には.信頼限界がばらけます。 相関曲線では(話しを簡単にする為に.2次元.1次方程式の場合に限ります). 横軸と縦軸それぞれに.平均値が存在し.平均値を中央値とするガウス分布になっている場合に限って.相関曲線を求めることができます。 縦軸・横軸を平均値からのずれを標準偏差の倍数に換算して.平均値からの距離の度数分布を求めて.正規分布になっていない場合には.意味がありません(計算の名称忘却.以下誤差分析と書きます)。 回帰線と相関曲線では仮定とする値の分布関数が決まっています。この仮定条件を満たせないので.回帰線の場合に相関曲線を求めることが無意味なのです。 通常は.正規分布であることを仮定して計算し.誤差分析をして正規分布であったならば.統計処理に間違いはなかったとします。 数学的証明は.数式でそれぞれの方程式を定理から導入してください。ここにはかけません。

brassard
質問者

お礼

そもそも仮定条件を満たしていない・・・なるほど、ありがとうございます。かなりすっきりしました。

その他の回答 (3)

noname#21649
noname#21649
回答No.3

>なぜでしょう? 数学的にいみがありません。 相関係数を定義から導入している内容が.最近の本に見かけないのです(古い本を探してみてください。)が. 定義を満足していませんので.おなじようなけ遺産をしても「相関係数」以外の数値を求めることになります。

brassard
質問者

補足

数学的に意味がない理由を教えていただけませんか?

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.2

気持ち的にはなんとなく判りますが、実用上は余り気にした事はありません。 片方の変数が固定型であろうが、それをわかった上で相関係数を求める事はよく やります。やってはいけないという気はしません。 ただ、相関係数の分析自体、相関があるかどうか判らないものを、相関係数で 関係ありと結び付けていくのが基本なわけですから、理論的にはきっと2つの 変数が対等という事が前提なのでしょう。 気を付けないといけないのは、相関係数がある値以上でないと回帰式を求めても意味がないということです。 いずれにしても、教科書の気持ちを汲みつつ、実用的には、ある程度、自由でよいという事だと思います。やっているうちに、経験的に判ってきます。

brassard
質問者

お礼

>相関係数の分析自体、相関があるかどうか判らないものを、相関係数で 関係ありと結び付けていくのが基本なわけですから、理論的にはきっと2つの 変数が対等という事が前提なのでしょう。 なるほど・・・、一番納得しやすいお答えです。ありがとうございました。

  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.1

得られた標本における2変数の関係を考えるときに、相関係数と回帰直線がよく用いられます。 しかし、この両者には、次のような違いがあります。 相関係数では、2変数X、Yとの関係は対等です。 しかし、回帰直線では、例えば、YのXへの回帰直線では、Xは独立でYはXに従属する変数である。ある検査値の加齢による変化を調べる場合には、年齢が独立変数X、検査値が従属変数Yになるが、これを逆にすることはナンセンスです。 このようなことをその統計の本は言いたいのではないでしょうか。

brassard
質問者

お礼

ありがとうございました。回帰直線のご説明にはなるほどと思いました。

関連するQ&A

  • 相関係数と回帰直線ってなんですか?

    相関係数と回帰直線ってなんですか? ある資格の勉強をしているのですが、上の2つの用語の意味がよく分かりません。自分なりに調べたのですが、???な状態です。 どなたか、用語の意味を簡単に説明してください。 また、相関係数や回帰直線を調べることによって何が分かるのでしょうか? ちなみに私は、統計学についてはド素人ですので、専門用語などはまったく分かりません。説明する際、専門用語の使用はできるだけ避けてください。お願いします。

  • 回帰直線と相関係数

    ある任意の回帰直線に対する相関係数の求め方をどなたか教えていただけないでしょうか。 EXCELでは近時曲線(直線)を書いて、その曲線に対する相関係数を算出していると思います。 また、切片を任意に変更することによって相関係数が変わっています。 説明不足でしたら、ご指摘いただけたら幸いです。

  • 相関係数を教えてください。

    n≧50の相関係数を求めたい。xの平均とy平均、相関係数と、相関図表をかき、回帰直線の方程式を求めて、相関係数を論じてください。お願いします。

  • 相関係数と回帰分析

    大学でSPSSの使い方の授業を受けていますがわからないことがあるので教えてください。 私は都道府県別のコンビニの数について調べようと思いました。 ・コンビニ数と人口 ・コンビニ数と県民所得 ・コンビニ数と県内総生産 という3つの関係について調べています。 先生から教えていただいた内容ですと・・・ 相関係数を求める⇒回帰分析を行う⇒t検定をする という順番で分析すると教えて頂きました。 しかし、この場合は、 相関係数は3つそれぞれ求めてから1度の重回帰分析をしたらよいのか、それともそれぞれを回帰分析したらよいのかわかりません。 また、相関係数を求めて相関がない(0)となった場合であっても回帰分析は行うものなのでしょうか? SPSSは勉強開始したばかりなのでなかなか理解できません。 また、分析の仕方についてアドバイスありましたらよろしくお願いします。 どうか教えてください。

  • 回帰直線を求める問題

    通常の(EXCELの図や関数などで求まる)回帰直線 y = ax + b について考えよ,という問題です。 1. 相関が0であるデータ分布に対しては,直線の回帰係数つまり,傾きaは,0/0となり不定(求まらない)である。 これは,正しいか?間違いなら,数値を述べよ。 例えば,単位円上にx軸から45度ずつ,8点を取る。以下のデータである。 x      y 1      0 1/√2  1/√2  0       1 -1/√2  1/√2 -1      0 -1/√2  -1/√2 0      -1 1/√2  -1/√2  これに回帰直線を当てはめるのは不自然だが,回帰係数の性質を学ぶために,やってみよう。  すると,相関0なのに,傾き0の直線,y=0が出てしまう(添付図参考)。これは何かの間違いか?そんな例も考えてみよう。 統計ソフトを利用して考えても良い。 2. 最小二乗法で,回帰直線を求めるとき,直線のx方向にもy方向にも最小二乗となる。 これは,正しいか?間違いなら,正しく述べよ。あくまで,通常の最小二乗法である。 なお,工業統計では, 1正しい。傾き0 となることはない。 2正しい。つまり,x,yどちらから見ても最小二乗となる。 となるが,ここでは一般的に考えてみよう。 工業統計の参考として,このOKにも回答があるので,参考にして良い。 http://okwave.jp/qa/q6733154.html

  • 相関分析や回帰分析について

    相関分析や回帰分析についての記述が正しいのかわかりません。 間違っていたらどこが違うのか理由も教えていただけると幸いです! (1)ある特性、例えば、身長についてゴールドンのいう第二世代(子)の平均への回帰が観測される(b<1)のとき説明変数と被説明変数を逆にした回帰計算をしてもいわば、おやの平均への回帰が観測される可能性はない。(親と子の身長には、正の相関があると考えてよい) (2)第二世代(子)が平均へと回帰するのならば、将来は、個人のもつ身長その他、さまざまな諸特性がすべて一様な社会になってしまう。(ある経済学者はそう考えた) (3)重回帰の場合、通常の決定係数を使用すると、説明変数の増加のよるあてはまりのよさの改善を誇張してしまうので、修正済み決定係数(自由度調整済み決定係数)を使用するのが普通である。もいろん、単純回帰については、決定係数と修正済み決定係数は同じものになる。 (4)決定係数は、マイナスになることはないが、修正済み係数はマイナスになりうる。 (5)回帰分析を因果関係と結びつける(説明変数を原因、被説明変数を結果と見る)ことは、記述統計の範囲を逸脱している。 よろしくお願いいたします!!!

  • 相関係数とは?

    相関係数というのは、言ってみれば、回帰直線の45°または-45°という角度がどれだけ正しいか、というような指標 という説明が,ここでされているが, http://okwave.jp/qa/q6733154_2.html#answer 私には,どうも分からない。 この点を誰か説明してほしい。

  • 回帰直線の求め方

    (x,y)のデータが沢山あるとします。 そしてxとyの間に直線関係(比例関係)が認められそうです。 Excelを使って、最小二乗法により回帰直線(y=ax+b)を求める際、aの値を固定してbを求める、そしてその相関係数を求めることはできますでしょうか。 ※単に回帰直線を計算させると、y=0.95x+bと算出されたのですが、 理屈から考えるとy=1x+bの関係がありそうなので、そのときのもっとも適当なbの値を知りたいのです。

  • 相関係数について

    お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

  • 相関係数について

    相関係数(ピアソンの積率相関係数)のp値とは何ですか? 文献の解釈をする上で、このことが分からなくて困っています。統計学の本などを調べてみたのですが、分かりませんでした。回答お願いします。