• ベストアンサー

相関の強さの表し方

2点質問があります。文系人間ですので、簡単に表現してくれると有り難いです。 1.2つの変数の相関関係の強さがどれくらいかを、説明する場合にどのような方法があるのでしょうか。 2.某サイトで相関関係の強さについて、「相関係数の絶対値の大きさが0.7~1.0だと強い相関、0.4~0.7だとやや相関あり、0.2~0.4だと弱い相関あり、0~0.2だとほとんど相関なし」というものを見つけたのですが、これは統計学的に一般的に言われていることなのでしょうか。何か確認できる書物などをご存知でしたら教えてください。  

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.2

こんにちは.質問順番を入れ替えて回答します. <2.相関係数の言語的評価> 例えば『心理学のためのデータ解析テクニカルブック』などに書かれています.数値に多少変動はありますが(0.0~0.3などのように),おおよそ一般的な基準です.統計解析法の入門書には大抵書かれています. (実際には…) ただ,あるテストで60点をとった場合,その人の能力やテストの難易度によって,その60点に対する評価が変動するように(人によっては「高い」あるいは「低い」点と考える場合がありますね),相関係数の値も本来はそのデータ領域の特性を考えて解釈しなければなりません.この点を相関係数を実務で使う人は十分理解しているので,上記の言語的評価を目安程度に使っています.このためある領域では0.5を高い相関があると解釈することもあれば,同値をあまり関連性がなかったと解釈する場合もあります. なお,相関係数のイメージ的理解としては,二つの変数ABの場合,変数Aが単独に作業した量と変数Bが単続に作業した量の積の中で,変数ABが一緒に働いたときの作業量の割合と考えてもらうのがいいでしょう(あまりイメージ的理解でもありませんが…). <1.相関係数の説明> 一般的に相関係数と呼ばれるものはピアソンの積率相関係数です.この相関係数は直線的関係を示していますので,二つの変数の点をプロット図に描くと良いと思います. == 正・負の「完全:|r|=1」相関図 ==========================   <正の完全相関:r=1>      <負の完全相関:r=-1>   │       *        │ *   │      *         │  *   │     *          │   *   │    *           │    *   │   *            │     *   │  *             │      *   │ *              │       *   └─────────       └────────   ・正の相関:ある変数が増加(減少)すれば他の変数も増加(減少)   ・負の相関:ある変数が増加(減少)すれば他の変数は減少(増加) ============================================================= ※図が歪んでいるかもしれないので,上記の図をコピー&貼り付けで適当な文章ソフトに貼り付け,等幅フォント(MSゴシック)に修正して下さい. 上記のように「完全に直線状になっていれば[1]」となります. なお傾きについては,右上がりか,左上がりかというという大雑把な解釈をする程度に留めてください(傾きの程度も重要な情報ですが,多少数学的知識を入れないと説明できないので). 実際のデータをプロット図に示し,「どの程度直線的か,傾きはどちら向きか」という観点で説明するのはどうでしょうか?

その他の回答 (3)

  • yam113
  • ベストアンサー率50% (6/12)
回答No.4

こんにちは。少しだけ統計学をかじったことがある文系出身の者です。 (1について) 相関関係について、一般的に、強さは「相関分析」(相関係数)、法則性は「回帰分析」で。 (2について) 『統計のみ・か・た』(高橋寛著 三省堂)がわかりやすいと思います。これによれば、相関係数の目安として次のように書かれています。 0.75~1 正の相関がある 0.5~0.75 まあ正の相関があるといえる 0~0.5 あまり相関はない (ただし、どのくらいが「強い相関」でどのくらいが「弱い相関」かは測定対象にもよるし、なによりも主観的なものなので、一般論として書かれているだけです。より正確に表現しようとするなら「検定」による方法が必要だと思います。) ※もう少し突っ込んだものに『はじめての統計学』(鳥居泰彦著 日本経済新聞社)があります。後者は斯界の入門書として結構ポピュラーなもののようです。

参考URL:
http://www.sanseido-publ.co.jp/publ/bypass_1.html, http://book.keizaireport.com/asin/4532130743.html
noname#21649
noname#21649
回答No.3

1.相関係数と残差二乗和があります。 2.これは.多分心理学関係(心理学関係の人がこの話をしますので)の内容かと思います。 統計関係の本で「R表」を見てください。危険率5%で有意な場合に「相関がある」.1%で「強い相関がある」.10%で「相関があるかもしれない」と表現します。資料数で変化しますので.数値表を見てください。 注意点として.「相関係数が存在する」場合は.残さは.ガウス分布である必要があります。 測定値から計算値を引いた値を.それぞれの軸(本来ならば.どの軸に対しても無相関になるはず)でプロットしてみてください。両者の相関が見とめられた場合は最初に求めた「相関係数」は意味を持ちません。 また.連が見とめられる場合も相関係数が意味を持ちません。 多変量解析の(名称忘却マなんとか)分析を行うと.平均値を中心とする(線名忘却)線が楕円状に描くことができます(2つの軸共に平均値が存在して.平均値の付近にガウス分布で存在する)。線の間に存在する点の数がガウスぷんぷに従わない場合には.相関係数が意味を持ちません。 単に相関係数だけ比較すると.誤った判断をしてしまうことになります。分布の状態を見る必要があります。 人文関係の方ですと.「相関」と「回帰」を間違える場合がありますので.これも書いておきましょう。 測定値は連続数(実数)であること。 相関の場合には.2つの値が独立に特定できること。 回帰の場合には.片一方の値は固定され無限桁の精度がある(例.1gの薬を投与した場合.2gの薬を投与した場合等).

  • hiko758
  • ベストアンサー率33% (1/3)
回答No.1

こんにちわ。 1.相関関係の強さは相関係数を求めて、その値によって判断するしかないと思われます。(2でおっしゃられてることそのままですけど・・・) 2.相関係数を求めて、「相関係数の絶対値の大きさが0.7~1.0だと強い相関、0.4~0.7だとやや相関あり、0.2~0.4だと弱い相関あり、0~0.2だとほとんど相関なし」と評価します。 今、私の手元にある本であれば、 「図解でわかる 統計解析」という本は比較的やさしく書かれていると思われます。

関連するQ&A

  • 相関係数について

    お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

  • スピアマンの順位相関係数について教えてください

    論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。

  • 相関係数と回帰直線の使い分け

    相関係数は2つの変数とも無作為型であること、回帰直線は片方の変数は固定型であること・・・ということが、統計の本には書いてあります。 なぜでしょう? 片方の変数が固定型であった場合、相関係数を求めてはいけないのでしょうか?

  • 相関を求める時の、はずれ値のはずし方

    こんにちは 現在、ある2つのデータの相関関係を調べています。 そのデータを散布図にしたところ、数個はずれ値が確認できました。 これのはずし方をご質問させてください。 はずれ値のはずし方について、標準偏差を考えるやり方などがありますが、そういった統計的手法ではなく、単に『はずしてみて分析してみた』というのは、ありなのでしょうか? 私は、この2つのデータの相関があることを言いたいだけで、それ以上に詳しい分析を行うつもりはありません。 しかし、統計的におかしはことはしたくありません。 そこで、話の流れとして、 『散布図を作って、相関係数を求めてみた。相関があった。けれど、はずれ値もあった』  ↓ 『はずれ値っぽいのを外してみて、相関係数を求めてみた。やっぱり相関があった』  ↓ 『いずれにせよ、相関はある』 はずす値がはずれ値であるかどうかが、主観によってしまうので、統計的にどうなのかな?と思ったので、ご質問させていただきました。 けれど、結局、はずしても、はずさなくても相関があるのなら、統計的にも話しの流れ的にも問題はないのでしょうか……。

  • 【心理学統計】 2変量の関係の表し方-「相関」についての質問です。

    みなさま。お世話になっております。 心理学研究で、SPSSを使ってデータの統計解析をしておりますが、2変量の関係の表し方について、おそらく簡単と思われることを教えていただきたく思います。 2変量の関係を1つの数値で表すのは相関係数ですよね。 <質問1> 相関係数の元になっているのは、2変量をX-Y軸にドットした散布図だと思いますが、この散布図の中に、相関の直線(?という言い方でよいでしょうか? 相関が1に近ければ右上がり、-1に近ければ右下がりに表現される、あの直線のことを言っているのですが、「相関直線」とはあんまり言いませんよね。「回帰直線」というのはありますけれども。相関の直線は散布図の視覚的傾向をだいたいの線にして表現したものであって、回帰直線のようにきちんと算出して描ける直線ではないとか?そんなことないですよね??)を書くには、SPSSでどう操作したらよいのですか? <質問2> 変数Xは、1⇒5にスケールが上がっていくと度数(そのスケールを選ぶ人の数)も上がっていく変数、 変数Yは、1⇒5にスケールが上がっていくと度数は下がる変数だとします。 この2つの変数の関係を、視覚的な図で表現するには、どんな図を作ればよいのですか? つまり、変数Xは大きい数字が選ばれやすく、変数Yは小さい数字が選ばれやすい、ということを1つの図で表現できないのでしょか? これがまさに相関(の直線)である気もするので、おかしなことを質問しているかもしれません。 <質問3> 2変数に曲線的な関係があるかどうか見たかったら、どうするのですか? わかる方は、SPSSの操作も教えてください。 「相関」。 いままで、わかっているつもりでおりました。 が、少し頭が混乱していることに気づきました…(^^;) みなさま、教えていただけたら大変ありがたく思います。 よろしくお願いいたします。

  • 相関関係を示すには、何を求めればよいでしょう?

    こんにちは 相関関係を求める方法を教えてください。お願いします。 ある2つのデータがあるとします。この2つのデータに相関があるかどうかは、どう求めればよいでしょうか? 相関係数を求めるということはわかるのですが、例えばこれが一定数以上あれば、それだけ『この2つのデータは相関がある』と言ってしまっても統計的に良いものでしょうか? 自分でもいろいろ調べてはみたのですが、人によって『t検定を行わなければダメ』『相関係数の優位性の検定をしないとダメ』『回帰直線まで求めないとダメ』など、言っていることが疎らで、よくわかりません。 私の調べたいことは、2つのデータに相関があるかどうかだけです。 浅薄な質問で、大変申し訳ありませんが、どなたかお答えいただけるようお願い致します。

  • 相関がないのに相関係数が1???

    相関係数の意味を考えていて、理解できないことが出てきたので教えて下さい。 変数Xと変数Yの相関係数の求め方は、データ数がnの時、  1.変数X,Yの平均値を求める。ここでは、X^、Y^と書くことにします。  2.変数X,Yの標準偏差を求める。ここでは、σx、σyと書くことにします。  3.変数X,Yを基準化する。     基準化したX=(X-X^)/σx、 基準化したY=(Y-Y^)/σy  4.基準化したX,Yの積の平均が相関係数である。     r=1/n・Σ{(基準化したX)・(基準化したY)} となります。 基準化したXと基準化したYの積が全て1のデータの場合、 例えば、(1,1)、(0.5,2)、(0.4,2.5)、(0.1,10)、(0.01,100)、(-1,-1)、(-0.5,-2)、(-0.4,-2.5)、(-0.1,-10)、(-0.01,-100)‥‥‥ 双曲線になりますが、平均値と標準偏差で元のデータに戻しても、双曲線みたいなデータの散布図になります。つまりXが大きければYも大きいという関係がないにもかかわらす相関係数は1になってしまいます(というか1になるようにデータを選んだ)。 考え方に間違いがありますか。

  • 相関関係と双方向因果関係

    どこのカテゴリーで質問しようか迷いましたが、ここでさせていただきます。 回帰分析を知ったときあたりからずっと不思議だったのですが、相関関係と双方向因果関係との違いって何ですか?私の言っていることは、以下のものの違いについてです。 ○相関関係とは…  二つの変数の相関係数をとったときに、有意な係数が出てくることです。 ○双方向因果関係とは…  二つの変数に対して、片方を独立変数、もう片方を従属変数として単回帰分析を行ったとき、有意な係数が出てきた場合、独立変数と従属変数を入れ替えて回帰分析したとしても有意な係数が出てくることです。 分かりにくいことがあれば補足要求をしてください。宜しくお願いします。

  • 相関に関する統計手法について

    たとえば、 「タバコを吸う量」と「酒を飲む量」とが相関してることを確認するときは、この2つの因子の相関係数を見て、相関が強いとか相関が弱いとか、統計的に有意な差があるとか見るかと思います。 では、 「就業時間が長い」or「年齢が高い」ほど、この2つの因子の相関が強く、「就業時間が短い」or「年齢が低い」ほど、この2つの因子の相関が弱いといったように、3つ目の因子によって2つの因子の相関の強さが変わるということを見るには、どのような統計処理を行えばよいでしょうか?

  • 相関係数の使い方

    およそ関係のなさそうな2つの統計量の相関係数を計算した時に、値として’相関がある’という結果が出たのですが、これは信用すべきなのでしょうか、それともこの計算および分析が成立するのには何か条件があり使ってはいけない場面で使ってしまっているのでしょうか、詳しい方ご教示ください。