• 締切済み

相関を見る統計について

小学生15人の一日の歩数を調べて、年齢との相関があるかどうかを調べたいと思います。 ExcelのCORRELを使用すると、負の相関(-0.6)となりました。 (1)この場合、学年が高いほど歩数は少なくなる、というのでいいのでしょうか。 (2)X軸にはどちらの変数をおけばよいですか。 (3)相関を見る場合、ピアソンとスピアマンがあるようですが、Excelの場合はどちらにあたるのでしょうか (4)15人の場合、ExcelのCORRELを使って相関を見ても良いのでしょうか。 おわかりになる方、ご回答もしくは、この答えがわかるサイト等ありましたら教えて下さい。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 サンプル数がわずか15で相関係数が-0.6というのでは、何か結論を言うのは憚られる。実際、散布図を描いてみればかなりバラバラでしょ?  ところで、「歩数を調べて、年齢との相関があるか」という問いは、「歩数と年齢との相関」を問うのであり、これは「年齢と歩数との相関」と言っても同じこと。結論を言うにしても、「学年が高いほど歩数が少ない」「歩数が少ないほど学年が高い」「学年が低いほど歩数が多い」「歩数が多いほど学年が低い」という表現はどれも対等であるべき。  ですから、おかしな誤解が生じないように、単に「15人の小学生において、歩数と年齢との間には(弱い)負の相関があった」とでも言うのが良いと思います。(ゆえに、X軸にどっちの変数を取るかを心配するのは、無意味。)  なお私の場合、数学的な定義がよくわからんExcelの関数はキモチワルイんで、自分で表計算を使って算出します。

  • spring135
  • ベストアンサー率44% (1487/3332)
回答No.1

(1)この場合、学年が高いほど歩数は少なくなる、というのでいいのでしょうか。 解釈としてはいいと考えられます。 (2)X軸にはどちらの変数をおけばよいですか。 年齢です。 (3)相関を見る場合、ピアソンとスピアマンがあるようですが、Excelの場合はどちらにあたるのでしょうか ピアソンは正規分布を仮定した場合、スピアマンはそうでない場合に用いますが、 広く用いられているのはピアソンで、Excelはピアソンです。 (4)15人の場合、ExcelのCORRELを使って相関を見ても良いのでしょうか。 これは厳密に考えると検定ということに関連して結構難しい問題ですが、相関の第一歩としてよいと思われます。

関連するQ&A

  • 相関係数について

    お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • 相関係数の計算について質問です。EXCELにCORREL関数というのが

    相関係数の計算について質問です。EXCELにCORREL関数というのがあり、2つの変数の相関係数を計算できることを聞きました。一種の回帰分析のような計算をすることのようです。計算式(EXCELの関数)は=CORREL($A1...$A100,$B1...$B100)というような式のようです(この場合、同一変数のA列の1から100行までのデータと、相関をみる別の変数のB列の1から100行までのデータの相関を計算し、A列の変数とB列の変数の相関値(答えはひとつ)を出すということのようです。そこで質問なのですが、この100のデータの個々の相関係数(つまり、データひとつひとつをこの関数(CORREL)で計算した相関値をあとでその総和としての100のデータの相関値にする計算はできるのでしょうか。つまり、この100のデータの分類(同種の仲間として分析したい)をやる場合、その同種の分類の数だけこの関数計算をしなければならないので、先に個々のデータごとに必要な分析結果を出しておいて、後で同分類ごとに集計(総和)した結果を出したほうが早いと思ったので、この質問をしています。そもそも、この考え方のほうが結果が早く出るのかということも含めて、どなたかよくご存知の方、おしえてください。お願いします。

  • 相関係数の違いについて

    はじめまして、maro77と申します。 現在、学生と社会人に関する公共政策に対する意識調査のアンケートを各1000通づつ、2000通回収し、そのデータ分析をしております。 具体的には、属性(年齢、性別、職業〔学部〕など)と各設問の関係性を分析したり、設問の回答結果同士の関係性を分析しております。 現在、相関関係をみようと思っているのですが、ちょっと調べてみたところ、いろんな分析手法があり、困っております。 そこで、相関係数について質問があります。相関係数には、ピアソンの相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数のほか、クラメールの連関係数、ファイ係数、コンティンジェンシー係数、ケンドールのタウなどいろいろあることを知りました。 ピアソンの相関係数については、2変数が、数字のもの(年齢、年収、身長、体重など)の数値ではないと、求めていけないことを知りました。 しかし、そのほかの分析方法については、あまりよく違いがわかりません。 アンケート結果で得られたカテゴリーデータと順位データがある場合は、どの分析方法を使うのが正しいのでしょうか。また、これらは、どうゆう基準で使いわければよいのでしょうか?いろいろ調べたのですが、いまいち、頭の中のモヤモヤが晴れません。 お手数ですが、ご教示頂ければ幸いです。 宜しくお願い致します。

  • 積率相関係数がわかりません

    ある2変数の共分散は30.0 2つの変数それぞれの分散は81.0 49.0 ピアソンの積率相関係数を求めよ 答えは0.48になるそうです 公式はr=Sxy/SxSyを使うんだと思うんですけれど いくらやっても0.48になりません もしかしたら答えが間違っているのかもわからないので できれば途中式みたいなのをつけてくれると助かります。

  • スピアマンの順位相関係数について教えてください

    論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。

  • 相関係数の求めかたbyエクセル

    エクセルの分析ツールにある相関ですが、一般的に使用される場合はどの相関を方法を使用すると良いのでしょうか。CORRELでの方法またはPEARSONの方法かよく分かりません。 内容的には、サンプリングを行ったものの2種の測定数値、例えばA値(30,50,55)B値(0.5,0.35,0.7)というような数値より相関を求める内容です。 また、その相関係数をどの様に判断をする良いか、例えば、0~0.2までは相関はない。0.2~0.3やや相関があるなどの目安の様な物はあるのでしょうか。

  • 質問票の妥当性(統計、スピアマン)

    統計学について質問させて頂きます。 私は現在、ある年齢の方々を対象に身体活動量(kcal)をみる為の質問票を作成し、現在集計が終了しました。 また、質問票と同時に歩数計の様なものを装着させ、実際の身体活動量を測定しました。 そして、この結果から質問票の妥当性を考察しようとしております。 類似した過去の文献を読むと、多くの場合、スピアマンの相関係数で処理されていました。 何故、スピアマンを使用するのでしょうか? また、スピアマンを使用した場合、どのような結果がでると、質問票に妥当性があるということがわかるのでしょうか。 また、この処理をする前に必要な準備(正規性を見るなど)はありますか? 統計は苦手で克服しようと沢山の文献や教科書を読みましたが、いまいちしっかりと理解することが出来ませんでした。 具体例などを交えてアドバイスしていただけると幸いです。 頑張ります、回答よろしくお願い致します。

  • 重回帰分析の多重共線せんいついて

    重回帰を行います。説明変数間に相関がないか確認するために、ピアソンの相関係数を確認します。名義尺度をダミー変数化し、連続変数として扱う場合、他の説明変数間との相関は、ピアソンの相関係数を参考にすべきか、その検定のp値を参考にすべきかわかりません。ご指導ください。

  • 相関係数とt検定についてお伺いします

    相関係数についての質問をさせてください すいませんエクセルで相関係数をもとめたところ,2つの集団の間に負の相関がみられました。 そこで2つの集団の間に本当に差があるのかを確認したいのですが,その場合は t検定を使用してもよろしいのでしょうか。 質問がわかりずらくて申しわけありません。 よろしくお願いします。