• ベストアンサー

エクセルで相関係数を出すときのデータの空欄について

エクセルに入力されたデータについて、相関係数を出そうとしたときに、空欄になっている場合と、0が入っている場合で数値が異なることが分かりました。 数値としては1,2,3,4,5の5件法のアンケートデータであり、未回答部分を空欄または0にしようと思っています。 相関係数を出すにあたり、こういったとびとびの未回答データはどのように処理するのが妥当でしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

詳しくは知りませんが、Excelでcorrelというワークシート関数を使ってみると、yの枠が空欄の場合はそのデータの組を無視するようです。 そこに無理に0を入れると当然変な結果になります。 つまり、(x,y)=(1,1),(2,2),(3,3),(4, ),(5,5)だと相関係数は1になりますが、(x,y)=(1,1),(2,2),(3,3),(4,0),(5,5)だと0.49という値になります。つまり(x,y)=(4,0)というデータがあるとして相関係数を求めることになるからです。 欠損がある場合は処理が出来ないので、そのデータは削除するのが適切な方法と思います。 補間などでデータを作ることも可能ですが、補間すると言う行為は相関があることを前提とした処理になるので、相関係数を大きくする効果があり、適切ではないと思います。

dreamcon
質問者

お礼

ありがとうございました。 0を入れると無回答ではなく0を回答したとして認識しちゃうのですね。 参考になりました。

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

基本的には未回答があった被験者(調査協力者)のデータは全て削除するのが常套手段といえます。つまり、Excelのワークシートでいえば欠損値のある行を削除するということです。 平均値を当てはめて補完するような方法などありますが、あまり面倒なことをやるよりは素直に切り捨てて扱ったほうがラクです。

dreamcon
質問者

補足

早速のご回答ありがとうございます。 確かに欠損値があるものは削除するという考えもあるかもしれません。 では、欠損値があるものを分析したらどういう点がまずいのでしょうか? どのような点に注意すれば使って良いなど、アドバイスいただけると幸いです。 どうぞよろしくお願いします。

関連するQ&A

  • エクセルのデータ分析における相関について

    いつもお世話になっております。 添付ファイルのような表を作成して、それぞれの相関を調べたいと思っております。 エクセルのデータ分析で相関係数の表を出力すると、大半が0.2以下となり相関が弱いという結果になりました。 この結果に『あれ?こんなに相関ないの?』っと疑問を感じおります・・・! (1)データ分析の相関において元となる表の空欄の扱いはどうなるのでしょうか?  ※作成した表では、各セルに数式をいれており、ゼロ値を非表示設定にしてあるため、表示設定にすると、空欄部分は0が表示されます。   作成した表の本質は空欄部分はゼロではなく、データ無という扱いです。    この場合、相関係数を算出すると、ゼロ値として計算されるのでしょうか?       データ無という扱いにする場合は、どうすればよいのでしょうか?(例:NA()でエラーにするとか?) (2)データ欠損となる場合の処理は、  例えば、A1~J1まで10個のデータがあり、うち5個が空欄(データ無)の場合は、どのような処理になるのでしょうか? 分かりづらい文章で申し訳ありませんが、よろしくお願いいたします。

  • エクセルで相関係数

    『AとB』、『AとC』の相関係数を エクセルで出したいのですが、 どうしたらいいのかわかりません。 Aの数値は、0.24、0.44、0.32、0.42、0.21、0.33で、 Bの数値は、2.60、2.53、2.71、2.48、1.63、1.98で、 Cの数値は、1.79、1.56、2.13、1.98、1.37、1.37です。 ピアソンの積率相関係数というものを使って 出したいのですがさっぱりわかりません。 分かる方教えてください。 よろしくお願いします。

  • 相関係数の求め方で質問

    相関係数の求め方について教えて下さい>< 例えば、運転での交通違反の有無と性別のデータで 交通違反の経験     男      女     計 あり         3122  2255  5377 なし         3958  4695  8653 計          7080  6950  14030 (1)上記のようなデータの場合の相関係数の求め方(手計算可) (2)あと、できればこのデータをつかってエクセルかJMPで相関係数を求める場合どのようにデータを入力すればいいのでしょうか?

  • 相関係数の違いについて

    はじめまして、maro77と申します。 現在、学生と社会人に関する公共政策に対する意識調査のアンケートを各1000通づつ、2000通回収し、そのデータ分析をしております。 具体的には、属性(年齢、性別、職業〔学部〕など)と各設問の関係性を分析したり、設問の回答結果同士の関係性を分析しております。 現在、相関関係をみようと思っているのですが、ちょっと調べてみたところ、いろんな分析手法があり、困っております。 そこで、相関係数について質問があります。相関係数には、ピアソンの相関係数、スピアマンの順位相関係数、ケンドールの順位相関係数のほか、クラメールの連関係数、ファイ係数、コンティンジェンシー係数、ケンドールのタウなどいろいろあることを知りました。 ピアソンの相関係数については、2変数が、数字のもの(年齢、年収、身長、体重など)の数値ではないと、求めていけないことを知りました。 しかし、そのほかの分析方法については、あまりよく違いがわかりません。 アンケート結果で得られたカテゴリーデータと順位データがある場合は、どの分析方法を使うのが正しいのでしょうか。また、これらは、どうゆう基準で使いわければよいのでしょうか?いろいろ調べたのですが、いまいち、頭の中のモヤモヤが晴れません。 お手数ですが、ご教示頂ければ幸いです。 宜しくお願い致します。

  • 相関係数の求めかたbyエクセル

    エクセルの分析ツールにある相関ですが、一般的に使用される場合はどの相関を方法を使用すると良いのでしょうか。CORRELでの方法またはPEARSONの方法かよく分かりません。 内容的には、サンプリングを行ったものの2種の測定数値、例えばA値(30,50,55)B値(0.5,0.35,0.7)というような数値より相関を求める内容です。 また、その相関係数をどの様に判断をする良いか、例えば、0~0.2までは相関はない。0.2~0.3やや相関があるなどの目安の様な物はあるのでしょうか。

  • 相関係数の差について求めたいのですが

    相関係数の値の差を求めたいのですが、求めたいAとBのデータの数値が、それぞれ一つしかない状態です。 関数のCORRELを用いて相関係数を一度求めようとトライしたのですが、数値がそれぞれ一つしかないせいか、求められませんでした。 やはり、データの数値が一つしかないから求められないのでしょうか? 無知ですみませんが、よろしくお願いします。

  • 相関係数

    相関係数について質問させて頂きます。 EXCEL関数の"CORREL"で求められる相関係数と同じデータをしようして散布図を作成した際のR2乗値が異なるのはなぜなのでしょうか?

  • Excelで相関係数を求めた時に表示される「~E-~」(~は数値)とは

    Excelで相関係数を求めた時に表示される「~E-~」(~は数値)とは? Excelで“=correl(~,~)”を用いて相関係数をいくつか出したのですが、 そのうち数個の相関係数が「1.92639E-16」とか「9.64107E-17」などと出ました。 相関係数の値は0~±1.0の範囲だけだと思っていたのですが、 何故このような計算値が出てしまったんでしょうか? また、この値をどのように解釈したらよいのでしょうか? 統計にはあまり慣れていないので、ご存知の方がいらっしゃいましたら、 なるべく分かり易い単語での回答をよろしくお願い致します。

  • 相関係数の高い項目が多いのはどのような時でしょうか

    いつもこちらのサイトで勉強させてもらっています。 色々なキーワードで検索してみたのですが見当たらなかったので質問させてください。 お菓子の試食アンケートを解析しています。 お菓子は3品あり、アンケート項目は共通です。(そう思う~そう思わないの5段階評価)。 「おいしい」と味(甘い、しょっぱい、すっぱいなど)や食感(やわらかい、しっとり、さくさく、とろけるなど) との相関を見たいと思い、相関係数をエクセルで算出しました。(分析ツール-相関) 「おいしい」と相関の高い項目は3品で共通していたのですが、 相関係数の高い項目が多いお菓子と、そうでないお菓子がありました。 (相関係数が0.7以上を「高い」として、「おいしい」と相関の高い項目を抽出しました)。 この場合、「おいしい」と相関係数の高い項目が多いお菓子は特徴がなく、 相関が高い項目が少ないお菓子は特徴的である、といったようなことが言えるのでしょうか。 このように、相関係数の高い項目数に差が出るのはどのような場合が考えられるか教えてください。 なお、試食は一人1回なので、違う人が食べています。 母集団の違いも影響するものでしょうか。(各お菓子を60人ずつに試食していただきました)。 拙い文章で、とんちんかんな質問をしているかもしれませんが、 統計学初心者にも分かるようにご回答いただけますと大変ありがたいです。 どうぞよろしくお願いいたします。

  • 相関係数

    こんにちは。 現在統計学を学んでいるのですが、相関係数についていまいちよくわかりません。 「2つのデータの関連性が強ければ相関係数は1に近づき、関連性が低ければ0に近づく」とは、下記のような例の場合、具体的にはどのようなことをいうのでしょうか。 この相関係数から得られる知見はどのようなものがあるのでしょうか。 教えていただけると助かります。 教科ごとの相関係数 (1)英語、理科  0.1453 (2)数学、社会  0.6489 (3)国語、英語  0.2948 (4)国語、数学  0.3092 (5)数学、英語  0.4893 国語と