• ベストアンサー

異なるデータ数から求めた相関値の比較

時系列のデータA(サンプル数15000程度)とデータB(サンプル数2500程度)があります。この2種類のデータはサンプリング時間は同じですが、サンプリング周期が異なっています。それぞれのデータはXの値とYの値があります。 このとき、データAについて求めたXとYの相関値Aと、データBについて求めた相関値Bは、そのまま比較することはできますか?サンプル数の違いによって、相関値が大きくぶれてしまうことはあるのでしょうか?データAはデータBと同じ数のデータにすべく、データを間引くべきでしょうか? 教えていただけると幸いです。どうぞよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

引き算したり割算したりはできないけれど、大小比較はしてもよいのでは? 相関係数を比較するにあたって、両系列のデータ数が違うことに引っかかっている ようだけれど、それは気にする必要がない。 相関係数の式を見れば、データ数が影響しないように定義されていることが解かる。 例えば、同じデータ系列の各データを n 回づつ読んでデータ数を n 倍にしても、 相関係数の値は変わらないようにできている。

mon-monkey
質問者

お礼

ご回答ありがとうございます。

その他の回答 (1)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>そのまま比較することはできますか? そのままでなくても、相関係数(相関値なんぞは、聞いたことが無いので)を比較するのは、統計学ではありません。あくまでも質問者の趣味です。好きなようにどうぞ。 データの間引き、なんぞは、データのねつ造につながりかねません。私なら『そんな怪しげな作業が必要なら、全体に問題がある』と判断します。

mon-monkey
質問者

お礼

ご回答ありがとうございました。

関連するQ&A

専門家に質問してみよう