- ベストアンサー
異なるデータ数から求めた相関値の比較
時系列のデータA(サンプル数15000程度)とデータB(サンプル数2500程度)があります。この2種類のデータはサンプリング時間は同じですが、サンプリング周期が異なっています。それぞれのデータはXの値とYの値があります。 このとき、データAについて求めたXとYの相関値Aと、データBについて求めた相関値Bは、そのまま比較することはできますか?サンプル数の違いによって、相関値が大きくぶれてしまうことはあるのでしょうか?データAはデータBと同じ数のデータにすべく、データを間引くべきでしょうか? 教えていただけると幸いです。どうぞよろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
引き算したり割算したりはできないけれど、大小比較はしてもよいのでは? 相関係数を比較するにあたって、両系列のデータ数が違うことに引っかかっている ようだけれど、それは気にする必要がない。 相関係数の式を見れば、データ数が影響しないように定義されていることが解かる。 例えば、同じデータ系列の各データを n 回づつ読んでデータ数を n 倍にしても、 相関係数の値は変わらないようにできている。
その他の回答 (1)
- kgu-2
- ベストアンサー率49% (787/1592)
回答No.1
>そのまま比較することはできますか? そのままでなくても、相関係数(相関値なんぞは、聞いたことが無いので)を比較するのは、統計学ではありません。あくまでも質問者の趣味です。好きなようにどうぞ。 データの間引き、なんぞは、データのねつ造につながりかねません。私なら『そんな怪しげな作業が必要なら、全体に問題がある』と判断します。
質問者
お礼
ご回答ありがとうございました。
お礼
ご回答ありがとうございます。