• ベストアンサー

相関係数の求め方

うまく質問内容が伝わるか不安ですが、聞いてください。 ある地区の10年分の雨量の記録があります。 これに対して違う地区の2年分の雨量の記録があります。 この両者の相関係数を求めたい場合に、データ数が違いますが、 どうやって求めたらよいのでしょうか? 2年の値を5倍して単純に10年分のデータ数にすればよいのか、 別の方法があるのかわかりません。 ご教授ください。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

>うまく質問内容が伝わるか不安ですが  10年分のデータを基に、2年分のデータがある地区のデータが欠けている年の降水量を推定したい、という目的なら、  回帰分析で、データ数さえあればいけると想います。 2年分の記録は、同時期であること。 それぞれの地区の測定地点が、同一であること(必ずしも満たす必要は無い)。  上記の条件を満たし、データー数が、10以上あれば判定できるでしょう。 すなわち、 1) A地点とB地点の同時期のデータが5以上(各月の総計、あるいは、毎月の同一日など)がある。 2) 相関係数を計算して、少なくとも有意であること(データが5では、有意差を出すのは実際には困難、多いほうが良い)。  この2条件を満たせば(実際は第2の相関係数さえ有意ならOKです。ただし、第一の条件について反論されたときに返答ができるなら)、回帰式から、データのない時期の雨量を推算するのは、推計統計学のごく一般的な方法です。 以上は、基本です。実際は、2の条件、すなわち、有意な相関を見出だせば、両者に無関係でも、回帰式から推算できます。  乳児死亡率から平均寿命。  新聞の購読数から、その国の自動車事故の数などなど。

shinchi
質問者

お礼

たいへんわかりやすい回答ありがとうございます。 回帰分析ですね。 勉強していきたいと思います。 ありがとうございました。

その他の回答 (2)

  • incd
  • ベストアンサー率44% (41/92)
回答No.2

"2年の値を5倍して単純に10年分のデータ数にすればよいのか" ということは、存在するデータは2年間の雨量の合計に関するデータ、ということですか? もし、「地区Aの10年間の総雨量」と「地区Bの2年間の総雨量」の相関係数を求めるのであれば、一方を定数倍しても相関係数は変わらないはずです。 この相関係数が統計的に意味があるかどうかは分析の目的によると思いますが、どのようなデータがあり、目的があるのかを補足してくれませんか?

shinchi
質問者

お礼

回答ありがとうございます。 5倍して数を同じくしても相関係数は変わらないのですか。 ありがとうございました。

shinchi
質問者

補足

10年分の降雨データ量で河川の流量を算定するのですが、 当該地区は2年分のデータしかないのでデータ量が足りないのです。 そこで近くの10年分データ量があるものを使用しようと思ったのですが、 こちらのものにあちらのものを使用する場合に相関係数0.9以上必要だと いうことになりました。 それで、データ量が違うものの相関係数を算出するのはさてどうすればと悩んでいます。

  • yanasawa
  • ベストアンサー率20% (46/220)
回答No.1

統計でその操作はまずいと思います。 同じデータが5カ所出てくるような処理では、相関係数は何か意図的な数になってしまいます。 データはよく分かりませんが・・・ 基準を共通にすることが大切で、例えば同じ年度の同じ日の同じ時間の・・・とやってデータ処理することが一番いいです。この場合、もう一方も2年間分のデータで処理すべきです。

shinchi
質問者

お礼

回答ありがとうございます。 同じ期間にしなくてはならないのですね。 ありがとうございました。

関連するQ&A

専門家に質問してみよう