• 締切済み

2つのデータセットの関連性を知る指標

あるデータセットの将来の値を予想したいと思っています(時系列のデータ)。予想するための値は、データセットを構成しているであろう他の指標から作成します。 例えば、将来のGDPを予想するために、消費関連の指標や、企業の設備投資データなどを用いて、「次期はGDP成長率が○○%」といった具体的な予測数値を算出します。 そこで、どのデータセット(モデルから作成したデータ列)が最も説明力が高いと呼べるのか、その判断指標について質問させていただきます。 単に相関係数を見ても、両者の水準間の違いが反映できません。例えば、添付の画像をご覧ください。 系列1は予想値、系列2のデータを実測値とします。 左側は相関が1で回帰線45度、ばっちり予測できていそうな気がしますが、水準が違うので、具体的な数値予測としてはいまいちです。特に私のケースでは水準の違いが説明できません。 右側は無相関ですが、平均は同じなので、水準は合っている。ただしデータ予測としてはあまり意味がない。 上記のようなケースを包括して、一つの指標で判断することは出来ますか? 水準が違うと、その説明をすることが出来ないため、モデルの説明力がない可能性があります。 両者の差の2乗和を取るといった方法も考えましたが、何か他に指標があればご教授いただければ幸いです。よろしくお願いします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

図を見ることができないのですが、  経済を目的にならば、株、為替、などは、経済分野の人が予測しているが、まあ当たらない。というより、短期の推定は困難だが、長期の推定は可能。 >左側は相関が1で回帰線45度、ばっちり予測できていそうな気がしますが、水準が違うので、具体的な数値予測としてはいまいちです 相関なら、相関係数と考えましたが、45度と書いてあるので、回帰係数のことでしょうか。それなら、1であることは、推定値が実測値と一致することとは、全く関係ありません。  相関係数が1なら、推定値は(私は占い師でも預言者でもないので、予想はあまりつかいません)狂わないハズ。 >右側は無相関ですが、平均は同じなので、水準は合っている。。  「水準」というのが、意味不明。文章からは、見当違いのことを言っているように感じる。 統計学で「水準」で浮かぶのは有意差の水準。後学のために、「水準」の意味を教えて下さい > 私のケース これは何か、理解できません。経済予測、というのなら、自称専門家が山ほどいて、株価の予想に泥まみれ。世間も振り回されています。  真面目の方のようなので回答しましたが、気になることを3つ。  科学、特に理系では、用語は厳密に使用します。間違った用語では、混乱し、真意が伝わりません。  相関分析と回帰分析は、分けて考えた方が分かりやすい。パソコンでは同時に出せますが。  相関については、専門家でも、その解釈を間違っている場合を多々見かけます。ご質問は、回帰分析のような気がするので、いらぬお世話かもしれませんが、相関をキチンと理解しておかないと、擬相関だったりして、騙されます。

関連するQ&A

  • FX 指標予想は誰が決める?

    FX 指標予想は誰が決める? 実際の値ではなくて、指標の予想値によってFXは、 値動きが決まりますよね。 予想より高い数値だったら買い、低かったら売り。 その予想値は誰が決めてますか? かなり恣意的な感じがします。 誰かが、操作できるなら、自分が決めた方向に値動きを簡単に動かせます。

  • 経済指標のデータはどこから引っ張ってきてるのですか

    FX会社のサイト上や経済ニュースサイトに掲載されている経済指標のスケジュール・前回数値・予想数値・結果数値はどこから引っ張ってきているのでしょうか。 ほぼ発表と同時に結果などが掲載されているので、手動ではなく何かしらのデータとして取得していると思うのですが。。。 各国の統計局などにクロールして取得しているのでしょうか? もしくはどこかにまとまったサイトがあり、有料で配信しているのでしょうか?

  • 統計エクセル 量的データと質的データの回帰分析

    エクセル2013を使用している、エクセル統計勉強中の者です。 量的データ(説明変数)と質的データ(予測したいデータ)があり、 質的データを、可能な限り詳細な数値に置き換え、相関関係を調べてみました。 すると、相関係数が0.05という、相関関係がないという結果になりました。 この時点で、回帰分析や予測などは、断念すべきなのでしょうか? 相関がないと考えられた場合の、別の対応方法などがあるのであれば、ご教授お願いいたします。

  • FXの経済指標と判断基準について

    あるサイトで、「GDPの発表があったときにチャートが大きく動くわけではない。なぜならGDPはおおよそ予想されていて、予想とおりの結果がでるから。予想で実際の値に差異がないとチャートはあまり動かない」と書かれていました。 予想とおりであれば、わざわざ発表聞かなくても、それ以前に予想をもとに投資家たちはうごいているからですか? また、「前回と比べて非農業部門就業者数が増えたからといってドルがあがるわけではない。こちらも予想とくらべてどうだっかを考慮しなければならない」とありました。 結局、経済指標の発表だけではなく、予想値も調査しとかなければならないのですか?

  • エコノミストの経済予測方法

    新聞各紙で「エコノミスト」と呼ばれる方たちは、 どのようにして来期の経済指標の具体的数値を予測しておられるのでしょうか? 例えば、来期の日本のGDPを予測する、という状況においては、 ■何をデータとして収集するか ■どのような手段を以ってデータを収集するか ■どのような理論、考え方に基づいて予測数値を作成するか という実務の想像が付きません。 詳しくご存知の方がいらっしゃれば、是非お教えいただきたいと思います。 宜しくお願いいたします。

  • 経済指標

    5月19日に米経済指標でる「生産者物価指数(4月)」が発表されました。 <内容> 総合数値 ⇒ 0.2% (市場予想は0.4%) (前月比1.1%) コア   ⇒ 0.4% ( 〃   0.2%) ( 〃 0.2%) この結果を受けて、為替市場でドルが大幅に売られました。 そこで、質問があります。 生産者物価指数は、総合数値とエネルギーを除くコアとの2つがありますが、どちらの指標が為替市場に影響を与えたのでしょうか? できれば、説明していたでけると助かります。 よろしくお願いします。

  • 世界各国の国民1人当たりGDPの予測や推移

    はじめまして。 私は現在世界各国(ヨーロッパ主要国、東南、東アジア諸国、アメリカ等)の国民1人当たりGDPの推移と将来の予測値を探しているのですが (1人当たりGDPといろいろな指標の相関を調べたいと思いまして・・・) なかなかいいサイトを見つけることができません。 断片的には見つかるのですが、GDPは計算方法に違いがあるせいか、サイトによって値が大きく違うので比較ができなくて困っています。 もしそれらの統一された値が載っているサイト等をお知りの方がいらっしゃいましたら、教えて頂けないでしょうか。 よろしくお願いいたします。 知りたい国は 日本、中国、韓国、台湾、香港 インドネシア、インド、フィリピン、タイ、マレーシア、シンガポール、 イギリス、ドイツ、フランス アメリカ・・・等です。 また最近の値と予測値が知りたいのですが、 予測値は2010、2020年ぐらいを探しています。 ※別に厳密に上の条件でなくてかまいません。近いものでも知っている方がいましたらどうかよろしくお願いします。

  • 異なるデータ数から求めた相関値の比較

    時系列のデータA(サンプル数15000程度)とデータB(サンプル数2500程度)があります。この2種類のデータはサンプリング時間は同じですが、サンプリング周期が異なっています。それぞれのデータはXの値とYの値があります。 このとき、データAについて求めたXとYの相関値Aと、データBについて求めた相関値Bは、そのまま比較することはできますか?サンプル数の違いによって、相関値が大きくぶれてしまうことはあるのでしょうか?データAはデータBと同じ数のデータにすべく、データを間引くべきでしょうか? 教えていただけると幸いです。どうぞよろしくお願いします。

  • 基準化したデータより得られた回帰式に新たな説明変数を代入する際の取り扱いについて

    基準化したデータより得られた回帰式に新たな説明変数の数値を代入し、従属変数の数値を計算(予測)する際、その代入される説明変数も基準化されている必要があると思いますが、その基準化の方法はどのように行えばよいのでしょうか? 例えば、サンプル数10、従属変数1、説明変数4というデータセットがあり、全変数を基準化し回帰係数を求めたとします。 得られた回帰式を用い新しいデータの説明変数の数値を代入することにより説明変数の値を予測したいと思います。 この際、この新たなデータも基準化される必要があると思うのですが、基準化する際には回帰係数を求めるために用いた10個のサンプルより計算された各説明変数の平均及び標準偏差を用いて、基準化を行うのでしょうか? 具体的には10個のサンプルから計算された説明変数a,b,c,dの平均がそれぞれ2,4,6,8、及び標準偏差が10,20,30,40であったとします。 新たなデータの説明変数a,b,c,dの値が3,6,9,12であった場合は、それぞれ(3-2)/10, (6-4)/20, (9-6)/30, (12-8)/40の値を計算し、その数値を回帰式に代入するのでしょうか? 長くなってしまい申し訳ありませんが、どなたか詳しい方がいましたら是非教えていただきたくお願いします。

  • 線形予測モデル(LPC):自己相関法

    音声についてまったくわかりません。ほんとに基本的なことをお聞きしたいです。 大学で「線形予測モデル(LPC):自己相関法」についてPowerPointをつかって説明しろと言われました。 (1)線形予測モデル(LPC)とはなにか。 (2)線形予測モデル(LPC)と自己相関法はどういう関係か。 (3)わかりやすく説明するにはどのようにすればいいか。 など、どれでもいいので教えてほしいです。