• ベストアンサー

確率統計の時系列です!

時系列のことなんですが、 ある時間から、一定のライムラグをとって(有限個のデータ)自己相関関数を求めていくと、だんだん収束していってしまうのはなぜでしょうか? たとえば、札幌の1月から12月までの各月の気温を用いて、1月からラグをとって12月まで求めると、やはり収束します。これはなぜでしょう。 とあるホームページを見ると、「有限個のデータを用いた場合は収束する」と書いてあったのですが、この意味がわかりません!お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#108554
noname#108554
回答No.2

このページの自己共分散関数は、有限時間の場合、 どう定義してるんでしょう? たとえば、時系列データが3つの時刻からなる場合、 4,5,8 というデータだったら、自己共分散(時間差は1)は、 4,5,8 4,5,8 という具合でずれていくわけですが、 じゃあ、4とかけるもの(あるいは8)はどうすればいいの? ということになります。 端のデータは、0にしてしまう方法と 無視する方法がありますが、 標準的にはどっちを採用しているんでしょう? という可能性はないんでしょうか?

その他の回答 (2)

noname#108554
noname#108554
回答No.3

>端のデータは、0にしてしまう方法と 失礼しました。 0にすると別のデータになってしまうので、 普通は、無視するか巡回させるみたいです。 巡回させた場合は収束はしないでしょうから、 この場合は、無視してるんじゃないでしょうか。

noname#108554
noname#108554
回答No.1

よく分かりませんが、 1.「とあるホームページ」を教えてもらえますか? 2.「有限個のデータを用いた場合は収束する」 数学的には当り前で、例えば、発散する数列 a_n=n の平均は当然無限大ですが、有限で切れば結果も有限です。 ピントを外してるような気もしますね・・・

yusuke641
質問者

補足

http://www3.bpe.es.osakau.ac.jp/~asai/hsatolab/s1/ さるじけ というホームページです。 この自己共分散関数のところで、グラフが減衰している ことがわかると思います。 僕が気温のデータでやったときも同じグラフに なりました。 この理由がわかりません・・・。

関連するQ&A

  • 正規乱数から生成される時系列の自己相関について

    平均0、分散0.004の正規乱数を使って時系列を作ります。 イメージとしては株価収益の時系列なんかが当てはまります。 その時系列の自己相関を計測してみました。ラグは1です。 例えば(t,t+1,t+2,t+3,t+4)と、(t+1,t+2,t+3,t+4,t+5)の自己相関などなど。 そうすると、自己相関の計測期間を短くするほど平均がマイナスによる傾向があるのですが、 これには何か理由があるのでしょうか? 正規分布からの乱数ということで、イメージ的には、 同じ方向へ行くも、逆転するも確率的には一緒なのかなという感じなのですが。

  • 統計の質問です.

    統計の質問です. 例えばの話なのですが 地点Aで降る雨が川Rのあるポイントでの水位の上昇に関係しているかどうか確かめたいとします. 川Rの水位は自動で1時間に10回測定される量的データで,地点Aでの雨は1時間ごとに降ったか降らないかチェックできる程度の曖昧なデータだとします. また川Rの水位は様々な要因で変化すると予想されるがその全ての要因を掴むことはできないとします.(例えば地点Bや地点Cで降る雨だったり,最高気温の高い日に家庭用水として多く利用される等) さらに地点Aで降った雨が川Rの水位に影響を与えるまでは時差があり,その時差が一定でないと予想されるとします(一定ではないもののある程度まとまりがある.しかし1時間以上は差が出ることがある). この様な条件下で「地点Aで降る雨は確かに川Rの水位に影響を与えている」ということを証明するにはどのような統計的手法を用いるのが良いのでしょうか? 現在,地点Aで降る雨のデータを雨が降った場合を1それ以外を0というようにして1時間おきの時系列データに無理矢理置き換え「相互相関関数」というものをつかって考察しています. しかし相互相関関数では川Rの水位が上がったときに一定時間ずれた時点で地点Aに雨が降っていなければ相関は低いとなってしまいます. これでは 雨が水位に影響を与えるまでの時間は一定ではない 川Rの水位に影響するのは地点Aの雨だけではない という条件が反映されていません. このようなケースは統計の世界ではよくあることだと思うんですよ.例えば「不定期に発表される大統領発言が物価に影響を及ぼしているかどうか」とか,「薬剤Aの服用は心拍数に影響を与えているかどうか」とか.それようの由緒正しい解析手法があるのに自分が知らないだけなのではと思うのです. ごちゃごちゃしててすいません,まとめます. 「ある現象Aがある時系列の量的データBに影響を及ぼしている」ことを確かめる解析手法はありあませんか? 以上です,よろしくお願いします.

  • Excelのグラフの系列の名前

    Excelのグラフの系列の名前は、 右クリック>元のデータ で自由に変えられますね。この時例えば、セルB4を指定すると系列1の名前を「気温」というように、B4の中身で表示させられます。 さて、系列2の名前は、系列1の名前の後に「2」を付け加えたいのです。セルの式ルールと同じかと思い、 =B4&”2” としましたが、系列の名前としては使えません。 =B4+”2” もだめでしたし、関数もいくつか試したがだめでした。 C4にあらかじめ2と書いておいて、 =B4:C4 とすれば名前は「気温2」となりますが、 セルには文字数字を入れたくありません。 「気温2」と直接名前をつけるのでなく、あくまでもセルB4の参照にこだわる場合、何か良いアイディアはありますか?? Excel2003です。

  • scilabを使って時系列データをフーリエ変換するには?

    scilabを使ったフーリエ変換についての質問です。 あるデータ(メトロノームに合わせた指タッピングの時間間隔データでっす)を、フーリエ変換しなければいけないのですが分かりません。゜゜(´□`。)°゜。 具体的には、その時系列データ(512個あってexcelに収まってマス、A列に時間(5432ミリ秒とか)、B列に強さ(200g重とか))を、scilabを用いてフーリエ級数変換・・・スペクトル密度のグラフをつくる、な感じなことをするらしいのですが、プログラムがぜんぜんうまく書けません(今月末までつくらないといけないのに・・・)゜(゜≧□≦゜)゜ 生データの自己相関関数をつくって、フーリエ級数変換、高速フーリエ変換、グラフをプロット、のような流れなのかなぁ?と思うのですが、合ってますかぁ? もしよかったらサンプルプログラムを書いてくださると助かります(*^o^*) 先週から私なりにチャレンジしているんですが、エラーばっかりなんですぅ(涙) どうか、よろしくお願いします☆

  • 時系列データの定常性について

    一般的な説明である平均や分散が一定という他に定常性を確かめる方法というのはあるのでしょうか? 線形回帰で1にかなり近い、例えば0.99のR-Squaredが十分なサンプルから得られている場合、かなり定常的であると推察できるのではと思うのですが、株価のような経済学的な時系列データをある関数で変換して得た分布の場合、関数のロジックが間違いないなくランダムな分布を発生させるという説明が出来ない限り定常と判断できないのではとも思います。 どなたか、ご専門の方、一般的な方法でも結構です、ご教示頂ければ、と。

  • 自己相関と相互相関

    相互相関関数と自己相関関数の相関係数の違いはどういうことなのでしょうか。 相互相関は異なるデータの相関、自己相関は1つのデータの時間差の相関ということなのですか?

  • コピペで1つにまとめた散布図の系列の指定方法を教えてください。(Excel2003)

    コピペで1つにまとめた散布図の系列の指定方法を教えてください。(Excel2003) 気温を横軸、降水量を縦軸とし、1月と2月の散布図を作りました。 A列 1月気温(31データ) B列 1月降水量(31データ) C列 2月気温(28データ) D列 2月降水量(28データ) 2月のグラフ(C,D列)をコピーして1月(A,B列)のグラフに貼りつけ、1枚のグラフに2系列のデータがある状況です。 ここで、2月の降水量の系列を指定する方法を教えてください。 2月のデータの書式を変更したいのですが、 ActiveChart.SeriesCollection(2).Select としても、なぜか1月の系列が選択されてしまい、うまくいきません。 よろしくお願いします。

  • 自己相関関数

    大学の実験で自己相関関数についてやって、疑問に思ったので質問します。 まず、自分なりに解釈した自己相関関数のことについて書きます。 「あるノイズを含んだ信号を自己相関することで、その中から周期的信号を得る。」と、解釈しているんですが、これは間違っているんでしょうか? 次に、実験のことなんですが、特にノイズを含んでいない三角波を自己相関したところ、三角波の自己相関関数の波形がx軸の正に進むほど0に収束していく正弦波の形になりました。 ノイズの中から周期的信号を得ることが自己相関なので、ノイズを含んでいない周期的波形を自己相関しても、元の三角波がでると思っていたんですが、なんで違う波形がでたんでしょうか? もともとノイズを含んでいない周期的波形を自己相関したらおかしくなるんでしょうか?

  • 残差に自己相関がある時系列データy(1),y(2),y(3),...,

    残差に自己相関がある時系列データy(1),y(2),y(3),...,y(n) に対して上昇トレンド(線形)が有意に存在することを 統計的検定で示したい場合はどのようにすればよいのでしょうか? 単にデータ 時刻(x) 値(y) 1 1.512472 2 1.594956 3 1.636873 4 1.711896 5 1.570067 6 1.440109 7 1.550716 8 1.55284 9 1.372756 ・・・ ・・・ に対して単回帰分析(y=a+b*x)を行い、初級の統計で習うように 係数aの仮説検定H0:a=0 H1:a!=0に対応するp値を見ようとも 最初は思ったのですが、どうも系列相関を 無視して分析しているのが気になっていまいちすっきりしません。 適切な方法がわかる方がいたら、ご教示いただければ幸いです。

  • エクセルでの時系列表示

    エクセルの時系列データがあるのですが、その表示方法についてお尋ねします。 以下がそのデータをcsv形式に変換した一部です。 2019/07/31 24:00,237.81, , , , 2019/08/01 01:00, , , , 年・月・日・時間・分が1つかたまりで、その次にカンマで区切られたデータが来ています。このようなものが1万個ぐらいあります。1時間ごと(その意味では分は不要)のデータで年月日時間順に並んでいます。自動計測の気象データのようなものです。このようなデータがあったとき、それを時系列に表示する方法が難しいと思っています。また作図したときの図のメモリ数字の表示方法も問題です。系統的に間引く必要があります。元旦からの時間数で通しで表示すればよい(メモリ数字は10日=240時間ごととか)ように思いますが、季節の感じが欠落します(元旦からの時間数にはあまり意味がない)。月がわかるように表示するのがいいのかもしれません。時系列を作成して横軸の時間に1月、2月...と区切りをつける方法があるでしょうか。自分で考えてレジェンドを入れていくのも方法ですが、オートマチックにやりたいのですが。作図なので編集する必要があり、そのたびに細かいレジェンド設定は効率が悪いのです。よろしくお願いします。