• 締切済み

R言語について

以下の時間情報についてRで、ARモデル(自己回帰モデル)でモデリングを行いたいのですが、R初心者につきどう扱っていいかわかりません・・・時系列予測を行いたいのです。 (関数変換による時間情報) 1323512577 1323525434 1325724531 1326216520 1326220240 1326220882 1326448740 1326608999 1327035002 1327371331 1327451383 1328012544 1328612173 1328791696 1329520836 1329751769 1330199586 1330409160 1330430784 1330461680 1331513221 1331737234 1331740144 1331852055 ar( データ , aic=TRUE )でモデリングできるらしいのですが、この”データ”のところはどうやって上の情報をいれたらいいのでしょうか?

みんなの回答

  • ki073
  • ベストアンサー率77% (491/634)
回答No.1

確認ですが 1323512577 1323525434 1325724531 1326216520 は何を意味しているのでしょうか? 一定時間ごとのデータであれば、読み込んでarに渡してやれば計算できますが、 参考 http://mjin.doshisha.ac.jp/R/ のRと時系列(2)あたり 読み込み方が分からないのでしたら http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html リンク:PDF版 R-Tips(200頁・3Mb) の第9章あたりを参考に。

関連するQ&A

  • 自己回帰モデルと自己回帰移動平均モデルについて

    現在,自己回帰モデルと自己回帰移動平均モデルから パワースペクトル密度を導出する過程について勉強中なのですが いくつかわからないことがあるのでよろしければ教えてください (1)自己回帰モデルではユールウォーカ法により線形予測係数を求めたのですが この線形予測係数とは物理的な意味として何を表しているのでしょうか. パワースペクトル密度の導出するにあたって観測信号をいくつかの 振動成分(減衰正弦波?)に分解して解析を行っていることから この係数は振動を表すような値?を示していると考えていますがいまいち 納得できません. (2)自己回帰移動平均モデルでは高い次数のARモデルを低い次数で表現可能とあったのですが なぜそのように表現できるのでしょうか. ARモデルをARMAモデルに拡張する手法としてARモデルのインパルス応答を求めて それをProny法で近似してARMAモデルにしました もしよろしければよろしくお願いします

  • 自己回帰モデルと自己回帰移動平均モデルについて「

    現在,自己回帰モデルと自己回帰移動平均モデルから パワースペクトル密度を導出する過程について勉強中なのですが いくつかわからないことがあるのでよろしければ教えてください (1)自己回帰モデルではユールウォーカ法により線形予測係数を求めたのですが この線形予測係数とは物理的な意味として何を表しているのでしょうか. パワースペクトル密度の導出するにあたって観測信号をいくつかの 振動成分(減衰正弦波?)に分解して解析を行っていることから この係数は振動を表すような値?を示していると考えていますがいまいち 納得できません. (2)自己回帰移動平均モデルでは高い次数のARモデルを低い次数で表現可能とあったのですが なぜそのように表現できるのでしょうか. ARモデルをARMAモデルに拡張する手法としてARモデルのインパルス応答を求めて それをProny法で近似してARMAモデルにしました. もしよろしければよろしくお願いします

  • AICについて教えてください

     線形自己回帰モデルの次数選択の指標となるAIC(赤池情報量基準)のもつ意味について教えて下さい。  

  • ARモデルと実測値でずれが・・・

    自己回帰モデル(以下ARモデル)を使い,気象変動のシミュレーションを行いました。 そのときに実測値とシミュレーションのグラフがかなり異なりました。どのような原因があるのでしょうか。

  • 時系列モデリングの数学について

    時系列モデリング(時系列をモデル化して将来を予測する?)というのは実用的な用途がいろいろあると思うので精力的に研究されていると思います。よく制御のテキストで見られるのですが、複素関数論のローラン展開を使った理論で、zを時間推移演算子と称して例えば z y(k)=y(k+1) とかz^(-1) y(k) = y(k-1) のような使われ方をしています。複素関数論の常として複素数はzのはずなので、zをかける(割る)ことが時間の前後をずらすことになるというところが理解しずらいです。あるテキストに書かれていたことなのですが、そこをのまないと先に進みにくいです。それ以降、それが当然という展開でどんどん先に進みます。複素数の積と商が時間を進めることに対応するというところは、複素数のもう1つの表現である極形式で書いたら積というのは位相θを加法的に進める方向になるからであるから、ということなのでしょうか。数学的にはそういう解釈をかろうじてすることができますが、制御とか時系列モデリングという特化した分野(もっと特化すると私が読んでいる文献の←これは著者に聞くしなかないですが)では常識と思っていいのでしょうか。つまり数学でzが出てきたら反射的に複素数と思ってしまうような。いかがでしょうか。 ※z変換と言われるものもありますが、私が読んでいる文献には書いてありません。 よろしくお願いします。

  • 時系列モデルに関する資料を探しています

    時系列予測について独学で勉強しているのですがよく理解できません。 ARモデルやARMAモデルについて勉強をするのにお勧めの本や資料等 をご存知の方いたら教えてください。 よろしくお願いします。

  • 周波数解析 FFTと自己回帰モデルについて

    いつもお世話になっています。 周波数解析で質問です。 十分なサンプリングレートで、十分な時間記録したデータを使う場合、自己回帰モデルを使った周波数解析は必要ないでしょうか。 現在、FFTを使ってあるデータの周波数解析をしていますが、ものの本によれば、そのデータを扱う場合は、FFTよりARモデルを使った周波数解析の方がよい、と書いてありました。しかし、サンプリングレートが細かすぎて、モデルの次数を決定するのも、妥当かどうか疑問が残ります。一般的に、MEMなどのARモデルを使った周波数解析は、周波数分解能の悪さを補うのが大きな目的ですか?

  • ARMAの予測値に関する質問です

    例えば以下の時系列モデルに関して、ARMA(1,2)が当てはまると言う分析結果が出た時なのですが 値   残差 100    7 103    8 104    9 123    11 153    5 154    4 132    7 135    4 142    6 123    3 142    8 AR(1)パラメータ  0.4 MA(1)パラメータ  0.3 MA(2)パラメータ  0.2 (データの値、残差、パラメータは適当です) このようになったとき、2期先の未来予測を行いたい(この場合だと142の次の次を求めたい)となったときに、どのようにすればよいかがわかりません。 Y(t)=AR(1)*Y(t-1)+MA(1)*ε(t-1)+MA(2)*ε(t-2)+ε(t) で142の次の期は求められる(ε(t-1)及びε(t-2)は残差でよい…のですよね?それは求められているため。ε(t)はホワイトノイズでランダムに出す) と思うのですが、142の次の次の値を予測する際に、t期の残差がわからないので、予測値は出せないのではないかと思うのですが…。 非常にわかりにくい質問で申し訳ありません。 簡潔に言えば、ARMAモデルで例えば時系列データが1000個あるときに、1050番目や1100番目といった遠い未来の値を予測するには、どうすればいいかということです。 非常に困っています…。宜しくお願いいたします。

  • 線形回帰分析:多重共線性と主成分回帰について

     最小二乗法による線形回帰モデルのあてはめについて,説明変数間に多重共線性がある場合,回帰係数の信頼性や予測精度が低下すると習いました.これを防止する方法として,元の説明変数行列の主成分を説明変数としてあてはめを行う主成分回帰(PCR)等があるようです.  しかし,説明変数行列の線形変換は,回帰モデルのあてはめ値(fitted values),残差,新たなデータに関する予測値に影響を与えません.主成分も線形変換の1つなので,元の説明変数と同数の主成分を説明変数に用いる場合,全く同じあてはめ値,残差,予測値が得られます. それでは,主成分回帰は何故,多重共線性による回帰係数の信頼性,予測精度の低下を防止する手段と言えるのでしょうか? (主成分回帰の狙いは,元の説明変数より少数の重要な主成分のみを説明変数に用いることにもあるようですが,これは,多重共線性の問題の防止とは関係ないと思います.) 勘違いしている点もあるかもしれないので,コメントを頂ければ嬉しいです。

  • 統計学 線形重回帰分析についての問題

    問題 高校生22名の物理の学力yと、物理の興味x_1、数学の学力x_2、知能偏差値x_3との関係を調べたデータ(100点満点で点数化)(22record.xls)に関して、yのx_1,x_2,x_3に対する線形重回帰分析を行え。 以下は、この問題について、R上で実行した結果と、※は自分が補足した部分です。これについて、間違ったことを言っていないか見てほしいです。 よろしくお願いします。 > record<- read.table("clipboard",header=TRUE) ※Excel上で範囲指定したデータを読み込む > record y x_1 x_2 x_3 1 43 35 50 55 2 62 44 50 70 3 15 20 10 32 4 23 32 15 45 5 84 70 88 80 6 90 76 90 92 7 67 58 82 54 8 45 37 52 45 9 75 85 92 60 10 13 10 15 25 11 56 52 58 73 12 86 62 83 89 13 24 30 24 60 14 18 22 20 32 15 52 60 46 42 16 80 50 72 86 17 70 92 63 76 18 32 38 25 17 19 37 45 30 25 20 50 46 55 73 21 60 63 59 73 22 72 43 70 72 > lm1<- lm(y~.,data=record)  ※yを目的関数、他のすべての変数を説明変数として線形重回帰分析を実行 > summary(lm1) ※実行結果の要約 Call: lm(formula = y ~ ., data = record) Residuals: ※残差の5数要約 Min 1Q Median 3Q Max -8.871 -4.041 -0.737 5.087 8.921 Coefficients: ※係数の最小二乗推定値と対応t値など Estimate Std. Error t value Pr(>|t|)   (Intercept) -1.95005 3.95936 -0.493 0.6283  ※β_0 x_1 0.17629 0.10686 1.650 0.1163  ※β_1 x_2 0.61691 0.10483 5.885 1.43e-05 *** ※β_2 x_3 0.23466 0.09315 2.519 0.0214 *  ※β_3 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 5.976 on 18 degrees of freedom Multiple R-squared: 0.9485, Adjusted R-squared: 0.94 ※寄与率、自由度調整済み寄与率 F-statistic: 110.6 on 3 and 18 DF, p-value: 8.711e-12 ※回帰式に関する分散分析 > slm<- step(lm1) ※変数選択実行 Start: AIC=82.25 ※AIC(Akaike's Information Criterion);赤池情報量規準 y ~ x_1 + x_2 + x_3 Df Sum of Sq RSS AIC <none> 642.83 82.25 - x_1 1 97.21 740.04 83.34 ※AIC最小 - x_3 1 226.66 869.49 86.89 - x_2 1 1236.70 1879.53 103.85 上記では、AIC法による変数選択を行っている。この方法では、AICの値が小さいほど良いモデルとされる。 独立正規誤差を仮定する場合: AIC=2p+n/2+n/2log(2πσ^2) (p:説明変数の数、n:標本数、σ:誤差分散の不偏推定量) ・・回答よろしくお願いします。

専門家に質問してみよう