• 締切済み

時系列モデル

交通事故が経年的に増減する理由を説明するために、時系列分析を用いて行おうと 思っています。しかし、わたしは統計に関してはシロートに近く、どのモデルを用いればよいのかわかりません。そこで、どのような式を使えばいいのか、またはどんな勉強をすれば時系列分析がわかるのか、どんな本をみればシロートにも分かるのかヒントをください。 使用するデータは人口、交通量、道路延長、自動車保有率、違反率(取締り件数)などです。よろしくおねがいします。

みんなの回答

  • comv
  • ベストアンサー率52% (322/612)
回答No.2

こんばんは MS-EXCELはお持ちではないですか? お持ちであれば、分析ツールで相関関係を自動分析して それぞれのカテゴリー値を返してくれますが! (分析ツール:MS-EXCELの標準付属アドインツールです) お持ちで無いようでしたら、意味無しレスですね!(スミマセン)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

初めから「時系列分析」と決めてかからずに、交通事故の件数、人口、交通量、道路延長、自動車保有率、違反率(取締り件数)と並んで、年というデータもある、というふうに捉えるのが良いかと思います。  多変量解析、特に因子分析、その中でも主成分分析を適用してみるべきであろうと思います。  なお、多変量解析はデータ項目相互の関連の強さを調べるもので、何が何の原因である、というような因果関係は示していない。この点、ご注意下さい。取り締まり件数が増えたのは、交通量が増えたせいではなく、道路事情が変化したため、あるいは警察官が余っているためかも知れない。勝手に因果関係を決めて掛かってはいけません。  はたして項目Xと項目Yの間に相関があるのかどうか、また相関が一次式で近似できるようなものかどうかをチェックするために、まずは散布図を描いてみるべきでしょう。たとえば人口を横軸に、交通事故の件数を縦軸に、という風にして。(散布図にカオスが現れるほど複雑な現象ではなさそうです。)  ひょっとすると自動車保有率ではなく、その2乗に比例して交通事故が増えるらしい、ということだってあり得ます。そういう時には、「自動車保有率の2乗」というデータ項目を追加すればよいのです。  相関の有無のチェックにはカイ二乗検定など検定理論を使います。 次に、因果関係の解析について。  ここでようやく、時系列らしい話になってくるはずなんですが、その前に。原因が結果に先立って統計に現れるかどうか、これは怪しいですね。年単位の統計なんかだと、時間差が出てくれるとはちょっと思えません。交通事故の多くは車を買ってすぐに起こるような気がしますし、それは慣れていない人が運転するからだろうと思われます。だとすれば、同じ年のうちに原因と結果が入ってしまうことがほとんどでしょう。ですから、原因と結果の時間差がデータには現れにくい。時系列で因果関係を導くのは難しいかもしれません。  もしそのようなら時系列解析はあきらめて、むしろ主観的に因果関係のモデル(causal network)を作って、そのパラメータをデータに合うように決められるか、というような研究をするしかないと思います。causal networkはデータ項目の他にも(測定されていない)項目を想定し、項目間に因果関係 A→B (AはBの原因)を描いて、網のような図を作ります。そのそれぞれの" → "はAが増えるとBがどれだけ増えるかを、一次式(aA+b)で表すことにします(線形因果関係)。a,bは未知の係数ですね。" → "ごとに2つづつ未知の係数ができることになります。 このネットワークを実際のデータに当て嵌めて、未知の係数の値を出来るだけうまく決めよう、というわけです。  一次式を幾ら並べても一次式だろうと思ったらそうでもなくて、非線形の連立方程式になります。従って、例えば非線形最小二乗法を使って未知の係数の値を決める必要があります。  時系列に時間差が出ているようなら、相互相関を計算すれば時間差を推定することが出来ます。

関連するQ&A

  • 時系列データの統計量

    こんにちは。 いま船の航跡データからクラスター分析を行い、いくつかのルートに分類することを考えています。 クラスター分析を行うために、3次元時系列データ(x座標、y座標、時間)を統計量で処理したいのですが、こういった多次元時系列データの場合にはどのような統計量を使えばよいのでしょうか? 何卒ご指導頂けますようお願い申し上げます。

  • 時系列分析

    大学の理系学部に所属する教員です。 来年度から一般教養の統計学を担当することになりました。 統計学を担当することはやぶさかではないのですが、学生の所属学部が多様になり、文系学部の学生、特に経済や経営関係の者も馴染めるようにいくつかのケース・スタディの変更を考えています。 現在、時系列分析(AR、ARIMA、Unit root程度)に関するノートを作っているのですが、ここでは株価のデータを利用しようと考えています。そこで質問です。 (1)一般的には東証株価や日経平均を用いることが多いようだが、個別銘柄(例えばA株式会社)の株価データを時系列分析で扱うのは希なのか?  例えば、企業の不祥事、あるいは業界全体を契印するような企業のそれによる株価の動向、のような個別各論的な分析があってもいい気がするのですが、多くの例題は情景の指数や平均株価が多いものですから。 (2)始値、高値、安値、終値のどれを使うのが一般的か?  単なる計算問題としての統計学ならばどれでも構わないでしょうが、経済学部生等もいますから、経済学、金融論との親和性を考えるべきやに思います。 (3)株式分解の扱いはどうすればいいか?  連続して扱ってしまって良いのか?以前、株式分割を半年ごとに繰り返してきた某IT企業の株価の時系列を見たことがありますが、特に何も断っていなかったように思いますが・・・連続した系列として扱っても良いのですか?

  • 有意差検定について教えて!

    2つの地域における事故発生件数に有為差があるかどうかは、どんな検定をすればいいのですか? 【例】 A市  人口10万人  事故件数3,000件     B市  人口5万人   事故件数1,000件 このような時に「A市の方が人口比での事故件数は多い」ということを統計的に有意であることを示すためには、どのような検定をすればいいのですか? 実際には、多数の地域の事故件数をデータとして、人口10万以上の都市と未満の都市とで人口比事故発生件数を対比して、「人口の多い地域の方が事故発生率が高い」という仮説を検証したいのですが。 検定方法さえわかれば、統計ソフトで処理するつもりです。 統計に詳しい方、どうぞ「優しく」教えてください。

  • 時系列分析による学習効果の検定

    心理学の研究者です。1人の被験者を35日間学習させ、2~3日に一度測定した成績データについて、それぞれの測定日でベースラインと比べて差(学習効果)がみられるかを検定したいのですが、被験者が1人の場合、分散分析などの方法が使えません。ARIMAを用いた時系列分析が適用可能とのヒントを得、RのARIMAを使えないかとみたのですが、時系列分析では将来値の予測をすることがメインのようで、このような検定例があるのかどうか分かりません。ご存知の方、やり方、参考情報などを教えていただけると助かります。1測定日に5回計測、測定日は15日くらいあり(等間隔ではありませんが)、データは全部で70以上あります。

  • 都道府県での自動車保有台数の違い

    都道府県と自動車保有台数の関係について調べています。 人口千人あたりの自動車保有台数の多い都道府県、少ない都道府県がありますが、なぜそのような差が現れるのでしょうか。 根拠となるような統計等も見つけることができませんでした。 ヒントになりそうなことでもいいので、よろしくお願いします。

  • 時系列データをベクトルとして平均値ベクトルの差の検定?

    統計の問題です。 2群の時系列データを持っています。 (スタートから値が上昇し、ある時点から減少するような形) この場合、群間に差があるかどうかを検定する場合は、 時系列データから何か指標(例えば曲線下面積)を分散分析にかける方法がよく用いられているようです。 しかし、時系列データが持っているデータ情報量が上手く生かされていません。 そこで、 http://aoki2.si.gunma-u.ac.jp/lecture/Wilks/wilks2.html にある方法を変数の項目を時系列に変えて適用できないものかと思いました。 時系列データをベクトルとして扱うことは大丈夫なのでしょうか? どなたかアドバイスいただけると幸いです。

  • 残差に自己相関がある時系列データy(1),y(2),y(3),...,

    残差に自己相関がある時系列データy(1),y(2),y(3),...,y(n) に対して上昇トレンド(線形)が有意に存在することを 統計的検定で示したい場合はどのようにすればよいのでしょうか? 単にデータ 時刻(x) 値(y) 1 1.512472 2 1.594956 3 1.636873 4 1.711896 5 1.570067 6 1.440109 7 1.550716 8 1.55284 9 1.372756 ・・・ ・・・ に対して単回帰分析(y=a+b*x)を行い、初級の統計で習うように 係数aの仮説検定H0:a=0 H1:a!=0に対応するp値を見ようとも 最初は思ったのですが、どうも系列相関を 無視して分析しているのが気になっていまいちすっきりしません。 適切な方法がわかる方がいたら、ご教示いただければ幸いです。

  • 売上の時系列予測について

    いつも参考にさせて頂いております。 本日は売上データの将来予測について、どのような統計的解析手法があるのか伺いたく存じます。 目的は、過去2年間の売上データ(毎日)を基にして、来月の売上予測(毎日)を予測する、というものです。時系列分析のテキストを読みますと、指数平滑化を使って明日一日だけの予測はできそうですが、1ヶ月の予測をデイリーで予測することは不可能です。このような分析は、EXCELやSPSS BASEでは不可能なのでしょうか。それとも、一年間のトレンドについて移動平均を使って大まかな傾向をつかみ(季節変動など)、あとはエイヤッと勘で予測を立てるべきなのでしょうか。ご助言いただきたく、宜しくお願いいたします。 ※手元にあるデータは、2年分の売上データ(毎日)です。 ※所有するソフトはEXCEL、エクセル統計、SPSS BASEです。 ※マッピングしただけで、月曜日に売上が伸び、以降週末に向かって落ちるという傾向が掴めました。また年始から11月までなだらかに売上が伸び、年末に向かって落ちます。

  • 交通白書

    お世話になります。 交通安全白書を見ててわからないことがあります。 http://www8.cao.go.jp/koutu/taisaku/h19kou_haku/genkyou/h1/h1_02.html 平成12年度に、「自転車対歩行者の事故発生件数」が件数で前年比約128%増となり、その後の増加件数も多いです(増加率はあまり変わりません)。17、18年度は自転車事故の全体件数が減少しているにもかかわらず、対歩行者の事故発生件数は増加しています(絶対数が小さいので統計データとして適当じゃないかもしれませんが)。 http://www8.cao.go.jp/koutu/taisaku/h19kou_haku/genkyou/h1/h1_02.html#z01_15 特に平成12年度の増加率についてですが、どういった事情があったんでしょうか。この時期に自転車人口や交通事情が激変したような記憶がありません。データの集計方法が変化したなんてことはないでしょうか。 その時期の白書の概要を見ても分析がなされていません。 どなたか何かご存知のことがありましたら、ご教授くださいませ。

  • クラスター分析の時系列適用のオーソドックスな方法について

    クラスター分析の時系列適用のオーソドックスな方法について アンケートデータをもとに世の中の人をそのライフスタイルにより いくつかのクラスターに分類した上で、今回(現在)はそれぞれのクラスター における自社製品のシェアや認知率などはこうだった、それが1年後は こう変化した、ということを今後時系列比較したいと思っています。 今回のクラスターづくりは10数個の設問をもとに、これをSpssで 因子分析→クラスター分析をして仮につくりましたが、はて、 次回以降は同様のクラスターづくりをどうやったらいいのかと疑問に なってきました。 他の質問では、何を重視するかにより異なるとのことですが、 分類ロジックを同一とするということが求められるかと思います。 良くあるケースだと思うのですが、オーソドックスな方法はこうだ よというのが分かる方(やったことある方)がいらっしゃいましたら ぜひご教示ください。