• ベストアンサー

過去のデータから、未来を予測する手法について

(数学で良いかわかりませんが、よろしくお願いします) よく、過去のデータから未来の値を予測(想定)すること があるかと思います。 例えば、過去の5年のデータ(これをx1,x2,x3,x4,x5とする)から、来年の値(x6)を想定するということです。 x6を求める手法について教えてください。 一般的なのは、最小二乗法等で1次近似してx6を求めたり なんて感じです。 他にも2次近似とか、3次近似とか、1次近似でも 重みをつけたり、ただ単に5つの平均にしたり 重みつきで平均にしたりと・・・・。 どんなデータの時にどんなものを使ったらよいのですか? ところで、1次近似したとします。 x=a×□+b で表したとします x6の値として、「ただ単に□に6を入れたとき」というのと □に5を入れたときをx5'、6を入れたときをx6'とします。 x6として、x5+(x6'-x5')とすることがあると思います。 (つまり、傾きだけ求めて、x5に傾きの分だけ加える。) これって、信憑性ありますか? 駄文ですみません。

質問者が選んだベストアンサー

  • ベストアンサー
  • ultraCS
  • ベストアンサー率44% (3956/8947)
回答No.1

いろいろな手法がありますから、一言では言えないのですが、実際の手法としては。 成長曲線(ロジスティックカープ)というのをご存知でしょうか、社会現象に関しては、これにフィッティングさせることが多いと思いますので、調べてみては如何でしょう。 また、自然現象の場合、単純に近似してもうまくいきません、気温や降水量はトレンドとして増え続けたりするのではないからです。ですから、周期性を探したり、平年値で逃げたりします。 >ところで、1次近似したとします。 >x=a×□+b で表したとします >x6の値として、「ただ単に□に6を入れたとき」というのと >□に5を入れたときをx5'、6を入れたときをx6'とします。 >x6として、x5+(x6'-x5')とすることがあると思います。 >(つまり、傾きだけ求めて、x5に傾きの分だけ加える。) >これって、信憑性ありますか? この方法の場合、X5の重みが大きくなりすぎると思いますね。X5が傾向に沿っていることを別途証明する必要があります。

その他の回答 (1)

回答No.2

まずは、データがどのような規則になると思われるかというのが一番重要になります。 最小二乗法を使って1次近似するのを一般的に感じられるのは、「一次式で表されるであろうものについて、最小二乗法を使わされている事が多い」からだと思います。 また、最小二乗法を使われる事が多い理由のひとつに、連続変化するほとんどの一変数関数は、局所的に見れば一次近似が可能だと言うのが根拠の1つにあります。 例えば、ある家庭で、去年の元旦には冷蔵庫に牛乳が3本あった。今年の元旦には冷蔵庫に牛乳が1本あった。来年の元旦には?という場合には、一次近似よりも単に平均で予測した方がよいというのが分かると思います。 また、この場合、家族構成が変わっていたり、食生活がご飯が多くなったりなどの環境の変化などもあるので、単なる平均よりも去年の本数の重みを大きくした方がいいかもしれません。 他に、潮の満ち引きによる海岸線の位置というのは、一日の中での干満、月の満ち欠けによる干満があり、二つの大きな sin 波を足し合わせたようなものになります。 この潮の満ち引きを予測するには、1時間後を予測するのであれば一次近似でもいいと思いますが、翌日について予測するのであれば、一次近似ではよい予測はできないと思います。 このように、そのデータは、どのような法則に支配されていて、どのような数式で近似する事ができるのか?というのを一番最初に考える必要があります。 そのため、質問の最後の二つのデータのみによる一次近似については、対象となる数値によるというのは結論になってしまいます。 例えば、ある人の身長や年収であれば、かなり信頼性はあるかもしれません。 これらは、多くの人は去年と同じぐらい成長するだろいうという予測があるからです。 しかし、台風の直撃した数や、地震の起きた回数などは、年をおって増えたり、減ったりするものではないので、一次近似では信頼性のある評価はできません。

関連するQ&A

  • 「指数想定」(分析?)ってどんな想定ですか?

    いくつかのデータから、他の値を想定するという はよくあると思います。 (例:過去のデータから、未来の数値を予測する 等) その方法として、「指数想定」というのがあるらしい のですがこれってどういうものでしょうか? y=ax+bとかで近似するのではなく、指数関数で近似する らしいです。 知っている方いましたら、内容のご教授をお願いします。

  • 最小二乗法での線形近似

    excelの最小二乗法による線形近似でわからないことがあります. たとえば,xy平面でデータが散布している状況で・・・ データがほぼ垂直(y軸に平行)に分布している場合,最小二乗法による線形近似がうまくいきません. ばらつきは少ないはずだから,決定係数も高くなると思うのですが,垂直線ではなく斜めの直線が引かれてしまい,決定係数も低くなってしまいます. これは,垂直線だと傾きaの値が∞に大きくなり,データの大きさ(?)上,近似不可能ということなのでしょうか?

  • 円の最小二乗法の公式

    いくつかのデータから最小二乗法で近似曲線を求めたいのですが、よくわかりません。そのデータ集の近似曲線は円になります。 最小二乗法を調べ、1次、2次関数についてはわかりました。ある点の座標を(x1,y1), (x2,y2)…、近似曲線上の座標を(x1,y’1),(x2,y’2)… とした時、 (y’1-y1)^2 + (y’2-y2)^2 … が最小となるような係数a,b などを偏微分 → 連立方程式で求めるという方法でした。 円についても、同様の方法で r^2 = (x-a)^2 + (y-b)^2 のような近似曲線の式が求められるのでしょうか?1次関数などのように、y’1-y1を求めようとすると、±√ が出てきてしまい、ややこしくなる気がしますが、これを解くしかないのでしょうか?もしくは別の解法があるのでしょうか?詳しく教えていただけたらと思います。よろしくお願いします。

  • 最小二乗法とデータのばらつきを除去

    実験データに最小二乗法を適用して近似関数(y=ax+b)を求めたいです。 しかし,実験データにはばらついた値があり,得られた近似関数も それらの値によって,おおきくずれてしまいます。 そこで,何らかの方法でばらついた値を排除していき, 信頼できる近似関数を求めたいと思います。 聞いたところ,正規分布か何らかの方法で, 信頼区間(95%)以外のデータを除去すれば良いと のことですが,具体的な方法が分かりません。 実験データyi,xiと最小二乗法でy(=a*xi+b)から どのような処理をすればよいのか教えてください。 よろしくお願いします。

  • Excelの近似値はどれを使うの?

    予測を立てるため、Excelのグラフウィザードで近似値を求めようと思ってます。しかし、以下の近似値を求める方法があり、 ○線形近似 ○多項式近似 ○対数近似 ○指数近似 ○累乗近似 ○R-2 乗値 ○移動平均 どれを使用すればよいのか、わかりません。「この値を予測するときは、この近似法」というのがあれば、教えてください。 ちなみに、調べたいのは2003年~2005年までの医療費をデータとして、持っており2006年から先を予測しようと考えております。 どうか、ご教授ください。お願いします。

  • 量予測の手法について

    いま、コールセンターに入ってくる入電の予測をする為に、過去5ヶ月の入電実績データを使って、平均値と標準偏差を求め、上限値(平均値+標準偏差)、下限値(平均値-標準偏差)として、電話オペレータの手配の目安に活用しようと考えています。 この方法が妥当かどうか、他にも方法があるのか、調査しています。コールセンターに限らず、日々、時間帯毎に発生する量の予測をして必要なリソースを準備する作業がいろいろあると思います。その辺で、もっと他にやり方あるよ、とか、その考え方はおかしいよ、とかご教示頂きたく、投稿しました。 ・30分単位の入電件数のデータ ・平日のみ(土日祝日は開設していないため) ・期間:1月~5月 ・時間帯:8:00~22:00 ・例えば、9:00~9:30の入電件数の期間全体データの平均値と標準偏差を算出 ・今後の30分単位の入電件数の上限・下限値を算出 ・必要なオペレータを上限値を目標に手配しようとしています。 統計とか、予測に関する経験と専門的な知識もなく、取組んでいて、不安をもっています。お知恵をお貸しください。よろしくお願いします。

  • 最小二乗法における有効数字について

    最小二乗法における有効数字について質問があります. 直線近似を行うとします.最小二乗法を用いるデータの有効数字を考慮して,最小二乗法により求められた直線の傾きa,切片b の有効数字が決まると思うのですが,どのようにこの有効数字を決定すれば良いのでしょうか?

  • 実験データのフィッティングについて

    i 個の測定データ(x[i],y[i]) を,最小二乗法などを用いて下記の式にフィッティングさせ、AとBを求めたいと思うのですが、私の勉強不足で線形最小二乗法(グラフにプロットして、切片と傾きから求める方法)で解く方法が分かりません。 Y = Alog{x/(x-B)} (x>B) 考え方だけでも構いませんので,どうかご教授下さい。よろしくお願いいたします。 また、最小二乗法に関する大学学部生程度のレベルの教科書的な本がありましたら、教えて下さい。よろしくお願いします。

  • [統計] こんな検定をして意味がありますか?

    2グループあります。 各グループにはいくつかのサンプルがあって、 各サンプルにたいしてある試験を行い、 得られたデータを最小二乗近似したときの傾きの値(A)をサンプルごとに得ました。 このAの平均値がグループ間で異なるかどうかを検定したいのですが、 通常のt検定や分散分析で解析しても大丈夫でしょうか?

  • 散布図からの近似曲線、近似式の出し方(Xの値が大きくなると、ある一定のYの値に限りなく近づく場合)

    少々複雑な酵素反応から得られた、あるデータから散布図を書きます。 これから求められる曲線は、Xの値が大きくなると、Yの値は、ある一定の値に限りなく近づくと考えられます。 (プラトーに達するという意味です。反応系から行っても、多分、そうなると予測はつきます。) しかし、マイクロソフトExcelでは、そのような近似曲線はかけません。 このような近似曲線(近似式)は、何というのでしょうか? このような近似曲線および、近似式、R2乗値、がでるフリーソフトウェアが教えて頂けないでしょうか? 実際にやりたいのは、その近似式を使い、Yが特定の数値の場合、Xの値はいくつなのかを計算したいと考えています。 わかりづらい質問で恐縮ですが、大変困っています。 どうぞ、よろしくお願いします。