重回帰分析による売上予測について

このQ&Aのポイント
  • 洋菓子屋の売上予測には重回帰分析が利用される。
  • 説明変数として「気温」を採用する際の「季節」の扱いに悩んでいる。
  • 「最高気温」を変数にしたほうが相関関係が強いが、気温は季節によってその意味が変わるため対処法を考えている。
回答を見る
  • ベストアンサー

重回帰分析による売上予測について

洋菓子屋の日々の売上データを基に重回帰分析を行い、 説明変数を入力することによる売上予測を行いたいと考えておりますが、 説明変数に「気温」を採用する際の「季節」の扱いに悩んでいます。 現在の変数候補は下記の通りです。(天気/気温は気象庁の過去データより引用)  ・天気(晴れ/曇り/それ以外)  ・最高気温、最低気温  ・曜日  ・季節指数(過去4年間の売上を元に作成) 例えば12月の売上データを元に重回帰分析を行ったところ、 「天気」より「最高気温」を変数にしたほうが相関関係が強いことがわかりました。 ところが、気温は季節によってその値の持つ意味が変わってきます。 冬の間は「暖かいほうが客の入りもよく売れ行きが良い」と考えられ、 「最高気温」変数が「高い」ほうが売上は向上します。 一方、夏になると「涼しいほうが売れ行きが良い」となることが予想され、 単純に「最高気温」を変数に用いることはできないと考えられます。 気温の絶対値でなく「季節に応じた快適気温」からどれくらい乖離しているかで求めるなども考えてみましたが、いまいち強い相関関係が得られませんでした…。 どなたかこういった場合の対処、お知恵おもちでないでしょうか。 宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • hanakk36
  • ベストアンサー率66% (2/3)
回答No.2

以前、重回帰分析の項目を受講された方より、コンサルティングの相談を受けたことがあります。 同じ気温や天候でも、夏の20℃は涼しく感じ、冬の20℃では温かく感じますよね。 よって、このような場合、夏場と冬場で同じ予測モデルを使うのは、予測値を求めることができても、予測精度は期待できないでしょう。 つまり、冬場は冬場のモデル、夏場は夏場のモデルとして分けて考えるだけでも、精度は上がる期待があります。 たまたま冬場、夏場、としましたが、過去のデータが2~3シーズンあり、或る程度の精度が期待できるようであれば、四半期ごとや月ごとのモデルを考えてもよいと思います。

参考URL:
http://www.datamining.jp
saku_1982
質問者

お礼

ご回答ありがとうございました! たしかに四半期くらいで区切ってしまうのも手ですね。 天気は気象庁に過去データが膨大にありますので、 過去10年くらいを基に遡及分析してみます!

その他の回答 (1)

回答No.1

「湿度」が要素になっているような気がしますが、いかがでしょう。

saku_1982
質問者

お礼

早速の回答ありがとうございます。 湿度も試してみましたが、平均/最小湿度共に相関関係は強くありませんでした。

関連するQ&A

  • 重回帰分析と数量化理論について

    データ分析を行っているのですが、例えば売上を分析するときに、説明変数として気温などの量的データと曜日や天気などの質的データ(ダミー変数を用いる)を一緒にしてExcelの回帰分析の機能を使用し分析することは、数量化理論(1)類といえるのでしょうか?それとも重回帰分析というのでしょうか?それとも他に呼び名があるのでしょうか?

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 相関分析と重回帰分析について

    研究の中である因子同士で相関分析を行いました。その結果有意な相関を得られた因子が複数見つかったため、それらの因子を用いて重回帰分析を行うことにしました。 この分析の流れを担当教員に伝えたところ、重回帰分析を行う際になぜ相関が得られなかった因子も含めなかったのかと問われ、上手く説明ができませんでした。というか先生の言ってることが理解できませんでした。なぜなら全く相関がないとわかっているものを重回帰分析の中に含めたところで結果は見えていると考えたためです。 まだ知識は浅いですが、先生の問いについて理解できる方がいれば教えていただきたいです。

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • 重回帰分析と数量化理論(1)類の両方を一緒に使いたい時は?

    文系人間ですが、必死の思いでデータの分析をしてます。 スポーツのタイムの傾向を調べており、距離や気温などからタイムが予測できないかと思っております。いくつかの変数となる値を引っ張り出してそれぞれタイムとの相関関係がある程度あることは解りましたが、その他に天候にもタイムが左右されることに気づきました。 質的データを分析するには数量化理論(1)類での分析がよいと本で知りましたが、通常の数値からの分析である重回帰分析とどのように組み合わせて分析すればよいのでしょう?天気は「晴」「雨」「曇」「雪」「小雪」など5つ程度に分けて考えたいと思います。その他にも質的データとなるアイテムが考えられます。 元が文系人間で数学はとても苦手です。分析もexcelの分析ツールで分析しています。 どなたか良い解法の糸口をお教えください。

  • 重回帰と偏相関の違い

    重回帰分析も偏相関分析もともに、複数の説明変数と1つの従属変数が登場人物となって、その関係を分析するものと認識しています。 が、大きな違いとして、重回帰は多重共線性を示す説明変数を同時投入した分析はできないのに対し、偏相関分析は寧ろそういう変数たちを同時に取り扱って分析することに使うと聞きました。 どういう理由で、両者にこのような違いがあるのか、ご教示頂けないでしょうか。

  • 重回帰分析について。

    重回帰分析について。 私は今卒論で中小企業の動向について調べています。 現段階では、業界別に売上高から全企業の売上高の成長率への寄与度を出したり、業界別の成長率、企業数の増減などを調べました。 データは中小企業庁の中小企業実態調査を使っています。 このデータを使って、重回帰分析をしたいのですが、初心者なので、どのデータを組み合わせていいのかわかりません。 参考までに、アドバイスお願いします。

  • 階層的重回帰分析

    コンパニオンアニマルが飼い主の主観的幸福感と社会的ネットワークに与える影響(心理学研究2006年第77巻第1号pp.1-9)という論文を読んでいます。 その中で、擬似相関でないかを確かめるために、階層的重回帰分析を行ったとあります。 擬似相関や重回帰分析というのは、参考書等にあり、理解できたのですが、『階層的重回帰分析』となると見当たりません。 階層的とはどのようなものなのですか?

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

専門家に質問してみよう