統計分析の手法について教えてください

このQ&Aのポイント
  • 統計分析の手法について教えてください。
  • 上記データの傾向から日・月曜が入荷が少ないことが分かりました。週初めから金曜にかけて徐々に入荷が多くなる傾向にありました。
  • この様なデータを基に、明日・明後日・明々後日の入荷予想を立てたいです。それにより必要人員の確保と現場への配置を行いたいと考えています。1.これらのデータだけで、入荷予想(いつ、どれくらい)を立てることは可能でしょうか?2.また制度を高めるためには、ほかにどのようなデータが必要でしょうか?3.また出来ないとすれば、どのような理由から出来ないのでしょうか?
回答を見る
  • ベストアンサー

統計分析の手法について教えてください

統計分析の手法について教えてください。 下記はある納品業者(特定一社)への注文情報と入荷情報に関するデータ(サンプル抜出)です。 伝票番号 入荷予定  実際入荷 注文個数 A0001  2013/1/14  2013/1/15  1000 A0002  2013/1/14  2013/1/16   500 A0003  2013/2/14  2013/2/15   800 A0004  2013/2/14  2013/2/17   900 A0005  2013/2/14  2013/2/15  2000 A0006  2013/2/14  2013/2/18  1500 A0007  2013/1/25  2013/1/22  1200 A0008  2013/1/26  2013/1/26   700 A0009  2013/1/28             300 A0010  2013/1/27             2500 伝票番号:伝票の一意な番号です 入荷予定:納品業者が回答してきた入荷の予定日 実際入荷:実際にこちらに届けられた日 注文個数:我々が注文した数量です 実際入荷が空欄の場合は、まだ入荷していないものです。 【分かったこと】 上記データの傾向から日・月曜が入荷が少ないことが分かりました。 週初めから金曜にかけて徐々に入荷が多くなる傾向にありました。 単純に着荷が多い曜日をカウント 月 58 火 72 水 86 木 95 金 120 土 112 日 65 【知りたいこと】 この様なデータを基に、明日・明後日・明々後日の入荷予想を立てたいです。 それにより必要人員の確保と現場への配置を行いたいと考えています。  1. これらのデータだけで、入荷予想(いつ、どれくらい)を立てることは可能でしょうか?  2. また制度を高めるためには、ほかにどのようなデータが必要でしょうか?  3. また出来ないとすれば、どのような理由から出来ないのでしょうか? よろしくご教授ください。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.6

#4です。 #5さんの回答を支持します。 私は、背後に潜んでいるモデルがわからないケースを忘れていました。 これだったら、とりあえず放り込んでも、まあまあの予測が得られると思います。 ただ、データは、かならず3つにグループ分けして、 グループ1・・・回帰に使用 グループ2・・・ストッピングルールに使用 グループ3・・・バリデーション(検証)に使用 を心がけて下さい。 このような方法はオーバーフィッティングが怖いです。 #5さんの回答は、自己相関移動平均という方法ですが、 さらに、その動き(納品量)が複数の要因によって複雑に動く場合、 最新の手法に、異種混合学習法というのがあります。 とは言っても、これはビッグデータの解析に用いられる手法であり、 通常のケースでは、担当者の知見によって、 切り分け(層別と言います)すれば済む話ですけどね。 昨年、NEC技報に出て、センセーションを起こした手法で、 開発者の藤巻さんという方は若手の研究者ですが、すごい受賞歴の持ち主です。

参考URL:
http://www.nec.co.jp/press/ja/1206/images/2202-01-01.pdf
ice1982
質問者

お礼

kamiyasiroさん 再びありがとうございます。 今週はインフルと花粉症でダウンし、会社を休んでいたので 教えて頂いた本でも読んで入れば良かったと後悔。 >自己相関移動平均 >このような方法はオーバーフィッティングが怖いです。 ちらも調べて見たいと思います。 >異種混合学習法 リンク読みました。素晴らしいですね。 この手法を取り入れる場合は、さらにインプットが必要ですね。 たとえば、今回の例で言えば、相手方の在庫、市場の動向などなど・・・ 統計、奥深いですね。さらに興味を持ちました。 もう少し時間を取って掘り下げて考えてみたいと思います。 ありがとうございます。

その他の回答 (5)

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.5

数字のデータだけがあって、その変動の背景に特段の情報がないときは、ARIMAモデルによる予測が使えます。日次データの3日後程度であれば、多くの場合、かなりの精度で予測できます。 曜日変動があるようなので、最低7日のタイムラグを持つモデルを使用します。 まだ入荷していない注文個数の情報も使って予測する場合は、ARIMAモデルと回帰分析を組み合わせて使います。これは、 regARIMA モデルと呼ばれることもあります。 regARIMA モデルを実装したソフトとして、例えば X-12-ARIMA があります。このソフトは、アメリカの商務省センサス局の次のサイトから無料ダウンロードできます。   http://www.census.gov/srd/www/x12a/

ice1982
質問者

お礼

ramayanaさん お礼大変遅くなりました。失礼いたしました。 >曜日変動があるようなので 実は投稿させて頂いたあと、しばらく自分でデータを 見なおしてみたのですが、どうにも数字との関係性が見えて来ませんでした。 サンプルのデータは、多少曜日との関連性があると聞いていたので 多少の修正を加えまいした。 >ARIMAモデルによる予測 こちら、初めて目にしました。 実はこの手の調査を依頼されることが多く、統計学の専門家でもない私は 非常に困っていたのですが、このソフト、是非利用してみたいと思います。 >数字のデータだけがあって、その変動の背景に特段の情報がないとき こんなケースでも予想が可能であることがあるんですね。いや、驚きです。 有益な情報、ありがとうございました。

回答No.4

企業で統計学を教える者です。 人員を遊ばせない かつ、後工程に迷惑を掛けない ということは、生産管理では非常に重要です。 入荷予想は、コンビニなんかでは重要な問題です。 「できない」ではなく、なんとかしないと、 大量の廃却や、はたまた、商品棚に商品が無い、とか バイトの子がいなくて、レジに行列、はたまた、バイトが暇、 という状況になります。 (1)発注・業者手番(リードタイム)はランダムですか? ・ランダムの場合 もし、発注がポアソン分布,業者の手番は指数分布であれば、 これは「待ち行列問題」といい、「リトルの公式」があります。 たとえば、ドトールのコーヒーショップで、 客が1/λ=60秒でポアソン到着し、給仕が1/μ=45秒の指数分布とすると、 列に並んで、レジを出て行くまでの平均時間は180秒と計算されます。 この式により、レジ係が手持無沙汰にならないような最適化が可能です。 ・曜日により、分布が変わる場合 さらに、それに応じて業者の手番が変わるとき(発注が集中すれば業者にも遅れが出ますので)、 これは、MCMC(マルコフチェーン・モンテカルロ)の問題で、 曜日が7ノードですので、エクセルでもできます。 しかし、品目が多数あって、それぞれ分布が異なれば、 シミュレーション・プログラムを書く必要がありますね。 専門の方(コンサルタントとか)にご相談下さい。 (私だったら、自分で書いちゃいますけどね) なお、バーンイン区間にご用心下さい。 ・品目によって、発注曜日,業者手番,・・・が決まっている場合 これは、たとえば、航空会社の定期路線の関係と同じで 飛行機機材,パイロットのやりくりの問題になります。 「中国郵便配達人問題」「倉庫問題」で知られる OR(オペレーションリサーチ)の問題です。 これは、1品1品に与えられる方程式が、品数に応じて膨大になり 従来法では、それだけの連立方程式を解かなければなりませんが、 当然、何百年という計算時間を要します。 今は、それを解くアルゴリズムが多数あります。 「LP最適化問題」と言います。 パッケージソフトもありますよ。 (2)精度を上げるには、 そりゃ、過去データがたくさんあれば、 ノンパラメトリックなMCMCのケースでは、学習精度が上がりますが、 通常、モデルを仮定しますので(パラメトリック推定)、 あなたの「知見」の方が重要です。 あなたは、上のどのケースだと思うのか、というようなことが重要なのです。

ice1982
質問者

お礼

kamiyasiroさん お礼が遅くなりまして、申し訳ありません。 >人員を遊ばせない~生産管理では非常に重要です。 まさしくこの点で非常に困っております。 >発注・業者手番(リードタイム)はランダムですか? はい、まったくのランダムでした。 下記の回答で記載させて頂きましたが、曜日と納品日の関連性はありませんでした。 >発注がポアソン分布,業者の手番は指数分布であれば、 >これは「待ち行列問題」といい、「リトルの公式」があります。 初学者の私には聞き慣れない用語です。 こちら是非調べて見たいと思います。 色々豊富な実例と共に、様々な手法をご紹介いただきありがとうございます。 単純にリードタイムと曜日での係数表を作ることしか 頭にありませんでしたが、もう少し教えていただいたことについて 時間を取って調べて見たいと思います。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.3

2. 提案。着荷が多い曜日を見るときに、 単純に着荷の曜日ごとにカウントするのではなく、 入荷予定日と実際入荷日の曜日の対で分類して カウントしてみる。 そこで明らかな傾向が見られれば、着荷を予想する 手掛かりにはなるはず。 1.3. 懸念。質問文中の「曜日をカウント」から見て、 使いものになる予測をたてるには、データ点が少ない ような気がする。結論が、誤差に飲み込まれそうな…

ice1982
質問者

お礼

alice_44さん お礼が遅くなりまして、申し訳ありません。 (2)については、アドバイスに従い曜日ごとのカウントをしてみました。 そこで分かったことは、注文日の曜日と「入荷予定日と実際入荷日」について 関連性が一切ないことでした。 「入荷予定日と実際入荷日」の誤差が、1~2日どころではなく 10日以上のデータが多数ありました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

注文、というのが、農産物ならまだしも、工業製品なら注文と違っているようでは、納期に間に合わないということなので、話にならないのですが。日本なら「納期を守れ」「取引相手を変える」で、問題解決です。 1) データ不足で不可能  月から金までは、1回コッキリですか。それだと、「こうなった」としか言えませんし、「そうですね」と応えるしか。統計学的な処理には、1回コッキリでは、「偶然」で片づけます。 つまり、不可能 2) 物による  農産物なら、自然相手なので収穫流、季節や諸費者の動向、市場価格。工業製品なら「納期を守れ」で片付く。が、これは一般論。  統計では、回帰式を使います。それも、重回帰分析。これはパソコンで式は簡単に出せます。 3) 2)と同じ  質問内容からは、こんなところではなく、専門家にご相談を。しかし、回帰分析は、因果関係が間違っていると、株の予想のように外れて右往左往、場合によっては破産。、

ice1982
質問者

お礼

kgu-2さん お礼遅くなりまして申し訳ありません。 データは一つの取引先に付き、数百件程度あります。 お答え頂いた(1)~(3)につき、全て納得です。 (特に2については、もう「ごもっとも」としか良いようにありません) 「重回帰分析」については自分も興味を持ち 色々と本を購入し、勉強しております。 的確なアドバイス、ありがとうございます。

回答No.1

一般論をいろいろ述べることはできるかもしれません.けれども実際のデータに当てはまらなければそんなもの三文の値打ちもありません.支障のない範囲で実際のデータを公開(別の場所で公開してリンク?)してくれませんか?

ice1982
質問者

お礼

ask-it-auroraさん お返事遅くなりまして申し訳ありません。 信じられないかもしれませんが、サンプルでお出ししたものがほぼほぼ実際のデータです。 これが一つの取引先に付き、数百件あります。 これに数量と一個あたりの金額と総額のデータが足されたものが全てです。 何卒ご了承くださいませ。

関連するQ&A

  • 発注数と実入荷数の照合

    POSレジにより、発注や在庫管理などを行っています。 仕入・検品・入荷入力の仕組みがうまく動いていないので、業務改善も含めて、システム変更を検討しています。 発注者が発注した商品が、いつ・どれくらいの数量で入荷するのか在庫管理担当者が把握していない状況で、入荷受付をしなければならない状況とします。 例えば、ある商品が、8個着荷したとします。納品伝票も8個であっています。 しかし、実は10個着荷するのが正しいとする場合、在庫管理者が「2個足らない」と認識するためには、どういった機能を設けてやるのが一般的なのでしょうか。 ※納品は、仕入先タイミングで発送可能になる度に行われるので、発注伝票と納品はリンクしません。 ※上と同じ理由により、「○月○日に着荷する予定リスト」の様なものは、作成できませんし、できたとしても当てになりません。

  • OpenOfficeで統計分析をとりたい

    *受付日 *原票No.  *扱店 *個数 *運賃合計 *運賃 *消費税 *伝票番号 12/26  30**-5512 台東区  2  1635   1500 135   02-999 12/27  11**-7026 渋谷区  1  735   700  35  03-011 ↓ というデータが続くNotepad(テキスト ドキュメント)のデータの統計分析をとりたいです。 (1)セル1つ1つに*受付日 *原票No. *扱店‥とデータを分けて入れたいのですが、データの形式を変え格納する手順とは?  (ただ単にコピペではダメなんですよね‥。) (2)受付日ごとの総個数、扱店の地域別データ、1個当たりの運賃料別の  昇順/降順などデータをとりたいです。 (3) (2)以外でとれるデータは他にはないですか (4) ExcelではなくOpenOfficeで行いたいので、データ⇒並べ替え⇒並べ替え条件 でしょうか?  ExcelとOpenOfficeの違いに戸惑っています。 OpenOfficeに博識な方ご教授宜しくお願いします。

  • Excleで統計分析をしたい

    *受付日 *原票No.  *扱店 *個数 *運賃合計 *運賃 *消費税 *伝票番号 12/26 30**-5512 台東区  2  1635   1500 135   02-999 12/27  11**-7026 渋谷区  1  735   700  35   03-011 ↓ というデータが続くNotepad(テキスト ドキュメント)のデータをExcleで統計分析をとりたいです。 (1)Excleのセル1つ1つに*受付日 *原票No. *扱店‥とデータを分けて入 れたいのですが、データの形式を変え格納する手順とは?  (ただ単にコピペではダメなんですよね‥。) (2)受付日ごとの総個数、扱店の地域別データ、1個当たりの運賃料別の  昇順/降順などデータをとりたいです。 (3) (2)以外でとれるデータは他にはないですか。 非常にレベルが低い内容で恐縮ですが、恥を忍んで質問します。どうか、ご教授宜しくお願いします。m(__)m"

  • 皆様いつも大変お世話になっております。また、いつも

    皆様いつも大変お世話になっております。また、いつも親切で的確なご回答をいただき、感謝申し上げます。 この度、部品の入庫・在庫管理が全く行われていない会社に入社して管理を任せれ苦慮しています。 使用するアプリはEXCELで注文書の作成して印刷して仕入先へFAXを行い、注文書のデータは別シートに蓄積され、入荷時に別シートを開けて入荷数と入荷日を手入力しております。 今後は、EXCELで下記仕様にて注文番号をバーコード化して、それを一つの管理コードとして入荷・在庫管理を行いたいと思います(ある注文番号を入力すると該当する品名/型番・注文数・注文単価が表示される)。 お知恵をお借りいたしたくご教示のほどお願い申し上げます。 (1)注文書のデータは別シートに蓄積され、注文番号・品名/型番・注文数・注文単価・入荷数・入荷日が入力されている。 (2)在庫管理シートを作成する。部品毎に別シートで管理、品名/型番・注文番号・注文数・入荷数・在庫数が入力されている。 (3)(1)より納品書を作成して、納品書の注文番号の隣に注文番号をバーコードで表示させる。仕入先に注文書と納品書をFAXや電子メールのPDFデータを送信する。 (4)仕入先は、(3)の納品書を使用して納品書。バーコード化された注文番号をバーコードでリーダーで読み取り(1)のシートの該当する注文番号のデータを呼び出す。入荷数と入荷日のセルに注文数の数字と入荷日(当日)を反映させる。 (5)(4)の処理と同時に注文番号より(2)の別に作成されている在庫管理シートの該当する注文番号を選択して注文番号の右列の入荷数を入力するセルに自動で入荷数を反映させる。 以上が行いたい処理の仕様ですが、もしかしたら不可能かもしれません。 少なくとも、(1)(3)(4)は行うことができればと思います。 よろしくお願いいたします。

  • 注文番号をバーコード化して入庫・在庫管理を行いたい

    この度、部品の入庫・在庫管理が全く行われていない会社に入社して管理を任せれ苦慮しています。 使用するアプリはEXCELで注文書の作成して印刷して仕入先へFAXを行い、注文書のデータは別シートに蓄積され、入荷時に別シートを開けて入荷数と入荷日を手入力しております。 今後は、EXCELで下記仕様にて注文番号をバーコード化して、それを一つの管理コードとして入荷・在庫管理を行いたいと思います(ある注文番号を入力すると該当する品名/型番・注文数・注文単価が表示される)。 お知恵をお借りいたしたくご教示のほどお願い申し上げます。 (1)注文書のデータは別シートに蓄積され、注文番号・品名/型番・注文数・注文単価・入荷数・入荷日が入力されている。(添付ファイルの画像下部) (2)在庫管理シートを作成する。部品毎に別シートで管理、品名/型番・注文番号・注文数・入荷数・在庫数が入力されている。 (3)(1)より納品書を作成して、納品書の注文番号の隣に注文番号をバーコードで表示させる。仕入先に注文書と納品書をFAXや電子メールのPDFデータを送信する。(添付ファイルの画像上部) (4)仕入先は、(3)の納品書を使用して納品書。バーコード化された注文番号をバーコードでリーダーで読み取り(1)のシートの該当する注文番号のデータを呼び出す。入荷数と入荷日のセルに注文数の数字と入荷日(当日)を反映させる。 (5)(4)の処理と同時に注文番号より(2)の別に作成されている在庫管理シートの該当する注文番号を選択して注文番号の右列の入荷数を入力するセルに自動で入荷数を反映させる。 以上が行いたい処理の仕様ですが、もしかしたら不可能かもしれません。 少なくとも、(1)(3)(4)は行うことができればと思います。 VBAは、ほとんど経験がありません。少なくとも(1)(3)(4)は行うことができればと思うのですが、教えていただけませんでしょうか?。 ・注文データの入力 ・納品書の作成印刷 ・バーコード表示 ・商品台帳管理 ・入庫明細作成蓄積 ・出庫明細作成蓄積(納品書の作成と連動です。) ・商品の在庫管理(入庫明細、出庫明細作成と連動です) 以上の機能があれば助かります。 小生の都合で申し訳ありませんが、年末年始休暇を勉強をかねて作成に努めたいと思います。 お忙しいところ申し訳ありませんが、可能な限りご協力・ご指導のほどをお願い申し上げる次第です。 よろしくお願いいたします。

  • 納品書の発行タイミング(宅配便で納品の場合)

    SOHOの個人事業者です。教えてください。 当方で開発した製品を、別の会社に製造を委託し、そこから宅配便でお客様に 直送納品しています。 製造委託先で発送した際、宅配便伝票の番号を送ってもらうことで、発送の 確認をとり、納品書を当方より別便で郵送しています。 このような場合、納品書の発行日付は、発送日(出荷日)で良いのでしょうか。 それとも、宅配便の荷物追跡サービスなどを使って、着荷日を確認し、着荷日を 納品書の発行日にしなければいけないのでしょうか。 締め日にまたがる場合、出荷日か着荷日かで、一ヶ月請求がずれるので、迷って います。 (今は、着荷日で処理していますが、結構この月ずれが苦しいので) よろしくお願いいたします。

  • アクセスについて!!

    現在、出荷管理の仕事をしております。 処理内容を記載いたします。 品番 注文番号 納品数があります。 品番A とし 注文番号 1  納品数が100  品番A    注文番号 2  納品数が200 だとします。 今回の、出荷は、150だとすると、 伝票の記載が、以下のようになります。 品番   注文番号 納品数  納品残数 A     1    100     0 A     2     50   150     また、出荷数が、50だと 品番   注文番号 納品数  納品残数 A     1    50     50 入力内容は、A品、出荷数と入力いたします。 (例は、一件だけですが、もちろん複数件の処理を行います) その為、通常のPG上ならば、条件式にてループさせ 処理を行うのでしょうが、アクセスでもそれは、可能でしょうか? 可能であれば、詳しく教えて頂きたいのですが、 宜しくお願いいたします。

  • エクセルの条件付き書式の設定方法

    教えてください エクセルの条件付き書式で設定だと思いますが、やり方がうまくわかりません。 A2:X100の表があるとします。 実際のデータはC1:X100に入力しますが、注文と入荷の管理を刷るため、色分けをしたいと思い、A列に注文日、B列に入荷日を入力して色分けしたいです。 例えば2行目にデータを打つとします。 (1)C2:C100に実際のデータを打ち込みます。このとき行の色塗りはなし (2)注文処理が済んだらA2に日付を入力し、このときに行の色が黄色になるようにします。 (3)入荷したら、B2に入荷日を入力すると、行の色が青になるようにしたいです。 よろしくお願いします。

  • 通販詐欺??

    通販のことで相談させてください。 一ヶ月ほど前にネットで服を注文しようと思い 問い合わせたところ、オーダーしてすぐに商品が入荷すると聞いて その商品をオーダーしたのですが、先振りと聞いていたのですが いきなり、一ヶ月後に「商品が入荷しましたので明日発送します。商品発送に電話番号が必要ですのでお知らせください。」ときまして いきなり着払いできました。中の納品伝票を見ると振込みもしてないのに振り込み入金済みと書いていました。 これは詐欺ですか??

  • Excel 条件付集計(Excel2002)

    おそらく出来ると思うのですが どうしても思いつきません。 顧客番号  日付   合計個数 001    2004/2/5  ○個 002    2004/3/8  ○個 003    2004/4/1  ○個 と言うデータがあるシート1(顧客リストのような物)と、 注文番号  顧客番号  日付   個数 A001    003    2004/1/1   1 A002    001    2004/1/3   1 A003    001    2004/2/8   2 A004    002    2004/3/10  2 A005    001    2004/3/18  3 と言うデータが入ったシート2(注文リストのような物)があるとします。 そこで顧客番号で検索して、 「シート1の日付よりあとの注文」 の個数を合計して、シート1の合計個数のところに表示する。 と言うシステムが欲しいです。(わかりにくくてすみません) つまり上の例で言うと シート1の001の合計個数には シート2の001のデータで2004年2月5日以降の個数だけを合計して、 「5個」と表示されて欲しいのです。 多分関数で行けると思うのですが、 無理でしたらマクロでも構いません。 お判りになられる方がいましたらぜひよろしくお願いします。