• 締切済み

出荷量のバラつきを統計学的に調査する方法

物流の仕事をしています。 出荷量のばらつきを把握する為の、統計学的な手法について教えてください。 たとえば、100日間かけて、10000個の貨物を出荷するとします。 単純に考えれば、1日あたりの平均では100個の貨物を出荷したことになります。 しかし実際は、前半50日は1日10個程度の出荷量で、後半50日で190個の出荷量ということも有り得るかと思います。 このように出荷量のバラつきが大きい場合、平均では100個/1日の出荷量であっても、平均のみで単純に表すのは無理かと思います。 出荷量のバラつきがどの程度であれば、[平均で100個/1日の出荷量]とみなせるでしょうか? 統計学的な手法を教えてください。

みんなの回答

  • QCD2001
  • ベストアンサー率59% (298/499)
回答No.3

全部を足して割ったものが平均値の定義ですから、たとえば 1日目に10,000個を出荷し、残りの99日の出荷個数が0であった場合、 1日あたりの平均は100個になります。 平均はバラつきを調べるための指標ではないので、平均を調べてもバラつきを知ることは出来ません。 大まかな話をします。 1日目の出荷個数をx1、2日目の出荷個数をx2 とし、以下同様にして、100日目の出荷個数をx100 とします。 出荷数の平均をxmean とすると、 xmean=(x1+x2+・・・+x100)÷100 です。 σ^2={(x1-xmean)^2+(x2-xmean)^2+(x3-xmean)^2+・・・+(x100-xmean)^2}÷100 とすると、σ^2 は、各日の出荷個数と平均出荷個数との差を2乗して平均を取ったものですから、平均よりも多かったり少なかったりした日が多いと、σ^2 は大きくなります。このσ^2 を分散と呼びます。分散の平方根であるσを標準偏差と呼びます。 よく、平均〇〇±△△ という表記の△△の部分が標準偏差です。 サンプルが平均±1σの範囲に入る確率は約69%、±2σ以内に入る確率は約96%、±3σ以内に入る確率は約99.7%です。 わかりやすく説明すると、平均が100個で標準偏差σが10個であるということは、 出荷個数が平均±10、つまり、出荷個数が90個から110個の範囲であるような日は、100日の69%である69日程度であり、 出荷個数が80個から120個の範囲であるような日の数は、96日前後であり、 出荷個数が70個から130個の範囲であるような日の数は99.7%ですから、ほぼすべての日が含まれることになります。 このように、標準偏差を計算すると、ばらつきを調べることが出来ます。 ところで、ばらつきを調べるにあたって、上記のような計算をする前に、まず度数分布のグラフを作ることをお勧めします。出荷個数が0個から9個の日は何日あり、10個から19個の日は何日あり、・・・というようにして調べてグラフを作り、これを眺めると、単純な計算では求められない、思いがけない規則性が発見されることがあります。 たとえば、出荷する荷物をトラックに積み込む際に、両手で1個ずつ2個を持ってトラックに載せ、おおむねいっぱいになったところでトラックが出発すると、出荷個数は偶数になります。もしかするともう1個乗せたほうが効率がよいかもしれません。 グラフと言うのは原始的なように思えますが、意外と使える統計手法です。

  • qwe2010
  • ベストアンサー率19% (2132/10811)
回答No.2

統計、何のためにそれをとるのか考えましょう。 倉庫の大きさ、車の手配とか、人員の配置に必要なのでは? 一年をとおして、 月ごとの移り変わり、 曜日ごとの、移り変わり、 盆前、 正月前の、量 それを数年分用意すれば、よく理解できるでしょう。 それを使用しないのであれば、1日100個で十分です。

  • f272
  • ベストアンサー率46% (8013/17127)
回答No.1

「出荷量のばらつきを把握する為」には平均だけでなく、分散と呼ばれる統計量を計算します。分散は、平均からどの程度ちらばっているかを表す指標です。 > 出荷量のバラつきがどの程度であれば、[平均で100個/1日の出荷量]とみなせるでしょうか? どんなにばらついていても、平均が1日100個であれば、「平均で100個/1日の出荷量」です。だから平均だけでなく分散も示すのです。

関連するQ&A

  • 統計に基づく【累積の】出荷量の予測

    教えてください。 今後数日間の累計出荷量について、過去1か月間の実績に基づき、統計的に予測したいと思います。 (前提として出荷量は正規分布するとします。) 過去1か月の出荷量の平均と標準偏差を調べると、平均は1日100ケース、標準偏差は5ケースだったとします。 そこで、1日目は、標準偏差2つ分を基準に考えると、110~90ケースの間の出荷量となる確率が95%程度と考えました。 また2日目も完全に同じで、110~90ケースの間の出荷量となる確率が95%程度と考えました。 ここからが質問なのですが、1日目と2日目の、【累積の出荷量】は、95%の確率で、どの程度の数量なのでしょうか? 計算の仕方も教えて頂けると幸いです。 (220~180の間の数量ではないだろう、と予想しています。)

  • 実務で役立つ統計知識

    教えてください。 物流の仕事をしています。 在庫量の変動とか出荷頻度とかについて、統計学の初歩中の初歩といえる程度の知識で取り扱いたいです。 下記の項目の意味は理解しましたが、ほかに、「素人に理解しやすく、実務での役に立ちそうなキーワード」はないでしょうか? 中央値 最頻値 加重平均 相乗平均 調和平均 移動平均 トリム平均(調整平均) 中央平均(25%トリム平均) 変動係数 外れ値/異常値 相関係数 ※あくまで素人でも割と簡単に理解できる内容を目指しています

  • 検定統計量について

    検定統計量と検定について(http://www.aoni.waseda.jp/abek/document/t-test.html) 1. 検定の方法は,T検定,F検定,J検定などの手法をみかけるのですが,違いがいまいち 分かりません.これらの違いは,考える確率分布が違うということなのでしょうか? 2. 各検定法(T検定,F検定,J検定など)と検定統計量のかかわりがよくわからないのですが, たとえば,T検定をする場合の平均の検定統計量とF検定をする場合の平均の検定統計量 は同じなのでしょうか?   3. 検定についてまだよく分かっていないので,検定の仕方を正しく認識しているか怪しいですが, 検定は,仮説に応じて検定統計量を定義してから,その検定統計量を計算し, P値を求めることで仮説が有意か否か判定するのですよね? なので,最終的にどの検定(T,F,J検定)もP値を求めて有意か否か判定するので, 検定統計量さえ正しく定義できれば,T検定,F検定,J検定など,どの検定法 を使おうとひとつの検定の方法でどんな仮説の検定もできると考えてよいのでしょうか? それとも用途に応じて検定法を使い分ける必要があるのでしょうか? 回答よろしくお願いします。

  • 統計量 正規分布、分散の加法性について

    統計量 正規分布と分散の加法性の演習問題です。 自分なりに考えておりますがどんどん思考の渦に巻き込まれわからなくなってきてしまいました。 また、統計学は習い始めたばかりの初心者です。考え方のコツ等をご教授頂ければ幸いです。 以下問題文です。 部品1000個 を箱に詰めて出荷するが、部品の個数を数えるのではなく重量を測定することで箱詰め数量を管理したい。どのようにすればよいか方法を検討し報告書にまとめよ。 以下に条件を示す。 (1)部品、及び箱の重量 【部品一個の重さ】平均:5g 標準偏差:0,05g 【箱一個の重さ】平均:100g 標準偏差:5g (2)出荷品質 混入率:0.05%以下 ※混入率:1000個ではないものが出荷される割合 方法を決定した背景や根拠なども含め答えよ。

  • 統計 ばらつきの大きなデータを平均化して扱う手法

    ご存知の方が居ましたら教えて下さい。 (伝わりにくくて申し訳ありません、エクセルでグラフにする必要があります。お手数をおかけ致しますがよろしくお願いします) 以下のようなばらついたデータがあります。 3.27 2.80 3.30 3.67 3.17 3.10 3.10 3.27 4.00 3.90 3.87 3.60 3.77 3.80 3.67 4.00 4.07 3.90 3.27 3.50 3.60 2.50 2.80 2.40 2.37 3.30 2.60 2.90 2.60 2.10 2.07 左上から1,2,3…とします。 これをグラフにするとひとつひとつがばらついて傾向がわかりにくいです。 ちなみに16番目と26番目の時にとある操作を加えた事の効果を見たいです。 そこで、前後あわせて5つのデータ平均でグラフにするとばらつきが緩和されて傾向が見て取れます。(3.27+2.8+3.3+3.67+3.17)/5=3.24の次を(2.8+3.3+3.67+3.17+3.1)/5=3.21としていきます。 3.24 3.21 3.27 3.26 3.33 3.47 3.63 3.73 3.83 3.79 3.74 3.77 3.86 3.89 3.78 3.75 3.67 3.35 3.13 2.96 2.73 2.67 2.69 2.71 2.75 2.70 2.45 これをグラフにすると16番目と26番目付近でグラフが見た目で大きく変化しているのが分かります。このように一回一回の測定では誤差が大きいが前後数日分を平均し、平均している日をずらして評価する方法に名前はついているのでしょうか?このようなデータの扱い方は統計学等で正式に認められている手法なのでしょうか?教えて下さい。 よろしくお願い致します。

  • 【統計】検定とその多重検定について

    はじめまして。これまで避けて避けてきた統計だったのですが、ついに勉強を、しかも猛烈な勢いでデータの分析をしなければならなくなりました。検定手法はデータがどういうものかによってその手法を選択するところまでは理解しました。その手法に基づき計算はPCでやり、それなりに結果が出てきたのですが、このデータは何を意味するのかがよく分かりません(読み方がわかりません)。 結果は下記のものでした。 Kruskal-Wallis検定: サンプル数=649, 統計量(H)=8.574 棄却率(p)= (10+1) / (1078+1) =0.0102 F=4.33, 自由度1=2, 自由度2=645, 棄却率(p)=0.0135 カイ二乗近似: 自由度=2, p=0.0137 N: 平均順位 1: 170: 303.0 2: 231: 353.4 3: 248: 313.6 多重比較 (Dunn): Q 2 = 3 : 2.325 : 0.1 > p > 0.05 2 > 1 : 2.662 : 0.05 > p > 0.02 3 = 1 : 0.566 : p > 0.5 平均を比較したのですが、  ・1群と3群の平均にはとくに関係なし  ・2群と3郡の平均にはとくに関係なし  ・2群と1群の平均には、どうやらなにか関係があって、   平均値は2群>1群といえるかも と判断しております。 超基本をすっ飛ばしご意見をいただこうとするのは大変申し訳ございませんが、何卒よろしくお願いいたします。

  • (統計学)n数をいくらにすれば良いでしょうか。

    統計が無知な私に、ぜひご教示願います。 いま、丸い形をしたサンプルが30000個あり、 それぞれのサイズにややばらつきがあります(正規分布とします)。 大きすぎるもの、小さすぎるものは不合格になるとします。 30000個をすべて確認すると、 その中の不合格はだいたい50-100個程度と把握しているのですが、 毎回30000個確認するのは大変なので、 n数を少なくして確認し、 「この日製造したサンプルは不合格率○%だった~」、という話をしたいと思っています。 だいたいいくらくらいのn数にすれば、ある程度信頼性のある話ができるのでしょうか? できれば理由も添えて、お願いします。

  • 有意差が生じているかどうかの統計手法を教えてください。

    有意差が生じているかどうかの統計手法を教えてください。 質問事項は2点在ります。 1.Aというサイトで1年間Bという物質の日平均濃度を測定し、同サイトにおける地上5mと25mとの温位日平均値とで相関が見られた。翌年同様の測定を行ったが、同じ程度の有意性が認められるのか確認するにはどのような手法を用いればよいのか。 2.1999年度に500地点で測定されている物質Xと物質Yの日平均濃度値を用い、Y=aX^bという回帰式が求められた。10年後に再度同様の手法で回帰を求めて得られたY=AX^Bという式は10年前に求めた式と有意な差が見られるか 以上です。 数学に疎く、理解できなくても使えれば良い、という状況下におります。 ご見識のある方のアドバイス、よろしくお願い致します。

  • 統計的にサンプルサイズを決める方法について疑問

    統計的にサンプルサイズを決める方法について、疑問があるので教えてください。 以下、例として提示します。 各種数字は計算がしやすいような数値でとってあります。 68,000 個の製品を出荷直前に検査するとして、 許容誤差10%で 信頼水準レベル90%の場合、 必要なサンプルサイズは 68個 のようです。 (自分で計算したわけではなく、ツールで計算されたものですが) 出荷は68日間あり、1日に1,000個を出荷していくとします。 許容誤差10%で信頼水準レベル90%の場合、サンプルサイズは68個なので、この場合は、【日割りで計算して】、毎日1,000個の中から、1個のサンプルを取ればよい。 つまり、【日割りで計算すると】、1/1,000 (千分の一)の確率でサンプルを取れば良い、ということになると思います。 ここからが疑問です。 全体数68,000 個を日割りにするのではなく、毎日1,000個出荷する前に個別にサンプルサイズを求めた場合、許容誤差10%で信頼水準レベル90% ならば、統計上は必要なサンプルサイズは 64 個となってしまうようです。 68,000個を68日間の日割りで計算した場合はサンプルは1000個に1個だが、1日1日で個別にサンプルサイズを導きだした場合は1000個に64個となってしまいます。 異なる結果になってしまうのですが、どちらの考え方が正しいのでしょうか?

  • 累計の標準偏差の計算方法とは?

    統計学的な計算について教えてください。 前提: ある商品Aの出荷量は毎日変動があり、過去のデータから計算したら平均50個で±5個の標準偏差でした。 標準偏差を2倍(=2シグマ)し、約95%の確率で、明日の出荷量の変動は、±10個の標準偏差の値に収まると予測しました。 質問: では、7日後の累積の出荷量は、95%の確率で、どれほどになるでしょうか。 予想では、95%の確率で、 ・累積出荷量が50個×7日 = 350個、 ・標準偏差は、 [10個の分散である100個]×[7日]の平方根で = 約26.5個 よって95%の確率で、350個に上限のぶれが26.5ぐらいの範囲に収まる 上記の計算で合っているでしょうか? 合っていない場合、正しい計算式を教えて頂けますと幸いです。 よろしくお願いします。