• ベストアンサー

Webアクセス数の確立の計算方法

数学から遠ざかって早十数年・・・。 Webアクセス数の負荷状況についてお客さんへの説明をするあたって、以下の仮定に説得力を持たせたいと考えています。 秒間平均160回のアクセスを受け付けるシステムがあるとします。 ここで、瞬間的に800回以上のアクセスがある確立はどれくらいか?  今度システム提案をするにあたって、秒間平均160アクセスをさばくスペックとしていますが、じゃあ、瞬間的に5倍の800回以上のアクセスがきたらどうなるのと聞かれました。  そこで、「いえいえ、800回以上のアクセスなんてこの程度の確立でしかないので気にする必要はないですよ」と答えたいのです。 ここで、多分仮定としてアクセス頻度(到着間隔)がポアソン分布とするかなど、前提条件があると思いますが、もう、何を仮定にすればいいのかなどすっかり忘れてしまっています。 一般的なWebアクセスの想定の計算方法について教えていただけないでしょうか?

  • pair
  • お礼率40% (8/20)

質問者が選んだベストアンサー

  • ベストアンサー
  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.3

ポアソン分布となるはずですが、この領域では殆ど正規分布で近似出来ます。 参考URLでポアソン分布のシミュレーションが出来ます。EXCEL表ダウンロード。 160ではオーバーフローが起きて全部の計算が出来ませんが 100で試した所、135で100%になりました。 つまり1.35倍以上の入力が入ることは殆ど皆無と言うことです。 正規分布として考えれば標準偏差σ=√100=10 ですから 3σを考えても130と言うことで感覚的にも合います。

参考URL:
http://www.ed.yama.tus.ac.jp/j-tokei/tusy22/class0626/tokei020626.htm
pair
質問者

お礼

再度の回答、ありがとうございました。 Excelでも計算できるんですね。大変ありがたいです。

その他の回答 (4)

  • moritan2
  • ベストアンサー率25% (168/670)
回答No.5

#2です。式は#4様の示されたとおりですが、普通にCでdoubleでやると260くらいで0.0になってしまい計算できません。小数点以下1000桁程度まで計算できる特殊な処理系でないと計算できないと思います。でも、ちょっと概算しただけでも、ポアソン分布で平均160/秒のものが800/秒を超えることは、宇宙の素粒子が全部webサイトになって、宇宙が始まってから宇宙が終わるまでやってもあり得ないことはわかるはずです。

pair
質問者

お礼

再度の回答、ありがとうございます。 納得です。 相手のお客様が素人で、感覚的には少ない確率でも秒間800とか行くんじゃないかと思われているで・・・・。 (極まれに800行くんじゃないか?) 数学的に説明できればかなり説得力があります。 ありがとうございました。

  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.4

ポアソン分布 p(x)=λ^x/x! exp(-λ) で平均が160とのことなのでλ=160として800以上になる確率を計算すれば良いです。計算方法は P(x>=800)=Σx=800~∞p(x) =1-Σk=0~800 p(x) で求まります。 簡単にはモンテカルロシミュレーションなどを行なうのも手です。経験分布なども仮定できるので、実際にアクセス数を測定してその分布を元に計算することも出来ます。

pair
質問者

お礼

回答ありがとうございました。 サービスイン後には実際にアクセス数を測定しての分布を計測することも検討します。

  • moritan2
  • ベストアンサー率25% (168/670)
回答No.2

ポアソン分布とすれば、平均160/秒なら秒300になることもほとんどあり得ませんが、ハッカーの攻撃を受ければポアソン分布にはなりませんね。ハッカーの興味の対象とならないようなものなら、だいたいポアソン分布でいいんじゃないでしょうか? 平均160/秒なら800/秒なんて計算する気も起きないけど、10の数百乗分の1でしょうから問題外です。

pair
質問者

お礼

回答ありがとうございます。 確かにハッカーの攻撃を受ければポアソン分布にはなりませんね。今回はこれは除外するつもりです。 やはり800/秒はかなり小さい確立になるんですよね。  正確な計算式はどこかにないでしょうか?  以上、よろしくお願いします。

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.1

顧客が聞いているのは確率の話ではないような気がします。 東京証券取引所で度々能力オーバーがありましたが そのようなときの通信帯域制限やユーザーに対する受付不能メッセージ等の 対策を聞かれているのではないですか。 予想以上の入力があったのでダウンしましたでは済まされなくなってきていますから。 あと増強の容易性の配慮も必要ですね。 この辺を整理して説明しないと確率論だけではすれ違うと思いますよ。

pair
質問者

お礼

回答ありがとうございます。 はい、その通りで、受付不能メッセージを出す閾値をどれくらいにするかという打ち合わせででた話です。 システムの閾値を例えば800アクセス/秒とした場合、それ以降の利用者は受付不能メッセージ表示サーバへふられます。  その確立がどれくらいあるかを知りたかったのです。  こういった値はSLAにも関わってくるのでしっかりと客先合意する必要がありますね。

関連するQ&A

  • Webシステムの負荷試験について

     社内Webシステムを作っている者ですが、負荷試験をすることになり、困っています。仮想的に、同時アクセスをしようと考えていますが、同時アクセス数をいくらぐらいにすれば良いのかわかりません。  現在のアクセス数は大体わかっていますが、ピークをどう考えればいいのでしょうか?ポアソン分布が使えますか?

  • 二項分布、ポアソン分布の問題について質問です

    二項分布、ポアソン分布の問題について質問です 私は高校生ですが、経済学に興味を持っているので、統計学を自習しております。しかし参考書でわからない問題があったので質問したいと思います。 (1)二個のさいころを72回振る時両方とも一の目が出る回数をxとする。x=0,1・・・5の各々についてその確率を二項分布とポアソン分布を用いて計算し、両者を比較せよ (2)ある工場で製造された電球の3%は不良品である。いま100個を抽出する時0個、1個、2個、3個が不良品である可能性をポアソン分布を利用して求めよ。 (3)ある大学の食堂で、カレーライス一皿のなかの牛肉の個数はポアソン分布に従っているという。一個に少なくとも2個の牛肉が入っている確立を95%以上にするには一皿あたりの牛肉の個数の平均をおおよそいくら以上にしなければならないか(グラフを用いて会の近似値を求めよ)

  • テレビからWebへのアクセス数

    全国放映されるテレビから、ある団体のことが紹介され、 具体的にキーワードが出て(たとえば、OKWave等と) そこからWebへアクセスするとなると、瞬間的に何ヒット 出るものでしょうか? (たとえば、秒間何ヒット、等) アクセス数の見積もりをしたいので、よろしくお願いします。 対象は、以下のような番組です。 ・朝夕のNHKニュース ・ほぼ全民放の夕方のニュース、及びその特番 ・ほぼ全民放の深夜のニュース、及びその特番 ・NHK及び特定の民放の専用のドキュメント番組 ・(その他、各種新聞メディア) URLは出ないと思われますが、 テレビに表示されるキーワードですぐに検索キーワードで 引っかかるものになります。

  • ポアソン分布の問題です。よくわかりません

    ポアソン分布の問題です。よくわかりません。 ある都市における1日あたりの交通事故による死者の数は、平均1.8人のポアソン分布に従うという。 (1)ある日の交通事故による死者の数が0人である確率をもとめよ (2)ある日の交通事故による死者の数が3人を超える確立を求めよ よろしくおねがいします。

  • 確立・統計の問題です。(正規分布)

    確立・統計の問題です。 (1)ある確立変数が標準偏差σ=21.5の正規分布に従うものとする。 この確立変数が120.5未満のある値をとる確立が90%であるとき、この分布の平均値をもとめよ。 (2)ある検問所で記録されたスピードのデータによると、そこを通過する車は平均時速60.5km、標準偏差7.4kmで、大体正規分布に従っている。 このとき (a)時速70kmを超えている車は全体の何%か (b)時速48kmよりも遅い車は全体の何%か (c)時速56kmから時速64kmまでの車は全体の何%か (3)ある商品の1ヶ月の売り上げ個数は、平均250個、標準偏差30個の正規分布をする。 90%の確立で品切れをおこさないようにするためには、月初めにどれだけの在庫を準備しておけばよいか。 ただし、各月の需要はすべてつき始めの在庫で満たすものとする。 (1)は答えが P{(120.5-μ)/21.5<z}=0.9 z=1.28であるからμ=92.98 と回答にあるのですが、zがどうしてそうなるのかがわかりません。21.5<zとなるのもどうしてでしょうか? zがわかったと仮定してμを計算すると、そっちは出るのですが・・・。 (2)は答えが(a)10% (b)4.6% (c)41.0%とあるだけで どうやって導いたらいいのかいまいち検討がつきませんでした。 比較的簡単にでそうな感じの問題だとは思うのですが。 (3)は250+1.28×30=288個と回答にありましたが、 1.28はどうやって出したのかがわかりません。 それになぜ標準偏差の30をかけるのでしょうか? よろしくお願いします。

  • 統計学のアーラン分布について

    統計学のアーラン分布について質問です。 待ち行列理論のシュミレーションをC言語で作っていて ポアソン分布の式は分かったのですが アーラン分布の式が分かりません。 確立密度関数f(x)は平均が1/aの時に  f(x)={(at)^(k-1)/(k-1)!}*a*e^(-at)  となることまでは分かっているのですが この分布に従う値をいくつか出す方法が 分からなくなってしまいました。 文章が分かりにくくてすみません。 例えばポアソン分布なら平均1/aとして  -log(1-(random))/a (randomは0~1の乱数) として乱数の値を変えていくと できた数は全体としてポアソン分布に従っているのですが これがアーラン分布ではどのような式になるか知りたいです。 どなたか分かる方、教えてください よろしくお願いします。

  • ポアソン分布の問題を 計算機で解く方法

    ポアソン分布の問題で、計算機を使ってやるのが 学校の流儀です。 平均を求めたり、「事象が8回起こる確率」を求めるための公式は、公式BOOKにあります。 しかし、「下側累積確率」などを求める公式を、計算機で出すことができずに困っています。 計算機で、例えば 平均が 3.63で、8回以下、事象が起こる確率・・ を求めることはできるでしょうか? 添付は、私が使っている計算機です。

  • ポアソン到着?

    あるシステム処理の負荷テストをしようと思います。 一般ユーザから10秒間に平均10回の処理ボタンが押されると想定して、 テストパターン1=1秒間隔で一人が10回ボタンを押す テストパターン2=2秒間隔で二人が同時にボタンを押す テストパターン3=5秒間隔で五人が同時にボタンを押す テストパターン4=10秒間隔で十人が同時にボタンを押す 負荷的にはパターン1が緩く、パターン4が厳しいと思いますが どれならば「まあ大丈夫」といった推測ができるのでしょうか。 よろしくお願いします。

  • 誤差計算

    あるシステムで計器誤差が3パーセントで正規分布と仮定し同一対象を100回測定した場合、この計器が真値から1パーセント以上離れる値を示す回数はどの様に計算すれば良いのでしょうか? 質問が整理できていないかもしれませんその辺りも含めて宜しくお願いします

  • 確率変数XがP(X=1)=P(X=2)なるポアソン分布を持つならばP(X=4)を

    もし確率変数XがP(X=1)=P(X=2)なるポアソン分布を持つならばP(X=4)を求めよ。 という類の問題なのですがどなたか解き方をご教示ください。 ポアソン分布とは 「ポアソン分布 特定の事象が起こる確率pはきわめて小さいが、試行回数nが非常に多いためにその 事象が何回かは起こるときその生起回数の分布として表れる。 パラメータλのポアソン分布の確率密度関数は p_λ(k)=(λ^k)e^-λ/k!である。ポアソン分布の平均、分散はともにλである」 といったものです。