• 締切済み

WEBサイトのPV・アクションの確率モデル作成

あるサイトのPV数、申込数の分析を行うにあたって確率モデルの適用を考えています。 各ページのPV数・アクション数の確率的な分布の導き方について 以下の考え方で問題ないかご意見いただきたいです。 ※当方、15年ぶりに学生時代の統計の教科書を引っ張り出して悪戦苦闘中です。 ------------------------------- 総ページ数:a 申込可能なページ数:b ※考慮外ですが、データとして持っています UU数:c  総PV数:d ※個別ページ毎のPV数の情報も持っています 総申込数:e ※同上 と置いたとき ユーザ1人当たりのPV数平均=d/c ユーザ1人当たりの申込数平均=e/c 【仮定】ユーザの申込行動:申込可能なページを参照した際に一定の確率pで申込を行うベルヌーイ分布に従う # 実際には一定の確率ではないので、ここも分析対象になるかと思いますが、 # それはまた別の機会に。 ▼ http://ja.wikipedia.org/wiki/%E8%B2%A0%E3%81%AE%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83 の記法に倣って サイト閲覧を終了するまでの申込件数r=e/cと置いたときユーザ1人当たりのPV数の分布は負の二項分布に従う このとき、PV数の期待値E(X)=d/c=e/cp ∴p=e/d ※この確率分布関数をf(x)と記述します。 ------------------------------- このとき、個別ページのPV数の確率分布モデルを適用するにあたり、 ユーザがページ選択する確率:1/a この試行を全体でd回繰り返すことになるので、なので予想されるPV数の分布は f(x)*d/aとなる アクション数も同様の導き方を考えています。

みんなの回答

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

何をしたいのかよく理解できたわけでないですが。 ページビューはページによって大きな差があり、人による好みの違いも大きいことから、一律にaで割り算する「ユーザがページ選択する確率:1/a」「PV数の分布はf(x)*d/aとなる」の部分は、無理があるような気がします。 そもそも、ページビューを既定する要因は様々あると考えられ、その大部分は未知の可能性があることから、演繹的にモデルを導くのは難しいのではないでしょうか。 PV数の確率分布をモデル化したいなら、実際のPV数の分布をグラフ化してみて、似た形状の確率分布にあてはめる方法があります。案外、正規分布やポアソン分布で事足りる場合があります。 お考えのf(x)*d/aも含めて、複数の候補のどれを選ぶかということなら、それぞれを最尤法であてはめてみて、尤度が最も大きいモデル(あるいはAICが最小のモデル)を選べば良いと思います。 選ばれたモデルについて、どうしてそういう関数形になったのかが気になるならば、後付で理屈を考えればよろしいかと。

inakanamazu
質問者

お礼

回答ありがとうございます。 現在の分布形状を見ると、対数正規Orべき乗っぽい形状になっているので、 うまくロジックとして説明できそうな上記モデルをベースとして 母集団分布を仮置きしたい、というのが意図するところになります。 この後、各ページで持っている属性をパラメータとして、ページ側の属性だけで 何らかの傾向を見出して行きたいと思っています。 正規分布・ポアソン分布は分散が大きいのでちょっと当てはめるのが難しいです。 (対数正規だと中間だといい感じにQQプロットは乗るんですが、両方の裾で 外れてしまい、検定も通らないのです…)

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計学で混乱してしまいます

    統計学の授業で、次の2問が出題されました。 (1)1991年の人口動態統計によると日本人の出生時の性比は、男児:女子=627:595であった。この母集団から10人を抽出したとき (a)男性の人数を確率変数としたとき、その確率分布はどう表わされるか[X~B(10、0.513)] (b)男性は平均何人か。また分散はいくらか。[5.13、2.5] (c)男性が3人である確率はいくらか。また、女性が3人である確率はいくらか[0.105、0.130] (2)昨年、ある自治体の交通事故による死者は1日当たり平均3人であった。 (a)死者数を確率変数としたとき、その確率分布はどう表わされるか。[P(X=n)={e^(-3)・3^n}/n!] (b)1日当たり3人の死者が出る確率はいくらか[0.224] (c)1日当たり3人以上の死者が出る確率はいくらか[0.575] ※[ ]は解答です。 まず、(1)は二項分布で(2)はポアソン分布だと思うのですが、その違いがわかりません。 問題分のどこを見れば二項分布なのかポアソン分布なのかが分かるのでしょうか。 (そもそも二項分布とポアソン分布の違いを自分が理解できていないのが原因かと思います;) 次に(1)の(a)について、答えがX~B(10、0.513)となっていますが この10は抽出した10人のことですか?なぜX~B(n、p)のnが10なのでしょうか。 また、0.513はどのように求めるのでしょうか? いろいろ計算したところ、627/(627+595)=0.513となりました。 これは新生児1222人から1人選んだら男児だったときの確率だと思うのですが それでよいのでしょうか? 最後に、(1)と(2)のどちらも(c)の求め方が分かりません。 (2)の(c)は1-(死者が1人の確率)-(死者が2人の確率)で出ますか? 間違っていたら訂正をお願いします。 大学で専門ではない統計学をかじっている程度なので まったく理解できていないのにどんどん先へ進んでしまってつらいです。 拙い表現でうまく質問できていない部分があるかもしれませんが お力添えをよろしくお願いいたします。

  • 確率論の密度関数

    Xがパラメーターλの指数分布に従うとき、(1)A=2X+5(2)B=e*X(3)C=1/1+Xの確率変数の分布の密度関数を求めたいのですがどのようにしたらいいのかわかりません!アドバイスお願いします(泣)

  • 確率の問題です。

    どれか一つだけでもいいので回答よろしくお願いします。 問1, Xを幾何分布Ge(p)にしたがって分布する確率変数、Lを自然数とするとき Y = min (Χ, L) の分布を求めよ。 問2, パラメータαをもつ指数分布の分布関数は F(x) = 0 (x<0), F(x) = 1-e^(-αx) (x≧0) で与えられる。 a , b > 0とするとき以下の確率を求めよ。 (1)P(X≧ a/2) (2)P(X> a + 2b\X > a) 問3, 確率変数Xの確率密度関数が f(x) = sinx , 0≦x≦π/2 で与えられるとき、P(X≦π/3)を求めよ。

  • 確率の問題です。

    どれか一つだけでもいいので回答よろしくお願いします。 問1, Xを幾何分布Ge(p)にしたがって分布する確率変数、Lを自然数とするとき Y = min (Χ, L) の分布を求めよ。 問2, パラメータαをもつ指数分布の分布関数は F(x) = 0 (x<0), F(x) = 1-e^(-αx) (0≧x) で与えられる。 a , b > 0とするとき以下の確率を求めよ。 (1)P(X≧ a/2) (2)P(X> a + 2b\X > a) 問3, 確率変数Xの確率密度関数が f(x) = sinx , 0≦x≦π/2 で与えられるとき、P(X≦π/3)を求めよ。

  • 統計について習ったばかりで困っています。

    (1) 長さaの線分AB間に二点、C,Dをとり、CDの長さがk以下である確率が1/3とする。kの値を求めよ。ただし、点C,Dがどの位置に選ばれるのも確からしく、かつ独立に選ばれるものとする。 (2)Xが二項分布B(12,1/2)に従うとき、P(|X-m|=3σ)の値を求めよ。ただし、m=E(X),σ^2=V(X)である。 どなたか助けてください。

  • 確率密度関数の問題

    以下の、確率密度関数を求める問題がよくわかりません。 詳しい解説をお願いします。 Xはパラメータλの指数分布に従う確率変数とする。以下の確率変数について、その確率密度関数を求めよ。 (1) B = e^X (2) C = (1+ X)^-1 (3) D = (1+ X)^-2 よろしくお願いします。

  • モーメント推定量

    統計の問題がわかりません。 問題 標準正規分布に従う確率変数X,Y,Z,U,Vについて Y=aX+bU X=cZ+dV が成り立ち、E[XU]=E[ZV]=E[ZU]=0 とする。a,b,c,dは正の定数とする。 1)(X、Y、Z)の定める分布からのn個の無作為標本(x1、y1、z1)、…、(xn,yn,zn)が得られたとき、a,b,c,dのモーメント推定量を求めよ。 2)(U,X)の同時分布も正規分布であるとき、UとXが独立であることを示せ。 1)はr次モーメントとr次標本モーメントをもとめて解くのかと思いつつ立式できません。。。 2)も何を示せばいいのかわかりません。。。 考え方を教えてください。

  • 確率の最初の方の問題

    確率・統計の本を購入し勉強をはじめたのですが、いきなりつまづいてしまって困っています。 次の2問なんですが、問題の条件設定が足らないように思うのですが・・・ 本には答えが省略されており、かなり基本的な問題なのかもしれません。。 どなたか分かる方居ましたら教えてください。 宜しくお願いします。 1、事象A,B,Cについて確率 P((A^c∩B^c)∪C^c) を,P(A∪B)とP(C)を使って表せ。 2.さいころを投げて出る目の数を表す確率変数Xについて|X-3|の確率分布を求めよ。

  • [iframe]に関する質問です

    友達に聞かれたのですが、あまりWebに詳しくなくて答えられなかったので教えてください。 Aというページ内に、Bというiframeを作ったとします。 Bの中には検索エンジンレンタルを使用し、C,D,E…と商品が検索されていきます。 Bの[iframe]内で更新された内容(C,D,Eの商品のページ)を、PV数としてアクセス解析で拾うことは可能なのでしょうか? また拾うことが可能でしたら、どのようなアクセス解析ツールがあるのでしょうか? 友人は、PV数が拾えないのなら検索エンジンは使わない方がいいのかな、と悩んでいるようです。 検索エンジンのレンタル会社から提供されるPV数だと、検索エンジン+他サイトから見られた回数、で送られてくるそうで 自社HPからの効果を知った上で作りたいそうなのです。 よろしくお願いしますm(._.)m

  • 「Webサイト」って何でしょうか

    こちらでWebサイトの例やWebサイトと呼ばれるための条件などについて教えていただきました。 http://okwave.jp/qa/q6520109.html Webサイトの定義はいくつかのサイトにありますが微妙に異なるようです。 http://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88 http://e-words.jp/w/WebE382B5E382A4E38388.html http://d.hatena.ne.jp/keyword/%A5%A6%A5%A7%A5%D6%A5%B5%A5%A4%A5%C8 Webサイトは正しくはどのように言い表せばいいのでしょうか。

    • ベストアンサー
    • HTML