• ベストアンサー

95%信頼度での統計的違いについて

ある本に、 提案1:サイト訪問者5300, 購入者46, CVR=0.87% 提案2:サイト訪問者5200, 購入者55, CVR=1.06% の場合、95%信頼度では統計的に違いがないが、 提案1:サイト訪問者5300, 購入者46, CVR=0.87% 提案2:サイト訪問者5200, 購入者63, CVR=1.21% の場合であれば、95%信頼度で統計的に違いがあるといえる。 という記載がありました。現在統計の勉強中なのですが、どう検定すれば上記がわかるのか、検討もつきません。どなたかどういう式でそういえるのか、教えて頂けないでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • okormazd
  • ベストアンサー率50% (1224/2412)
回答No.1

サイト訪問者のうち、商品を買うか買わないかの統計だから、二項分布になります。 提案1の場合、n=5300人訪れたうち、平均してx'=46人が商品を購入するだろうという二項分布です。 二項分布の性質として、全体の事象の発生確率=母比率をpとすれば平均=np、分散=np(1-p)です。 母比率pはわかりませんので、統計データ p'=x'/n=p で近似します。 質問の場合は、nが大きい(np=64>10で実用的には正規分布で近似できるとされる)ので、正規分布とします。 また、ここでは商品の差異ではなく、サイトの出来についての話とすれば、サイトを訪れる、5300人が属する集団と5200人が属する集団は同質とするのが妥当でしょう。 サイトの出来はアクセスしなければわからないからです。 したがって、質問の場合、σが共通で未知の、2群の母平均の差の検定(Z検定)ていいでしょう。 σが未知なので、標本分散からの推定を使うだけです。

fumikun2
質問者

お礼

ありがとうございました。 ようやく理解できました。 前者は 1.475 に、後者の方は 2.64 になったので、前者は仮説を棄却できず、また後者は対立仮説となることが理解できました。

関連するQ&A

  • 統計的推定法と統計的検定法の違いについて

     今大学で交通工学での交通統計の勉強をしているのですが、その中で出てくる「統計的推定法」「統計的検定法」の違いが未だに良く分かりません。  前者は「既にあるデータを集計して、信頼区間を求める」で、後者は与えられたデータを基に、妥当かどうかを判別するようですが、具体的に答えをどう求めたらよいか分かりません。教科書を見てもよく理解できないので、もしよければ参考になる本やサイトがありましたらお願いします。

  • 統計

    卒論のために、統計(検定?)を勉強しています。 データの数が多くなくて、2×2のχ二乗検定もしくはFisher解析をまず行いました。 その後、3群比較が必要になり、2×3の検定を行いたいのです。セルの期待度数が小さく、Fisher解析のほうがいいのかと思ったのですが、これは2×3はできないのでしょうか。 検討違いの質問内容でしたら、ご指摘下さい。 いろいろ本を見てみたのですが、 よくわからないのです、すいませんが よろしくお願い致します。

  • 統計の検定と信頼区間について

    統計学で検定,信頼区間について勉強しています。 参考書を読んで理解に努めているのですが,どうもよく分かりません。 <信頼区間> http://dl.cybernet.co.jp/matlab/support/manual/r2007/toolbox/matlab/data_analysis/?/matlab/support/manual/r2007/toolbox/matlab/data_analysis/bqm3cio-1.shtml 上記リンクにおける2次多項式の信頼区間について, 信頼区間とは,データを発生した真の回帰式のパラメータに対して, 推定したパラメータがどれだけ信頼できる値であるかを示しているという 解釈でよろしいのでしょうか? <検定>(http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node9.html) 回帰における検定で,回帰係数の真の値がゼロでないかどうかを調べる とあるのですが,なぜこれを調べるのでしょうか? また,検定は上記の信頼区間の推定とどう関っているのでしょうか?

  • アンケート調査の信頼度について

    こちらのカテゴリーでいいのか分かりませんが… アンケート調査をする場合、母体の数に対する抽出数によって信頼度(%)というのがあると思うのですが、それらが分かるサイトなどがあれば教えてください。 例えば、母体数1万人に対して、30%(3千人)を無作為抽出。 内70%(2100人)から回答が得られた場合、そのアンケートの結果は どれくらいの信頼度なのでしょうか? 数学・統計はまったくの不得手ですので、分かりやすいとありがたいです。

  • 統計力学と熱力学のちがいは?

    統計力学と熱力学って どんな本を開いても(多少の違いはあれど)同じようなことが書かれていますが 何がちがうんでしょう? 中には「統計熱力学」としてまとめているものも多いです ついでに、お勧めの統計熱力学の本などございましたら 紹介してください 購入の際の参考にさせていただきます

  • 検定統計量について

    検定統計量と検定について(http://www.aoni.waseda.jp/abek/document/t-test.html) 1. 検定の方法は,T検定,F検定,J検定などの手法をみかけるのですが,違いがいまいち 分かりません.これらの違いは,考える確率分布が違うということなのでしょうか? 2. 各検定法(T検定,F検定,J検定など)と検定統計量のかかわりがよくわからないのですが, たとえば,T検定をする場合の平均の検定統計量とF検定をする場合の平均の検定統計量 は同じなのでしょうか?   3. 検定についてまだよく分かっていないので,検定の仕方を正しく認識しているか怪しいですが, 検定は,仮説に応じて検定統計量を定義してから,その検定統計量を計算し, P値を求めることで仮説が有意か否か判定するのですよね? なので,最終的にどの検定(T,F,J検定)もP値を求めて有意か否か判定するので, 検定統計量さえ正しく定義できれば,T検定,F検定,J検定など,どの検定法 を使おうとひとつの検定の方法でどんな仮説の検定もできると考えてよいのでしょうか? それとも用途に応じて検定法を使い分ける必要があるのでしょうか? 回答よろしくお願いします。

  • 統計学に関する質問です。

    統計学に関する質問です。 1.統計書で「正規分布する母集団から独立に得たX1、X2、…Xn」という記載がありますが、ここでの「独立に得た」は具体的にどういう意味でしょうか? 2.『Q&Aで知る統計データ解析』という本に「測定値の独立性」に関する記載があり、「同じ被験者の反応が同一条件下で反復して測定される」場合、「観測値は独立とはいえない」といった解説がありました。この「観測値の独立性」とは具体的にどういう意味でしょうか?単一事例からベースラインをとり、その後介入期を設けて、それぞれから得た観測値を検定にかけることは統計誤用でしょうか? 以上、宜しくお願い致します。

  • 統計学の信頼係数について

    こんにちは、 統計学の区間推定?のところを勉強していたのですが、信頼係数というのがよくわかりません。信頼係数の定義というか意味はわかるんですけど、問題で出てきたときにどうやって求めたらよいのかがわからないんです。 例えば、Aクラスにおいて178人中42人が自転車通学の場合、自転車通学の生徒の比率を信頼係数90%で区間推定しなさいといわれた場合、 標本比率はp'=42/178=0.326(すいませんpハットの記号が出ないのでp'にしてあります) 信頼係数は90%=0.9=1-0.1 ここまではいいんですが、 この次の式が、 p'±z(0.05)√{p'(1-p')/n}=0.236±1.64√… となっていて……? このz(0.05)というのは、先ほどの信頼係数90% = 0.9 = 1-0.1 の0.1を2で割って出てきた0.05を使っているんですよね? だからもし信頼係数が95%なら95%=0.95=1-0.05よりz(0.025) ですよね?あってるでしょうか… それで、このz(0.05)とかz(0.025)とかいったものの実際の数値はどうやって出したらいいんでしょうか。標準正規分布表を使うんだろうとは思うんですけど、実際分布表の0.05のところを見てみても値は1.64にはなっていないし…。教えてください。よろしくお願いします。 ※わたしの教科書に載っていた表は原点からのF(x)までの確率を示すやつでした。↓ここのと同じです http://www.mbanavi.com/school/stat60.htm

  • 統計学2

    またまたすみませんが、教えて下さい。分からないんです 課題 7. あるテレビ番組の視聴率 p (0≦p≦1)を調べるために,アンケート調査を行ったところ, 60 人中 21 人が視聴したと答えた.   帰無仮説 H0: p= 0.26,対立仮説 H1: p≠ 0.26 について,有意水準 0.08 で仮説検定を行え. また,視聴率 p を信頼度 0.92 で区間推定せよ.   ただし,仮説検定と区間推定のどちらに対しても,ラプラスの定理(2項分布の正規分布による近似)を用いよ. 検定統計量(B')= 臨界値(棄却域の端の値)= 帰無仮説 H0は, 棄却されるor棄却されない、どちらか 信頼区間 [ , ] 誰か統計得意な人助けて下さい。お願いします!

  • 統計の質問です。

    統計の質問です。 本を見て行くうちに、正規分布の式が f(x)=(1/√2π σ)e^(-1/2)((x-μ)/σ)^2 と出てきたんですが、どういう根拠でこのような式になったのかの説明が全く記述されていません。 本屋に行って、誤差解析の本や、統計学の本を30冊ぐらいあさったのですが、この式の導出について書かれているものは、ひとつもありませんでした。 ネットでもさんざん探しましたが、それにまつわるいくつかのサイトに行っても、納得のいく導出は見つかりませんでした。(教えて!gooのサイトでも2つくらいありましたが、納得がいきませんでした。) ちなみに統計学についてはど素人です。二項分布や、ポアソン分布については導出の仕方が載っていたので、納得できました。しかし、この正規分布だけは、導出の仕方が載っていないのです。 統計に限らず、重要な公式らしいので、ちゃんと理解したいのです。 どなたか、わかりやすい説明で、教えていただければ幸いです