• 締切済み

A/Bテストの検定方法(カイ二乗検定)につい

仕事でweb制作を行っておりまして、A/Bテストの検定方法について質問です。 統計学超初心者です。 特定のwebページの特定箇所の文言について4パターンを作成し、 コンバージョン率の高いものを見つけるためにテストしています。 その結果が例えば下記のような形だったとします。 <結果> パターン名 / クリック数 / コンバージョン数 / コンバージョン率 A / 10000 / 20 / 0.200% B / 10500 / 23 / 0.219% C / 10800 / 25 / 0.231% D / 9980 / 21 / 0.210% ■質問1 4パターン同時に有意差を確認するには カイ二乗検定で4×2列の表で検定する、と理解していますが合っていますでしょうか? ■質問2 カイ二乗検定で4×2列の表で有意差があった場合、 4パターンでやった場合にバラつきがあった、というだけで、 各パターン個別の有意差については何も言及出来ない、と認識しています。 そこから最もコンバージョンが低いものだけを除いて、 3パターンだけの数字で再度カイ二乗検定(自由度2)したり(上記の結果だと、Aを除いた3パターン)、 上位2パターンだけを取り出し(上記の結果だとCとBだけ→自由度1)カイ二乗検定を行うことは意味があるでしょうか? カイ二乗検定という統計手法を使う上で、数学的な前提が崩れるため意味が無い計算なのか、 それとも、上記のようなパターンで4パターンでの検定を行った後に、 個別に検定を行うことが出来る/意味がありますでしょうか? ■質問3 二項検定・Z検定・二群の比率の差の検定は、 2パターンの比較にだけしか使えないという理解で良いでしょうか?

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 ご質問に出て来る最初の■より前の部分については、stomachmanには理解しがたいので無視いたします。  検定を行うに際して最も重要なポイントを外していらっしゃるように思います。それは、帰無仮説は何か、ということです。  検定というのは、帰無仮説から確率論を使って導ける確率的命題、たとえば「データをあるやり方で処理した数値が●以下になる確率はp以上である」に基づいて、実際のデータで●以下になるかどうかを調べる。●以下になったら何も言えない。さもなくば、帰無仮説が危険率(1-p)で棄却され、すなわち帰無仮説の否定が結論できます。(危険率は有意水準とも言う。)  ご質問に並べていらっしゃる「××検定」という名称は、この処理の「あるやり方」のことを指しているのですが、もちろん名称が付いているような既存の方法だけしか使えないというわけじゃありません。むしろ、現象の特徴を捉えるに適切な方法を考えて、それに合わせてデータを取るのが本来のやりかたです。  ところで、いくつかのグループについてのデータがあるときに、それらのうちの一対のグループを取り上げて検定する、ということを全ての対について行う手法は「多重検定」と呼ばれます。その際、同じデータを繰り返し使ったせいで、本来なら棄却されないはずの帰無仮説が棄却されてしまう、ということが生じやすくなる。その効果を打ち消すための補正が必要です。

関連するQ&A

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • --- カイ二乗検定 ---

    ある学校のA組・B組・C組で、インフルエンザの罹患者数について有意な差があるのか、また有意差があるのであれば、どの組とどの組に有意差があるのかを確認したいとします。 検定方法は次の通りで合っているでしょうか。 まず3群全体でPearsonのカイ二乗検定を行う(p<0.05で有意)。有意差があれば、A-B、B-C、A-Cで同様にカイ二乗検定を繰り返す。 このとき有意とするのは Bonferroni の補正により p<0.0166…(=0.05/3)の場合とする。    (例)ABC組におけるインフルエンザ罹患有りと無しの人数               有  無           A組  9   21            B組  5    25           C組  14   16

  • カイ2乗検定

    ご存知の方がおられましたら教えてください。 以下のような2×3表でカイ2乗検定を行う際に、 単純にA群とB群の差の有無を検定するだけでなく、 どこに差があるか検定する方法はあるのでしょうか? (例:好きという回答は有意差があって、普通の回答には有意差はない)    好き 普通 嫌い A群  100  120 30 B群  80  140 10

  • χ2(カイ2乗)検定とフィッシャーの直接確率検定

    統計学の素人です。 医学の臨床試験のデータに、p値についてχ2(カイ2乗)検定とフィッシャーの直接確率検定のふたつが記載してありました。 p値<0.05で有意差がある、と聞いていますが、上記のふたつの検定方法では、ともにp値<0.05で有意差あり、と考えてよいのでしょうか? それとも検定方法によって異なるのでしょうか。 ネットで調べてみたのですが、難しくてわかりませんでした。 上記のふたつにつきまして、どのような値で有意差ありになるのか教えていただけますとたいへん助かります。よろしくお願いいたします。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。

  • SPSSのカイ二乗検定について

    初歩的な質問になりますがもうしわけありません。 卒論で分析をしているのですが知識がありません。 ある尺度によって分けた高群と低群の間に、質問に対する回答(質問が4つで回答が5つの選択肢からひとつを選ぶもの、のそれぞれについて)に有意な差があるかどうかを調べるために、SPSSを使ってカイ二乗検定を行いました。 結果で有意な差があるかどうかはどこを見ればよいのでしょうか。 統計の授業など取っておらず、大変初歩的な質問かと思うのですが申し訳ありません。 超文系人間で数字が苦手なので優しく教えていただけるとありがたいです。

  • カイ2乗検定って何??;;

    タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<)) 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。 知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

  • カイ二乗検定の多重比較について

    SPSSで4×4の名義尺度のカイ二乗検定を行ったところ、Pearsonのカイ二乗検定で5%水準で有意差が出たと出力されました。 そこで質問です。 1.この結果は4×4のデータのどこかの組み合わせに差があるということを表している、と解釈していいのでしょうか? 2.差があるとすれば、どれとどれのデータの間の差なのか知りたいので、分散分析のように多重比較をする方法があるのでしょうか? ご指導お願いします。

  • エクセルでのカイ二乗検定の仕方について

    いつもご利用させて頂いております。 大変、親切に教えて頂けますので、ありがたいです。 さて、エクセルで、統計のカイ二乗検定のやり方を教えてください。 行いたいことは、 はじめる前と、終わりでの変化です。 カイ二乗検定で、「有意さがある」とうことは、どういうことでしょうか?? よろしくお願い致します。6才の子どもでも分かるようにお願い致します。 よろしくお願いします。