- ベストアンサー
統計学
説明するのが大変なので、まず問題を載せます。 「ある政党の関係者は、その党のの支持率が少なくとも30%はあると主張している。今、全有権者の中から無作為に選ばれた1600人の調査では、その政党の支持者は415人だった。その政党の関係者の主張は正しいか?有意水準1%で検定せよ」 とあるのですが、自分なりに途中までやってみたのですが、よくわかりません。この後どうすればよいか、以下の回答が間違ってるなど、ありましたらお願いします。 帰無仮説 H0:P=30%(0.3) 対立仮説 H1:P<30%(0.3) 標準偏差 √{(0.3*(1-0.3))/1600} =0.011456 有意水準1%で左側検定なので 正規分布より2.3263という値をとるのは 分かったのですがこの後どうすればよいでしょう?その前にここまではあってるのでしょうか? 返事待っています。お願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
こんにちは。 帰無仮説と対立仮説には、 もんだいありません。 さて、検定するために、検定値が必要なのですが、 平たく言ってしまえば、この検定値で何を見ているかといえば、主張である30%と、実際の1600人の調査~得られたデータが支持するところの割合との差が、”誤差”の範囲におさまるか、おさまらないかといったことです。 誤差の範囲におさまるということは、データは30%いう主張を反駁できない範囲であるということで、帰無仮説を採択するということです。 さて、 ここで、 検定値をZと呼ぶことにしましょう。 このZ値は((415/1600)-0.3)/ 標準偏差 で求められます。 そして、このZ値が、2.3263よりも小さければ、誤差の範囲におさまったということになります。 ( このZ値は データと主張の差 が標準偏差と比べて、どれくらい大きいかということを見ているわけですからね。) この標準偏差は love mu-minさんのおっしゃるとおりです。 Z値を計算して、 2.3463という基準値(有意水準1%という基準から得られた値)と比べてください。 帰無仮説を棄却する結果になると思います。すなわち、政党関係者の主張は有意水準1%をもって、棄却することができます。(=間違っている可能性が非常に高い) ちなみに、love mu-minさんは片側検定をなさっていますが、 私だったら、 帰無仮説 H0:P /=/ 30%(0.3) (イコールではない) 対立仮説 H1:P<30%(0.3) という両側検定にしますね。なぜなら、30%という主張よりも割合が高くて間違っているのか 小さくて間違っているのかということを判断する材料はありませんからね。このデータはたまたま25.9パーセントという30%よりも小さい値が得られる結果になっただけかもしれませんからね。 片側検定か両側検定か、見分けるのが難しい時もたくさんあ ります。がんばってください。
その他の回答 (1)
- stomachman
- ベストアンサー率57% (1014/1775)
受験勉強からちょっと離れて、処理手順の本来の意味を考えてみましょうよ。 データをとってみたら、n=1600においてm=415だった。(m/nはx=0.3よりちょっと小さい。) 「真の支持率が0.3以上なのに偶然サンプルに偏りができてn=1600においてm=415になった」という事がちょいちょい生じるものだろうか? という問題です。 帰無仮説:真の支持率がxであるとする。 を前提として 「党員から無作為抽出されたn人について調べたとき、m人が支持である確率P(m,n)は幾らか。」 という問題を考えます。で、nがうんと大きい時にはP(n,m)が(n/m)を変量とする正規分布で近似できる(大数の法則)。だから正規分布で代用しちゃえ。 おっとと、これじゃすっ飛ばし過ぎです。 本来調べたいのは「真の支持率はx以上である。」かどうかじゃありませんか。でもこれだとP(n,m)を具体的に計算する手段がない。しょうがないんで、 「帰無仮説:真の支持率がxであるとする」 で代用したのです。帰無仮説というものはこのように、仮説から具体的な確率あるいは分布が計算できなくてはどうしようもない。ですから例えば「真の支持率はxでないとする。」なんてのは帰無仮説として役に立ちません。 真の支持率が0.3である母集団から1600人のサンプルを取ったとき、415人以下が支持である確率Q(415,1600) Q(415,1600)=ΣP(j,1600) (j=415,414,....,0) がどのくらいなのか。ここで上記の正規分布による近似を利用させてもらう。正規分布(平均0,標準偏差1)の表を利用するには t=|(n/m-x)/σ| の所を見れば良い。すると正規分布においてtより小さい値が生じる確率が幾らであるかが書いてあります。これがQ(415,1600)の近似値です。 でも、Q(415,1600)が0.01より大きいかどうかだけを知るには、逆に累積確率表から0.01になるtの値が幾らであるかを調べ、そのtが|(n/m-x)/σ|より大きいかどうかを考えても良いわけです。 後者の方法なら「Qが0.01になるtの値」だけ分かれば良いので、幾つかのよく使う所(0.01,0.005,0,0001など)をメモしておけば累積度数表まるごとは必要ない。実務ではこっちのほうが便利ですね。 いずれにせよ、 もしQ(415,1600)が0.01より小さかったら、こんなことちょっと起こりそうにない。だから帰無仮説がウソっぽい。いや勿論、帰無仮説がウソと言い切るのが間違っている可能性(危険率)がQ(415,1600)程度はあるけどね。 つーわけで、「帰無仮説は危険率0.01以下で棄却できる」という結論になる。そして「真の支持率が0.3である」と仮定してすら、あり得そうにないぐらい少ないヒトしか支持していないという調査結果が出たのだから、「真の支持率は0.3以上である」は当然もっとウソっこい。ゆえに棄却。(片側検定を使う理由はここにあります。) だから「支持率は0.3以上である、だなんてウソでしょお」と(危険率0.01以下で)言える。 もしQ(415,1600)が0.01より大きかったら、帰無仮説を「採択」する。なんてこと、やっちゃいけません。 だってこんなデータから一体どうして 「真の支持率は0.3001でも0.29999でもなく、0.3丁度である」 なんてことが言えるでしょうか。おかしいですね。 言えるのはせいぜい 「データは帰無仮説と矛盾していないようだ(だけど、帰無仮説が正しいなんて言えない)」 というだけのことです。はてこの文は一体何を言ってるのでしょうか。意味のあることは何も言ってないですね。結局素直に「何も言えない」とするのが正しいんです。 帰無仮説なるものは「採択」されることは絶対にあり得ません。お間違いなきよう。(でもこんな基本中の基本を間違えてる「教科書」すらあるんで要注意です。) つまり、帰無仮説は棄却されたときにだけ意味がある。だから「帰無仮説」と呼ばれます。
お礼
わかりやすい説明ありがとうございます。 一つ質問なんですが 「支持率が少なくとも30%はあると主張している」 ってことから 片側検定にするのは良くないのでしょうか? 「少なくても30%」→「30%以上は、あってもかまわない」って事から、片側検定にするのは良くないのでしょうか?