• ベストアンサー
  • 困ってます

統計学の第2種の過誤(対立仮説が説が正しいのに、帰無仮説が棄却できない

統計学の第2種の過誤(対立仮説が説が正しいのに、帰無仮説が棄却できない)に関する質問です。たいていの統計学の入門書に出ている図なのですが、2つの分布が重なり合った部分が色塗りされていて、「この部分が第2種の過誤です」という説明がなされています。が、その部分がなぜ第2種の過誤を意味しているのか、さっぱりわかりません。どなたか、初心者向けにわかりやすく噛み砕いて教えていただけないでしょうか?そもそもどの図を指しているのかイメージしにくいかもしれませんが(言葉で説明しにくい)、「あー、あの図のことか」と理解していただいた方がいらっしゃたら、お願いします。

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1

ああ,分かりました。 あれは妙なところに出てくるので分かりにくいんですよね。統計学単独だと上手に説明できていなかったりします。 たとえば,インフルエンザにかかると高熱が出る!というのは納得できると思います。 でも,熱の出方は人によりますよね。 熱をx軸(横軸)として,低いほうを左,高いほうを右とします。 インフルエンザの患者の熱を調べれば,ベル型の分布が右側に1個できますね。このグラフを仮にAとしておきましょう。 おそらくAの中心(一番高いところ)は,39度ぐらいでしょうか。そのあたりを中心に,インフルエンザでも負けない人は37度台かもしれませんし,死にそうな人は41度を超えるかもしれません。 危険率の範囲(正確な表現ではありませんが要するにグラフが書いてあるところと思ってください)としては,Aが37度~42度としておきます。 これ以下ならA棄却です。さすがに36度台ならインフルエンザじゃないだろう,というわけです。 さて,今度はインフルエンザでない人の体温をとって分布を描きBとしようと考えます。 これまたばらばらで,私平熱低いのよねと言う人は35度台かもしれませんし,なんか日ごろから熱い人は37度台かもしれません。体調不良とか,軽い風邪なら37.9度ぐらいもあるかもしれません。 こちらの危険率の範囲としては35度~38度にしておきます。これ以上ならB棄却です。 とすると,AとBの重なっているところ(37度~38度)は,「インフルエンザでも見られる体温だし,平熱でも見られる体温だ」ということができます。 ここまで準備してきて,帰無仮説「平熱の範囲内であってインフルエンザではない」,対立仮説「平熱ではなくインフルエンザである」とします。 いま一人の患者が来て,本当はインフルエンザだとします。この患者が体温37.6度だとすると,ABの重なっている部分になりますね。 Aの範囲には入っているので,確かに対立仮説は採択できます。インフルエンザでも低めならそういう人はいるなあということです。 しかし,Bの範囲でもあるので,「平熱の範囲である」を棄却できなくなります。平熱がそれぐらいの人もいないわけでもない,となってしまうからです。(平熱ではないとはいえない) これが,もっと高熱になって39度なら,Bのグラフは低くなっていますから,危険率1%でも帰無仮説を棄却できますね。すなわち対立仮説を採択して帰無仮説を棄却(「平熱であるとはいえない」)できるわけです。 ざっと説明してみましたがどうでしょうか。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

スッキリわかりました!噛み砕いた説明有難うございました。こういう説明は本当に助かります。

関連するQ&A

  • 帰無仮説と第一種過誤について

    確率・統計の帰無仮説と第一種過誤についてお尋ねします。 私の理解が正しいかどうかなのですが。 帰無仮説は、その仮説が否定される(あるいは成立が認められない)ことを目指して作る仮説であり、その仮説が成立していると仮定すると手持ちのデータが大変レアなケース(5%とか)で生じていることになる場合はその仮説が不成立となる(目標達成)。 第一種過誤は、その仮説が正しい(成立している、捨てることができない)のに捨てる(棄却する)誤りであり、仮説が否定されることを目指すので目的が達成できないのに達成していると言ってしまう過誤である。勇み足のような過誤 このような理解でもいいのでしょうか。いつも引っ掛かるのが”この仮説が正しい”というところで、仮説が否定されることを目指すのだからそれが”正しい”と考えると仮説が成立しないこと(目的達成)を意味しているように思えてしまうのです。帰無仮説が成立しないというのも本望なわけですね。 何か覚え方があるでしょうか。いつも混乱してしまうのですが。

  • 第一種過誤・第二種過誤

    心理学系出身の者です。 統計における第一種過誤とは、母集団においては差が無く、帰無仮説を棄却できないのが本来正しいのに、標本では差があるように見えて対立仮説を採択してしまうこと。 統計における第二種過誤とは、母集団においては差があり、帰無仮説を棄却するのが本来正しいのに、標本では差が無いように見えて対立仮説を採択できないとしてしまうこと。 で、ここからが質問ですが、なぜ第一種がそれで、第二種があれなのでしょうか。 学生の時には丸覚えしたはずなのに、最近統計の本を読んだら丸忘れしていたような気がしました。この機会に「あえて第一種である理由」とまとめて覚え直したいと思ったのですが、なかなかいいソースが見つからず、ここに質問させていただく次第です。 宜しくお願いいたします。

  • 検定における対立仮説

    コインを10回投げる 表の回数を観察 生起確率は0.5=1/2 結果・・・・表=0回だった! ₁₀C₀×0.5⁰×(1-0.5)¹⁰=0.00097 帰無仮説 表がでる確率は1/2 対立仮説  表がでる確率は1/2より小さい。 5%で検定をかけたとき、帰無仮説は棄却できると思いますが 対立仮説は”1/2ではない”とすべきか ”表がでる確率は1/2より小さい。”とすべきかどちらが適切なのでしょうか?

  • 統計 検定の仮説の質問です。

    検定の最初に仮説を立てます。例えば、下記のように仮説を立て検定の結果、対立仮説が採用されたとします。 ・帰無仮説H0:μ1=μ2       ・対立仮説H1:μ1≠μ2・・・採用 しかし、帰無仮説は最終的に棄却されるべき仮説なので、μ1=μ2であるかμ1≠μ2によって、結論が変りますね(悪く言えば、恣意的に結論を変えられます)。 検定における仮説の立て方について、不変的な基準はあるのでしょうか? 宜しくお願い致します。

  • 統計用語(帰無仮説、有意水準)の使い方

    こんばんは、皆さん。 統計のテキストを読んでいますが、用語の使い方がしっくり来ません。 統計用語の使用方法について、次のような使い方は適切でしょうか? 言葉の使い方でおかしいところがあればご指摘ください。 帰無仮説を「推定母平均(母集団の平均値)は8である」と定義して、t検定を実施した。 採取したサンプルは1,2,3,4,5,10であった。 この時、推定母平均に基づくtは2.94484…であり、t分布表に基づくtは2.571であった。 よって、帰無仮説は有意水準5%で棄却される。 疑問点は次の箇所です。 ・「帰無仮説」の使い方 ・「推定母平均」という単語(googleではほとんど引っかからない) ・「有意水準」は「100-危険率」か?「有意水準=危険率」か? ・帰無仮説が棄却できない場合、「採択される」ことにしてしまってよいか? ・「帰無仮説が棄却される」ということは、「推定母平均は8ではない」と同義でよいか? ご教授お願いします。

  • 第2種の過誤と検出力、標本サイズ

    前回EPSカード実験の質問をした者です。 今回はその結果処理における統計処理にわからないところが出てきたので質問します。 5種類のカードを使って、それを見ずにカードの記号があたるか、あたらないかという検査をしました。試行数は250回です。偶然当たる確立pは5分の1、つまり0.2です。 ここでの帰無仮説はp=0.2で、有意水準は0.05です。 二項検定で、あるサンプルが棄却域を外れ、帰無仮説が棄却されませんでした。つまり、そのサンプルの正答率は偶然ではなかったのです。(回答率が高いほうで) ここで帰無仮説を採択したのですが、第2種の過誤の可能性がありますよね? 教えてほしいこと 1)帰無仮説を棄却できる確率、検定力の計算方法を教えてください。エクセルなどでできるのならば、その方法も教えてください。また、どのくらい検出力が低ければ採択しても問題はないのですか。 2)標本サイズが大きければ誤差は少ないのですよね?どれくらい大きければよいのか、その計算方法と共に教えてください。 実験の情報 先ほどのサンプル 250試行中、65回正答した。 足りない情報があれば補足します。なにせ、ほとんど理解していないので・・・。よろしくおねがいします。

  • 統計解析法

    統計解析手法の検定についての質問です。 2つの母平均の差の検定の場合です。 帰無仮説H0:μ1=μ2 対立仮説H1:μ1≠μ2とします。 帰無仮説が棄却された場合は結論として対立 仮説が成り立ち、第1種の過誤はαであり、 このケースは問題ありません。 しかし、帰無仮説が棄却されない場合、第2 種の過誤の問題があり、積極的に結論として 帰無仮説が成り立つとは言えません。 上記問題は、2つの母平均の差の検定の手法を 使って、積極的に2つの母平均に差が無いと言 う結論を統計的に導き出す事の障害になります。 2つの母平均の差の検定の手法をうまく工夫 する事、又は、別の手法で、2つの母平均に差 が無いとの結論を統計的に導く事は出来な いでしょうか? ご教授の程宜しくお願い致します。

  • 統計学の仮説検定は、両側検定しかありえないのでは?

    統計学の仮説検定では、両側検定しかありえないのではないかと考えますが、ご意見をお聞かせ下さい。 コイン投げにおいて、表が出る確率をP(H)、裏が出る確率をP(T)とします。 帰無仮説が「P(H)=0.5」である場合、対立仮説を「表が出やすい。P(H)>0.5」とすると片側検定、「コインに偏りがある。P(H)>0.5またはP(T)>0.5」とすると両側検定と説明されます。帰無仮説は同じだでれども、対立仮説が何であるかによって片側検定か両側検定かが決まる、という説明が少なくとも2つの教科書に書かれています。 しかし私は、帰無仮説と対立仮説は互いに排反で、かつ2者で標本空間をカバーし尽くせる(起こりうる全ての事象をカバーできる)ものでなければいけない、と思います。 帰無仮説「P(H)=0.5」に対する対立仮説は「コインに偏りがある。P(H)>0.5またはP(T)>0.5」であるべきだと考えます。そして、「P(H)=0.5」とP(H)の値が特定の1つの値であれば、コインを投げる回数が決まれば(例えば10回)、表が出る回数(0~10回)の確率分布を得ることが可能なので、検定できるわけです。 対立仮説を「表が出やすい。P(H)>0.5」とするのであれば、帰無仮説は「P(H)<=0.5」であるべきだと思います。そうでないと標本空間をもれなく考慮したことになりません。ところが、P(H)=0.5はさておき、P(H)<0.5のもとでは、P(H)の値が無数にあります。ということは、例えば10回中表が0回の確率は無数にあります。10回中表が1回の確率も同様です。したがって、表が出る回数(0~10回)の確率分布を得ることができないので、検定できません。 以上の理由で、統計学の仮説検定では、両側検定しかありえないのではないかと考えますが、ご意見をお聞かせ下さい。

  • 統計の問題【至急お願いします】

    統計の問題にほとんど手が出ません。 お恥ずかしいですがよろしくお願いします。 x1,x2,…,xnが平均μ、分散1の正規分布N(μ,1)をしている母集団からの大きさnの無作為標本であるとする。x^-=Σ[i=1→n](xi/n)と置く。帰無仮説H0:μ=0を有意水準0,05で検定する。回答に必要な記号は適宜説明して用いよ。 標準正規分布上側確率0.025の点は1.96であることを用いよ。 1)対立仮説H1:μ≠0とした場合およびμ>0とした場合の棄却域を与えよ。 2)検出力について一般的に説明し、2)で与えた2つの棄却域についてμ>0の時の検出力と比較せよ。 3)x^-の値が正であることを観測してから対立仮説をμ>0とする方法について考えを述べよ。 自作解答 2)検出力とは、対立仮説H1が正しい時に正しく仮説を棄却する確率のことを言う。 検出力=1-(第二種の過誤を犯す確率)

  • 統計 仮説の立て方

    統計学のカテゴリがないようなのでこちらで質問させていただきます。 「二つのグループがあり、一つ目は10人の非喫煙者、二つ目は10人のヘビースモーカーである。二つのグループは、ベースラインとしてBMIの値を調べ、六年後にもう一度BMIの値を調べている」 「データは一年目のそれぞれのグループのBMIの値、六年目のそれぞれのグループのBMIの値、それぞれのグループ内でのBMIの値の変化した値がある」 上記の条件下で喫煙がBMIに関係しているかどうかの仮説を立てたいのですが、どうやって仮説を立てて良いのか迷っています。 私が考えているのは、帰無仮説(喫煙はBMIの変化に関係ない)、対立仮説(喫煙はBMIの変化に関係する)なのですが、それぞれ 帰無仮説=一つ目のグループのBMIの変化した値の平均 = 二つ目のグループのBMIの変化した値の平均、 対立仮説=一つ目のグループのBMIの変化した値の平均 < 二つ目のグループのBMIの変化した値の平均 で仮説を立てて良いのでしょうか?