• 締切済み

信頼区間の求め方が分かりません

学校で出された問題ですが、全くわからないので お願いします。 ある町の駅で乗降客400人を任意に抽出して調べたところ、 196人がその町の住人であった。乗降客中、その町の住人 の比率に関する信頼区間を信頼係数99%で推定せよ。 どう解けばいいのでしょうか、どなたかお願いします・・。

みんなの回答

  • gootaroh
  • ベストアンサー率47% (396/826)
回答No.2

「信頼区間」とは、母集団(全体)の平均値や分散値などがあると考えられる区間のことです。よく、95%信頼区間、99%信頼区間などといいますが、それは、母集団(全体)の値がこの区間にある確率が95%や99%であることを表しています。言い換えれば「100回サンプリングしたら、95回(99回)はこの範囲内に値が当てはまる(という確率)」といえます。 簡単に言うと、「誤差の範囲」(許容できる誤差)ということです。 今回は、400人中196人だったので、その割合は「49.0%」でしたが、これでもって、乗降客のうちのその町の住人の割合は「常に49.0%」である、と結論付けるのは危険です。全数調査ではありませんので、当然誤差が生じます。その範囲(上限と下限)はどうか、というのを数学的に算出するわけです。 算式は次のとおりです。(Excel風に表記します) ・下限値 (町民数/乗降客数)-(1.96*SQRT((町民数/乗降客数)*(1-(町民数/乗降客数))/乗降客数)) ・上限値 (町民数/乗降客数)+(1.96*SQRT((町民数/乗降客数)*(1-(町民数/乗降客数))/乗降客数)) これは、信頼係数が95%の場合です。信頼係数が99%であれば、「1.96」を「2.58」に変えてください。実際の計算はご自分でどうぞ。 ちなみに、信頼係数が95%の場合は、「44.1%~53.9%」となります。つまり、100回サンプリングすれば、95回はこの「44.1%~53.9%」の範囲内に納まるはず、という意味です。 以下、厳密性には欠けますが、ダーツに例えますので、イメージしてみてください。 母集団(全体)の平均値(真の値)が「的の中心」で、標本の平均値(調査値)が「矢」だとします。そして、サンプリングを「矢を投げること」、信頼係数を「命中率」、回答率を「腕前」とします。 ではこの場合、信頼区間(誤差の範囲)は何に相当するでしょうか?そう、「的の大きさ」です。 さて、矢を投げて、的の中心に当てるのは難しいですが、的そのものに当てるのであれば、その的が一般的な大きさであれば、そんなに難しいことはないですよね。 しかし、的が小さい場合(信頼区間≒許容誤差が小さい場合)、的に当たれば、それは中心(真の値)に近いことを示しますが、命中率(信頼係数)は下がります。 この状態で命中率(信頼係数)を上げたければ、腕前(回答率)を上げるしかありません。 一方、同じ腕前(回答率)で命中率(信頼係数)を上げたければ、的を大きくすれば(信頼区間≒許容誤差を大きく取れば)よいのですが、それだと、的に当たったとしても、中心(真の値)からは遠いかもしれません(近いかもしれませんが、それは分かりません)。(ちなみに、先ほど「実際の計算はご自分でどうぞ」と言いましたが、信頼係数を95%から99%に上げるということは…?もうお分かりですね。) ざっくり言うと、こういう関係になっているのです。イメージできましたでしょうか? もっとも、実はあんまり正確な例えではないんですよね。というのは、信頼区間(許容誤差)の「場所」がちょっと違うのです。 「場所」とはどういうことかというと、上記のダーツの例では、信頼区間(許容誤差)を「的の大きさ」に例えました。これでは、矢を投げて(サンプリングして)、その矢(調査値)が的に当たるかどうか(信頼区間≒許容誤差の範囲内に納まるかどうか)という話になりますよね。でも、ちょっと違うのです。 本当は、誤差がある場所は「矢」(調査値)の方なのです。矢を中心に信頼区間(許容誤差)が設定され、投げると(サンプリングすると)、その許容誤差が、中心(真の値)を含むかどうか、というのが正しい理解なのです。 例え直すと、ダーツではなく、輪投げのイメージですね。つまり、輪の中心が「調査値」、輪の直径が「信頼区間(許容誤差)」、的棒が「真の値」というわけです。命中率が「信頼係数」、腕前が「回答率」であることは変わりません。 このごろ「内閣支持率が下がってきた」という世論調査をよく目にしますが、新聞等の世論調査でいつも思うのは、どの社でも信頼区間と信頼係数を載せていないということです。1ポイントや2ポイントの変化なんて許容誤差の範囲であり、前回調査における許容誤差を超えるような変化があって初めて「低下」や「上昇」といえると思います。さすがに今回は15ポイント前後下落しましたので「低下」といえると思いますが。いずれにせよ、参考値として信頼区間と信頼係数を載せればよいと思っています。(つまり、支持率は「25%」ではなく「22%~27%」という具合に。一般読者にとっても有意義です。もっとも、記事中に与えられたデータで、上記の式を使って自分で計算することもできますが、一般読者で上記の式を知っている人は少ないし、知っていても設問数が多ければ面倒、ということもあります。) いかがでしょうか?この回答が、ご理解の一助になれば嬉しいです。頑張ってください!

  • incd
  • ベストアンサー率44% (41/92)
回答No.1

その講義でどのような説明の仕方がなされているか分からないので概略のみ説明します。 問題の設定から、Xを、住民ならX=1, そうでなければX=0という値を取る確率変数として、Xはパラメータpのベルヌーイ分布に従うと仮定します。 比率pを196/400で推定します(これはpについての一致推定量です)。 次に、中心極限定理を使って n^(1/2)(196/400 - p) →d N(0, V(X)) V(X)はXの分散ですが、この値は分かっていません。 そこで、s^2 = (196/400)*(204/400)を代用します。s^2はV(X)の一致推定量です。 したがって n^(1/2)(196/400 - p)/s →d N(0, 1) こうして左辺の分布が求められたので、あとは Z(0.005)≦n^(1/2)(196/400 - p)/s≦Z(0.995) が信頼区間です。Zは標準正規分布です。

関連するQ&A

  • 統計学の信頼区間の問題について教えてください。

    Aを使用したときに不快感を覚える確立をpとする。 Aを使用した500人のうち、150人が不快感を覚えた。 これよりpを信頼係数95%の信頼区間で推定せよ。 という問題なのですが、どのようにといたらよいのでしょうか。 教えてください。

  • 信頼区間について・・・・・

    信頼区間について・・・・・ ベアリングの製造機械がある。この機械からつくる9個のベアリングの直径(mm) を測定して 7.01 6.96 6.96 7.02 6.93 7.03 6.91 7.06 6.94 を得た。直径は正規分布に従うと仮定して、平均直径μの信頼係数95%の信頼区間 を少数2桁まで求めよ という何が何だか分からない問題に苦戦しているので助けて下さい。

  • 推定区間について

    統計学の区間推定の問題について質問です。 ある生産現場で100個の製品を抽出して検査したところ、4個の不良品が見つかった。 この生産工場での不良率(P)を信用係数95%で区間推定せよ。 (注)√0.04×√0.96=0.196 この問題を教えて欲しいです!

  • 統計学の信頼係数について

    こんにちは、 統計学の区間推定?のところを勉強していたのですが、信頼係数というのがよくわかりません。信頼係数の定義というか意味はわかるんですけど、問題で出てきたときにどうやって求めたらよいのかがわからないんです。 例えば、Aクラスにおいて178人中42人が自転車通学の場合、自転車通学の生徒の比率を信頼係数90%で区間推定しなさいといわれた場合、 標本比率はp'=42/178=0.326(すいませんpハットの記号が出ないのでp'にしてあります) 信頼係数は90%=0.9=1-0.1 ここまではいいんですが、 この次の式が、 p'±z(0.05)√{p'(1-p')/n}=0.236±1.64√… となっていて……? このz(0.05)というのは、先ほどの信頼係数90% = 0.9 = 1-0.1 の0.1を2で割って出てきた0.05を使っているんですよね? だからもし信頼係数が95%なら95%=0.95=1-0.05よりz(0.025) ですよね?あってるでしょうか… それで、このz(0.05)とかz(0.025)とかいったものの実際の数値はどうやって出したらいいんでしょうか。標準正規分布表を使うんだろうとは思うんですけど、実際分布表の0.05のところを見てみても値は1.64にはなっていないし…。教えてください。よろしくお願いします。 ※わたしの教科書に載っていた表は原点からのF(x)までの確率を示すやつでした。↓ここのと同じです http://www.mbanavi.com/school/stat60.htm

  • 統計学≪信頼区間の幅≫の問題。

    統計学≪信頼区間の幅≫の問題。 母分散σ^2=9の正規母集団から大きさnの標本を抽出して母平均μの信頼係数99%の信頼区間を求めたい。その幅を1以下にするにはnをいくつ以上にすべきか。 という問題です。 excelでどれを使っていいかわからないし、手書きで途中の説明も加えよ、ということなんです。 excelのものをどう手書きで途中を加えればよいでしょうか。 答えも含めて解説していただけるとありがたいです。 よろしくお願いいたします。

  • 統計の検定と信頼区間について

    統計学で検定,信頼区間について勉強しています。 参考書を読んで理解に努めているのですが,どうもよく分かりません。 <信頼区間> http://dl.cybernet.co.jp/matlab/support/manual/r2007/toolbox/matlab/data_analysis/?/matlab/support/manual/r2007/toolbox/matlab/data_analysis/bqm3cio-1.shtml 上記リンクにおける2次多項式の信頼区間について, 信頼区間とは,データを発生した真の回帰式のパラメータに対して, 推定したパラメータがどれだけ信頼できる値であるかを示しているという 解釈でよろしいのでしょうか? <検定>(http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node9.html) 回帰における検定で,回帰係数の真の値がゼロでないかどうかを調べる とあるのですが,なぜこれを調べるのでしょうか? また,検定は上記の信頼区間の推定とどう関っているのでしょうか?

  • 信頼区間の求め方について

    以下の問題につきまして、解き方が分からず手も足も出ません。 ある正規母集団から取り出した標本サイズ32の標本を用いて、信頼水準95%で母平均を区間推定したところ、信頼下限が156、信頼上限が220となった。このとき、同じ信頼水準95%において、標本サイズを128とした場合の信頼上限はどのようになるか。ただし、標本サイズを変更しても、標本平均は変化しないものとする。 どのように解けばよいのでしょうか。どなたかご教授をお願い致します。

  • 標本分布が歪んでいる場合の区間推定について

    パラメータθの母分布に従う標本変数T(θ)の分布が歪んでいて、対称で峰のあるような分布に変換できないような場合の信頼区間を求める問題について疑問に思ったのですが、この場合信頼係数を1-εに設定したとき、下側信頼限界t_LをP(t_L≧T)=ε/2を満たすように求めるのは自然なのでしょうか?どこかで信頼区間が母数を含む確率を1-εに保ったまま、その信頼区間の幅を最小にするのが信頼区間の定義、と書いてあったのですが、標本分布が対称になっていなかったり、峰が中央にないような場合は区間幅が最小にならないケースも考えられると思うのですが。それとも真の母数ごとに異なる信頼区間の取り方を考えるのはやっかいだからε/2ずつになるようにするのでしょうか。 もともと二項分布の精密法による区間推定を考えていたのですが、この場合母比率pが非常に小さいか、または1に近い場合ってかなり分布に偏りができます。このような場合の区間推定も上記のような方法で得る公式が書いてあるのですが、本当に正しいのでしょうか。

  • 二項分布の信頼区間

    母数pの二項母集団Bi(1,p)からn=50の大きさの標本を抽出して、0が23、1が27であった。pの信頼係数95パーセントの区間を求めよ。 という問題で、(中心極限定理による正規近似)というヒントが付いているのですが、どこから正規近似したらいいのかがわからないので、全くわかりません。 いきなり正規分布の様に見て 平均=0.54 標本分散=0.46^2*27/49 としてt分布から求めようとしてみましたが、うまく行きませんでした。 どういう流れでとくのか教えていただけないでしょうか。 ちなみにZ0.025=1.960です

  • 統計学の正規分布、信頼区間について質問です。

    問1、ある錠剤のA成分の含有量を9回測定して標本平均6.85mg、標本標準偏差0.006mgを得た。測定値は正規分布に従うと仮定して、A成分の含有量の真の平均を95%信頼区間で推定せよ。 問2、同年齢の身長は正規分布に従っていると考えられる。15歳の男子10人を無作為抽出して測定したところ169,155,163,164,151,162,160,150,156,150の結果を得た。15歳の男子の平均身長および分散を95%信頼区間で推定せよ。 この二つの問題がいくら考えてもわからないのでわかる方居ましたら解答・解説をご教示願います。よろしくお願いします。