• 締切済み
  • すぐに回答を!

信頼区間の求め方が分かりません

学校で出された問題ですが、全くわからないので お願いします。 ある町の駅で乗降客400人を任意に抽出して調べたところ、 196人がその町の住人であった。乗降客中、その町の住人 の比率に関する信頼区間を信頼係数99%で推定せよ。 どう解けばいいのでしょうか、どなたかお願いします・・。

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数16274
  • ありがとう数10

みんなの回答

  • 回答No.2

「信頼区間」とは、母集団(全体)の平均値や分散値などがあると考えられる区間のことです。よく、95%信頼区間、99%信頼区間などといいますが、それは、母集団(全体)の値がこの区間にある確率が95%や99%であることを表しています。言い換えれば「100回サンプリングしたら、95回(99回)はこの範囲内に値が当てはまる(という確率)」といえます。 簡単に言うと、「誤差の範囲」(許容できる誤差)ということです。 今回は、400人中196人だったので、その割合は「49.0%」でしたが、これでもって、乗降客のうちのその町の住人の割合は「常に49.0%」である、と結論付けるのは危険です。全数調査ではありませんので、当然誤差が生じます。その範囲(上限と下限)はどうか、というのを数学的に算出するわけです。 算式は次のとおりです。(Excel風に表記します) ・下限値 (町民数/乗降客数)-(1.96*SQRT((町民数/乗降客数)*(1-(町民数/乗降客数))/乗降客数)) ・上限値 (町民数/乗降客数)+(1.96*SQRT((町民数/乗降客数)*(1-(町民数/乗降客数))/乗降客数)) これは、信頼係数が95%の場合です。信頼係数が99%であれば、「1.96」を「2.58」に変えてください。実際の計算はご自分でどうぞ。 ちなみに、信頼係数が95%の場合は、「44.1%~53.9%」となります。つまり、100回サンプリングすれば、95回はこの「44.1%~53.9%」の範囲内に納まるはず、という意味です。 以下、厳密性には欠けますが、ダーツに例えますので、イメージしてみてください。 母集団(全体)の平均値(真の値)が「的の中心」で、標本の平均値(調査値)が「矢」だとします。そして、サンプリングを「矢を投げること」、信頼係数を「命中率」、回答率を「腕前」とします。 ではこの場合、信頼区間(誤差の範囲)は何に相当するでしょうか?そう、「的の大きさ」です。 さて、矢を投げて、的の中心に当てるのは難しいですが、的そのものに当てるのであれば、その的が一般的な大きさであれば、そんなに難しいことはないですよね。 しかし、的が小さい場合(信頼区間≒許容誤差が小さい場合)、的に当たれば、それは中心(真の値)に近いことを示しますが、命中率(信頼係数)は下がります。 この状態で命中率(信頼係数)を上げたければ、腕前(回答率)を上げるしかありません。 一方、同じ腕前(回答率)で命中率(信頼係数)を上げたければ、的を大きくすれば(信頼区間≒許容誤差を大きく取れば)よいのですが、それだと、的に当たったとしても、中心(真の値)からは遠いかもしれません(近いかもしれませんが、それは分かりません)。(ちなみに、先ほど「実際の計算はご自分でどうぞ」と言いましたが、信頼係数を95%から99%に上げるということは…?もうお分かりですね。) ざっくり言うと、こういう関係になっているのです。イメージできましたでしょうか? もっとも、実はあんまり正確な例えではないんですよね。というのは、信頼区間(許容誤差)の「場所」がちょっと違うのです。 「場所」とはどういうことかというと、上記のダーツの例では、信頼区間(許容誤差)を「的の大きさ」に例えました。これでは、矢を投げて(サンプリングして)、その矢(調査値)が的に当たるかどうか(信頼区間≒許容誤差の範囲内に納まるかどうか)という話になりますよね。でも、ちょっと違うのです。 本当は、誤差がある場所は「矢」(調査値)の方なのです。矢を中心に信頼区間(許容誤差)が設定され、投げると(サンプリングすると)、その許容誤差が、中心(真の値)を含むかどうか、というのが正しい理解なのです。 例え直すと、ダーツではなく、輪投げのイメージですね。つまり、輪の中心が「調査値」、輪の直径が「信頼区間(許容誤差)」、的棒が「真の値」というわけです。命中率が「信頼係数」、腕前が「回答率」であることは変わりません。 このごろ「内閣支持率が下がってきた」という世論調査をよく目にしますが、新聞等の世論調査でいつも思うのは、どの社でも信頼区間と信頼係数を載せていないということです。1ポイントや2ポイントの変化なんて許容誤差の範囲であり、前回調査における許容誤差を超えるような変化があって初めて「低下」や「上昇」といえると思います。さすがに今回は15ポイント前後下落しましたので「低下」といえると思いますが。いずれにせよ、参考値として信頼区間と信頼係数を載せればよいと思っています。(つまり、支持率は「25%」ではなく「22%~27%」という具合に。一般読者にとっても有意義です。もっとも、記事中に与えられたデータで、上記の式を使って自分で計算することもできますが、一般読者で上記の式を知っている人は少ないし、知っていても設問数が多ければ面倒、ということもあります。) いかがでしょうか?この回答が、ご理解の一助になれば嬉しいです。頑張ってください!

共感・感謝の気持ちを伝えよう!

  • 回答No.1
  • incd
  • ベストアンサー率44% (41/92)

その講義でどのような説明の仕方がなされているか分からないので概略のみ説明します。 問題の設定から、Xを、住民ならX=1, そうでなければX=0という値を取る確率変数として、Xはパラメータpのベルヌーイ分布に従うと仮定します。 比率pを196/400で推定します(これはpについての一致推定量です)。 次に、中心極限定理を使って n^(1/2)(196/400 - p) →d N(0, V(X)) V(X)はXの分散ですが、この値は分かっていません。 そこで、s^2 = (196/400)*(204/400)を代用します。s^2はV(X)の一致推定量です。 したがって n^(1/2)(196/400 - p)/s →d N(0, 1) こうして左辺の分布が求められたので、あとは Z(0.005)≦n^(1/2)(196/400 - p)/s≦Z(0.995) が信頼区間です。Zは標準正規分布です。

共感・感謝の気持ちを伝えよう!

関連するQ&A

  • 信頼区間はなぜあのように選ぶのか?

    信頼区間(や推定区間)はなぜ教科書に書かれているような取り方をするのですか? 区間は要は推定量が95%(等の信頼率)の確率で、その中に入るような区間であればい訳ですが、 そのような区間は無数にあるのでは?

  • 統計学の信頼区間の問題について教えてください。

    Aを使用したときに不快感を覚える確立をpとする。 Aを使用した500人のうち、150人が不快感を覚えた。 これよりpを信頼係数95%の信頼区間で推定せよ。 という問題なのですが、どのようにといたらよいのでしょうか。 教えてください。

  • 信頼区間について・・・・・

    信頼区間について・・・・・ ベアリングの製造機械がある。この機械からつくる9個のベアリングの直径(mm) を測定して 7.01 6.96 6.96 7.02 6.93 7.03 6.91 7.06 6.94 を得た。直径は正規分布に従うと仮定して、平均直径μの信頼係数95%の信頼区間 を少数2桁まで求めよ という何が何だか分からない問題に苦戦しているので助けて下さい。

  • 信頼区間0%

    統計でよく用いられる信頼区間についての質問です。 95%信頼区間の意味は「真の値を95%の確立で含んでいる区間」ではなく、「100回中95回は真値を含む」という意味であることはなんとなく理解出来ているつもりでいるのですが・・・。 リスク差の信頼区間を出す問題なのですが、 「0%信頼区間は何を意味しているのか」、という意地悪な質問をされて困っています。 分かる方は是非教えてください! よろしくお願い致します。

  • 信頼区間推定方法

    95%信頼区間の推定方法に付いての質問です。 信頼区間推定の計算式として下記の2通りの式を見掛けます。 1)信頼区間 = 標本平均 ±(t(95%) × 標本標準誤差 ) 2)信頼区間 = 標本平均 ±( 標準偏差 × 1.96 ) 2通りの式で同一標本の信頼区間推定してみるとそれぞれ 異なる区間が算出されます。 どちらの式を用いるべきなのでしょうか? また、なぜ結果の異なる計算式が並存するのでしょうか?

  • 統計学≪信頼区間の幅≫の問題。

    統計学≪信頼区間の幅≫の問題。 母分散σ^2=9の正規母集団から大きさnの標本を抽出して母平均μの信頼係数99%の信頼区間を求めたい。その幅を1以下にするにはnをいくつ以上にすべきか。 という問題です。 excelでどれを使っていいかわからないし、手書きで途中の説明も加えよ、ということなんです。 excelのものをどう手書きで途中を加えればよいでしょうか。 答えも含めて解説していただけるとありがたいです。 よろしくお願いいたします。

  • 信頼区間の「まるめ」について

    統計で信頼区間を求めています。 オッズ比を求めた場合の95%信頼区間です。 例えば,「0.093~0.368」だと→丸めて「0.1~0.4」となると思います。 同様に「0.523~0.991」だと→丸めて「0.5~1.0」となります。 1.0を含む項目を除外としたいので,この作業をしています。 単変量解析でオッズ比や95%信頼区間,P値を求めて,除外項目を割り出し, 次の工程へ進みたいのですが,後者の場合の丸め「1.0」が腑に落ちません。 と言いますのも,この場合は真の区間を含むために四捨五入ではなく・・・ と聞いたことがあるからです。 このことについてご教授いただければと思います。 宜しくお願いします。

  • 信頼区間

    信頼区間の求め方が全くわからないので教えてください! 50人の患者にある新薬を投与したところ、有効と判定された患者は30人であった。 このとき、有効率の両側95%信頼区間を求めよ。 どなたか解説お願いいたします。

  • 90%の信頼区間における区間推定

    統計学の区間推定に関する質問です。 このとき、標本平均は標準正規分布に従っているものとします。 95%の信頼区間の場合、標準正規分布から1.96のときちょうど0.9750なので、-1.96<X<1.96と割り出すことができますよね。 ところが90%の信頼区間の場合、ちょうど0.9500になる値がありません。 これに近い値では0.9495(1.64)と0.9505(1.65)とがありますが、どちらも0.9500との差は0.0005ですよね。 この場合、1.64と1.65のどちらの値を採用すればよいのですか?

  • 統計の検定と信頼区間について

    統計学で検定,信頼区間について勉強しています。 参考書を読んで理解に努めているのですが,どうもよく分かりません。 <信頼区間> http://dl.cybernet.co.jp/matlab/support/manual/r2007/toolbox/matlab/data_analysis/?/matlab/support/manual/r2007/toolbox/matlab/data_analysis/bqm3cio-1.shtml 上記リンクにおける2次多項式の信頼区間について, 信頼区間とは,データを発生した真の回帰式のパラメータに対して, 推定したパラメータがどれだけ信頼できる値であるかを示しているという 解釈でよろしいのでしょうか? <検定>(http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node9.html) 回帰における検定で,回帰係数の真の値がゼロでないかどうかを調べる とあるのですが,なぜこれを調べるのでしょうか? また,検定は上記の信頼区間の推定とどう関っているのでしょうか?