• ベストアンサー
  • 困ってます

信頼区間推定方法

95%信頼区間の推定方法に付いての質問です。 信頼区間推定の計算式として下記の2通りの式を見掛けます。 1)信頼区間 = 標本平均 ±(t(95%) × 標本標準誤差 ) 2)信頼区間 = 標本平均 ±( 標準偏差 × 1.96 ) 2通りの式で同一標本の信頼区間推定してみるとそれぞれ 異なる区間が算出されます。 どちらの式を用いるべきなのでしょうか? また、なぜ結果の異なる計算式が並存するのでしょうか?

noname#230358

共感・応援の気持ちを伝えよう!

  • 回答数4
  • 閲覧数501
  • ありがとう数4

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.4
noname#230359

標準正規分布表を確認してください。 95%又は半分の47.5% 記載方法を変えると0.95又は0.475です。 0.475のZは1.96です。 一般的に1σは70%、2σは95%、3σは99.7%と記載してますが、95%は正式には2σではなく1.96σです。 1σも同様に1では有りません。 如何でしょうか。 宜しく。 追加;サンプリング測定結果の平均値、標準偏差にも信頼区間があります。 これにのめり込むと、実験計画法までのめりこみますよ。 記載方法が異なるだけで、どちらも95%の確立だと思います。 どういうわけか、区間推定は95%を使いますね。推定です。 この理由は有限母集団の全数測定ではなく、集団の中からのサンプリングでの推定だからと解釈してます。 標準偏差でσnとσn-1の使い分けありますよね。 σn;有限母集団の全データを使いその集団の標準偏差 σn-1;集団中のサンプルデータを使い標準偏差の推定 です。 測定誤差等を上記に加えるとややこしくなるので止めましょう。 こんな説明でよいですか。 あくまで推定です。 番外ですが、何でも推定で良いわけでは有りません。 安全装置なんかで95%の確立で安全だなんていえませんよね。100%です。 宜しく。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご回答有難う御座います。 結論としては、 1)の式は母平均を95%の確率で含む区間推定。 2)の式は母集団データの95%が含まれる区間推定。   (母集団の95%のデータの値が推定された区間に含まれると云うこと) と云う事でしょうか? すみません読解力が足りなくて m(_ _)m ご回答を頂きたく宜しくお願い致します! 追記を有難う御座います。 はい、推定として参考までに用いる積もりです。 目的に向かう道中で岐路に立った際の判断材料とでも云いましょうか。 統計に過度の期待はいたしません(笑) ご協力有難う御座いました。

関連するQ&A

  • 統計学(信頼区間)

    信頼区間が95%の時、平均±(2×標準偏差)の範囲に値が収まると覚えたのですが、 なぜ信頼区間を求める際には、平均±1.96標準誤差を用いるのでしょうか。 1.96はどこから来た数字なのでしょうか? 2で計算するのではなく1.96で計算するのはなぜでしょうか?厳密には1.96みたいな感じですか? この質問をわかる人が見たら質問の意図も分かりづらいと思うのですが、よろしくお願いします。 (分からないことを質問するって難しい。。)

  • 90%の信頼区間における区間推定

    統計学の区間推定に関する質問です。 このとき、標本平均は標準正規分布に従っているものとします。 95%の信頼区間の場合、標準正規分布から1.96のときちょうど0.9750なので、-1.96<X<1.96と割り出すことができますよね。 ところが90%の信頼区間の場合、ちょうど0.9500になる値がありません。 これに近い値では0.9495(1.64)と0.9505(1.65)とがありますが、どちらも0.9500との差は0.0005ですよね。 この場合、1.64と1.65のどちらの値を採用すればよいのですか?

  • 信頼区間の1.96や1.65ってどこから?

    統計の問題で信頼区間を求める際に、 信頼率90%なら1.65、95%なら1.96を標本標準誤差にかけますが、 この数字はどうやって求めるのでしょう? 信頼率が他の値になった場合に解けなくて困っています。 正規分布の表から判ると習いましたが、 最大でも0.5までしか見当たらず悩んでいます。

その他の回答 (3)

  • 回答No.3
noname#230359

1)信頼区間 = 標本平均 ±(t(95%) × 標本標準誤差 ) が なぞだけど 管理図のほうからきてる? http://www.geisya.or.jp/~mwm48961/linear_algebra/conf1.htm 3σ とかと 一緒 95%相当だと 1.96σ http://quality-mind.cocolog-nifty.com/qualitymind/2008/08/post_b7ca.html ここね http://kogolab.jp/elearn/hamburger/chap2/sec3.html やってることが違うよ なんとなく似てるが リンク先より抜粋 t分布は正規分布に似ていますが、サンプルサイズによって形が少し変わります(後述します)。 1)は正規分布図 ではなく t分布図 http://ja.wikipedia.org/wiki/T%E5%88%86%E5%B8%83

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご回答有難う御座います。 1)は95%確率での平均値の信頼区間推定です。 某ハンバーガー統計学で解説がされています。 それから、 「3σ とかと 一緒 95%相当だと 1.96σ」 ですが、 理解できます。 工程能力を考える際に用いる正規分布の考え方ですよね。 であれば、[標準偏差×1.96] は正しいですよね。 とすると! 1)は上記の通り母平均を95%の確率で含む区間推定で、 2)は母集団データの95%分布区間   (母集団の95%の値が推定された区間に含まれると云うこと) と考えられるのですかね? 補足を有難う御座います。 はい、 1)はt分布から推定する平均値の区間推定ですね。 2)は正規分布に従うと仮定した母集団の95%のデータを含むと 推測される区間推定ですね。 再度、該当式を掲載している資料を読み直してみたら その様に解釈できる内容でした。 ご協力有難う御座いました。

  • 回答No.2
noname#230359

1)は95%信頼区間の定義で 2)は母集団が正規分布と仮定した簡易式では?   >異なる区間が算出されます。 2)は区間外両サイドを合わせて5%なのを片側でやっていませんか?

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご回答有難う御座います。 「2)は区間外両サイドを合わせて5%なのを片側でやってませんか?」 ですが、正しくは下記の式になると云うことでしょうか?  信頼区間 = 標本平均 ±( 標準偏差 × (1.96 / 2))             もしくは  信頼区間 = 標本平均 ±( 標準偏差 × (1.96 + α)) 私は、正規分布中心から±1.96σ間が全体の95%を占める と理解していたのですが間違いですか? 何分にも必要に迫られ俄仕込みでやっているもので、 基礎を理解出来ている自信がありません。 ご教授頂けると有難いです。 宜しくお願い致します。

  • 回答No.1
noname#230359

サンプル数が十分に多い場合は2)、サンプル数が少ない場合は、 自由度によってt分布の値を計算して適用する1)を使えばいいのでは?

参考URL:
http://kogolab.jp/elearn/hamburger/chap2/sec3.html

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご回答有難う御座います。 イメージとしては仰る通りだと思うのですが、 実際に計算してみると1)は2)に比較して推定区間が狭く算出され、 その差はかなり大きくなるんですよね。 統計学的にはどちらも正しいのでしょうけど。。。 上記の特性を踏まえれば、区間推定の目的に応じ使い分ける 必要があるのですかね?

関連するQ&A

  • 統計学の母平均の信頼区間

    母平均の信頼区間を求めるとき、母分散が分かれば母平均を求められますが、母分散が未知で標本の値や標準偏差も与えられていない場合、母平均の信頼区間を求めることは出来ますか? 例えば、無作為に25人を選び、1日の睡眠時間を聞いたら平均7時間だった。この母平均の信頼区間を信頼度95%で求めよ。 「母標準偏差は1時間であることが分かっている」などという条件がない、このような問題は求められますか? よろしくお願いします。

  • 統計学 区間推定について

    信頼区間を求めるときに、zの式を作ると思うのですが、その公式が理解できません。 以前正規分布を学んでいたときは、zの分母はただの母集団の標準偏差だったのに、 なぜ信頼区間を求めるときは、それをn(標本数)の平方根でわるのですか? わかりにくかったらすみません。 詳しい方、教えてください。

  • 信頼区間 正規分布しない場合

    信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか? 具体的には以下の2群のそれぞれについて95%信頼区間を知りたいのです。 統計については素人なので的はずれな質問かも知れません。 X 209.1 280 91 124 80.57884211 67 152.2 88.584 138.0215385 112.43 115.71 97 128 144 Y 145.035 113.2352941 143.5 117.25 62 78 58 79.5 68.49975 73.85728571 81.61222222 190.5 58 179.25 84 76.6665 168.92 76.76

  • 信頼区間の問題です

    ある特定の英語教材の効果を測定するために、ある県で25人の高校1年生を無作為に選びこの教材を使って教えた後に、共通の問題を使って試験を実施したところ、標本平均は(xのバー)=62、標本標準偏差は(σのハット)=10.0であった。この県の高校1年生の試験の点数全体を母集団と考え、母集団分布は正規分布N(μ、σ^2)であると仮定する。母平均μの95%信頼区間を求めよ。 お手数ですが、よろしくお願いします。

  • 標準誤差の式について

    標準誤差を求める式、SE = SD / √nについて質問がございます。 現在、標準誤差を勉強しております。 標準誤差が標本平均の標準偏差だと知り、 下記母集団を単純な例にして標準誤差を求めました。 ■1 母集団「2,3,4」 標本集団「2,3」「3,4」「2,4」 ■2 母平均:μ=3 母標準偏差:σ=√[{(2-3)^2 + (3-3)^2 + (4-3)^2} / 3] = √(2/3) ■3 標本平均:μ1=2.5、μ2=3.5、μ3=3 標本平均の平均:x=3 標本平均の標準偏差(標準誤差): s=√[{(2.5-3)^2 + (3.5-3)^2 + (3-3)^2} / 3] = √(1/6) ■4 標準誤差の式にあてはめ SE = SD / √n =√(2/3) / √3 =√(2/9) 3は標準偏差の公式に当てはめました。 4は標準誤差の公式に当てはめました。 計算間違いあるいは値の代入間違いでなければ、 3の標準誤差と4の標準誤差は同じになるはずだと思うのですが、 なっておりません。 何故なのでしょうか? 3の計算方法が間違っているのでしょうか? お教えていただければ幸いです。 以上、宜しくお願いいたします。

  • 【母集団推定】信頼区間が、上限下限の間に入らい

    隣接するカフェにて、一定時間内に何人の客が入店するかを調査しました。 それを元に、AとBのカフェに入る顧客数の母集団推定を行いました。 しかし、下記の式が正しいか、間違っているか、判断できません。 特に、Aカフェの信頼区間:1.807・・に対し、上限2.35 下限5.97と、信頼区間の中に入っていません。 これはデータの値が上述の信頼区間に入らないので、Aカフェのデータの値は統計的には平均と異なると見なし、信頼性は無い。と見なした方が良いのでしょうか? ID  Aカフェ Bカフェ 1  5人    10人 2  4人    3人 3  2人    7人 4  3人    14人 5  7人    7人 6  4人    3人    Aカフェ    Bカフェ 平均: 4.17       7.33 標準偏差:1.722401424    4.226897996 標本数: 6 自由度: 5           5 信頼度: 0.95          0.95 臨海値:2.570581835       2.570581835 信頼区間:1.80754944    4.435857401 下限: 2.359117226    2.897475932 上限: 5.974216107    11.76919073

  • 信頼区間とt検定

    「ハンバーガー統計学にようこそ! ハンバーガーショップで学ぶ楽しい統計学──平均から分散分析まで──」 というサイトで,統計の勉強をしています。 http://kogolab.jp/elearn/hamburger/index.html 大学の個別化教授システムで使えるように開発されたものを,web公開されているということです。 「4. t検定(対応なし)」の章でいくつかわからない点があるのですが,詳しい方教えていただけませんでしょうか。 http://kogolab.jp/elearn/hamburger/chap4/sec0.html わくわくバーガーとモグモグバーガーという2店のハンバーガーの味の評価を比較するという設定です。 ランダムに選んだ女子高生に,1人目はワクワクバーガー,2人目はモグモグバーガー,3人目はワクワクバーガー…と食べてもらい,味の評価点をつけてもらいます。 そしてワクワクの8個の評価点とモグモグの8個の評価点を統計手法で比較していきます。 平均,分散を求め,標本の差の信頼区間を求め,t検定を行います。 ワクワクの評価点と,モグモグの評価点は,母集団Aと母集団Bから抽出された標本A,Bとして扱われています。 このページの「信頼区間を差に適用してみる」のところで, http://kogolab.jp/elearn/hamburger/chap4/sec2.html 「平均の差の信頼区間=(標本平均A-標本平均B)±t×差の標本標準誤差」を求めているのですが,「差の標本標準誤差」を求める過程で「AとBの母分散は等しいとして、「推定母分散」と表記する」としています。 でも,母集団Aは「ワクワクバーバーを食べた人全員の評価点」,母集団Bは「モグモグバーガーを食べた人全員の評価点」だと思うのですが,どうしてその分散が等しいと仮定できるのでしょうか。(片方のバーガーの方が,人によって評価の差があるというか,好みが分かれやすいというのはありえると思うんですが…) こういう仮定は,差の信頼区間を求める場合,普通に行われる議論なのでしょうか。 また,ここで等しいと仮定できない場合,この後,どのように式を求めていくのか,ご存知でしたら教えていただけませんでしょうか。 実際にこの計手法を応用したいのは,化学実験のデータなのです。同じ検体に,試験法AとBを適用した場合に,結果に差があるかどうかを,数回の実験から推定したいということです。試験法Aのすべての結果が母集団A,試験法Bが母集団Bとなります。 この場合,試験法によって,結果の数値の平均値にずれが出ることもありますし,平均値は同じでも,片方の試験法の方が数値のバラツキが大きい場合もありえます。 ですので,母集団A,Bの母分散A,Bが一致するという仮定があっては,私の使いたい場合には応用できないと思うのですが,どうなのでしょうか。 このままの考え方では応用できない場合,どのように式を求めたらよいのでしょう。 それから,信頼区間と検定の解釈がよくわかりません。 同じページの「差の信頼区間の解釈」で「ワクワクバーガーとモグモグバーガーの評価点の差は、5点でした。しかし、その信頼区間には、0点が含まれていました。つまり、母集団においてその差が0点であること、つまりワクワクバーガーとモグモグバーガーの評価には差がないということが、十分起こり得ることだと解釈できます。」という「結論」のようなものが出ています。 ところが次のページから「4.3 t検定」が始まり, http://kogolab.jp/elearn/hamburger/chap4/sec3.html 「t検定の考え方」のところに「さて、計算したtは、-1.29でしたので、5%有意水準での棄却域には入っていません。したがって帰無仮説は棄却できません。結論としては、ワクワクとモグモグの評価点の平均には差がないということになります。」と,また結論が出ています。 この結論は同じことを言っているのでしょうか。それとも違う意味があるのでしょうか。 実際の統計処理を行う場合,両方の結論を出さなければならないものなのでしょうか。片方出せばよいのでしょうか。 片方が「差がない」,片方が「差がある」という結論が出る場合もあるのでしょうか。その場合はどのように判断をすればよいのでしょう。 統計は何度勉強しようとしても,なかなか理解できず,困っています。 この教材は割とわかりやすいかと思ってはじめたのですが,やっぱりいろいろ引っかかっております。 詳しい方いらっしゃいましたら,なるべく初心者向きの解説をお願いできませんでしょうか。 よろしくお願いいたします。

  • 統計学の正規分布、信頼区間について質問です。

    問1、ある錠剤のA成分の含有量を9回測定して標本平均6.85mg、標本標準偏差0.006mgを得た。測定値は正規分布に従うと仮定して、A成分の含有量の真の平均を95%信頼区間で推定せよ。 問2、同年齢の身長は正規分布に従っていると考えられる。15歳の男子10人を無作為抽出して測定したところ169,155,163,164,151,162,160,150,156,150の結果を得た。15歳の男子の平均身長および分散を95%信頼区間で推定せよ。 この二つの問題がいくら考えてもわからないのでわかる方居ましたら解答・解説をご教示願います。よろしくお願いします。

  • 統計学の基礎?

    前提 日本人の身長の真の平均値を知るためには、日本人全員の身長を測定しなければならないが、それはおそらく不可能である。 そこで、一部の人(標本)の身長を測定し、その結果から推測したい。 標本(n)の身長もばらつき(標本分散:v)を持つし、日本人全体(母集団:N)の身長もばらつき(母分散:σ^2)を持つが、これらと真実の値(母平均:μ)や標本平均(m)との関係はどうなっているだろうか? ただし、各人の測定結果(身長)はX1,X2,X3・・・XNとあらわす。 問 1)日本人の平均身長= 2)日本人の平均身長の標準偏差= 3)標本の平均身長= 4)標本の平均身長= 5)標本の平均身長の分散から推定される日本人の平均身長の標準偏差= 6)標準誤差はσ/√nで与えられるが、これを標本分散を用いて表すと次のようになる。  標準誤差= 7)標準誤差を用いると、真実の平均値(母平均)があるであろう範囲(信頼区間)を特定の有意水準で求めることができる。有意水準5%のときの範囲(95%信頼区間)を表す式を示せ。 8)160、165,170,175,180というデータの平均の95%信頼区間を求めよ また、145,165,170,175,195というデータの平均の95%信頼区間と比較せよ。 以上の問です。 7と8以外は、数値を聞いているわけではなく、求める式を問うていることはなんとなくわかるのですが、ちょっとパソコンを利用して調べて回ったところ、どれが必要な情報かさえわからないレベルで、頭が痛くなってしまいました。 よろしければ問いの回答、その回答に至る考え方の流れなどを、簡単なものでも構わないのでご教授願えないでしょうか?

  • 区間推定に使うt値

    ある母集団から10個の標本を抜取って、 標本の平均μと不偏分散σ^2、標本標準偏差σ/√10を求めました。 次に母集団の平均の区間推定を行います。 99%の信頼度で区間推定した場合、ある参考書に、 区間= μ ± t × σ/√10 と記されていました。 このtという値は信頼度とサンプル数(自由度)によって変化するとのことなので、 t分布表から選択して計算するようにと書いてあります。 自分は エクセルのNorminv(0.005,μ,σ/√10)~Norminv(0.995,μ,σ/√10) を使って求めたほうが簡単なので、こちらを使用するのですが、 上の参考書の値と異なってしまいます。 エクセルのNorminv関数にはなにか欠点があるのでしょうか? よろしくお願いいたします。 データ添付します。