• ベストアンサー

正規分布でない母集団の母平均の信頼区間

数学を趣味で勉強してます。よろしくお願いします。 質問内容は 正規母集団の母平均は、t分布を使って求められますが 標本を取って行ったら「母集団が正規分布と言えない場合」の 母平均の信頼区間を求めるには、どのように考えればよいのでしょうか。 母集団が正規分布でなくても、 中心極限定理(標本数を大きくしていくと標本平均の確率分布は正規分布に近づく)から 標本数を増やしてt分布使えばいいのかな?と思うのですが、どうでしょうか。 アドバイス、お願いします。

  • kihon
  • お礼率69% (79/114)

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

 平均を求める目的は、何ですか。 これを考えれば、正規分布していない集団の平均を求めるのは意味が無いことに気づいて下さい。 >標本数を増やしてt分布 サンプル数を増やすしかありません。  が、それでも十分でない場合もあります。以前、日本人(=サンプル数は多い)の平均貯蓄額が700万と発表されたが、中央値の400万の方が実感に近い。すなわち、貯蓄額は個人の考え方に大きく左右されるので(イソップのアリとキリギリス)、正規分布していません。人の意志・意図でかえられる場合は要注意でしょう。

kihon
質問者

お礼

回答ありがとうございます。 確かに、山が二つあるような分布に対して 平均が何を意味するかを考えるべきなんですね。 参考になります。

その他の回答 (1)

回答No.2

どういう状況を想定手いるかわかりかねますが、そもそも、「母集団が正規分布と言えない場合」でしたら、ほかの手法で推定すると思います。 ノンパラメトリック手法 http://ja.wikipedia.org/wiki/%E3%83%8E%E3%83%B3%E3%83%91%E3%83%A9%E3%83%A1%E3%83%88%E3%83%AA%E3%83%83%E3%82%AF%E6%89%8B%E6%B3%95

kihon
質問者

お礼

このような手法があるんですね。 アドバイスありがとうございます。

関連するQ&A

  • 二項分布の信頼区間

    母数pの二項母集団Bi(1,p)からn=50の大きさの標本を抽出して、0が23、1が27であった。pの信頼係数95パーセントの区間を求めよ。 という問題で、(中心極限定理による正規近似)というヒントが付いているのですが、どこから正規近似したらいいのかがわからないので、全くわかりません。 いきなり正規分布の様に見て 平均=0.54 標本分散=0.46^2*27/49 としてt分布から求めようとしてみましたが、うまく行きませんでした。 どういう流れでとくのか教えていただけないでしょうか。 ちなみにZ0.025=1.960です

  • 統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っ

    統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っているならば、標本の大きさnの大小に関わらず、その平均の分布は正規分布」という記述があります。であるならば、母平均を区間推定する場合、zの値を用いて推定してもいいのかなと思いますが、ほとんどの書籍では、標本の大きさが小さい場合、tの値を用いて推定しています。なぜでしょうか?たぶん、自分がどこかで誤解をしているのだと思いますが、宜しくお願いします。

  • 統計学 母平均の95(90)%信頼区間の求め方

    ↓の問題の解き方と回答が分かる方いませんか? 参考書を読んでもチンプンカンプンで非常に困っています。。 宜しくお願いします。 標本A{10・6・12・6・10・10} 標本B{9・3・11・2・5・6} (1)標本Aの母平均の95%信頼区間 (2)標本Bの母平均の90%信頼区間 *条件:t分布を使って解く

  • 中心極限定理 一様分布 平均値の意味

    統計学からの疑問です。 以前も中心極限定理について質問したことがあったのですが、また疑問が発生しました。 中心極限定理は、母集団が何分布であれ、そこからサンプリングされた標本の平均値は正規分布に従って分布するということで、この定理があるからこそ色んな統計手法を使うことができますよね。 例えば、プレス機の設定荷重を5.0トンに設定し、実荷重を複数回測定するとします。 この場合、実荷重は、4.9トンとか5.1トンとか、誤差的にばらつきますよね。 なので複数回測定した実荷重の平均値=プレス機の実力であると言えると思います。 では母集団が一様分布、例えばサイコロの場合、 サイコロを2個以上振って出た目の平均値は3.5ですが、この値は一体何を意味してるのでしょうか?サイコロは3.5の目がもっともよく出るというわけはありませんし・・・ 中心極限定理を解説するために、サイコロを使った説明があり、 母集団が一様分布であっても中心極限定理がちゃんと現れることは確認できたのですが、 母集団が一様分布の場合の統計量(平均値)の意味がわかりません。 変な質問かもしれませんが、疑問を解決したいのでどなたか教えて下さい。 よろしくお願いします。

  • 正規分布からの標本

    正規分布からの標本 母平均・母分散・がわかっている正規母集団からある大きさnの標本を抽出したとき、どのようにして標本平均が存在する場の確立を求めるのでしょうか? 例えば、母平均μ=4、母分散σ^2=15の正規母集団から大きさn=10の標本を抽出したとき、標本平均Xが3と6の間にある確率は? という感じです。 また、この問題に付随して標準分散s^2がaを超える確率が0.05となるような定数aの値を求めよ。というときに、どのようにして定数aを求めるのでしょうか。

  • 正規分布の問題

    大学院進学のために院試の過去問を解いています。 その中で正規分布の問題があり、私の通っていた大学ではここまでは勉強していなかったために 解き方が全く分かりません。 大学の先生に聞いてみても良いかと思いましたが、その先生とは全くといって良いほど接点がなく、また、違う大学の院試なので聞いても教えてくれません。 自分で調べるとしても他の部分の勉強のためにこの問題を解くのに時間がありません・・・ 分かる方がいれば教えてもらないでしょうか? ------------------------------------------ 平均μ(ミュー、マイクロとも)、分散σ^2(シグマ二乗)の正規分布N(μ σ^2)から独立に抽出されたn個の標本平均をXとする。 問1 母分散σ^2が既知の場合、母平均μの信頼度100(1-α)%の信頼区間を求めよ。但し、有意水準α、標準正規分布の上側確率が100(α/2)%となる点の値をZ(α/2)とする。 問2 測定値は母分散がσ^2=0.04の正規分布に従うとする。母平均μの信頼度95%での標本誤差を0.1以下にしたいとき、最小限必要な標本の大きさnを求めよ。但し、標準正規分布の上側確率が2.5%となる点の値Z(0.025)は1.96である。 ------------------------------------------- 宜しくお願いします。

  • 有限母集団の中心極限定理

    訳あって確率統計の勉強をしておりますが、中心極限定理について質問があります。 「母集団の平均をm、分散をvとすると、そこから抽出したn個の標本の平均の分布は、平均m、分散v/nという分布になり、標本数をn→無限大とすると、分布は母集団の分布によらず正規分布に近づく。」 とありますが、母集団が有限個(N個)の集合ならどうなるでしょうか。 その場合、標本数をnがNに等しくなった時点で平均はm、分散0、つまり標本から母集団の平均が完全に推定(決定)することになります。 ●有限母集団の場合も中心極限定理は成り立つのか? ●成り立つならn→Nで分散が0になるという点はどう表現されるのか? このあたりを教えてください。

  • 信頼区間の求め方について

    以下の問題につきまして、解き方が分からず手も足も出ません。 ある正規母集団から取り出した標本サイズ32の標本を用いて、信頼水準95%で母平均を区間推定したところ、信頼下限が156、信頼上限が220となった。このとき、同じ信頼水準95%において、標本サイズを128とした場合の信頼上限はどのようになるか。ただし、標本サイズを変更しても、標本平均は変化しないものとする。 どのように解けばよいのでしょうか。どなたかご教授をお願い致します。

  • 統計学の正規分布、信頼区間について質問です。

    問1、ある錠剤のA成分の含有量を9回測定して標本平均6.85mg、標本標準偏差0.006mgを得た。測定値は正規分布に従うと仮定して、A成分の含有量の真の平均を95%信頼区間で推定せよ。 問2、同年齢の身長は正規分布に従っていると考えられる。15歳の男子10人を無作為抽出して測定したところ169,155,163,164,151,162,160,150,156,150の結果を得た。15歳の男子の平均身長および分散を95%信頼区間で推定せよ。 この二つの問題がいくら考えてもわからないのでわかる方居ましたら解答・解説をご教示願います。よろしくお願いします。

  • 信頼区間 正規分布しない場合

    信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか? 具体的には以下の2群のそれぞれについて95%信頼区間を知りたいのです。 統計については素人なので的はずれな質問かも知れません。 X 209.1 280 91 124 80.57884211 67 152.2 88.584 138.0215385 112.43 115.71 97 128 144 Y 145.035 113.2352941 143.5 117.25 62 78 58 79.5 68.49975 73.85728571 81.61222222 190.5 58 179.25 84 76.6665 168.92 76.76