• ベストアンサー

標本のサンプルサイズ

stomachmanの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

再度stomachmanです。 スジはmotsuanさんの仰る全くその通りだとstomachmanも思います。つまり、母集団の確率密度関数をf()とするとき、φ(n,g0)=多重積分 f(x1)...f(xn)δ(g(x1,x2,...,xn) - g0) dx1 ... dxn はgの値の確率密度関数である。(「gが平均のときは平面、分散のときは球面」てのは集合S={<x1,....,xn>|g(x1,x2,...,xn)=g0}のことで、これを使うと φ(n,g0)=多重積分(<x1,....,xn>∈S) f(x1)...f(xn)dx1 ... dxn と書いても良い。そういう意味ですよね。)  fが既知なら、母集団から取ったn個のサンプルの分散s^2が幾らなのか、その確率密度関数φ(n,s^2)が決まりますから、累積確率P(n,a)=積分{y=0~a} φ(n,y) dyが決まる。5%の危険率なら、 P(n,a)が5%になるaの値a1(n)と95%になるaの値a2(n)を計算できる。  さて、もうひとつの母集団(確率密度関数hが既知)があって、サンプルn個は母集団fか母集団hか、どちらか一方からn個取られたものであるとする。どっちなのかを90%の精度で判定するには、幾つサンプルがあれば良いか?と、こういう風に話が進まなくちゃ。  ところが、この質問ではちょっと状況が違います。まず ●母集団の確率密度関数fについて分散以外は全く未知であるとしなくてはならないらしい。だからPは具体的に計算できず、上記の論法は使えない。分散だけ分かったってしょうがない。 ●「帰無仮説が90%の確率で 棄却されるには」という所。サンプルに関する何かの確率が計算できるためには、帰無仮説「サンプルは(ある既知の)確率密度関数h(x)を持つ母集団から取った」が必要(仮説「s^2=σ^2」じゃダメ)で、この質問の場合には、他に何の分布の話も出てこないのでh=fという話だと推察される。  だとすれば、この帰無仮説「サンプルは母集団fから取った」が棄却される確率とは、すなわち「母集団fから取ったサンプルを、誤ってその母集団に属さないと判断する確率」に他ならない。従って質問は『90%の確率でこの判断を間違えるにはサンプル数nを幾ら「以下」にすればよいか?』という意味になる???これはカナリ変 < ってそれは深読みしすぎ。 ●ひょっとすると帰無仮説の概念に多少混乱を生じていらっしゃるのではないかと推測してます。(違ってたらごめんなさい。)  帰無仮説は、検定に掛けられる具体的な結論が引き出せなくては役に立たない。そして棄却されたときだけしか、意味のある結論が出ない。  たとえば H:「これらのサンプルn個は平均m、分散vの正規分布N(m,v)をなす母集団からランダムに採られた」という仮説なら、たとえば「サンプルn個の平均値」の予想される分布を具体的に計算でき、それと実際の「サンプルn個の平均値」とを比較して検定を行える。その結果「Hが正しいとすると、こんな平均値が出る確率は非常に低い。だからHはほぼ確実に間違いだ。」という結論になるか、「Hが正しいとすると、こんな平均値が出る確率は結構高い。もちろん、H以外の仮説でもこんな平均値が出る確率が結構高くなるものは幾らでもある。だから、これ以上は何も言えない」という結論になるか。  一方、仮説H:「サンプルn個はある母集団(確率密度関数h)からランダムに選ばれた。hについては未知だが、hの分散はσ^2。」を考えているとする。hが具体的に分からないから、これ以上話が進まない。Hは棄却できず、何も言えない。これは使い物にならない仮説。(回答#2でhの例を出しました。)  さらに、仮説H:「s^2=σ^2」を厳密に解釈すれば、「(サンプルの分散s^2がたまたまσ^2に合うとかいう話ではなく、)s^2=σ^2になるようにサンプルを選んだ」という意味です。この仮説から言えることは「s^2=σ^2の筈だ」だけであり、実際のs^2がσ^2と違った場合の結論は「s^2=σ^2になるようにサンプルが取れていない。間違えたのは誰だ!」、実際s^2=σ^2だったら「サンプルをちゃんと選んだのか、偶然合ったのか。どちらとも言えない」。これはもう確率・統計とは無関係の話です。

myan
質問者

補足

先にstomachmanさんから頂いたご回答に対して、問題設定をすべて補足しておきました。質問の仕方があまりに悪かったことを重ねてお詫びします。あれだけでは統計的に意味を持たないこと、納得いたしました。 下の補足で述べた通りχ^2分布が出てくるため、混乱してしまって・・・。正規分布で考えて構わないのでしょうか?

関連するQ&A

  • 分散の検定

    昨年末のアクチュアリー試験での問題です。 分散の片側検定において,真の分散が帰無仮説において仮定された分散の3倍になったとき,帰無仮説が確率95%以上で棄却されるようにするには標本数が[ ]個あればよい.ただし,平均は未知とし,有意水準は0.05とする. という問題です。分布に何の仮定もないし、標本数の大きさを問うのだから正規分布近似も適当だとは思えません。とするとχ^2-testではできないように思います。こういう問題の場合、どのように解くものなのでしょうか?

  • エクセルによる母分散の検定

    一つの母集団から標本のサンプルサイズ10、標本平均50、不偏分散100を与え、母分散に関する帰無仮説 σ2=50、有意水準5%としたとき棄却域を求め仮説を検定しろ。 という課題がでたのですが、悪戦苦闘しています。どなたか分かる方教えてください。

  • 検定の質問です

    問題がどうしても解けないのでお願いいたします。 母分散と母平均が両方未知で正規母集団から大きさ51の標本を無作為抽出し、不偏分散Vを計算しました。 帰無仮説:母分散がvを有意水準0.05%で検定するときの棄却域をどうか教えてください。 カイ2条分布を用いて解けるとは思うのですが、どのように区間推定したら良いのかわからないのでよろしくお願いいたします。

  • 正規母集団で母分散未知の場合の母平均を検定する

    正規母集団で母分散未知の場合の母平均を検定するのに、t分布を使って次のようにしようと思いますがそれでよろしいでしょうか? 1. ある物体(非常にたくさんある)のパーツA、Bのそれぞれの長さの比が4対1であるように思われた。 2. そこで、この長さの比の平均値μ0(ゼロは添え字)=4と仮定し、さらにこの比が正規分布していると仮定する。 3. n=20の標本をとる。 4. 標本平均を「ラージXバー(以下、単にX_と略記)」、不偏分散をs^2、(sは標準偏差)とするとき次の確率変数Tは自由度n-1のt分布に従う。T=(X_-μ0)/(s/√n) 5. 帰無仮説H0=4、 対立仮説H1≠4 6. 有意水準を5%とします。 7. 両側検定とします。 8. 棄却域は2.093以上、または-2.093以下。 9. 20の標本からX_、s を求めて、Tを計算します。 10. もしT=1.8 ならば、帰無仮説は受容されます・・・等々。 このような進め方でよろしいでしょうか、よろしくお願いいたします。

  • 第2種の過誤と検出力、標本サイズ

    前回EPSカード実験の質問をした者です。 今回はその結果処理における統計処理にわからないところが出てきたので質問します。 5種類のカードを使って、それを見ずにカードの記号があたるか、あたらないかという検査をしました。試行数は250回です。偶然当たる確立pは5分の1、つまり0.2です。 ここでの帰無仮説はp=0.2で、有意水準は0.05です。 二項検定で、あるサンプルが棄却域を外れ、帰無仮説が棄却されませんでした。つまり、そのサンプルの正答率は偶然ではなかったのです。(回答率が高いほうで) ここで帰無仮説を採択したのですが、第2種の過誤の可能性がありますよね? 教えてほしいこと 1)帰無仮説を棄却できる確率、検定力の計算方法を教えてください。エクセルなどでできるのならば、その方法も教えてください。また、どのくらい検出力が低ければ採択しても問題はないのですか。 2)標本サイズが大きければ誤差は少ないのですよね?どれくらい大きければよいのか、その計算方法と共に教えてください。 実験の情報 先ほどのサンプル 250試行中、65回正答した。 足りない情報があれば補足します。なにせ、ほとんど理解していないので・・・。よろしくおねがいします。

  • 正規性の検定について

    正規性の検定において、例えば5%未満で有意な時には「有意に正規分布に従わない」と判断できると思います。 この場合の帰無仮説はどうなるのでしょうか? t検定では例えば「両者に差がない」という帰無仮説を立て、p=0.02ならば棄却でき、「5%未満で有意に差がある」といえ、もしp=0.07となったら、「有意に差があるとは言えない」 この考え方で言うと、正規性の検定の場合、帰無仮説は「正規分布しない」となって、これを棄却して「正規分布する」と結論付けるような気がするのですが、この考えは根本的に間違っていますか? ごちゃごちゃして、分からなくなってしまいました。 どなたか詳しい方、お願いします。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 自由度とt分布

    自由度19のt分布の上側が2.5%が2.093 であるとき、帰無仮説が有意水準5%で棄却できるというのがわから ないでいます。t分布表の上側2.5%は片側検定? 有意水準5%は両側検定? おしえてください。