• 締切済み

標本数の決め方

整数10000個からなる母集団から5000個抜き出した標本の総和が500なら,母集団全体の総和は1000前後と推定でき,5000個の平均が500なら,母集団全体の平均も500前後と推定できると思います.このように総和は標本数に依存しますが,平均は標本数に依存しない性質があると思います.以下,操作Fは単なる平均ではないのですが,平均のように標本数に依存しない値を返す操作とします. N個のデータからなる母集団全体に操作Fを行った値をある誤差,ある信頼区間で推定したい場合,どのような考え方で標本数を決めればよいでしょうか.Fが単なる平均をとる操作,つまり母平均の推定の問題であれば分かるのでが,そうでない操作Fの場合についての質問です. よろしくお願いします.

みんなの回答

noname#227064
noname#227064
回答No.1

推定したい値、母集団の大きさ、標本の大きさにもよりますが、デルタ法はどうでしょうか?

参考URL:
http://datapowernow.blog.fc2.com/blog-entry-22.html

関連するQ&A

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。

  • 統計学の標本についてです

    下記の問いが分からずに困っています。 手計算でも良いですが、可能ならばExcelでの求め方も教えて頂けると幸いです。 1.平均100、分散1000の正規分布に従う母集団から10個の無作為標本を抽出する。 (1)標本平均の分布は? (2)標本平均値が110を越える確立はいくつか? 2.母比率が0.3である場合、その母集団からの100個の無作為標本に基づく標本比率が0.4を上回る確立はどの程度か? (1)標本比率の分布は? (2)その分布で0.4以上の値を得る確立は? よろしくお願いいたしします。

  • 「標本平均の分散」についての質問です.

    「標本平均の分散」についての質問です. 「母集団からn個のデータを無作為抽出する.すると,サンプルサイズnの標本ができ,標本平均が計算できる.これを,標本平均1としよう.この作業を何度も繰り返し,標本平均2,標本平均3・・・と,多数の標本平均を集める.これらの標本平均の分散は,母分散のn分の1(母分散/n)である」という説明をある本で読みました. では,極端な話,1000個のデータからなる母集団(有限母集団)から,サンプルサイズ1000個(母集団サイズと同じ)の標本をいくつも作ったとします.標本平均は,いつも母平均そのものであり,よって,標本平均の分散は0です.母分散/1000とはなりません. 上記の説明が間違っているのでしょうか?私が何か勘違いをしているのでしょうか?それとも,説明は無限母集団を対象としている,とか,母集団サイズとサンプルサイズが一致するような抽出は想定されていない,と言った理由があるのでしょうか?

  • 標本平均値の分散

    平均μ、分散σ^2の母集団からとられた標本数nの標本平均値x ̄(エックス・バー)の平均値はμということは、理論的にも感覚的にもだいたいわかりますが、標本平均値の分散がσ^2/n(母集団の分散を標本数nで割った値)になるのかは、nが多いと母集団の平均値に近い標本がとれる確率が高くなるからなど、感覚的にはある程度(ほんとうにある程度…)わかりますが、理論的にはほとんどわかりません。どなたかなぜ標本平均値の分散がσ^2/nになるのか、特に理論的にお教えいただけないでしょうか? 本などを見ても、このことを理論的にわかりやすく説明した本は少なく、実際に実験してみたらそうなるからとか、あいまいな説明しかありません。 ちなみに数学はあまり得意じゃありません。

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準誤差とその性質

    標準誤差(SEM)が標本平均の標準偏差であることは,分かったのですが,母集団から標本集団Aと標本集団Bをとった場合に,AとBの標準誤差の関係が分かりません。 具体的には,例えば貨幣を製造したときに基準をパスする貨幣の重さのSEMが1つの貨幣あたりsだとした場合に,n個の貨幣を無作為抽出したときに得られる総和の標準誤差と貨幣の重さの平均の標準誤差が求められるものでしょうか。

  • 標本、標本点、標本空間

    次の言葉は、通常、概ね次のように定義されていると思います。 (1)標本:統計において、母集団から抜き出した要素の集合。例えば、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高。 (2)標本空間:標本点全体の集合。例えば、1個のさいころを1回投げたときに出る目の数の集合{1, 2, 3, 4, 5, 6}。 (3)標本点:試行の結果生じ得る1つひとつの現象。例えば、1個のさいころを1回投げたときに出る目の数。{1}、{6}など。 これに関連して次のQ1、Q2についてお教えいただけないでしょうか。 Q1:「標本」は母集団からの抽出の話であり、「標本点」は試行の話です。「標本」と「標本点」とは、たった1文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。 Q2:「標本」は抽出したもの(つまり、一部分)の話であるのに、「標本空間」は試行の結果の全体(つまり、全体)の話です。。「標本」と「標本空間」とは、たった2文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。 そもそもの疑問は、「標本点」と「標本」は1文字違うだけなので、「標本点」の定義は「標本」という言葉を用いて定義できるのではないかと思ったことにあります。例えば、「預金高」と「預金」は1文字違うだけなので、「預金高」は「預金の金額」のように「預金」という言葉を用いて定義できるようにです。 これらは全く異なる概念だと言われれば観念して覚えますが、何か腑に落ちないのです。

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • 正規分布からの標本

    正規分布からの標本 母平均・母分散・がわかっている正規母集団からある大きさnの標本を抽出したとき、どのようにして標本平均が存在する場の確立を求めるのでしょうか? 例えば、母平均μ=4、母分散σ^2=15の正規母集団から大きさn=10の標本を抽出したとき、標本平均Xが3と6の間にある確率は? という感じです。 また、この問題に付随して標準分散s^2がaを超える確率が0.05となるような定数aの値を求めよ。というときに、どのようにして定数aを求めるのでしょうか。

  • 標本抽出について

    大学の授業で説明されたのですがよくわからなかったのでおしえてください。 平均45、標準偏差15の正規分布から無造作抽出した標本数9の標本から求めた標本平均が次の範囲の値をとる確率をそれぞれ求めよ。 (1)p(x≥50) (2)p(40≤x≤50) (3)p(35≤x≤55) できれば解法詳しく書いていただけると助かります。