• ベストアンサー

サンプル数について

今N個のデータがあって、そのデータを分析したいと 思っています。 しかし、N個全部調べると大変なので、そこから無作為に 抽出してn個のデータを調べたいと思います。 nはどのくらいの数値にすればいいのでしょうか? 高校の確率統計の教科書を見てもいまいちわかりません。 (もう32歳ですが・・・) 一応数学については得意なほうです。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.1

数値データの統計なのか、良/不良の検査なのかによって変わります。 数値データであれば、n=10もあれば、平均値と標準偏差を求める目的に対しては、ある程度十分です。 (私のかつての仕事では、事情により、n=5でやったことさえあります。) 良/不良の抜き取り検査であれば、JISで定められている JIS Z 9015 という規格があります。 (かつて「MIL規格」(米軍の規格)というのがあり、広く使われていましたが、今では廃止されたようです。) http://homepage1.nifty.com/QCC/2003-5.html http://homepage1.nifty.com/QCC/2003-3.html

shiritai
質問者

補足

ご回答ありがとうございます。 数値データです。 n=10で十分である根拠はなんでしょうか?

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

高校の確率・統計の範囲では扱う問題ではないのでしょうね(^_^;) > 一応数学については得意なほうです。 ということなら、下手に私が説明するよりも、  永田「サンプルサイズの決め方」朝倉書店 を読んでしまった方がはやいと思います。あるいは「検出力」とか「パワーアナリシス」というキーワード検索してみるとより深い内容が得られます。英語が嫌でなければ、ただで見れるよいサイトがありますが、、、  http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/ Helpの[guide to G*power]より、This is what you find here:の3の2statistical testの部分です。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計学 正規分布

    ある工場で生産された電球の寿命がN(1180,400)に従うとき、無作為に抽出された25個の電球の寿命の平均値が1170時間を超える確率はいくらか。 また、無作為に抽出されたn個の電球の寿命の平均値が少なくとも0.95の確率で1175時間を超えると言えるnの値はいくらか。 という問題なのですが、 「無作為に抽出された25個の電球の寿命の平均値が1170時間を超える確率」は、0.99379 と出ましたが、 「無作為に抽出されたn個の電球の寿命の平均値が少なくとも0.95の確率で1175時間を超えると言えるnの値」の計算過程で分からなくなりました。 最終的に 5=1.64√(400/n) という方程式ができると思うのですが、 この左辺の5はどこからきているのでしょうか。

  • サンプル数が大きく異なる分散分析について

     大学の統計の講義で勉強しています。分散分析で少し疑問があったので質問させてください。  練習用のデータでは、幸福度に関する調査で、量的変数として1~10の段階評価の幸福度があり、質的変数は幾つかあったのですが、自分はその中から、年齢(20代/50代)と喫煙の有無の2種類を選びました。  このデータから2要因の被験者間分散分析を行い、喫煙の有無(有/無)と被験者の年齢段階(20代/50代)と、その組み合わせの効果によって幸福度の平均値に差がでるかということを調査してみようと考えました。  しかし調べてみると、20代の喫煙有り/無しが(12/95)。50代では (15/90)とサンプル数が大きく異なっています。  このようなケースで分散分析を行った結果は、信頼できるものといえるのでしょうか?また、言えない場合はどのように調整すればいいのでしょうか。データ数を揃えるために、多い方のデータから無作為抽出を行って必要な分だけデータを取り出してしまったりしていいんでしょうか?  よろしくお願いします。

  • エクセルについての質問です。

    カテで迷いましたがここで質問します。 連続した正の整数N個から無作為にn個を抽出する方法を教えてください。 例として1~100の連続した整数から10個を無作為に抽出する方法で示して頂けるとありがたいです。

  • 確率の問題

    今弟に勉強を教えているのですが・・・確率の問題はすごい久しぶりなので以下の問題がわからなくて教えることができません><  M+N個の要素のうち、M個は性質Aをもち、N個はこの性質を持たない。この中からk=m+n個の要素を無作為に取り出す。そのときm個が性質Aを持ち、n個がこの性質をもたない確率は?という問題です。 教えていただけるとうれしいです

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。

  • 確率の問題

    確率の問題でよくわからないような感じの問題がありましたのでお願いします。 「箱の中にn個の玉があり連続したn個の整数a,a+1,a+2...a+n-1がそれぞれの玉に1つずつ記されている。 以下ではnの値は知らされているがaの値は知らされていないものとする。 この箱から無作為に1個の玉を取り出し記されている整数を調べる。 ただし取り出した玉は箱に戻さない。 これを繰り返してk回目に初めてaの値がわかるものとする。 この確率を求めよ。」 解は2(k-1)/n(n-1)となっています。 一応解説をみるとそうなのかなあというような感じで理解できなくはないようなってところです。 どなたか解説をお願いします。

  • 数学3の級数の問題がわかりません。

    数学3の級数の問題がわかりません。 n個のボールを2n 個の箱へ投げ入れる。各ボールはいずれかの箱に入るものとし、どの箱に入る確率も等しいとする。どの箱にも1個以下のボールしか入っていない確率をPnとする。 このとき、 極限値lim[n→∞] logPn/n を求めよ。 確率の考え方からわかりません。 お願いします!

  • データ集団から抽出した値の総和が条件にあてはまるか

    こんにちは 数学超初心者です。 ある数値のデータ集団Aがあり その集団Aから任意の数(N個)抽出した際に、 その総和が数値Bを超える確率を表す場合、どのような計算をすれば良いのでしょうか? 教えてください。

  • 確率の問題です。

    『 1からNまでの整数の値を書いたN枚のカードが袋に入っているとする。袋から無作為にカードを1枚抽出し、書かれていた値を記録し、カードを袋に戻す。この動作を繰り返しk番目の動作で抽出したカードの番号をukとする時の問いに答えよ。 (1)xn=max{u1,u2,...,un}とするとき、xn=ν(1≦ν≦N)となる確率を求めよ。 (2)yn=min{u1,u2,...,un}とするとき、yn=μ(1≦μ≦N)となる確率を求めよ。 (3)xnの期待値を求めよ。 』 という問題です。 n=2のときはN×Nのますを書いてxn=νになる確率は(2ν-1)/N^2だろう、 n=3のときはN×N×Nの立方体を書いてxn=νになる確率は(3ν^2-1)/N^3だろう ってことは一般的にxn=νになる確率は(nν^(n-1)-1)/N^nだろうという予測はついたのですが、 それをどう理論的に説明するか、その方法が分かりません。 (3)に至っては見当もつかない状態です。 よろしくお願いします。

  • 確率の問題です

    N個の区画に無作為にk個の種をまくとき、2個以上まかれる区画がない確率を求めよ。ただし、N>kとする。 という問題なのですが、解き方の糸口がいまいち分かりません。よろしくお願いします。。。