• ベストアンサー

【統計学】標本抽出の際の初歩的な質問

今月から統計学をまずは予習し始め、「はじめての統計学」と言う本にお世話になりながら一人で勉強しております。 標本から、乱数表を利用して抽出をする練習問題をしておりますが、標本の合計数が例えば40に対して、乱数表では64とか98とかの数が抽出された場合は、40までの標本なので数が存在しません。 その場合は、どのように扱えばよろしいのでしょうか? 観測データ表には標本が存在しない乱数表で指定された数の箇所は、空欄などにすれば良いのでしょうか? その逆もしかりで、200位ある標本なのに、乱数表は2桁で抽出した場合は、最大99までの乱数の抽出となってしまい、間違ってしまっているような気がいたします。しかし、3桁で乱数を抽出すると679などが抽出されると、標本は無い訳で。。。。 う~ん、トートロジーに陥っているような。。。 誰かお力をお貸しください。

質問者が選んだベストアンサー

  • ベストアンサー
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

候補が40個だったら2けたの乱数をとり、該当候補がないもの(00、41以上、すでに選ばれた番号)は単に無視して(捨てて)ください。 200だったら、3けたをとり、同様に、該当候補がないときは、そのまま捨ててください。 もし、捨てるのはもったいない(作業効率が悪い)とお考えであれば、3けたの数を200で割ってその余りを使う方法もありますが、この場合は、次の配慮が必要です。 * 1000が200で割り切れるから許される。 * 余りが0になったら200とみなすこと。

neotrax
質問者

お礼

この度は、ありがとうございました! 乱数表とのつきあい方が少しわかったような気が致します。

その他の回答 (1)

回答No.1

(乱数表の値/乱数の最大値)×標本の合計数=抽出する値 などすれば良いのではないでしょうか(小数点以下は適当に処理してください)。

neotrax
質問者

お礼

この度はありがとうございました。 当方の説明と理解力が足りなく申し訳ございませんでした。 参考にさせていただき、勉強して参ります。

neotrax
質問者

補足

質問の仕方がド素人すぎて申し訳ございませんでした。 改めて整理させて頂きますと、合計で180の個数の有限母集団の中から、大きさ20の標本を1つ観測データ表としてまとめよう(標本を集めよう)としております。 180の有限母集団から、20個の標本を集める際に、乱数表を使う練習問題なのです。 悩みのポイントとしては、任意の(乱数表上の)座標から2桁ずつ乱数を拾い上げると、拾い上げた乱数(数字)の最大は99(という数字)な訳で、せっかく180個の母集団が有るのに、良いのかなー?と心配になりました。 (ここまでが、投げた後者の疑問となります) そして、その問題では、母集団の最後の3行(母集団の数で言うと36個の数値)から20個の標本を集めようとなっており、乱数表で拾い上げた数字は36を上回る数字ばかりで困っております。拾い上げた乱数の中には、10とか21が混ざっているので、これは36を下回っているので、観測データ表に単純に書き込めるので、より混乱しております。 (これが前者の質問です) このような説明で伝わりますでしょうか? 頂きました回答を私自身が理解できていなく、申し訳ございません。

関連するQ&A

  • 抽出する標本数について

    100,000個のケーキにおける良品率を調査する場合、 標本誤差:0.1%、信頼水準:99.7%(λ=3)、標本比率:0.99999 と設定した場合、 標本数は89.99≒90となったのですが、 これで抽出した標本数は正しいと言えるのでしょうか? 標本比率は0.5にして計算すべきなのでしょうか? また、信頼水準λは3以上はないのでしょうか? 宜しくお願いします。

  • 統計学における無作為抽出に関する質問です.

    統計学における無作為抽出に関する質問です. 有限母集団から全ての個体を抽出すること,すなわち全数調査は,無作為抽出の一種と見なして良いのでしょうか?私は,良いと考えます. 無作為抽出が満たすべき条件は,全ての個体に抽出される機会を均等に与え,母集団の性質を標本にできるだけ反映させることだと思います.全数調査は,この条件を満たしています.標本が母集団そのものになりますから,標本は「できるだけ」どころか「完全に」母集団の性質を反映しています. 例えば,「日本中から無作為に1000人を抽出した」と言った表現があります.これが無作為抽出であるならば,1億人の有限母集団から2000人を選んでも,100万人を選んでも,9999万9999人を選んでも,無作為抽出のはずです.抽出される人数がある値を超えた途端,無作為抽出でなくなるとは思えません.仮にそういう値があるなら,私にはたいへん興味深いことです.無作為抽出になるかならないかの,境の値はいくつでしょう? 9999万9999までは無作為抽出だが(実行されるか否かは別として),1億になった途端,無作為抽出でなくなるのでしょうか?この場合,9999万9999と1億の間には,質的な違いがあります.つまり,前者の場合は,ある個体が抽出される確率は,完全に1ではないのに対し,後者の場合は,全ての個体が確実に,100%の確率で抽出される,という違いです.もし全数調査が無作為抽出でないならば,この辺りがポイントになるのでしょうか?

  • 統計に関する質問です。

    統計に関する質問です。 小麦における3産地以上の蛋白質含量における差を比較しています。 それぞれ標本数の異なり、例えばアメリカ産は1000標本、カナダ産は500標本、国産は50標本となっています。 その場合は、分散分析し、差が見られた場合はturkey法という多重検定で精査する統計法が適しているのでしょうか? ご助言をよろしくお願いします。

  • 統計学についての質問です。

    統計学に興味を持ち、簡単な統計の本を見ながら独学で勉強しています。 現在、「標本平均の差の信頼区間」ちょっと躓いております。 標本平均の差の信頼区間の式の中に、 (標本平均Aー標本平均B) が含まれていますが、 (標本平均Bー標本平均A)ではダメなんでしょうか? 入れ替えた場合、当然符号が変わり、信頼区間の符号も変わってしまうのはわかるんですが、なぜAーBなんでしょうか? 何に注目して、引かれる数と引く数を決めればいいのでしょうか? 以上、回答いただきければ幸いです。

  • 標本、標本点、標本空間

    次の言葉は、通常、概ね次のように定義されていると思います。 (1)標本:統計において、母集団から抜き出した要素の集合。例えば、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高。 (2)標本空間:標本点全体の集合。例えば、1個のさいころを1回投げたときに出る目の数の集合{1, 2, 3, 4, 5, 6}。 (3)標本点:試行の結果生じ得る1つひとつの現象。例えば、1個のさいころを1回投げたときに出る目の数。{1}、{6}など。 これに関連して次のQ1、Q2についてお教えいただけないでしょうか。 Q1:「標本」は母集団からの抽出の話であり、「標本点」は試行の話です。「標本」と「標本点」とは、たった1文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。 Q2:「標本」は抽出したもの(つまり、一部分)の話であるのに、「標本空間」は試行の結果の全体(つまり、全体)の話です。。「標本」と「標本空間」とは、たった2文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。 そもそもの疑問は、「標本点」と「標本」は1文字違うだけなので、「標本点」の定義は「標本」という言葉を用いて定義できるのではないかと思ったことにあります。例えば、「預金高」と「預金」は1文字違うだけなので、「預金高」は「預金の金額」のように「預金」という言葉を用いて定義できるようにです。 これらは全く異なる概念だと言われれば観念して覚えますが、何か腑に落ちないのです。

  • ノンパラメトリックな統計解析について質問です。

    マンホイットニのU検定等で比較したい群間の標本数が大きく違う場合、有意差が出やすくなるなどの問題は生じるでしょうか? 順位和で統計量を出すと聞いて疑問に思ってます。 例えば、A群、B群の標本数がそれぞれ10と100のように大きく違う場合何か問題は生じるでしょうか? 統計の本を見てみたのですが、記号が多くて理解しがたいです。 統計を理解する気持ちは持っています。 迷える子羊にご教授よろしくお願いします。

  • 統計学の検定について

    統計の問題で以下のようなものがあります。 ある母集団から無作為に抽出した学生にテストを受けさせたところ 55 45 46 54 38 62 64 36 という標本が得られた。この母集団が正規分布している元のした時、得点の母平均が60である、という仮説を有意水準5%で検定せよ。 というものでしす。この時の検定の仕方はどうすればいいのでしょうか? またこの時の有意水準とは何の何に対する比率が5%なんでしょう? あとこの場合でなされる判断は、観測された結果をどのように考えた結果なされたものなのですか? よろしくお願いします!

  • 統計の計算ができません・・・!!!

    至急お願いします!統計分かる方! 四苦八苦してます・・ (1) データB 13.5.7.7.9.10 最大値に対応する10の偏差値を計算しなさい (2) P(0≦Z≦0.50)=0.1915 P(0≦Z≦1.00)=0.3413 P(-∞≦Z≦∞)は何でしょう (3) N(10,16)からサンプルを40個抽出した場合 その標本平均に関する標準誤差を計算しなさい よろしくおねがいします!!!! この質問に補足する

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。