• ベストアンサー
  • 困ってます

層化比例無作為抽出時の検定などの方法

とある書籍にて以下のことを学習しました。 ・層化比例無作為抽出法を用いて標本抽出をおこなった場合、標準誤差の算出には標本全体の分散ではなく、各層内分散の加重平均値を用いる。 ・よって、単純無作為抽出時に比較して標本誤差を低く抑えることができる(ことが多い)。 ここで質問なのですが・・・、 ・層化比例無作為抽出をおこなう場合、すべてのな区間推定や検定,果ては分析仮定で標準誤差を用いるすべての多変量解析において、一般的な統計ソフトを用いることは『正しくない』のでしょうか(大抵の統計ソフトは単純無作為抽出を仮定していると考えています)? ・『正しくない』とすれば、皆さんはどのように対処されてらっさるのでしょうか?ご自身でスクリプトを書いたりされているのでしょうか?それとも、「分析結果にさほど影響を与えるものでもないから統計ソフトで済ましている」といった感じなのでしょうか? 以上、どなたかおわかりの方がいらっしゃいましたら、ご教授いただけませんでしょうか? 宜しくお願いいたします。

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2

理論的には分かっていても、時間、金、精神エネルギーなどのコストの関係で、現実に使える手段は限られるということでしょうか。 層化比例無作為抽出(したがって復元倍率を使わないか、またはすべての客体に同一の復元倍率を乗じる)に限れば、単純無作為抽出より必ず達成精度が高くなります。したがって、これをあたかも単純無作為抽出のようにみなして誤差を計算すると、必ず過大推計になります。誤差を安全弁としてみると、過少推計すれば差し障りが大きいけど、過大推計する分には差し障りが少ない、という意味で、単純無作為抽出のようにみなして計算することを正当化できるかもしれません。ただ、レポートにまとめるときは、そういう方法をとったことを明記するのが良心的でしょう。

共感・感謝の気持ちを伝えよう!

質問者からの補足

私の知りたかったことへのドンピシャのご回答をいただきました。 有難うございます。 非常に参考になります。 で、よろしければもうひとつだけ質問にお付き合いいただいてよろしいですか? >層化比例無作為抽出(したがって復元倍率を使わないか、またはすべての客体に同一の復元倍率を乗じる)に限れば、単純無作為抽出より必ず達成精度が高くなります。 巷の学習書などでは、この点について「だからとりあえずは層化比例無作為抽出をしたらいいよ」という趣旨が展開されていることが多いように感じるのですが、もし単純無作為抽出と層化比例無作為抽出のどちらも可能な状況であれば単純無作為抽出のほうを用いるべき調査主題というのもあるのではないかと考えるのですがいかがでしょう? 例えば、『利き腕(地域別の有意差はないと仮定)』の調査に居住地域を層化基準として層化比例単純無作為抽出をおこない、その結果得たサンプルデータについて、抽出法に応じた誤差推定をおこなった場合、本来の誤差の一部を層間誤差として取り除いた不正に過小評価された誤差をはじき出してしまうように思います。

その他の回答 (1)

  • 回答No.1

ご質問の趣旨に合っているか自信がありませんけど… 1 層化抽出の場合の標準誤差などを、単純無作為抽出を前提とした手法で推計するのは、もちろん、間違いです。 2 しっかりした統計調査なら、層化抽出を前提とした手法で標準誤差を推計していますし、また、その推計方法を公開しています。代表的な方法として、 (1)層別に標準誤差を推計したうえで、それらのウェイト付けされた総和でもって、全体の標準誤差を計算する、 (2)(副標本による方法)サンプルをいくつかのグループに分けて集計して、そのグループごとの結果の散らばりから、全体の標準誤差を推計する、 といったものがあります。例えば、失業率なら、次のURLに解説があります。 http://www.stat.go.jp/data/roudou/9.htm 3 2つの調査の結果が違っているかどうかを検定するために、カイ2乗検定の一種のワルド検定を使う方法もあります。 http://www.jil.go.jp/institute/discussion/2005/05-001.html 4 市販の統計ソフトにも、層化抽出に対応したものがあるようです(私は使ったことがありませんが)。 http://www.spss.co.jp/software/pasw_cs/index.html

共感・感謝の気持ちを伝えよう!

質問者からの補足

つたない質問にご回答いただき有難うございます。 1,2: そうですね。このあたりのことについては、何とか理解できていると思います。 ただ、同じ層化抽出でもネイマン配分による層化であったり、リンク先のような複雑な多段抽出であれば 様々な推定方法について明記されていることもあるかと思いますが、『層化比例無作為抽出』の場合ですと母数の推定値は単純無作為抽出の場合と一致し、推定誤差の違いが問題になってくると認識しておりますので、現実に統計をお使いになっている方は「まあ、いろいろ細かいことをやるくらいなら誤差くらいはいいだろう」と考え単純無作為抽出を仮定した誤差推定をおこなうことが多いのだろうか、またそれが一般的であるといえるのだろうかと、そのように考え質問させていただいた次第です。 いかがなものでしょうか? 3: はい。今回悩んでる中で私もこのリンクは確認しました。 これは私にとってひとつの解決策ではあるのですが、例えば分散分析や多変量解析など、より汎用性のある手段を探しています(そんなのないような気もしますが・・・)。 4: 3と同様です。 私にとっては『富士の高嶺に降る雪』ってやつですね。 ただ、詳細をみてみると、ワルド検定が多用されているようですので、逆説的に考えると、通常は皆さん層化比例無作為抽出時は単純無作為抽出を仮定した方法で分析しているのかな、と感じました。

関連するQ&A

  • 統計学における無作為抽出に関する質問です.

    統計学における無作為抽出に関する質問です. 有限母集団から全ての個体を抽出すること,すなわち全数調査は,無作為抽出の一種と見なして良いのでしょうか?私は,良いと考えます. 無作為抽出が満たすべき条件は,全ての個体に抽出される機会を均等に与え,母集団の性質を標本にできるだけ反映させることだと思います.全数調査は,この条件を満たしています.標本が母集団そのものになりますから,標本は「できるだけ」どころか「完全に」母集団の性質を反映しています. 例えば,「日本中から無作為に1000人を抽出した」と言った表現があります.これが無作為抽出であるならば,1億人の有限母集団から2000人を選んでも,100万人を選んでも,9999万9999人を選んでも,無作為抽出のはずです.抽出される人数がある値を超えた途端,無作為抽出でなくなるとは思えません.仮にそういう値があるなら,私にはたいへん興味深いことです.無作為抽出になるかならないかの,境の値はいくつでしょう? 9999万9999までは無作為抽出だが(実行されるか否かは別として),1億になった途端,無作為抽出でなくなるのでしょうか?この場合,9999万9999と1億の間には,質的な違いがあります.つまり,前者の場合は,ある個体が抽出される確率は,完全に1ではないのに対し,後者の場合は,全ての個体が確実に,100%の確率で抽出される,という違いです.もし全数調査が無作為抽出でないならば,この辺りがポイントになるのでしょうか?

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 統計学の練習問題 解説が理解できないので…

    統計学の練習問題を解きたいのですが、解説が理解できないので教えてください。 「世帯数が約10万の市でn世帯を無作為に抽出して各世帯の人数を調べて市の人口を推定する。 推定量の変動係数を5%以下にするためには 抽出する世帯数nはおおよそいくら必要か。 ただし母集団の変動係数は1.0以下であることがわかっている。」 解説には 「世帯数を推定するのに推定量の分散が最大となる場合、つまり母集団の変動係数が1.0である場合を考えて、この場合でも推定量の変動係数が5%以下になるように標本サイズを定めればよい。標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。これが5%以下になるためには、標本サイズは(1/0.05)^2=400以上あればよい。」 と書いてあります。 理解できないのは、 『標本サイズをnとするとき、標準誤差が1/√nとなることより、変動係数は1/√nとなる。』 この部分です。 変動係数=標準偏差/平均値 標準誤差=標準偏差/√n というのは調べました。 どうして『』のような流れになるのでしょうか? 教えてください。よろしくお願いします。

  • 標準誤差とその性質

    標準誤差(SEM)が標本平均の標準偏差であることは,分かったのですが,母集団から標本集団Aと標本集団Bをとった場合に,AとBの標準誤差の関係が分かりません。 具体的には,例えば貨幣を製造したときに基準をパスする貨幣の重さのSEMが1つの貨幣あたりsだとした場合に,n個の貨幣を無作為抽出したときに得られる総和の標準誤差と貨幣の重さの平均の標準誤差が求められるものでしょうか。

  • カイ自乗分布の問題について質問です

    カイ自乗分布の問題について質問です 私は高校生で、経済学に興味があるので統計学を自習しております。しかし参考書にわからない問題があり困っております 統計学に詳しい方、よろしくお願いします。 1 自由度100のカイ自乗分布においてχ^2の5%点を正規分布近似により求めなさい 2 平均10 分散5 の正規母集団から抽出した大きさ4の無作為標本に基づく標本分散s^2が8より大きくなる確率は0.05より大きいか 3 平均μ 分散30の正規母集団からの大きさ16の無作為標本に基づく標本分散をs^2とする P(a<s^2<b)=0.95となるような定数a b を求めよ ただしP(s^2はa以下)=0.025とする

  • 多変量解析と検定の違いは?

    現在、アンケート調査の回答分析について学んでいます。 しかし、多変量解析と統計的検定の違いがわからなくて困っています。 どんなときに解析を使い、またどんなときに検定を使えば良いのでしょうか? ちなみに多変量解析は共分散構造解析、検定はカイ二乗検定を学んでいます。

  • 検定の質問です

    問題がどうしても解けないのでお願いいたします。 母分散と母平均が両方未知で正規母集団から大きさ51の標本を無作為抽出し、不偏分散Vを計算しました。 帰無仮説:母分散がvを有意水準0.05%で検定するときの棄却域をどうか教えてください。 カイ2条分布を用いて解けるとは思うのですが、どのように区間推定したら良いのかわからないのでよろしくお願いいたします。

  • 高校数学の標本平均について 教えてください。

    母集団から大きさnの無作為標本を抽出しそれらの変量xの値をX1.X2.….XnとするときXバー=(X1+X2+…Xn)/nを標本平均という。標本平均Xバーの確率分布と母集団分布関係を調べよう。母平均m,母標準偏差σの母集団から大きさnの無作為標本を抽出しそれらの変量xの値をX1.X2.….Xnとする。各Xkはどれも大きさ1の標本で母集団分布に従う確率変数である。よってE(X1)=E(X2)=E(Xn)=m σ(X1)=σ(X2)=σ(Xn)=σであるしたがって E(Xバー)=mになる。 また復元抽出の場合はX1.X2.….Xnは互いに独立な確率変数であるから分散V(Xバー)={V(X1)+V(X2)+…+V(Xn)}/n^2というところがわかりません。 なぜn^2で割ることになるのですか? どなたか教えてください。お願いします。

  • 統計の標準誤差について教えてください

    統計の問題を解いているんですが誤差についての問題でつまずいています。わかる方いましたら解答・解説をご教示願います。 問、ある県の高校入試の数学の成績は標準偏差14点であろうと予想されている。母平均を95%信頼区間で推定するとき、次の問いに答えよ。 (1)無作為抽出した100人の平均点がx~(エックスバー)のとき、母平均μの誤差はいくらか。 (2)母平均μの誤差を2点以内にするには、抽出する標本の大きさnをどれくらいにすればよいか。 よろしくお願いします。