統計的推定の進め方

このQ&Aのポイント
  • 母平均の推定を行う際に、適合度検定(カイ二乗検定)を行い、正規分布に適合していない場合、nを増やしてサンプリングを続けるか、区間推定に移行するか考える。
  • 検定では正規分布が前提とされるが、推定ではその制約はない。
  • nが150以上になれば中心極限定理によって正規分布に近づくことが理解されている。
回答を見る
  • ベストアンサー

統計的推定の進め方

いつも大変お世話になります。 表題の件に関し、 例えば母平均の推定を行う際に、サンプリングn=20、の標準偏差とAVが求められているとしますが、この個々のサンプリングn=20の適合度検定(カイ二乗検定)を行うと、検定結果が、棄却→正規分布に適合してないしていない場合、母平均の推定を進めても良いものでしょうか。それとも、適合度検定が棄却された段階で、正規分布が適合されるまでnを増やしてサンプリングをつずけてから、区間推定に移った方がよいのでしょうか?(n=150以上になれば中心極限定理で正規分布かされることは理解しています。) 話が変わるかもしれませんが、 検定では正規分布かされているかどうかで(n=100以上は除く)、検定方法がかわったので(例えばノンパラメトリック)、推定ではそのような制約がないのかご教授願いたい。

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>検定では正規分布かされているかどうか 検定で、集団の正規性が要求されのは、t検定だけだと記憶しています。 t検定以外では、F検定、χ2乗検定、U検定などが利用されます(相関分析を加えると、論文の80%の統計処理はカバーできるとか)が、いずれも正規分布が想定できない場合に利用されます。 >正規分布が適合されるまでnを増やしてサンプリングをつずけてから  たとえば、貯蓄額については、サンプル数がどれほど多くても、正規分布ではないことが知られています(F分布らしい)。データ数が多いので、正規分布しているハズ、としてt検定をするのは誤りでしょう。データ数が多ければ正規分布しやすいのは事実ですが、成立しない場合もあります。  どの検定法を採用するかは、研究者の自由です。検出力が高い(=有意差が出やすい)方法で行い、「有意差有り」の結果が得られれば十分です。ただ、t検定の場合は、正規性、という前提条件を満たす必要がある、ということです。  検定結果で、「有意差は無い」という表現は、他の研究者に「私は他の検出力の高い方法で有意差を認めた」と言われると反論できないので誤りです(他にも理由があります)。

関連するQ&A

  • 統計の区間推定についてお尋ねします。

    95%信頼区間の母平均の近似的な推定で、標本平均ー1.96√(σ^2/n) < μ < 標本平均+1.96√(σ^2/n)という式があります。ここで1.96というものを持ち出すのは標準正規分布(N(0,1))の計算から求まるということになると思いますが、例えばポアソン分布に従うという場合でも使えるようです。まず、信頼区間の設定の式で上記の式が近似的に使える分布はどのようなものがあるでしょうか。 また、二項分布→近似→正規分布、とか二項分布→近似→ポアソン分布という関係があります。近似の仕方が違うわけですが、そのような分布はあの区間推定の式が使えるということになるでしょうか。あとt分布は自由度をあげると正規分布に近くなるということですが。試験とかだと丸暗記的覚えていくことが多いと思いますが、95%信頼区間といわれたら上記の式とか1.96がすぐに出てくるというのはどのような限定の下なのかを知りたいのですが。 また、これらは近似法ということであり、厳密法というのは各分布によって計算法が個別に決まっているのでしょうか。 よろしくお願いします。

  • 統計:正規分布と正規分布でない母集団を比較すると

    正規分布である母集団(n=30)と正規分布だない母集団(n=18)の差を比較するときはどうしたらよいのでしょか?パラメトリックとノンパラメトリックで正規分布の有無で検定方法が変わりますよね。この場合どうしたらよいのでしょうか?統計学あまり覚えてませんでして。

  • 統計:正規分布を仮定するかどうか(検定手法)

    母平均に関して差があるかどうかを検定したいです。 サンプルに関してA群とB群があります。 t検定を行いたいのですが、この場合、A群・B群ともに正規分布を仮定できる分布でなくてはならないものだと思います。 しかし、A群・B群に関して比較する項目が5種類ありそのうち3種類は正規分布を仮定でき、あとの2種類は正規性を期待できません。 この場合、統一してノンパラメトリック検定を行うべきですか? それともt検定とノンパラ(マンホイットニーU)検定の両方を使うべきですか? あと、A群だけ正規分布を期待できてB群は正規分布を期待できない場合は?・・・やはりノンパラメトリック検定ですか? 両群とも正規分布を期待できてはじめてt検定ができるのでしょうか?

  • 【統計学】 区間推定すれば仮説検定は不要?

    区間推定すれば仮説検定は 必要ない気がするのですが思い違いでしょうか? 例えば、区間推定によって、ある母平均μの95%信頼区間が 「-10<μ<+10」と求まったとします。 このとき、仮説「μ=μ0」を有意水準5%で検定したとすると、 「-10<μ0<+10」のとき仮説は受容され、 「μ0<-10」または「μ0>+10」のときに仮説は棄却されるのですよね。 だとすれば、なぜどういう場面で仮説検定が必要になるのかが よくわからないのですが、教えていただけますか?

  • 検定の質問です

    問題がどうしても解けないのでお願いいたします。 母分散と母平均が両方未知で正規母集団から大きさ51の標本を無作為抽出し、不偏分散Vを計算しました。 帰無仮説:母分散がvを有意水準0.05%で検定するときの棄却域をどうか教えてください。 カイ2条分布を用いて解けるとは思うのですが、どのように区間推定したら良いのかわからないのでよろしくお願いいたします。

  • 統計論文:ノンパラメトリック検定は?平均値or中央値?

    正規分布を仮定できない分布の集団で検定をするとき、ノンパラメトリック検定を使いますよね? 例えば、独立2群で母平均に差があるか検定したいとき、t検定が使えない場合マンホイットニーU検定をしますが、 記述は、平均と標準偏差とP値を書くべきですか? それとも、中央値とかを書くのですか? 論文の書き方の統計の質問です。。。

  • 統計学2

    またまたすみませんが、教えて下さい。分からないんです 課題 7. あるテレビ番組の視聴率 p (0≦p≦1)を調べるために,アンケート調査を行ったところ, 60 人中 21 人が視聴したと答えた.   帰無仮説 H0: p= 0.26,対立仮説 H1: p≠ 0.26 について,有意水準 0.08 で仮説検定を行え. また,視聴率 p を信頼度 0.92 で区間推定せよ.   ただし,仮説検定と区間推定のどちらに対しても,ラプラスの定理(2項分布の正規分布による近似)を用いよ. 検定統計量(B')= 臨界値(棄却域の端の値)= 帰無仮説 H0は, 棄却されるor棄却されない、どちらか 信頼区間 [ , ] 誰か統計得意な人助けて下さい。お願いします!

  • 統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っ

    統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っているならば、標本の大きさnの大小に関わらず、その平均の分布は正規分布」という記述があります。であるならば、母平均を区間推定する場合、zの値を用いて推定してもいいのかなと思いますが、ほとんどの書籍では、標本の大きさが小さい場合、tの値を用いて推定しています。なぜでしょうか?たぶん、自分がどこかで誤解をしているのだと思いますが、宜しくお願いします。

  • 統計学・推定量、分布とは?

    統計学を勉強をしているのですが 最良不偏推定量というものがでてきて、前提条件やら計算の仕方などは書いてあったのですが最良不偏推定量自体は何を表しているのかわかりません。ウィキも見たのですがいまいち理解できないので簡単な説明をお願いします もう一つ、分布について正規分布からカイ二乗分布、t分布、f分布の形に変形できるということはわかりましたが実際使うときに上の4つの分布のうちにどれを使うかを判断する方法はどのような方法でしょうか? 漠然としていますが宜しくお願いします

  • 確率統計における確率分布の定理について

    検定を行うときの確率分布のあてはめで、 データをk個の事象に分けて統計量X^2を求め、それが自由度k-r-1のカイ2乗分布に従う、 rは期待値を求める際に母数で推定したももの個数で、標本平均と標本分散を使用したとすればr=2、 という定理を使うと思うのですが、 例えばデータを身長として検定を行う場合はそれを標準化して、 期待値の算出にサンプルの平均、標準偏差を使うのでr=2で自由度はk-3になりますよね? ここで上の定理が正しいことを確かめるためにデータを1,000個ほどの標準正規乱数として、X^2を複数回求め、 その分布が実際にカイ2乗分布に従うかどうかを調べるときは自由度はどうなるのでしょうか? 1,000個の標準正規乱数が実際に標準正規分布に従うとして平均=0、分散=1として行う場合はr=0、 また標準正規分布に従うかではなく1,000個のサンプルから新たに平均、標準偏差を求めてX^2を求める場合はr=2となると考えたのですが、これは正しいのでしょうか? わかりにくい文ですみません。 よろしくお願いします。