• ベストアンサー
  • すぐに回答を!

対応のないt検定について

  • 質問No.8840632
  • 閲覧数150
  • ありがとう数1
  • 気になる数0
  • 回答数1
  • コメント数0

お礼率 45% (69/153)

本日、対応のないt検定について、教授(統計が専門ではなく、社会学系)から話がありました。
a群(n=99)、b群(n=99)において、有意な差が「絶対にでない」と言い、
有意な差がでるのは各群n=100以上の時であり、有意な差がでる可能性があると言っておりました。
授業後、「n=99以下の時に有意な差が絶対にでない」という根拠が知りたかったのですが、忙しいので説明できないと言って帰って行きました。

対応のないt検定のt値の算出式を見る限り、サンプルサイズに関わらず、平均、分散によって算出されるt値が、t分布(自由度、有意水準)により算出された値を超えれば、帰無仮説(Ho:a群=b群)を棄却できると思うのですが、「絶対に棄却できない根拠」は何なのでしょうか。直感的にも、サンプルサイズが少なければ、分散の裾が広がり、分布が横に長くなるので、帰無仮説を棄却しにくくなると思いますが・・・

質問者が選んだベストアンサー

  • 回答No.1
  • ベストアンサー

ベストアンサー率 46% (23/49)

その先生の専門領域では標本の数を最低100集めることが常識で、
そのことを伝えようとしたときに、
じゃぁ99じゃだめなのか、という話題になっていまって、
勢いでとにかく100以上だ、99はだめだ、と言ってしまったのを
変に真に受けて考えている、的な展開に見えます。
ただ、本来その話をするところを間違えているかも。

質問者様の第2パラグラフに書いてある話は、説明が短すぎて絶対にとまでは申し上げられませんが、たぶんまっとうな理解です。

たとえば正規分布に従うなら5%両側確率で1.960を乗じることになる計算で、サンプル数が少ないともう少し大きな値を掛けなければなりません。それがt分布という議論の本質です。当然t分布の5%両側確率についてn=∞で1.960です。このnが小さくて10くらいだったら、少し大きな2.228を使いましょう、n=3だったら3.182を使いましょう、って話ですね。
はっきりしたことがいえる範囲を議論してますから、大きな数字をかけるほど、範囲が拡がって、はっきりしなくなるという意味です。

それを、「細かいことはいいから、だいたい2ですよね」、くらいに思えるなら、n=20のとき2.086、n=30のとき2.042ですし、まあ30越えたらもう「十分たくさん」ってことでいいんじゃないですか(ペンネーム スチューデント、本名ゴセットが考慮した、サンプル数が少ないときの特別扱いが、不要ではないか、という意味)と思えます。でもn=100で1.984だから1.960には迫りきってないかも。


いろんな統計の本を読むと、その境目を、30くらいを目安に、といっているのが少なめにいう人、多めにいう人で100を目安にしてますよね。
というか、30と100という2つの数字がよくでてきますよ。
それでその先生は100派。

ただ、サンプル数がその境目を下回ったらt分布で議論しなきゃいけないっていう話です。少なくても有意かどうかは議論できます。

バイオの世界とかだと、n=3くらいで2群の善し悪しを議論しなきゃいけないケースって、実際よくありますよ。でもそれは得られる差に比べてデータの分散がある程度小さいとき。
社会学でn=3って「そういう人もいる」程度のことしか言えないですよね。もともと差が大きすぎるところだと数が必要ですよね。
別の言い方をすると、両側5%議論で「何%の人が○○です」という話をするなら、n=10でそれなりに広い信頼区間ができてしまい±31%くらい。これがn=30だと±17.9%、n=100だと±9.8、n=10000で±1.0%。なのでn=100は越えてほしいですよね。テレビの視聴率みたいに0.1%で一喜一憂するならn=96万くらいだったかな。
ただ、これはご質問のt検定の有意な差の話と少し違う議論ですよね。差が十分大きければ、サンプル数少なくても、有意って言えたりするんですよ。
お礼コメント
hetaeigo1989

お礼率 45% (69/153)

ありがとうございます。
真意を次回の授業にでもきこうと思います。

また、大変勉強になりました。
投稿日時:2014/11/29 17:22
結果を報告する
このQ&Aにはまだコメントがありません。
あなたの思ったこと、知っていることをここにコメントしてみましょう。
関連するQ&A

その他の関連するQ&Aをキーワードで探す

ピックアップ

ページ先頭へ