対応のないt検定について

このQ&Aのポイント
  • 対応のないt検定について、教授からの話をまとめます。
  • 対応のないt検定のt値の算出式を見る限り、サンプルサイズに関わらず、帰無仮説を棄却できるかどうかは分布の形によると思われます。
  • サンプルサイズが少ないと、分布が横に長くなるため、帰無仮説を棄却しにくくなる可能性があります。
回答を見る
  • ベストアンサー

対応のないt検定について

本日、対応のないt検定について、教授(統計が専門ではなく、社会学系)から話がありました。 a群(n=99)、b群(n=99)において、有意な差が「絶対にでない」と言い、 有意な差がでるのは各群n=100以上の時であり、有意な差がでる可能性があると言っておりました。 授業後、「n=99以下の時に有意な差が絶対にでない」という根拠が知りたかったのですが、忙しいので説明できないと言って帰って行きました。 対応のないt検定のt値の算出式を見る限り、サンプルサイズに関わらず、平均、分散によって算出されるt値が、t分布(自由度、有意水準)により算出された値を超えれば、帰無仮説(Ho:a群=b群)を棄却できると思うのですが、「絶対に棄却できない根拠」は何なのでしょうか。直感的にも、サンプルサイズが少なければ、分散の裾が広がり、分布が横に長くなるので、帰無仮説を棄却しにくくなると思いますが・・・

質問者が選んだベストアンサー

  • ベストアンサー
  • fluidicB
  • ベストアンサー率46% (23/49)
回答No.1

その先生の専門領域では標本の数を最低100集めることが常識で、 そのことを伝えようとしたときに、 じゃぁ99じゃだめなのか、という話題になっていまって、 勢いでとにかく100以上だ、99はだめだ、と言ってしまったのを 変に真に受けて考えている、的な展開に見えます。 ただ、本来その話をするところを間違えているかも。 質問者様の第2パラグラフに書いてある話は、説明が短すぎて絶対にとまでは申し上げられませんが、たぶんまっとうな理解です。 たとえば正規分布に従うなら5%両側確率で1.960を乗じることになる計算で、サンプル数が少ないともう少し大きな値を掛けなければなりません。それがt分布という議論の本質です。当然t分布の5%両側確率についてn=∞で1.960です。このnが小さくて10くらいだったら、少し大きな2.228を使いましょう、n=3だったら3.182を使いましょう、って話ですね。 はっきりしたことがいえる範囲を議論してますから、大きな数字をかけるほど、範囲が拡がって、はっきりしなくなるという意味です。 それを、「細かいことはいいから、だいたい2ですよね」、くらいに思えるなら、n=20のとき2.086、n=30のとき2.042ですし、まあ30越えたらもう「十分たくさん」ってことでいいんじゃないですか(ペンネーム スチューデント、本名ゴセットが考慮した、サンプル数が少ないときの特別扱いが、不要ではないか、という意味)と思えます。でもn=100で1.984だから1.960には迫りきってないかも。 いろんな統計の本を読むと、その境目を、30くらいを目安に、といっているのが少なめにいう人、多めにいう人で100を目安にしてますよね。 というか、30と100という2つの数字がよくでてきますよ。 それでその先生は100派。 ただ、サンプル数がその境目を下回ったらt分布で議論しなきゃいけないっていう話です。少なくても有意かどうかは議論できます。 バイオの世界とかだと、n=3くらいで2群の善し悪しを議論しなきゃいけないケースって、実際よくありますよ。でもそれは得られる差に比べてデータの分散がある程度小さいとき。 社会学でn=3って「そういう人もいる」程度のことしか言えないですよね。もともと差が大きすぎるところだと数が必要ですよね。 別の言い方をすると、両側5%議論で「何%の人が○○です」という話をするなら、n=10でそれなりに広い信頼区間ができてしまい±31%くらい。これがn=30だと±17.9%、n=100だと±9.8、n=10000で±1.0%。なのでn=100は越えてほしいですよね。テレビの視聴率みたいに0.1%で一喜一憂するならn=96万くらいだったかな。 ただ、これはご質問のt検定の有意な差の話と少し違う議論ですよね。差が十分大きければ、サンプル数少なくても、有意って言えたりするんですよ。

hetaeigo1989
質問者

お礼

ありがとうございます。 真意を次回の授業にでもきこうと思います。 また、大変勉強になりました。

関連するQ&A

  • 正規性の検定について

    正規性の検定において、例えば5%未満で有意な時には「有意に正規分布に従わない」と判断できると思います。 この場合の帰無仮説はどうなるのでしょうか? t検定では例えば「両者に差がない」という帰無仮説を立て、p=0.02ならば棄却でき、「5%未満で有意に差がある」といえ、もしp=0.07となったら、「有意に差があるとは言えない」 この考え方で言うと、正規性の検定の場合、帰無仮説は「正規分布しない」となって、これを棄却して「正規分布する」と結論付けるような気がするのですが、この考えは根本的に間違っていますか? ごちゃごちゃして、分からなくなってしまいました。 どなたか詳しい方、お願いします。

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • 2群間平均の差の検定 差が“ない”ことを示すには?

    2群間平均の差の検定 差が“ない”ことを示すには? お世話になってます。 2群の平均を比べて,両者の平均には差が“ない”という仮説を設定して検定したいと考えています。 通常の2群間の平均の差の検定は,両者の平均に差が“ある”ことを仮説として設定して, 帰無仮説に「2群の平均に有意な差がない」を設定し,対立仮説に「2群の平均に有意な差がある」を設定しています。 もし両者の平均には差が“ない”という仮説を検定したい場合には,単純にt検定を行って,棄却されなかった=「2群の平均に有意な差がない」という結論ではいけないと統計の授業で習った気がします。 その理由を説明できなくて申し訳ないですが・・・ そこで質問なのですが, 帰無仮説に「2群の平均に有意な差がある」を設定し,対立仮説に「2群の平均に有意な差がない」を設定してもよいのでしょうか? そして,「2群の平均に有意な差がある」という帰無仮説を検定するためにはどのような検定方法を用いればいいのでしょうか? お時間ございましたら,ご教示のほど宜しくお願い申しあげます。

  • 自由度とt分布

    自由度19のt分布の上側が2.5%が2.093 であるとき、帰無仮説が有意水準5%で棄却できるというのがわから ないでいます。t分布表の上側2.5%は片側検定? 有意水準5%は両側検定? おしえてください。

  • 「有意差検定」とは

    「有意差検定」「統計学的有意性の評価」とは、どうすればよいのでしょうか。 平均値、標準偏差、標準誤差が求まっているので、以下の手順を踏むとよいと調べたら出てきました。 が、何をどうすればよいのかわかりません。 (ちなみに今回行った実験は、マウスに局所麻酔薬を注射して痛み刺激を与え、痛がらなかった回数を記録する、というものです) ① 仮説設定: まず、研究の対象に応じて帰無仮説(H0)と対立仮説(H1)を設定します。例えば、2つのサンプル間の平均値に差があるかどうかを検定する場合、次のように設定できます。 帰無仮説 (H0): 2つのサンプルの平均値は等しい。 対立仮説 (H1): 2つのサンプルの平均値は等しくない(または、ある特定の差がある)。 ② 統計検定の選択: 2つのサンプル間で平均値の差を評価する場合、独立な2標本t検定が適しています。ただし、データの性質や仮説に応じて、他の統計検定を選択することもあります。 ③ t検定の実行: 選択したt検定を実行し、結果を得ます。t検定は、2つのサンプルの平均値の差が統計的に有意かどうかを評価します。結果には、t値(t-statistic)とp値(p-value)が含まれます。 ④ 結果の解釈: 得られたp値を帰無仮説が成立する確率と比較します。通常、あらかじめ設定した有意水準(例: 0.05)と比較して、p値が有意水準未満であれば、帰無仮説を棄却し、対立仮説を採択します。これは、2つのサンプル間に統計的に有意な平均値の差があることを示唆します。 どんな些細なことでも教えていただきたいです。 どうぞよろしくお願いいたします。

  • 分散の検定

    昨年末のアクチュアリー試験での問題です。 分散の片側検定において,真の分散が帰無仮説において仮定された分散の3倍になったとき,帰無仮説が確率95%以上で棄却されるようにするには標本数が[ ]個あればよい.ただし,平均は未知とし,有意水準は0.05とする. という問題です。分布に何の仮定もないし、標本数の大きさを問うのだから正規分布近似も適当だとは思えません。とするとχ^2-testではできないように思います。こういう問題の場合、どのように解くものなのでしょうか?

  • エクセルによる母分散の検定

    一つの母集団から標本のサンプルサイズ10、標本平均50、不偏分散100を与え、母分散に関する帰無仮説 σ2=50、有意水準5%としたとき棄却域を求め仮説を検定しろ。 という課題がでたのですが、悪戦苦闘しています。どなたか分かる方教えてください。

  • t検定について教えてください

    t検定に関する質問はたくさんあるのですが、今、頭がこんがらがっており、 誠に勝手ながら新しく質問させてください。それではよろしくお願いします。 2標本の分布が等しいと仮定。t検定の基礎を教えてください。 帰無仮説は、「2標本の平均が等しい」ですか? 帰無仮説が上記の場合、 危険率1%で仮説が棄却されず、5%で棄却されることはありますか? 上記の判定がなされた場合、 これら2標本はどのような関係にありますか? 1~5%の確率でうんぬん???よくわからなくなってしまいました。 駄文のみの状況説明で、申し訳ありませんが、ご教授願います。 それではよろしくお願いします。補足要求があれば、つたない説明ながら加えさせていただきます。

  • 検定の有意水準・95%信頼区間の質問

    例えば、ある行為のあとに血圧が下がるという仮説を立てて研究するとします。 そして、対応のあるt検定を行います。(正規分布を仮定できたとして) 前後に差がないという帰無仮説のもとに、そのときのt統計量を算出し、自由度n-1のt分布の確率密度関数を積分したP値が棄却閾か?95%信頼区間か?で判定を有意差ありor有意差なしとします。 しかし、これは「前後の母平均に差があるかどうか?」の確率ですよね?【どの程度の差】なのかは知ることができませんよね? 所詮、差があるかどうかを2択で言い切っているだけですよね? どの程度の差なのか?ということを知るためにはどうしたらよいのでしょうか?また、その差は【有効的?】?かどうかどうやって判定(判断)したらよいのでしょうか? (自分の考えとして) 95%信頼区間の上限・下限の値を母平均にプラスマイナスして算出して、?!あれ? わかりません。 ?もしかして、どの程度の差なのか?は標準偏差で判断するのかな? よくわかりません。どうか教えてください。お願いします。

  • t検定について教えて下さい(Excel)

    質問内容をご覧頂いてありがとうございます。 どちらか一方でも回答いただけると幸いです。 質問1 t検定:等分散を仮定した2標本による検定を行なおうとしたところ、「仮説平均との差異」を入力する欄が出てきます。この欄はどういった場合に入力するのでしょうか?それぞれの標本の平均の値は0.654と0.695なのですが、その差の0.041を入力するのでしょうか?それとも0を記入し、帰無仮説として平均が等しいとして、有意な差がでたならば帰無仮説は棄却できる(つまり平均は等しくない)といえるようにするのでしょうか? 質問2 t検定:等分散を仮定した2標本による検定を行ったところ(仮説平均の差異の欄には0を記入)、P(T<=t) 片側とP(T<=t) 両側の値がそれぞれ3.4E-13、6.80E-13という値になりました。このE-13の意味がわかりません。どういう意味なのでしょうか? わかりづらい文章で申し訳ありませんが、よろしくお願いします。