• ベストアンサー

何でもかんでもt検定を使うのはOKですか?

雑誌に掲載された学術論文を読んでいると、対応の無い2群間の間に有意差があるか否かを判断するのに大抵t検定が使われています。 しかし、パラメトリックなt検定の前提条件としては、正規分布が必要と聞いています。サンプル数が多い場合は「どんな分布でも正規分布に近づく」という大数の法則をあてはめて、近似的に正規分布と見なしてt検定するのも分かりますが、サンプル数が高々10個程度(1群につき)のケースでもt検定を使って良いのでしょうか。 正規分布を満たすことを確認する検定をしてからt検定をするなら理解できますが、私の読む論文では、少ないサンプルに対し、正規分布か否かを確認せずいきなりt検定している場合が多く、これはマンホイットニーのU検定なんかを使う方が良い様に思っています。

質問者が選んだベストアンサー

  • ベストアンサー
  • kyo1308
  • ベストアンサー率42% (3/7)
回答No.2

経験上ですが。 >サンプル数が高々10個程度(1群につき)のケースにt検定 間違いではないと思いますが、これは確かに信憑性が低いと思います。 エクセルでt検定が簡単に出来てしまうので、あまり勉強せずに使ってしまうのでしょう。 少し統計の本を読むだけで理解できそうですが。 >マンホイットニーのU検定なんかを使う 同感です。 自分の場合はn数が少ない場合はウィルコクソンなどを使用したりします。 手計算になりますが、より信憑性の高いものを発表したいですし。

その他の回答 (2)

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

サンプル数ではなくてサンプルサイズ、もしくは標本の大きさですね。 原則としてパラメトリック検定を用いるというのが妥当だからでしょう。明らかに正規分布には従わない、というような場合にはノンパラメトリック検定もありますよということ。 そもそも、人によっては > 正規分布を満たすことを確認する検定をしてからt検定をする ということが、すでに検定の多重性が生じるので好ましくないと考える人もいます。 重要なのは、母分布が正規分布に従うと仮定することが妥当であるかどうかという問題で、経験的に(明らかに)正規分布に従わないとされるもの以外では、むしろ「正規分布には従わない」と仮定することのほうがおかしな話でしょう。

回答No.1

三重大の奥村教授の統計のページに似たような話が載っています。 http://oku.edu.mie-u.ac.jp/~okumura/stat/ttest.php

関連するQ&A

  • 統計学 正規分布と対数正規分布の比較方法

    統計学についての質問です。 比較使用としている群で、ひとつの群は正規分布( Shapiro-WilkのW検定、p<0.05)で、もう一つの群が対数正規分布(KolmogorovのD検定)となりました。この二群間にて数値の有意差を検定するときの検定方法は正規分布の二群間と同じようにt検定等といったパラメトリックな検定を用いて問題ないのでしょうか? また、正規分布と対数正規分布の二群を検定する検定方法はどのような方法が望ましいのでしょうか。 対数正規分布は標本数8検体で、正規分布のものは3検体~12検体となっています。

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • T検定とMann-WhitneyのU検定の使い分け

    ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない2郡間での検定です。 T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか? また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか? 例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか? また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか? それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。 統計についてかなり無知です、よろしくお願いします。

  • SPSSでの3群間の多重比較について

    統計学初心者です。 SPSSを用いて統計をやっています。 3群間のデータ比較を行っていますが、下記の方法で正しいのでしょうか? まず3群のデータはそれぞれ正規分布していません。 なので、クラスカル・ワーリス検定を用いて検定をした結果、『有意差あり』となりました。 ここから、どの群間に有意差があるのかを調べたいのですが、SPSSではノンパラメトリック版の多重比較はできないのでしょうか? できない場合、それぞれの群間をマンホイットニー検定で比較することは正しいのでしょうか? 統計初心者で的外れなことを言っているかもしれませんが、よろしくご教授いただけたらを思います。 よろしくお願いします。

  • マンホイットニーのU検定について教えてください。

    過去の論文と今回私たちが測定した結果との間に有意差があるかを知るために、検定を行いたいです。測定した値が等分散を示さないだろうから、studentのt検定を使用するのは不適切だろうとのご指摘を受けました。 そこで、マンホイットニーのU検定を使おうかと思うのですが、過去の論文で分かっているデータが平均値と標準偏差のみなのですが、マンホイットニーのU検定を行うことは可能なのでしょうか?ちなみにデータ数(n)は私たちが30、過去の論文は18です。 統計学は正直、初心者です。 ご教授ください。

  • パラメトリック検定か、ノンパラメトリック検定か?

    サンプルが小さい場合、パラメトリックかノンパラメトリックかどちらを選択すべきなのでしょうか? 検定は、一標本t検定か、WILCOXONの符号付き順位和検定のどちらかなのですが、サンプルが正規分布するかどうかわかりません。こういう場合は、両方の検定を行い、いずれの場合も優位さがなければ、検定する2郡には優位差はないとしてよいのでしょうか?? 検定には全くの素人です。。 どなたか、ご教授ください。

  • 対応のあるサンプル t検定 ウィルコクソンの符号検定

    今、コンテントアナリシスの卒論を書いています。 有名な人物の発言の頻度について検定を行っています。 男性と女性の著名人40人ずつを選択して、その動詞に注目しています。 40人それぞれについて、考える、考えた、買う、買ったという4つの動詞の 頻度について記録しました。 そこで問題が発生しました。 男性のサンプルと女性のサンプルで、「過去形の方が現在形よりも頻度が高い」という仮説を検定しようとしています。 「考える」と「考えた」に関しては、男性も女性もそれぞれ正規分布といえそうです。(Skew、Kurtosis、S-W検定、箱ひげ図等をみて総合的に判断) ですが、「買う」と「買った」の場合には、男性の場合には正規分布といえそうなんですが、女性には正規分布とは言え無そうなんです。ログとか平方根とかの変換もしてみたんですが、それでもぜんぜん正規分布からは程遠いです。 こんな場合に、 1:正規分布していると仮定して、すべてのサンプルについてt検定で押し通す。 2:正規分布が仮定している場合にだけ、対応のあるサンプルのt検定をして、 それ以外にはウィルコクソンの符号検定を行う。 という2つのどちらで行けば良いんでしょうか? 本当に困っています。先生は病気にかかってしまい、聞くことのできる方がまったく居ません。統計の論文なんかも読んでみたんですが、印象としては1の人が多いように思ったんですが、正規性が仮定できないのに??と思ってしまっています。

  • t検定かU検定か

    よろしくお願いします。 前提: サンプルサイズ各群ともに300 尺度は5段階のリッカートスケールの順位尺度 間隔尺度以上かつ正規性と等分散(等分散が仮定できない場合はウェルチのt検定)が仮定できる場合はt検定。 正規性が仮定できず、等分散(をシーゲルティーキー検定などで検定)が仮定できる順序尺度の場合はマン・ホイットニーのU検定 という解釈になると思います。(浅学のため間違いは指摘してくださると幸いです) ここで問題なのですが、5段階程度の順位しかなく、サンプルサイズが大きい場合、 U検定で同順位ばかりになってしまい、U値が大きくなってしまうため、 t検定などのパラメトリック手法を使う方が良いとも聞きます。 しかし、やはり順序尺度の場合はノンパラを優先すべきでしょうか。 それとも、U検定、t検定の結果を併記し、異なる結果がでた変数に対しては結論を保留するというような方法が良いのでしょうか。 併記している論文はあまりみかけませんし、5段階の順位尺度でもt検定を行なっている社会学系の論文はよく見かけます。 よろしくお願いします。

  • 対応のあるt検定についての質問です。

    対応のあるt検定についての質問です。 対応のない平均値の検定ではサンプルサイズが大きいとき、標準化した値は標準正規分布に従うため、それを使います。しかし、対応のある平均値の検定では、サンプルサイズが大きくてもt分布を用いるようです。なぜでしょうか? 宜しくお願い致します。

  • 正規性の検定について

    正規性の検定において、例えば5%未満で有意な時には「有意に正規分布に従わない」と判断できると思います。 この場合の帰無仮説はどうなるのでしょうか? t検定では例えば「両者に差がない」という帰無仮説を立て、p=0.02ならば棄却でき、「5%未満で有意に差がある」といえ、もしp=0.07となったら、「有意に差があるとは言えない」 この考え方で言うと、正規性の検定の場合、帰無仮説は「正規分布しない」となって、これを棄却して「正規分布する」と結論付けるような気がするのですが、この考えは根本的に間違っていますか? ごちゃごちゃして、分からなくなってしまいました。 どなたか詳しい方、お願いします。