• ベストアンサー

対応のあるt検定についての質問です。

対応のあるt検定についての質問です。 対応のない平均値の検定ではサンプルサイズが大きいとき、標準化した値は標準正規分布に従うため、それを使います。しかし、対応のある平均値の検定では、サンプルサイズが大きくてもt分布を用いるようです。なぜでしょうか? 宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

誤解のないように 「対応のない平均値の検定ではサンプルサイズが大きいとき、標準化した値は標準正規分布に従うため、それを使います。しかし、対応のある平均値の検定では、サンプルサイズが大きくてもt分布を用いるようです。」 という引用元(どんな本あるいは論文、webぺージに書いてあったのか)を書いたほうがよかったかもしれませんね。 サンプルサイズというよりも自由度が10以上である場合のt分布はほとんど正規分布と同じなので、その際にはt分布を用いようが正規分布を用いようが大差はないということです。 ちなみに対応ありのt検定というのは、対応のあるデータの差をとって独立1標本の平均値の検定を行うということです。 あまり回答になっていませんが(^_^;)

161016
質問者

補足

ご回答有難うございました。ということは、対応のあるt検定でも自由度が大きければ、標準正規分布表を用いてもかまわないと理解してよろしいでしょうか? お手数ですがよろしくお願い致します。

関連するQ&A

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • 何でもかんでもt検定を使うのはOKですか?

    雑誌に掲載された学術論文を読んでいると、対応の無い2群間の間に有意差があるか否かを判断するのに大抵t検定が使われています。 しかし、パラメトリックなt検定の前提条件としては、正規分布が必要と聞いています。サンプル数が多い場合は「どんな分布でも正規分布に近づく」という大数の法則をあてはめて、近似的に正規分布と見なしてt検定するのも分かりますが、サンプル数が高々10個程度(1群につき)のケースでもt検定を使って良いのでしょうか。 正規分布を満たすことを確認する検定をしてからt検定をするなら理解できますが、私の読む論文では、少ないサンプルに対し、正規分布か否かを確認せずいきなりt検定している場合が多く、これはマンホイットニーのU検定なんかを使う方が良い様に思っています。

  • t検定 U検定 メディアン検定

    サンプルサイズ300の集団に心理系の4尺度の質問を行い、まず属性により尺度得点に差があるかをみたいのですが、下位尺度と自作の質問で全部で17あります。属性は2群が4種類と3群がひとつの5つあります。 この全てについて、性別で2群に分けた後、別の属性で分類し比較したいのですが属性によっては、8と140とかかなりサンプルサイズにばらつきがあります ある属性では、正規分布は1尺度だけでこれにはt検定。正規分布でない尺度にU検定をし、等分散でないものにはメディアン検定など使うのでしょうか SPSSを使っています 記述するときには膨大な量になります。正規分布している場合にはt検定で平均値とSD、p、そうでなければU検定で中央値とp、等分散でなければメディアン検定で中央値とpを書くのでしょうか 初心者です

  • 対応のないt検定について

    本日、対応のないt検定について、教授(統計が専門ではなく、社会学系)から話がありました。 a群(n=99)、b群(n=99)において、有意な差が「絶対にでない」と言い、 有意な差がでるのは各群n=100以上の時であり、有意な差がでる可能性があると言っておりました。 授業後、「n=99以下の時に有意な差が絶対にでない」という根拠が知りたかったのですが、忙しいので説明できないと言って帰って行きました。 対応のないt検定のt値の算出式を見る限り、サンプルサイズに関わらず、平均、分散によって算出されるt値が、t分布(自由度、有意水準)により算出された値を超えれば、帰無仮説(Ho:a群=b群)を棄却できると思うのですが、「絶対に棄却できない根拠」は何なのでしょうか。直感的にも、サンプルサイズが少なければ、分散の裾が広がり、分布が横に長くなるので、帰無仮説を棄却しにくくなると思いますが・・・

  • 対応のあるサンプル t検定 ウィルコクソンの符号検定

    今、コンテントアナリシスの卒論を書いています。 有名な人物の発言の頻度について検定を行っています。 男性と女性の著名人40人ずつを選択して、その動詞に注目しています。 40人それぞれについて、考える、考えた、買う、買ったという4つの動詞の 頻度について記録しました。 そこで問題が発生しました。 男性のサンプルと女性のサンプルで、「過去形の方が現在形よりも頻度が高い」という仮説を検定しようとしています。 「考える」と「考えた」に関しては、男性も女性もそれぞれ正規分布といえそうです。(Skew、Kurtosis、S-W検定、箱ひげ図等をみて総合的に判断) ですが、「買う」と「買った」の場合には、男性の場合には正規分布といえそうなんですが、女性には正規分布とは言え無そうなんです。ログとか平方根とかの変換もしてみたんですが、それでもぜんぜん正規分布からは程遠いです。 こんな場合に、 1:正規分布していると仮定して、すべてのサンプルについてt検定で押し通す。 2:正規分布が仮定している場合にだけ、対応のあるサンプルのt検定をして、 それ以外にはウィルコクソンの符号検定を行う。 という2つのどちらで行けば良いんでしょうか? 本当に困っています。先生は病気にかかってしまい、聞くことのできる方がまったく居ません。統計の論文なんかも読んでみたんですが、印象としては1の人が多いように思ったんですが、正規性が仮定できないのに??と思ってしまっています。

  • t検定について

    統計を勉強中の者です。今、A群20人とB群25人の平均の差の検定でt検定を行うとします。 t検定は、母集団が正規分布するときに使うが、標本が十分大きければ正規分布でなくともOKと本にかいてありました。 20人と25人では大丈夫でしょうか?よろしくおねがいいたします。

  • t検定の棄却域について

    t検定の棄却域について 現在t検定について勉強していまして、演習問題で訳が分からなくなったので質問させていただきます。 問題としては 次のデータは平均値が5.333である集団から抜き出したデータである。このデータの平均が母集団の平均と一致しているかどうか、t検定を用いて有意水準を5%として確かめよ。ただしデータは正規分布に従う。 データ:8,9,6,10,12,8,7,9 というものなのですが実際にこのデータについていろいろ計算してみたところ 平均値8.625、分散3.411、標準偏差1.847、自由度7、t値5.042となりました。 両側検定で棄却域を考えました。 しかしそれの設定の仕方がわかりませんでした。 まずExcelのTINV関数で求めてみたのですが2.365となり、(u<=-2.365 && u>=2.365)が確率5%の領域としました。 これは例題を参考にして求めてみました。 しかし例題と違ってこの問題には正規分布に従うという条件が付いていたので http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/kihon0/basic0.htmを参考に正規分布で考えてみたところ 正規分布で5%になるためにはz=1.96で、さらに問題設定からμ=5.333、σ=1.847としてuを求めると u=8.953となりました。 そのため(u<=-8.953 && u>=8.953)が確率5%の領域としました。 t分布で考えるとt値>棄却域となり 正規分布で考えるとt値<棄却域となってしまいました。 ここで混乱し始めたのですが、問題設定どおり正規分布で考え、帰無仮説を棄却できないという結論(抜きだしたデータの平均値は母集団の平均値と一致しないとは否定できない)でよろしいのでしょうか? 長文となりましたがよろしくお願いします。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • T検定とMann-WhitneyのU検定の使い分け

    ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない2郡間での検定です。 T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか? また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか? 例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか? また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか? それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。 統計についてかなり無知です、よろしくお願いします。

  • 対応のあるt-検定の正規性は、どこで確認をするのか

    t-検定は、データが正規分布をしていることを前提としていますが、対応のあるデータを分析する際の正規性の確認は、どこでするのでしょうか? 例えば、介入研究の介入前と介入後のような場合、 1.介入前と介入後の両データとも正規分布している必要あり? 2.介入前のデータが正規分布していればOK? 3.介入前後の差が正規分布している必要あり? 4.その他、私の思いつかない理由? 統計の本や、インターネットで調べてみても、 「t-検定はデータが正規分布に従っている(従っていると仮定する)ことが前提」と書いてあるだけで、理解していたつもりですが、よく考えてみるとわからなくなりました。 ご回答お待ちしております。