• ベストアンサー

t検定について

統計でt検定という言葉をよく聞くのですが、t検定とはどのような時に用いられるのですか? t検定が用いられる時のデータの分布というのはどのようなものですか? 教えてください。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • dunnett
  • ベストアンサー率24% (16/66)
回答No.1

一標本の場合と二標本の場合があります.一標本の検定はダイェット前・後の体重の差(効果)に含まれる標準誤差の割合を検定します.一般的には二標本の検定です.A群とB群の平均値の差をt-分布を利用して解析します.データの分布は正規性を前提としますが正規性の検定は一般的には極めて実施した論文は少ないです.その代わりに分散の同一性を検定します(F-検定で等分散性・分散比を把握).両群の分散と標本数が同一の場合はStudentの検定で,同一標本で分布かせ異なる場合はAspin-Welchの検定で,表本数および分布が異なる場合はChocran-Coxのt-検定となりますが,最近の傾向はAspin-Welchで実施した論文が多いです.私もその検定を推奨します.t-分布を利用する全ての検定をt-検定と言います.所謂分散・標準偏差など分布を利用した手法でパラメトリック検定と言います.F-検定の有意差の限界は5%水準です.

その他の回答 (1)

  • ssmarugoo
  • ベストアンサー率47% (84/176)
回答No.2

>t検定とはどのような時に用いられるのですか? 正規分布していると仮定できる2群の母平均に差があるかどうか?を知りたいとき。 >t検定が用いられる時のデータの分布というのはどのようなものですか? 教えてください。 山の形のような分布(t分布)です。これは、自由度というものがあり標本数によって変わります。自由度によってt分布は変わります。

関連するQ&A

  • t検定について

    統計を勉強中の者です。今、A群20人とB群25人の平均の差の検定でt検定を行うとします。 t検定は、母集団が正規分布するときに使うが、標本が十分大きければ正規分布でなくともOKと本にかいてありました。 20人と25人では大丈夫でしょうか?よろしくおねがいいたします。

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • 対応のあるt-検定の正規性は、どこで確認をするのか

    t-検定は、データが正規分布をしていることを前提としていますが、対応のあるデータを分析する際の正規性の確認は、どこでするのでしょうか? 例えば、介入研究の介入前と介入後のような場合、 1.介入前と介入後の両データとも正規分布している必要あり? 2.介入前のデータが正規分布していればOK? 3.介入前後の差が正規分布している必要あり? 4.その他、私の思いつかない理由? 統計の本や、インターネットで調べてみても、 「t-検定はデータが正規分布に従っている(従っていると仮定する)ことが前提」と書いてあるだけで、理解していたつもりですが、よく考えてみるとわからなくなりました。 ご回答お待ちしております。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • 分散分析かt検定か

    統計に関しては素人です. 要因は2つで,それぞれに水準が2つあります. ですので,セル(グループ?)は2×2で4つあります. 各セルのデータ数は45で,総データ数は180です. ちなみにそれぞれのセルで度数分布表を作ると正規分布します. どの要因が有意なのか知りたいのですが,二元配置の分散分析と総当 たりのt検定のどちらを行えばよいのでしょうか? また,総当たりのt検定を行った場合,結果をどのように解釈すれば 良いのでしょうか? 手もとと近所の図書館の本をザッと調べましたが結局参考になりませ んでした. 何か参考になりそうな本やHPを教えて頂けないでしょうか? よろしくお願いいたします.

  • t検定、friedman検定について

    ある論文を読んでいて、データが統計的にまとめられ、t検定、friedman検定という風にまとめられていて、差を表しているのはわかりますが、具体的なことが専門ではないのでよくわかりません。どなたかできたら、素人のでもわかりやすく教えてください。どうかお願いします。

  • t検定の棄却域について

    t検定の棄却域について 現在t検定について勉強していまして、演習問題で訳が分からなくなったので質問させていただきます。 問題としては 次のデータは平均値が5.333である集団から抜き出したデータである。このデータの平均が母集団の平均と一致しているかどうか、t検定を用いて有意水準を5%として確かめよ。ただしデータは正規分布に従う。 データ:8,9,6,10,12,8,7,9 というものなのですが実際にこのデータについていろいろ計算してみたところ 平均値8.625、分散3.411、標準偏差1.847、自由度7、t値5.042となりました。 両側検定で棄却域を考えました。 しかしそれの設定の仕方がわかりませんでした。 まずExcelのTINV関数で求めてみたのですが2.365となり、(u<=-2.365 && u>=2.365)が確率5%の領域としました。 これは例題を参考にして求めてみました。 しかし例題と違ってこの問題には正規分布に従うという条件が付いていたので http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/kihon0/basic0.htmを参考に正規分布で考えてみたところ 正規分布で5%になるためにはz=1.96で、さらに問題設定からμ=5.333、σ=1.847としてuを求めると u=8.953となりました。 そのため(u<=-8.953 && u>=8.953)が確率5%の領域としました。 t分布で考えるとt値>棄却域となり 正規分布で考えるとt値<棄却域となってしまいました。 ここで混乱し始めたのですが、問題設定どおり正規分布で考え、帰無仮説を棄却できないという結論(抜きだしたデータの平均値は母集団の平均値と一致しないとは否定できない)でよろしいのでしょうか? 長文となりましたがよろしくお願いします。

  • t検定で困っています.

    t検定を行うにあたって,どのようにデータを処理していいのか分からないところがあるので教えて頂きたいです. このような場合どうしたらよいのでしょうか? データ1⇒10人の人が50m走のタイムをそれぞれ3回計測(靴を履いた状態で) データ2⇒同じ10人の人が50m走のタイムをそれぞれ3回計測(靴を履かない状態で) いま,データ1に対するデータ2の統計的有意差を調べたいです. このとき,データ1,データ2それぞれ10×3=30個の値を標本変数としてt検定を行うべきなのでしょうか? それとも,それぞれの状態で各個人のタイムの平均を出しておいて,10個の値を標本変数としてt検定を行うべきなのでしょうか?

  • t検定で合っていますか?

    とあるデータを集めていまして、その内容を発表することになったのですが、統計学的有意差を 求めたほうがよいのでは?というアドバイスを受けました。 そもそもまったくの数学音痴な私にとってははじめから?だらけなのですが、なんとなく調べていくうちにt検定なるものにたどりつきました。2つの群の平均値の比較と書かれています。 しかし私としては3つの群の平均値を比較したいので、t検定を使うことが果たして正しいのでしょうか?それとも他に適切な検定方法があるのでしょうか? よろしくおねがいします。

  • t検定で合ってますか?

    とあるデータを集めていまして、その内容を発表することになったのですが、統計学的有意差を 求めたほうがよいのでは?というアドバイスを受けました。 そもそもまったくの数学音痴な私にとってははじめから?だらけなのですが、なんとなく調べていくうちにt検定なるものにたどりつきました。2つの群の平均値の比較と書かれています。 しかし私としては3つの群の平均値を比較したいので、t検定を使うことが果たして正しいのでしょうか?それとも他に適切な検定方法があるのでしょうか? よろしくおねがいします