• ベストアンサー

サンプル数の異なる2群間におけるT検定について

サンプル数の異なる(50,15)2群間の身長の比較を行うのに、T検定をするよう指示を受けました。これは、長男と次男での出産時の身長に差があるかを調べるためですが、長男50人分と次男15人分(母親は異なる)のデータのため、サンプル数が違います。またT検定は私の理解では平均の比較(2群の場合)を行うものであるため、平均ではないこれらにどうしてT検定が良いのか、また統計ソフト(STATISTICAかエクセル)を使う場合にどのようにデータを入力すれば良いのかわかりません。 どなたかご存知の方がいらっしゃればアドバイスをいただけたらうれしいです。 よろしくお願いします。

  • 科学
  • 回答数2
  • ありがとう数3

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>平均ではないこれらにどうしてT検定が良いのか  t検定は、2つの集団の平均値の差について検定する、すなわち、有意差があるかどうかを判定します。平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。  ただ、前提時要件があって、2群が正規分布していることが必要です。サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。  検定法は、どの方法を選ぶかは、研究者の自由です。わたしがt検定を多用するのは、正規分布を想定でき、計算式が分かりやすく、サンプル数が2群で異なっても良い、その数も少なくて良い(大差があるので、1群3例でも有意差をだしています)、そして有意差が出やすいからです。  この場合は、正規分布しているという条件を満たしているとはいえないだろうと判断します。その場合は、F検定をしてください。これは、2群の平均値ではなく、バラツキによって検定する方法です。正規分布している必要は無いとされています。  F検定で有意差があれば、問題ありません。t検定では有、F検定ではなし、になると方針が定まりませんが(現在このデータで悩んでいます)。 >どのようにデータを入力すれば良いのか  t検定を指示した人は、身近にいないのでしょうか。その人に訊くのが一番です。身近にいないのなら、いないと返答があれば、書き込みますが。 というのも、大学などの研究テーマだと、指導教員をさしおいて、はマズイノデ。もしも、このテーマに興味を持てば、私が実施して先に発表します。こんな研究内容がハッキリ分かる書き込みを4年生がやったら、研究室は追放ですね。  長男、次男だけではなく、三男、四男となると多重比較という方法になります。この場合、H検定(エクセルだけでは無理でしょう)を使います。

pengrass
質問者

お礼

とてもわかりやすく回答をしていただいてありがとうございます。 言葉の意味を誤解釈していたのがわかり、勉強になりました。

その他の回答 (1)

noname#62000
noname#62000
回答No.1

長男50人分から推定される母平均と次男15人分から推定される母平均を比較したいならt検定が使えます。サンプルから推定される2つの母平均に差があるかどうかを検定する1つの方法がt検定です。 http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html http://memoire.sakura.ne.jp/pc/excel.html エクセルよりは統計ソフトを使った方がいいですね。 マニュアルを見ればt検定の実例くらいは載っていると思います。

pengrass
質問者

お礼

>長男50人分から推定される母平均と次男15人分から推定される母平均を比較したいならt検定が使えます。 回答をありがとうございます。よくわかりました。 実例を色々とみましたが、どれも2群の標本数が等しい場合だったので、お伺いしてみました。異なる場合でも使えることが分かり安心しました。 ありがとうございます。

関連するQ&A

  • t 検定について

    2群間の比較についてふつうはt検定を(分散が等しい場合)は行うと思うのですが、データがそれぞれ1つしかないない場合検定はできるのでしょうか?それぞれのデータはあるそれぞれのグループの平均値です。 できましたら急ぎで返事をどなたかいただけると助かります。

  • t検定で合ってますか?

    とあるデータを集めていまして、その内容を発表することになったのですが、統計学的有意差を 求めたほうがよいのでは?というアドバイスを受けました。 そもそもまったくの数学音痴な私にとってははじめから?だらけなのですが、なんとなく調べていくうちにt検定なるものにたどりつきました。2つの群の平均値の比較と書かれています。 しかし私としては3つの群の平均値を比較したいので、t検定を使うことが果たして正しいのでしょうか?それとも他に適切な検定方法があるのでしょうか? よろしくおねがいします

  • 2群間平均の差の検定 差が“ない”ことを示すには?

    2群間平均の差の検定 差が“ない”ことを示すには? お世話になってます。 2群の平均を比べて,両者の平均には差が“ない”という仮説を設定して検定したいと考えています。 通常の2群間の平均の差の検定は,両者の平均に差が“ある”ことを仮説として設定して, 帰無仮説に「2群の平均に有意な差がない」を設定し,対立仮説に「2群の平均に有意な差がある」を設定しています。 もし両者の平均には差が“ない”という仮説を検定したい場合には,単純にt検定を行って,棄却されなかった=「2群の平均に有意な差がない」という結論ではいけないと統計の授業で習った気がします。 その理由を説明できなくて申し訳ないですが・・・ そこで質問なのですが, 帰無仮説に「2群の平均に有意な差がある」を設定し,対立仮説に「2群の平均に有意な差がない」を設定してもよいのでしょうか? そして,「2群の平均に有意な差がある」という帰無仮説を検定するためにはどのような検定方法を用いればいいのでしょうか? お時間ございましたら,ご教示のほど宜しくお願い申しあげます。

  • SPSSでの3群間の多重比較について

    統計学初心者です。 SPSSを用いて統計をやっています。 3群間のデータ比較を行っていますが、下記の方法で正しいのでしょうか? まず3群のデータはそれぞれ正規分布していません。 なので、クラスカル・ワーリス検定を用いて検定をした結果、『有意差あり』となりました。 ここから、どの群間に有意差があるのかを調べたいのですが、SPSSではノンパラメトリック版の多重比較はできないのでしょうか? できない場合、それぞれの群間をマンホイットニー検定で比較することは正しいのでしょうか? 統計初心者で的外れなことを言っているかもしれませんが、よろしくご教授いただけたらを思います。 よろしくお願いします。

  • 何でもかんでもt検定を使うのはOKですか?

    雑誌に掲載された学術論文を読んでいると、対応の無い2群間の間に有意差があるか否かを判断するのに大抵t検定が使われています。 しかし、パラメトリックなt検定の前提条件としては、正規分布が必要と聞いています。サンプル数が多い場合は「どんな分布でも正規分布に近づく」という大数の法則をあてはめて、近似的に正規分布と見なしてt検定するのも分かりますが、サンプル数が高々10個程度(1群につき)のケースでもt検定を使って良いのでしょうか。 正規分布を満たすことを確認する検定をしてからt検定をするなら理解できますが、私の読む論文では、少ないサンプルに対し、正規分布か否かを確認せずいきなりt検定している場合が多く、これはマンホイットニーのU検定なんかを使う方が良い様に思っています。

  • 対応のないt検定について

    心理学をやってます。 対応のないt検定についてです。 PCに関する知識が乏しいので手計算でやろうとしてます。 条件が違う2群で7人(8人)の参加者に15試行テストをしました。 2群間のt検定をしたいのですが、 1群 参加者A(データの個数-平均)の二乗+… 参加者B(データの個数-平均)の二乗+… 2群 参加者A(データの個数-平均)の二乗+… 参加者B(データの個数-平均)の二乗+… の先がいまいちわかりません。 また、間違えている可能性もあります… どうかご指導お願いします。

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • t検定で合っていますか?

    とあるデータを集めていまして、その内容を発表することになったのですが、統計学的有意差を 求めたほうがよいのでは?というアドバイスを受けました。 そもそもまったくの数学音痴な私にとってははじめから?だらけなのですが、なんとなく調べていくうちにt検定なるものにたどりつきました。2つの群の平均値の比較と書かれています。 しかし私としては3つの群の平均値を比較したいので、t検定を使うことが果たして正しいのでしょうか?それとも他に適切な検定方法があるのでしょうか? よろしくおねがいします。

  • 検定手法の選択

    検定手法の選択 統計に詳しくないので、分かりやすく教えていただけると助かります。 この質問は既出なのですが、カテゴリを間違えたため、再度質問しています。すみません。 面接により、発話プロトコルを得ました。 そこからあるカテゴリーにあてはまる発言数をカウントし、2群間で比較しようと思っています。 しかし、サンプルが少なく、一方は8、もう一方は4です。 この場合、発言数(の平均値?中央値?)の差をみたいのですが、どの検定手法をとればよろしいでしょうか? そもそも、サンプルが少なすぎて無意味なのでしょうか? 教えてください。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。