• 締切済み

二群間の検定について

体内で、ある現象が起こったか起こらなかったかで その有無で内部情報(心拍数等)変数に差異が見られるか検定したいのですが。 サンプルが 3000人 と 100人 と言う関係です。 t検定を考えましたが、ks検定によって変数に正規性はなく、wilcoxを考えていますが、このサンプル数の差がある場合どのように検定すればよいでしょうか?そもそも検定が無意味でしょうか?

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 3000人ぶんも対照データがあるんですから、必ずしも対照データの分布をパラメータ付きの式で表さなくたっていいんじゃないかな。つまり、「その100人のデータは互いに独立であり、それぞれのデータは、対照データの累積ヒストグラムで表される分布に従う」という帰無仮説をお考えになっては如何。

全文を見る
すると、全ての回答が全文表示されます。
  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

1. 群の大きさの差はさして問題ではないですが、分布の形状 (ばらつき) についての推測が3000人のグループに引きずられるのも事実です。たとえば、t検定で併合分散を計算すると、実質は3000人のデータでの分散とほとんど変わらないことになります。しかし、平均値の推測には問題ないと思います。 2. ks検定で正規性が認められないとありますが、それだけ大きなデータだとわずかな正規性からのずれも有意になってしまうので、それを基にして手法を選択するのはどうかと思います。 3. まずはヒストグラムとか書いてみて、おおざっぱに左右対称で平均値あたりにピークのある分布だったらt検定で問題は起きないと思います。t検定は外れ値には弱いですが、左右対称な単峰性の分布ならば正規分布でなくてもそれほど悪くなりません。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 何でもかんでもt検定を使うのはOKですか?

    雑誌に掲載された学術論文を読んでいると、対応の無い2群間の間に有意差があるか否かを判断するのに大抵t検定が使われています。 しかし、パラメトリックなt検定の前提条件としては、正規分布が必要と聞いています。サンプル数が多い場合は「どんな分布でも正規分布に近づく」という大数の法則をあてはめて、近似的に正規分布と見なしてt検定するのも分かりますが、サンプル数が高々10個程度(1群につき)のケースでもt検定を使って良いのでしょうか。 正規分布を満たすことを確認する検定をしてからt検定をするなら理解できますが、私の読む論文では、少ないサンプルに対し、正規分布か否かを確認せずいきなりt検定している場合が多く、これはマンホイットニーのU検定なんかを使う方が良い様に思っています。

  • サンプル数の異なる2群間におけるT検定について

    サンプル数の異なる(50,15)2群間の身長の比較を行うのに、T検定をするよう指示を受けました。これは、長男と次男での出産時の身長に差があるかを調べるためですが、長男50人分と次男15人分(母親は異なる)のデータのため、サンプル数が違います。またT検定は私の理解では平均の比較(2群の場合)を行うものであるため、平均ではないこれらにどうしてT検定が良いのか、また統計ソフト(STATISTICAかエクセル)を使う場合にどのようにデータを入力すれば良いのかわかりません。 どなたかご存知の方がいらっしゃればアドバイスをいただけたらうれしいです。 よろしくお願いします。

  • T検定とMann-WhitneyのU検定の使い分け

    ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない2郡間での検定です。 T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか? また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか? 例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか? また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか? それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。 統計についてかなり無知です、よろしくお願いします。

  • ●excelのt検定の結果確認方法

    レベルの低い質問ですが、宜しくお願いします。あるサンプルを5回測定したデータの平均値と1回測定のデータで差があるかないかを調べるために、excelの分析ツールよりt検定を行いました。が、t検定自体いまいちよく解かっていません。有意水準を5%とし両側検定で考えます。t 境界値 両側(2.045229611)>t(0.296893746)であれば、「差がない」といえると思いますが、その差がないと言える確率は下記表のどこでわかる(もしくはどう計算をすれば、確率を出せる)のでしょうか? すみませんが宜しくお願いいたします。 t-検定 : 一対の標本による平均の検定 変数 1      変数 2 平均 0.358166667 0.358133333 分散 1.24713E-06 9.47126E-07 観測数 30 30 ピアソン相関 0.83550416 仮説平均との差異 0 自由度 29 t 0.296893746 P(T<=t) 片側 0.384331892 t 境界値 片側 1.699126996 P(T<=t) 両側 0.768663784 t 境界値 両側 2.045229611

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • パラメトリック検定か、ノンパラメトリック検定か?

    サンプルが小さい場合、パラメトリックかノンパラメトリックかどちらを選択すべきなのでしょうか? 検定は、一標本t検定か、WILCOXONの符号付き順位和検定のどちらかなのですが、サンプルが正規分布するかどうかわかりません。こういう場合は、両方の検定を行い、いずれの場合も優位さがなければ、検定する2郡には優位差はないとしてよいのでしょうか?? 検定には全くの素人です。。 どなたか、ご教授ください。

  • t検定の標本数

    はじめまして。 卒論で対応のない2変数のt検定を行っているのですが、どうしてもわからないことがあるので投稿させていただきました。 一方の標本数が259で、もう一方が5という検定を行ったところ、教授から「標本数が7以下だとt検定ではない検定を行うはず」と言われました。テューキーの方法かもしれないとも言われたのですが、調べたところ違うようなので、どうしたらよいかわかりません。2つの標本数の差が200近くあり、なおかつ一方の標本数が7以下の場合に、両者に差があるかを検定するにはどうすればいいか、ぜひ教えてください。よろしくお願いします。

  • t検定かU検定か

    よろしくお願いします。 前提: サンプルサイズ各群ともに300 尺度は5段階のリッカートスケールの順位尺度 間隔尺度以上かつ正規性と等分散(等分散が仮定できない場合はウェルチのt検定)が仮定できる場合はt検定。 正規性が仮定できず、等分散(をシーゲルティーキー検定などで検定)が仮定できる順序尺度の場合はマン・ホイットニーのU検定 という解釈になると思います。(浅学のため間違いは指摘してくださると幸いです) ここで問題なのですが、5段階程度の順位しかなく、サンプルサイズが大きい場合、 U検定で同順位ばかりになってしまい、U値が大きくなってしまうため、 t検定などのパラメトリック手法を使う方が良いとも聞きます。 しかし、やはり順序尺度の場合はノンパラを優先すべきでしょうか。 それとも、U検定、t検定の結果を併記し、異なる結果がでた変数に対しては結論を保留するというような方法が良いのでしょうか。 併記している論文はあまりみかけませんし、5段階の順位尺度でもt検定を行なっている社会学系の論文はよく見かけます。 よろしくお願いします。

  • t検定 U検定 メディアン検定

    サンプルサイズ300の集団に心理系の4尺度の質問を行い、まず属性により尺度得点に差があるかをみたいのですが、下位尺度と自作の質問で全部で17あります。属性は2群が4種類と3群がひとつの5つあります。 この全てについて、性別で2群に分けた後、別の属性で分類し比較したいのですが属性によっては、8と140とかかなりサンプルサイズにばらつきがあります ある属性では、正規分布は1尺度だけでこれにはt検定。正規分布でない尺度にU検定をし、等分散でないものにはメディアン検定など使うのでしょうか SPSSを使っています 記述するときには膨大な量になります。正規分布している場合にはt検定で平均値とSD、p、そうでなければU検定で中央値とp、等分散でなければメディアン検定で中央値とpを書くのでしょうか 初心者です

  • 統計手法について

    3段階あります 1.対応しない2群の標準偏差、サンプル数、平均点しか分かっていません。その2群間の平均点の有意差検定にはstudent-tもしくは、1変量のt検定 どちらが適切なのでしょうか? 2.その1群の中の分析で、ある因子の有無別に平均点の有意差を検定するには対応がありませんよね。その因子の有無別の等分散が肯定された場合はt検定、等分散が否定された場合はt-welch検定で良いのでしょうか? 3その1群の中で、治療前、治療後で比較するには、対応のあるt検定で良いのでしょうか? そして、これは全て正規分布を仮定しているものですよね?、もし、正規分布の検定で否定されたら、この3つの検定を同時に行うことは出来ないのですか?

このQ&Aのポイント
  • 彼はアルコール依存症と診断されており、過去には入院も経験している。しかし、最近はスパークリングワインを飲むことで体調が改善し、普通の生活を送っているようだ。
  • 彼は晩酌を続けているが、日中は飲酒欲求がなく、会社でも全く酔っていない様子。彼自身もアルコール依存者ではなかったのかもしれないと考えている。
  • 彼はアルコール依存症外来で処方された薬を服用しているが、再飲酒のことは主治医には伝えていない。健康診断ではガンマ値や尿酸値が気になる結果であり、性格の変化も見られるという。
回答を見る