t検定 U検定 メディアン検定について
- サンプルサイズ300の集団に心理系の4尺度の質問を行い、属性により尺度得点に差があるかを調査したい場合、t検定やU検定、メディアン検定を使用します。
- 性別で2群に分けた後、別の属性で分類し比較する際に、サンプルサイズのばらつきがある場合もあります。
- 正規分布している場合はt検定で平均値や標準偏差、等分散でない場合はメディアン検定で中央値やp値を記述します。
- ベストアンサー
t検定 U検定 メディアン検定
サンプルサイズ300の集団に心理系の4尺度の質問を行い、まず属性により尺度得点に差があるかをみたいのですが、下位尺度と自作の質問で全部で17あります。属性は2群が4種類と3群がひとつの5つあります。 この全てについて、性別で2群に分けた後、別の属性で分類し比較したいのですが属性によっては、8と140とかかなりサンプルサイズにばらつきがあります ある属性では、正規分布は1尺度だけでこれにはt検定。正規分布でない尺度にU検定をし、等分散でないものにはメディアン検定など使うのでしょうか SPSSを使っています 記述するときには膨大な量になります。正規分布している場合にはt検定で平均値とSD、p、そうでなければU検定で中央値とp、等分散でなければメディアン検定で中央値とpを書くのでしょうか 初心者です
- tonto7
- お礼率100% (3/3)
- 数学・算数
- 回答数2
- ありがとう数6
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
SPSSでも等分散性を仮定しない場合にはウェルチの検定を行っています。 正規分布については、経験的に正規分布ではなく他の分布(例えば二項分布やポアソン分布)に従うとされているようなデータ、もしくは経験的に知られていなくても明らかに「これは正規分布には従わないだろう」というデータ以外は正規分布に従うと仮定してもよいでしょう(と私は考えています)。 (なぜなら、分布の仮定ができないのに正規分布に従わないといって、ノンパラメトリック検定を行うのは望ましくないから。そして分散分析を用いれば、これについて頑健性があるから。) > 対数変換したら対数変換して出てきたデータで正規分布に見えるデータは、そのデータでt検定をするということでしょうか。 そうです。 > 中央値だと差がわかりづらいこともあるので慣習的なものなのでしょうか。 そういう理由もあるかもしれませんが、もしかしたら論文の執筆者が中央値の差の検定に関して知識を持っていなかったということも・・・ 基本的には比較に用いた代表値を記載すべきでしょう。メディアン検定なら中央値を、t検定なら平均値を、といったように。いずれの場合も1)代表値、2)自由度、3)検定統計量、4)p値を記載すべきでしょう。
その他の回答 (1)
- backs
- ベストアンサー率50% (410/818)
まず原則として"いかなる場合においても"ウェルチの検定(等分散性を仮定しないt検定)を行うこと。 サンプルサイズが300もあって、それをヒストグラムで表現してみて明らかに正規分布しておらず、なおかつ変数変換(対数変換など)を施しても改善されないような場合には"やむなく"マンホイットニーのU検定を採用する、というのが望ましいです。 要するに、明らかにt検定を行うことに妥当性を欠くような場合以外はノンパラメトリック検定を行うべきではないということです。http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.htmlを参照のこと。 また、サンプルサイズの不釣合いは特に問題にはなりません。むしろ、サンプルサイズを調節しようとして、得られているデータを用いないことの方がNG!!
お礼
先ほどは記入欄を間違えてしまいました。 http://okwave.jp/qa3705730.html?rel=innerHtml のページを読みました。 以前に読んだことのあるページでした。 同じ質問ですね。 根気よく答えて下さりありがとうございます。 Welchの検定でいこうかなと思いますが、先ほどの質問にも回答していただければ嬉しいです。
補足
回答いただきありがとうございます。 教えていただいたサイトの説明で、なぜ他の検定よりも等分散を仮定しないt検定がいいのかよくわかりました。 サンプルの偏りについてもありがとうございます。 で、SPSSでt検定をした時にLeveneの等分散性のための検定で、F値が有意のときに下段のデータを使いますがそれのことでしょうか。 本とかSPSSのCDとかいろいろ見るのですが、Welchとは書いてないので。。。 最初はF値が有意でないときのデータを使おうかと思っていましたが、 どうみてもヒストグラムで正規分布でなさそうで悩んでいたところです。。 明らかにというところが迷うところで。。。 判断は見た目でいいということでしょうか。 対数変換は今一つ分からずしてなかったのですが、たぶん変数の計算で出てくるLn、LG10、lngのことかなと思ってしてみました。 やはりこれは正規分布なのだろうかと迷うところです。 やむなくに該当しそうな感じです。 で、対数変換したら対数変換して出てきたデータで正規分布に見えるデータは、そのデータでt検定をするということでしょうか。 初歩的な質問ですみません。 それとU検定するとして、U検定でも平均値がよく書いてありますが、 正規分布でないならあまり意味がない気がします。 中央値だと差がわかりづらいこともあるので慣習的なものなのでしょうか。 記述の際は中央値とp値だけでいいのですか?
関連するQ&A
- t検定かU検定か
よろしくお願いします。 前提: サンプルサイズ各群ともに300 尺度は5段階のリッカートスケールの順位尺度 間隔尺度以上かつ正規性と等分散(等分散が仮定できない場合はウェルチのt検定)が仮定できる場合はt検定。 正規性が仮定できず、等分散(をシーゲルティーキー検定などで検定)が仮定できる順序尺度の場合はマン・ホイットニーのU検定 という解釈になると思います。(浅学のため間違いは指摘してくださると幸いです) ここで問題なのですが、5段階程度の順位しかなく、サンプルサイズが大きい場合、 U検定で同順位ばかりになってしまい、U値が大きくなってしまうため、 t検定などのパラメトリック手法を使う方が良いとも聞きます。 しかし、やはり順序尺度の場合はノンパラを優先すべきでしょうか。 それとも、U検定、t検定の結果を併記し、異なる結果がでた変数に対しては結論を保留するというような方法が良いのでしょうか。 併記している論文はあまりみかけませんし、5段階の順位尺度でもt検定を行なっている社会学系の論文はよく見かけます。 よろしくお願いします。
- ベストアンサー
- 数学・算数
- 何でもかんでもt検定を使うのはOKですか?
雑誌に掲載された学術論文を読んでいると、対応の無い2群間の間に有意差があるか否かを判断するのに大抵t検定が使われています。 しかし、パラメトリックなt検定の前提条件としては、正規分布が必要と聞いています。サンプル数が多い場合は「どんな分布でも正規分布に近づく」という大数の法則をあてはめて、近似的に正規分布と見なしてt検定するのも分かりますが、サンプル数が高々10個程度(1群につき)のケースでもt検定を使って良いのでしょうか。 正規分布を満たすことを確認する検定をしてからt検定をするなら理解できますが、私の読む論文では、少ないサンプルに対し、正規分布か否かを確認せずいきなりt検定している場合が多く、これはマンホイットニーのU検定なんかを使う方が良い様に思っています。
- ベストアンサー
- 数学・算数
- T検定とMann-WhitneyのU検定の使い分け
ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない2郡間での検定です。 T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか? また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか? 例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか? また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか? それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。 統計についてかなり無知です、よろしくお願いします。
- ベストアンサー
- 数学・算数
- 対応のあるt検定についての質問です。
対応のあるt検定についての質問です。 対応のない平均値の検定ではサンプルサイズが大きいとき、標準化した値は標準正規分布に従うため、それを使います。しかし、対応のある平均値の検定では、サンプルサイズが大きくてもt分布を用いるようです。なぜでしょうか? 宜しくお願い致します。
- ベストアンサー
- 数学・算数
- 統計:正規分布を仮定するかどうか(検定手法)
母平均に関して差があるかどうかを検定したいです。 サンプルに関してA群とB群があります。 t検定を行いたいのですが、この場合、A群・B群ともに正規分布を仮定できる分布でなくてはならないものだと思います。 しかし、A群・B群に関して比較する項目が5種類ありそのうち3種類は正規分布を仮定でき、あとの2種類は正規性を期待できません。 この場合、統一してノンパラメトリック検定を行うべきですか? それともt検定とノンパラ(マンホイットニーU)検定の両方を使うべきですか? あと、A群だけ正規分布を期待できてB群は正規分布を期待できない場合は?・・・やはりノンパラメトリック検定ですか? 両群とも正規分布を期待できてはじめてt検定ができるのでしょうか?
- 締切済み
- 数学・算数
- 統計論文:ノンパラメトリック検定は?平均値or中央値?
正規分布を仮定できない分布の集団で検定をするとき、ノンパラメトリック検定を使いますよね? 例えば、独立2群で母平均に差があるか検定したいとき、t検定が使えない場合マンホイットニーU検定をしますが、 記述は、平均と標準偏差とP値を書くべきですか? それとも、中央値とかを書くのですか? 論文の書き方の統計の質問です。。。
- ベストアンサー
- 数学・算数
- 心理 t検定 spss
被服関心尺度 高群 低群で下着の着用意識にどのような違いがあるかを調べています。 先行研究では学生と母親で下着の着用意識にどのような違いがあるか を調べており、本文には28項目4段階評価の下着の着用意識を単純集計で求めて、学生と母親間の違いをみるために平均値の差のt検定を行った。 と書いてありました。単純集計はだし、あとはt検定(spss使用)なんですが、t検定のどれを使えばよいかわかりません。 とりあえず、高群、低群にわけて1サンプルの検定はだしたのですが、間違ってますか? それかt検定をする前にしなくてはならにことがあるのですか? あと、もし1サンプルであっていたなら結果はだせたものの結果の読み取りができません。(いろいろ調べましたが…) 何も分かっていなく、本当に申し訳ないですが、だれか助けてください。 被服関心尺度 高群 の着用意識28項目の結果 1サンプルの統計量 N 平均値 標準偏差 平均値の標準誤差 1 83 2.22 .976 .107 2 83 2.48 .802 .088 3 83 2.52 .929 .102 4 83 1.98 .811 .089 5 83 2.24 .892 .098 6 83 3.19 .723 .079 7 83 2.29 .931 .102 ………………省略 26 83 1.98 .897 .098 27 83 2.23 .941 .103 28 83 2.40 .962 .106 1サンプルの検定 検定値 = 0 t 値 自由度 有意確率 (両側) 平均値の差 差の 95% 信頼区間 下限 上限 1 20.695 82 .000 2.217 2.00 2.43 2 28.199 82 .000 2.482 2.31 2.66 3 24.702 82 .000 2.518 2.32 2.72 4 22.193 82 .000 1.976 1.80 2.15 5 22.899 82 .000 2.241 2.05 2.44 6 40.207 82 .000 3.193 3.03 3.35 7 22.403 82 .000 2.289 2.09 2.49 8 24.872 82 .000 2.060 1.90 2.23 …省略 26 20.072 82 .000 1.976 1.78 2.17 27 21.573 82 .000 2.229 2.02 2.43 28 22.707 82 .000 2.398 2.19 2.61
- ベストアンサー
- 心理学・社会学
- t検定の棄却域について
t検定の棄却域について 現在t検定について勉強していまして、演習問題で訳が分からなくなったので質問させていただきます。 問題としては 次のデータは平均値が5.333である集団から抜き出したデータである。このデータの平均が母集団の平均と一致しているかどうか、t検定を用いて有意水準を5%として確かめよ。ただしデータは正規分布に従う。 データ:8,9,6,10,12,8,7,9 というものなのですが実際にこのデータについていろいろ計算してみたところ 平均値8.625、分散3.411、標準偏差1.847、自由度7、t値5.042となりました。 両側検定で棄却域を考えました。 しかしそれの設定の仕方がわかりませんでした。 まずExcelのTINV関数で求めてみたのですが2.365となり、(u<=-2.365 && u>=2.365)が確率5%の領域としました。 これは例題を参考にして求めてみました。 しかし例題と違ってこの問題には正規分布に従うという条件が付いていたので http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/kihon0/basic0.htmを参考に正規分布で考えてみたところ 正規分布で5%になるためにはz=1.96で、さらに問題設定からμ=5.333、σ=1.847としてuを求めると u=8.953となりました。 そのため(u<=-8.953 && u>=8.953)が確率5%の領域としました。 t分布で考えるとt値>棄却域となり 正規分布で考えるとt値<棄却域となってしまいました。 ここで混乱し始めたのですが、問題設定どおり正規分布で考え、帰無仮説を棄却できないという結論(抜きだしたデータの平均値は母集団の平均値と一致しないとは否定できない)でよろしいのでしょうか? 長文となりましたがよろしくお願いします。
- ベストアンサー
- 数学・算数
お礼
回答ありがとうございます。 なんだか霧が晴れてすっきりしました。 ありがとうございます。 とても助かりました。