• ベストアンサー

T検定について 

現在とある研究を行っており、その際の検定方法で質問させていただきます。(福祉関係勤務) _______________________________ A、B、C、D、E、F、G、H、I、J、K、L、N、Mさんがいるとします。 これらの方々に、○○という治療を行います。 事前に、14名に痴呆のテスト(点数化されるもの:0点~30点)を行います。 事後にも、同様のテストを行います。 上記にて、○○という治療に効果があるかをT検定を行おうと考えています。 __________________________ 以前、学生時代に、違う研究でT検定を使ったのですが、まったく思い出せません。 そこで、質問です。 例=TTEST(F3:F12,J3:J12,X,Z) 上記例ですと、F3:F12のデータが事前で、J3:J12のデータが事後と記入しているとします。 この場合、その後の、【X】は 尾部 …両側分布か片側分布かを1か2で指定 1…片側分布の値が計算される 2…両側分布の値が計算される 【Z】は 検定の種類 …検定の種類を1から3の数値で指定 1…対をなすデータのt検定 2…等分散の2標本を対象とするt検定 3…非等分散の2標本を対象とするt検定 をいれたらいいのですよね? この場合【X】、【Z】はどうすればよいですか?簡単な説明でよいので解説をつけていただけるとうれしいです。 さらには、0.05より小さい数字が出れば、この○○という治療は、効果あり!といえる。ということであってますかね? 乱筆、申し訳ありません。補足等可能な限りします。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • thiku-rin
  • ベストアンサー率54% (45/82)
回答No.1

私がこのデータでt-test(T検定)をするなら、 【X】は2で、【Z】は1ですね。 でも、ちょっと厳密な話をしますと、テスト結果を点数化されているそうですが、その場合正規検定の t-test は不適当です。従って、ノンパラメトリック検定をするべきだと誰かに指摘されるかも知れません。こういう場合、「Wilcoxonの順位和検定」ですかねぇ。ちょっと自信ありません。詳しくは参考URLの「手法の選択」を参考に http://www.gen-info.osaka-u.ac.jp/testdocs/tomocom/ さらに、このサイトはすばらしいことにデータを入力して実際に検定を行うことも出来ます。 >0.05より小さい数字が出れば、この○○という治療は、効果あり! ここはちょっと誤解されているかも。数字が例えば0.03と出れば、同じデータが出た100回の実験のうち97回は平均値に差があることが正しくて、3回は嘘っぱちだということです。値が小さいほど間違いは少なくなりますが決してゼロではありませんし、逆に値が大きくても本当は差があるかもしれません。実は「便宜上数字が0.05以下なら正しいことにしようか…」という暗黙の了解があるだけなんですよ。そんな当て物みたいな…と思われるかもしれませんが、それが「t-test」であり「統計学」なんです。 さらに値が0.05より小さいからといって「効果がある」と言い難い場合もあります。例えばある処理をして血糖値の平均値が 200mg/dl から 198 mg/dl に落ちたとしましょう。これに t 検定をして 0.01 と言う数字が出たとしても、この処置による血糖降下作用に意味があるでしょうか?t 検定で分かることはあくまで、「二つの群の平均の差が有意かどうか(違うかどうか)」ただそれだけです。 最後に14人すべてに○○という治療をするんですよね。 1.テストは主観が入らないものですか?つまり、kenchang さん達の良くなって欲しいという意識が影響して点数が高くなってしまうことはありませんか? 2.また、テストを繰り返すことによって例えば「慣れ」て点数が高くなることはありませんか? この2点は実験の根幹に関わるとおもいます。特に2.があるのなら、「○○という治療」が効果があるのか「慣れた」だけなのかわかりません。 参考にしていただけると幸いです。

kenchang
質問者

補足

回答、ありがとうございます。 正直、統計処理をするのは、学生時代も入れ、2回目で、T検定しか使ったことはありません。 今回は、ご指摘の部分も重々承知していますが、○○を行ったことで、実施前とは、有意に差がついたという方向で結果を持っていこうと思います。 今後、学術的な研究も考えていますので、これからさらに勉強して行きたいと思います。 ご教授ありがとうございます。 なお、最後に…のくだりについてですが… 1.例で、痴呆テストを出しましたが、本当は、情緒に関するテストをおこないました。 コレは、完璧に客観性が確認されたテストではなく、さらに、実施した私としても主観性が介助できない部分を感じております。 2.テスト自体は、検査者が2名以上で、実施しており、対象者に行ったものではありませんので、対象者の慣れはありません。ただし、上記で書いたように、検査者の主観を排除しきれていないといった問題も残ります。

その他の回答 (3)

  • ssmarugoo
  • ベストアンサー率47% (84/176)
回答No.4

新人看護師です。回答します。 ○○の治療が効果があるかどうかを調べるわけですね。 まず、痴呆(認知症といいますね)のテストがオリジナルならそのテストの内的整合性について妥当性・信頼性の【クロンバックα係数】を算出して検討します。 あと、テストの点数の分布を調べてください。ヒストグラムを作成するのです。そして、前後とも得点が正規分布するかどうかを確認します。この確認は、【コルモゴルフ・スミノルフ検定】を行います。そして、正規分布が仮定できるかどうか?の結果を出します。正規分布が仮定できたならt検定でOKです。(T検定ではなくtは小文字ね) あと、○○によって、物理的に治療効果が下がることがありえますか? 上がるか?下がるか?が事前に分からない場合に両側検定です。 たぶん認知症の点数の評価なら両側検定(two-tails)を選択するのが妥当です。 もちろん【対をなすt検定(両側】ですね。 あ、正規分布を期待できないなら、ノンパラメトリック検定の【ウイルコクスン検定】ですが。 0.05というのは、有意水準significant levelのことで平均値に差がないときの確率を棄却する判断基準のことです。これは主観的なものでp valueを求めてそれを示すべきです。 被験者のサンプルサイズ(標本数)によって、有意水準の決定はいくらにするか?は変えた方がいいです。サンプルサイズ30以下程度なら、有意水準0.1でもいいでしょう。あとテストの内容にもよります。厳密性が要求されるようなテストのt検定なら、0.001以下に設定とかもしますが、そうでもなさそうなので0.1がいいでしょう。 p valueが0.1以下なら治療効果あり。といえる。でいいですよ。 あ、もちろん被験者のほかの条件をマッチング(一致)させないといけませんが。(選択バイアスに対する対応) すみませんが、それ以前にエクセルでこれらの検定を行うことは不可能ですよ。統計ソフトでやらないと認められませんよ。 ※あと、あらゆるバイアスを制御したり、ランダムサンプリングしないと論文自体が査読でとおりません。もちろんプラセボの効果もブラインドする必要がありますね。できれば、被験者も実験者も、解析者さえもブラインドされたトリプルブラインドテストでなければ、研究と呼べるような代物ではありません。 厳しい内容を書きましたが、医療系では最低これくらいやらないと全く受け付けてもらえませんよ。

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

大学生が遊びで検定を行うためにExcelを使うのは良いでしょうが,お仕事で検定を行うのであれば信頼できる統計ソフトを用いるべきでしょう。こういうこと(http://bekkoame.okwave.jp/qa2649494.html)がしばしばあるのでExcelはやめた方がよいです。R(http://www.okada.jp.org/RWiki/)なら無料です。 例えば以下のように打ち込むだけでOKです。 jizen <- c(12, 10, 11, 13, 9, 10) #事前のテストデータ(F3:F12のデータ) jigo <- c(25, 28, 29, 27, 24, 26) #事後のテストデータ(J3:J12のデータ) t.test(jizen, jigo) #t検定を行うための関数です p-valueというのがp値ですから,おっしゃるようにこの値が0.05よりも小さければ有意差が認められるということになります。ただし,それが効果ありと断定することができるかといえば,必ずしもそうではない。

kenchang
質問者

補足

回答ありがとうございます。 >大学生が遊びで検定を行うためにExcelを使うのは良いでしょうが,お仕事で検定を行うのであれば信頼できる統計ソフトを用いるべきでしょう。 この点につきましては、素人ながら、承知した上で行っています。 本研究は、一応、法人内の小さな発表の場でのみの研究と現在は考えています。 今後、この研究、又は、別の研究等、学会レベルのモノに関しては、今後勉強して行きたいと思います。 ご教授ありがとうございます。 なお、この質問は、実際、統計処理を行ってから質問を閉じたいと思っております。

  • thiku-rin
  • ベストアンサー率54% (45/82)
回答No.2

ANo.1 です「実験」の根幹に~ 「実験」と言う言葉をつい使ってしまいましたが、大変不適切でした。申し訳ありません。

kenchang
質問者

補足

すいません。 追加で質問です。 【Z】の部分に関して(記号表記のルールを知らないもので…) 同じ人の前後は、『対をなすデータ』でいいということであってますか?

関連するQ&A

  • t検定について教えてください

    エクセルの分析ツールを用いて、t-検定: 等分散を仮定した2標本による検定 を行いました。 結果で、P(T<=t) 両側 に 6.82420809647282E-07 と出てきました。 この数字の中に、E が表示されていますが、 Eは何を意味しているのでしょうか?

  • t検定について教えて下さい(Excel)

    質問内容をご覧頂いてありがとうございます。 どちらか一方でも回答いただけると幸いです。 質問1 t検定:等分散を仮定した2標本による検定を行なおうとしたところ、「仮説平均との差異」を入力する欄が出てきます。この欄はどういった場合に入力するのでしょうか?それぞれの標本の平均の値は0.654と0.695なのですが、その差の0.041を入力するのでしょうか?それとも0を記入し、帰無仮説として平均が等しいとして、有意な差がでたならば帰無仮説は棄却できる(つまり平均は等しくない)といえるようにするのでしょうか? 質問2 t検定:等分散を仮定した2標本による検定を行ったところ(仮説平均の差異の欄には0を記入)、P(T<=t) 片側とP(T<=t) 両側の値がそれぞれ3.4E-13、6.80E-13という値になりました。このE-13の意味がわかりません。どういう意味なのでしょうか? わかりづらい文章で申し訳ありませんが、よろしくお願いします。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • Excelでt検定を行うTTESTという関数

    Excelでt検定を行うTTESTという関数 の使い方についてわからないことがあります。 検定の種類で1-3の数字を選ばないといけないようで、helpを見ると下記のような説明が書かれているのですが、何のことかわかりません。それぞれどのような場合に使うのでしょうか?具体的な簡単な例で説明していただけると助かります。  1 対をなすデータの t 検定  2 等分散の 2 標本を対象とする t 検定  3 非等分散の 2 標本を対象とする t 検定

  • 統計解析 相場分析 T-検定 エクセル SPSS

    2つの母集団の平均差に有意差があるかを調べるためエクセルでT検定をしましたところ、ある異変に気づきました。 メニューの「ツール>分析ツール」で等分散を仮定した2標本による検定を選ぶと、"配列1"と"配列2"に各々の集団を入れることになります。ところが、それぞれの欄に入れる集団の順番を入れ替えると両側有意確率が.05以下だったものが、.05以上になってしまい、有意差の有無の結果が間逆になってしまいます。 分析の概要は以下のとおりです。 (F検定で等分散は確認済み) 標本1: 火曜日を除外した某先物の寄値-引値の価格差(デイトレードの成績) サンプル数→489個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:647 標本2: 火曜日だけのデイトレ成績 サンプル数→88個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:3215 2つの集団の平均差:2568 ****************************** 分析結果にみられる矛盾 >>>>>>>[標本1]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう以外 かよう 平均 646.8844483 3214.899617 分散 201365586.2 157505681.3 観測数 489 88 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t -3.178472095 P(T<=t) 片側 0.000780042 t 境界値 片側 1.647508725 P(T<=t) 両側 0.001560084 t 境界値 両側 1.964099283 >>>>>>>>[標本2]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう かよう以外 平均 3214.899617 646.8844483 分散 157505681.3 201365586.2 観測数 88 489 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t 9.38710200484845E-06(質問者が換算→0.00094%) P(T<=t) 片側 0.499996257 t 境界値 片側 1.647508725 P(T<=t) 両側 0.999992514 t 境界値 両側 1.964099283 ************************  以上のようにT値のあたい自体もかわってしまうのです。本で計算式を調べても違いは出ないはずなのに(統計初心者です。まちがってたらゴメンナサイ)どうしてでしょうか。サンプル数もしくは平均値の大きさによって、配列1,2に入れる順番を変えるべきなんでしょうか。おそらく右側検定とか、左側検定とかの概念と関係しているのかもしれませんが、本やネットで調べても判然としません。  ちなみに月、火、水、木、金と曜日別に成績をわけ、SPSSで一元配置の分散分析(ANOVA)、Welch検定, Brown-Forsythe検定, ボンフェローニの多重比較表でも確認したところ、曜日間に有意差はみられませんでした。  どうしてエクセルでは、配列の順番により結果が変化するのか、どなたさまかぜひ教えてください。統計初学者なので、珍妙なことを申し上げてるかもしれませんが寛大なご教示のほどよろしくお願いいたします。

  • ●excelのt検定の結果確認方法

    レベルの低い質問ですが、宜しくお願いします。あるサンプルを5回測定したデータの平均値と1回測定のデータで差があるかないかを調べるために、excelの分析ツールよりt検定を行いました。が、t検定自体いまいちよく解かっていません。有意水準を5%とし両側検定で考えます。t 境界値 両側(2.045229611)>t(0.296893746)であれば、「差がない」といえると思いますが、その差がないと言える確率は下記表のどこでわかる(もしくはどう計算をすれば、確率を出せる)のでしょうか? すみませんが宜しくお願いいたします。 t-検定 : 一対の標本による平均の検定 変数 1      変数 2 平均 0.358166667 0.358133333 分散 1.24713E-06 9.47126E-07 観測数 30 30 ピアソン相関 0.83550416 仮説平均との差異 0 自由度 29 t 0.296893746 P(T<=t) 片側 0.384331892 t 境界値 片側 1.699126996 P(T<=t) 両側 0.768663784 t 境界値 両側 2.045229611

  • 両側検定と片側検定の違い

    t分布表を用いた検定をする時の、両側検定と片側検定の違いは何ですか??? 教えてください!!お願いします。

  • 対応のあるt検定の結果の見方

    下記のような結果が出ました。 ・統計的に有意かどうかを見るには、どこを見ればいいんですか? ・それ以外の項目はどのように見たらいいんですか? ・論文には、どのように書くんでしょうか? 教えてください。 t-検定 : 一対の標本による平均の検定ツール 変数 1    変数 2 平均 0.961538462 0.935897436 分散 0.037462537 0.060772561 観測数 78      78 ピアソン相関      0.219838047 仮説平均との差異 0 自由度 77 t 0.81473499 P(T<=t) 片側 0.208868395 t 境界値 片側 1.664884621 P(T<=t) 両側 0.41773679 t 境界値 両側 1.991256795

  • 統計学 プログラムの処理計測データのt検定

    t検定、平均の検定についてです プログラムの処理計測のデータ100個取りました。 同じ計測プログラムでデータを取ったので 対応があるt検定とみて、 取ったデータをエクセルで一対の標本による平均の検定 を行なったところ、一番下のようになりました 質問は(1)、P(T<=t) 両側の値が0に近い値となっているのですが この場合 帰無仮説(H0):「2群間に差がない」と仮定する。 対立仮説(H1):「2群間に差がある」と仮定する として、P(T<=t) 両側 1.8672E-171 ---------(1)<0.05 より2つの母集合の平均値に有意差があると判断できる と考えてよいのでしょうか? t-検定 : 一対の標本による平均の検定 有意水準α=0.05 変数 1 変数 2 平均 1321.87973 293.041754 分散 42.3286546 368.4568926 観測数 100 100 ピアソン相関 0.04224447 仮説平均との差異 0 自由度 99 t 514.2684974 P(T<=t) 片側 9.3362E-172 t 境界値 片側 1.660391157 P(T<=t) 両側 1.8672E-171 ---------(1) t 境界値 両側 1.9842169

  • t検定について

    統計を勉強中の者です。今、A群20人とB群25人の平均の差の検定でt検定を行うとします。 t検定は、母集団が正規分布するときに使うが、標本が十分大きければ正規分布でなくともOKと本にかいてありました。 20人と25人では大丈夫でしょうか?よろしくおねがいいたします。