• ベストアンサー
  • すぐに回答を!

測定日の異なるデータで有意差検定をすることは可能ですか?

測定日の異なるデータで有意差検定(T検定など)をすることは可能ですか? 例えば、10人の被験者(N=10)に血圧降下剤もしくはプラセボを投与して、血圧降下剤群は12日目に、プラセボ群は14日目に血圧を測定したとします。 この2つのデータで、有意差検定をすることは可能でしょうか?

共感・応援の気持ちを伝えよう!

  • 回答数5
  • 閲覧数401
  • ありがとう数5

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.3

検定する帰無仮説がたとえば 「実験群における血圧降下剤投与後12日目の血圧のデータと、対照群におけるプラセボ投与後14日目の血圧のデータは同じである(両者の違いは、偶然の変動で説明できる)」 であれば、もちろん検定できる。その結果もし有意差が出たらこの帰無仮説は棄却され、従って、「実験群における血圧降下剤投与後12日目の血圧のデータと、対照群におけるプラセボ投与後14日目の血圧のデータは同じではない」と言えます。以上が数学の話。  で、実際上の問題はこの命題を 「血圧降下剤投与後12日目の血圧と、プラセボ投与後14日目の血圧は同じではない」 だとか 「血圧降下剤投与後約2週間目の血圧と、プラセボ投与後約2週間目の血圧は同じではない」 だとかに拡大解釈していいかどうか、ということです。こちらは数学の出る幕じゃありませんで、被験者の選び方・振り分け方が適切かどうか(血圧降下剤が効きそうな人ばっかりを実験群に選んだのではないか)、測定条件がコントールされているかなどなど、のツッコミどころがあります。  で、ご質問では測定条件が揃っていないことを気にしていらっしゃるけれども、単に経過日数を同じにしたとしても特段改善されるようには思われない。むしろ、たとえば日内変動や運動や気分や気温の影響を考慮しているか、ということの方が効きそうですからね。(なおstomachmanの血圧は、血圧を測ってくれるナースの年齢と有意な相関を示します。いや冗談じゃなく。)あらゆる条件を含めたコントロールが問われるんですが、記録していない条件はコントロールしてなかった(あるいは作為的に差をつけた可能性すらある)ものと考えざるを得ません。  つまりズルの仕方は幾らでもある状況で「ズルをしてません」と主張したときに納得してもらえるだけの準備があるか、という問題なんです。  ご質問の実験の場合、偽薬まで使う以上は二重盲検(被験者の誰が実験群で誰が対照群かが被験者にも実験者にも分からない状態で薬を投与し、誰が実験群で誰が対照群かが被験者にも実験者にも分からない状態で測定する)をやるべきだった。そうすれば、少なくとも作為的に差をつける事は不可能だからです。(でも、測定日が群ごとに違うってことは、この実験が二重盲検になっていないのは明らか)。ちょっとした工夫でできることなんですがね。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご指摘のように、臨床試験の場合、二重盲検法で実施し、撹乱要因を制御し、識別不能性を確保しておこなうのが筋ですね。それに不備があると、検定結果を一般化し薬効を主張することはできないのですね。逆に、測定日時が異なっていても、「真の結論」を導くのに影響がないと判断されれば問題ないと言うことですね? 非常に参考になる回答ありがとうございました。

関連するQ&A

  • 検定で出てしまった有意差を認めたくないのですが。。。

    2つの装置で同じ試料を測定した値を比べています。 この2つの装置が同等であると言いたいのですが、一元分散分析による検定でも対応のあるt検定でも有意差が出てしまいます。n数が多い(n=120)のも問題なのですが、これはどうにもなりません。 以前、ある統計の本で、有意差が出てしまったけれど、それが意味のある差とは思えない場合は、区間推定までやって説明(言い訳?)することができる・・・というようなことを読んだことがあるのですが、それは具体的にどういうことなのでしょうか。 また、それ以外にも検定で出てしまった有意差を言い訳できるような手法があればご教授いただきたいと思います。

  • t検定について

    実験レポートなのですが、処理の仕方でわからないところがあるので教えてもらいたいです。 被験者はそれぞれ3名ずつのAとBの2群があります。それで、各被験者で、仮にXとYについてのデータが得られたとします。そこで、エクセルで、下記のようにまとめました。          X     Y A群・被験者1  60    50 A群・被験者2  40    20 A群・被験者3  55    70 B群・被験者4  45    70 B群・被験者5  35    50 B群・被験者6  50    40   それで本題なのですが、XとYについて、この2つに違いが見られるかを調べるため、t検定を行うのですが、 私は、等分散を仮定した2標本による検定というt検定を用いて、変数1に、A群のXの値3つ、変数2に、B群のXの値3つを入れて出したのですが、これだと自由度が4になりますよね。 実験助手の人が、自由度は2になると言っていたので、私のやり方が間違っていると思います。   XとYについて、この2つに違いが見られるかを調べる場合、どうやってt検定をしたらいいのでしょうか。 長文になりましたが、ご存知の方よろしくお願いします。

  • 2母集団の有意差検定

    非常に虫のよい投稿です。 昔、大村平著の分散分析と○○(忘却)のはなしを勉強し 2母集団の有意差検定を計算したことがあります。 この歳になると面倒なものでネットで計算ソフトがないか2日ほど調べてます。 Casioでそこそこ計算ソフト有りますがイマイチです。 と言うことで虫のよいと言うことにしました。 ご存知の方いましたら教示お願いできませんか。 ある集団の測定データvs条件を変えた集団の測定データ で有意差有無を計算したいと考えてます。 宜しく。

その他の回答 (4)

  • 回答No.5
  • backs
  • ベストアンサー率50% (410/818)

おそらくは理解されているのでしょうが、一応、念のためにいっておきますと、私がいったのは > 100日目と101日目を比較するのと、2日目と3日目を比較するのでは、妥当性がだいぶ違いますよね。 ということではありません。私がいっているのは、12日目と14日目との間1日をどう捉えるかということです。 (この回答に対するお礼は必要ありません)

共感・感謝の気持ちを伝えよう!

質問者からのお礼

測定日時の違いが、真の結論を導くのに影響があると捉えるか、ないと捉えるか・・・と言うことでしょうか? 再度の回答、本当にありがとうございました。 まことに勝手ながら、そろそろ質問を締め切ろうと思います。

  • 回答No.4

何と何を比較したいのか、によります。 0日目にデータを取らないで、この2群の比較をしたいのであれば、条件が交絡している(直交していない)のでダメです。 0日目にデータを取っており、それぞれの群について0日目との比較をしたいのであればOKでしょう。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

測定日時の違いが交絡になっていないと判断されれば問題ないのでしょうか? 回答ありがとうございました。

  • 回答No.2
  • backs
  • ベストアンサー率50% (410/818)

可能でしょう。 もちろん、観測条件を一致させるという点に関していえば、それぞれの群に含まれる被験者を同じ間隔で再度、観測することが望ましいでしょうが、実際には数日のズレがでるのは仕方のないことでは?マウス(マウスといっても色々ですが、、、)とかであればともかく、ヒト相手では同じ日に再来してもらうのは難しいですからね。 結局、12日目と14日目に行うことが「妥当かどうか」という問題でしょう。それを判断するのは質問者さん自身でしょう(あるいは論文の読者たち)。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

100日目と101日目を比較するのと、2日目と3日目を比較するのでは、妥当性がだいぶ違いますよね。 回答ありがとうございました。

  • 回答No.1
  • usokoku
  • ベストアンサー率29% (744/2561)

「AとBとの平均値差を検定する」場合には、統計以外の手段によって、「差が出ること」を示す必要があります。 統計以外の手段で、 12日目と14日目の結果に差がないこと を示す必要があります。注意するのは「差があるとは言えない」という場合には使えません。第一種・第2種の間違いの関係で、「同じである」場合と差が少なすぎて「わからない」場合を含めて「差があるとは言えない」としていますので。 統計というよりも、やくりの理論で、差を比較できること、を示す必要があります。 統計ですと、バスタブ曲線が簡単なのでこの例で上げると 中央部は、ほとんど変化がありません。初期変化を過ぎてしまえば、2-3日(あるいは3-10年)の違いはありません(バスタブ曲線という式が存在する)。だから、同じとみなして比較できるのです。 バスタブ曲線の様に、12-14日の間の差がないことを示す理論式を用意してください。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

回答ありがとうございます。 12日目と14日目の結果に差がないことを示せない場合、検定はできないと言うことでしょうか? 例えば、以下の様なデータの場合(バスタブ曲線ではない) 血圧降下剤群・・・0日目=160±5、12日目=100±5、24日目=80±5 プラセボ群・・・0日目=160±5、14日目=140±5、28日目=120±5 12日目のデータと14日目のデータには明らかに有意差があるように思われますが、これを検定することは不可能なのでしょうか?

関連するQ&A

  • T検定と分散分析間で異なる有意確率が出る

    心理学科4回のものです。 今回も前回に引き続き卒論の事について質問があります。 その前に前回お答えいただいたselferさん backsさんどうもありがとうございました。おかげで検定については何とか自力でやれるところまで 持っていくことが出来ました。 さて今回はですが、検定統計量の書き方についてです。 その前に自分の実験の概略について再度書いておきます。 自分は運動が及ぼす気分の高揚の効果を調べるために被験者にエアロバイク運動をさせ、それを行わせながら各時間(運動前、10分、運動終了後、終了5分後)に運動専用の質問紙に答えさせましてこれを計6日、条件を3群に分けて行いました。 例えば1日目の点数と六日目の点数 で有意な差があるか群関係なく調べたいときは対応のあるT検定を行います。日にちの主効果は有意な差が出ましてそれはそれでよいんですが 一方で被験者間3(群)×被験者内2(日)の方でも分散分析を行いまして群の主効果が有意、日にちの主効果が有意と出ました。 しかしこの場合T検定と分散分析とでは日にちの有意確率に多少の差が 出ています。両検定とも有意な結果が出たわけですがなぜ多少の差が 出たのかさっぱり分かりません。調べていることは同じだと思うのですが。。 後、もう一つ質問です。 分散分析の結果を論文に書いていくとき (F(○1、○2)=○3 p<○5) という風に表記しなければいけません。 ○1が自由度、○2が有意水準であることは知っているのですが 有意水準がSPSSのどこの蘭に出ているのかがさっぱり分かりません。 どこを見ればいいのでしょうか。 二つ併せてお答え頂けたら幸いでございます。 よろしくお願いします。

  • 統計の有意差に関して

    あるデータの有意差を求めたいのですが、データAとBは全く別のデータでなければいけないのでしょうか?Aの中にBが含まれる場合は、有意差を求める事は不可能なのでしょうか?測定の頻度を再考するために、全てのデータAと、抜き出したデータのまとめBに差があるのかどうか検定したいのですが。

  • 平均値の検定と元データの検定

    例えば、男女の100m走のタイムに有意な差があるかを95%信頼区間、 両側検定を用いたT検定で調べるという実験があったとします。 1.まず、実際に8人の被験者に走ってもらい以下のデータを得ます。 A子~D子さんに4回ずつ走ってもらう→16個のデータ A男~D男さんに4回ずつ走ってもらう→16個のデータ 2.このデータからA子さんの4回走った平均値、B子さんの4回走った平均値などという風に4つの平均値データ 同じくA男さんの平均値、B男さんの平均値という4つの平均値データを得ました。 (A子さんは速く、B子さんは遅いなどばらばら) 3.さらに女子(A子さん~D子さん)の一本目の平均、二本目の平均、といった平均の取り方で取った 平均値データ、同じように男子の平均値データ計8つが得られました。 (男女とも1本目の平均値が最も速く、4本目の平均値が最も遅い) そして実際にT検定した所、 ・16個のデータを比べたら有意差は出たが、(p≒0.01) ・4人の平均値のデータを比べたら有意差が出ない(p=0.054) ・4本の平均値のデータを比べたら有意差が出た)(p≒0.01) という状況に陥ったとします。 ここから、 1)男女の100m走のタイムに有意差はあるといえるのか? 2)4人の平均と、4本の平均で有意差が違うのは何故なのか? (イメージ的に何故なのかなんか腑に落ちません。4×4のデータ表があって、右への平均と下への平均で こんなに差が出ていいものなのでしょうか??) (実際は男女の100m走実験で無く、分かりやすいため書き変えております。 よって、実験をこう変えた方がいいなどの指摘はご容赦下さい。) 宜しくお願い致します

  • 【統計初歩】相対値での有意差検定

    考え方が合っているのか自身がないので質問させて下さい。 統計学についてはまだ勉強し始めたばかりです。 いま薬剤Aをラット30匹に投与し、投与前・投与後についてあるタンパクの産生量を測定するとします。そしてその産生量について有意差検定をします。ただ、個体差が激しいマーカーなので実測値(量)ではなく相対値(投与前後での変化率)で比較して検定したいのですが、投与前の生成量が「0」のラットはどのように扱えば良いでしょうか? データを例示すると以下のようなもので、(4)のデータが扱いに困っています。   投与前(相対値)    投与後(相対値)  (1)10 (100%)     20 (200%)  (2)200 (100%)     300 (150%)  (3)1000 (100%)     1700 (170%) ☆(4)0 (100%)     2 (なし)  (5)100 (100%)     70 (70%)          ・          ・          ・  (20)5 (100%)      15 (300%) このラットは除外してデータ数29で処理して良いのでしょうか。 また投与前の相対値は全て100(%)として検定に用いて良いのでしょうか。 検定は、符号付のWilcoxon順位和検定を考えています。

  • 有意差検定について(寿命の実験)

    現在、実験のデータの有意差をウィルコクソンの順位和検定で判断しようとしています。 実験は、生物の寿命の測定なんですが、各寿命の日数における個体数および生存率というものを算出して、グラフとしています。また、比べようとする、個体の総数は異なっています。 ウィルコクソン検定では、2つの値の差に順位を付けていくそうなんですが、実験データのどの値を比べれば良いかわかりません・・・。 例えば、被験体Aと被験体Bがいたとき、3日目で死亡したAの数とBの数の差を算出したらいいのでしょうか? 生物学に関連した統計に詳しい方の解答をお願い致します。

  • SPSSでの、関連多群を反復測定した検定

    別の処理もはじめたのですが、こちらも分からず、本当に申し訳ないのですが、教えていただければと思います。 10人の被験者にA,Bという2通りの処理をし、それぞれ処理後1時間後と処理後の10時間後の値を2×2の分散分析したいのです。 各条件内での、1時間後と10時間後の値は対応がありますし、各経過時間内でのA,Bの処理にも対応がありますよね? このように縦にも横にも対応がある場合にはどのようなSPSSではどの検定を使えばよいのでしょうか?

  • excelの対応のないt検定について

    こんにちは。統計について質問させてください。 対応のないt検定を行おうと思っているのですが、比較しようとしている集団Aと集団Bの被験者の人数が異なっています。(例 集団A=68名 集団B=48名) (1)この場合、t検定は行えますか? (2)エクセルで行う場合、データタブのデータ分析、t検定等分散を仮定した2標本による検定でよろしいでしょうか? 宜しくお願いいたします。

  • t検定の有意水準

    標本誤差についてわかりやすく説明する場合、例えば信頼区間95%の場合、 「同じ条件で調査を100回やったとしたら、 95回は+-〇〇%の誤差の範囲に収まります」 等と説明します。 ではt検定により、2つの比率の差を5%の有意水準で計算した場合には、 その結果はどのように説明するのでしょうか。 「2つの比率に有意な差がない、又は有意な差が見られる」 と言う部分 はさておき、 何が5%なんでしょうか。 元々100回のうち5回は誤差の範囲に収まらない可能性のある 2つのデータなのだから、 その2つを比較する時点で誤差の範囲に 収まらない可能性が5%ではないのではないか  と思うと訳が分からなくなりました。 当方知識が乏しいので、できるだけやさしくお願いします。

  • t検定で困っています.

    t検定を行うにあたって,どのようにデータを処理していいのか分からないところがあるので教えて頂きたいです. このような場合どうしたらよいのでしょうか? データ1⇒10人の人が50m走のタイムをそれぞれ3回計測(靴を履いた状態で) データ2⇒同じ10人の人が50m走のタイムをそれぞれ3回計測(靴を履かない状態で) いま,データ1に対するデータ2の統計的有意差を調べたいです. このとき,データ1,データ2それぞれ10×3=30個の値を標本変数としてt検定を行うべきなのでしょうか? それとも,それぞれの状態で各個人のタイムの平均を出しておいて,10個の値を標本変数としてt検定を行うべきなのでしょうか?

  • [至急]t検定、相関解析 項目の数が膨大な場合

    被験者数20人ほどから300ほどの異なる項目に関してデータをとりました。 この20人を2つの群、AとBに分けて、 この300ほどの項目に関して、どのような違いがあるか見たいときに、 対応のないt検定、p<0.05で有意性を見たいと思った場合に、 300項目の5%、つまり15個は項目数の多さからランダムに有意になってしまうということでしょうか? あるいはこの300ほどの項目間に相関があるかどうかを見たいときも、 15個の項目では、ランダムに有意になってしまうかもしれないのでしょうか? 項目数が膨大の場合に、どの項目が2群で差があるか、あるいは項目同士の相関の有無 を見るときにどのような解析方法をするのがふさわしいのでしょうか?