- 締切済み
サンプル数が1とサンプル数が5を比較し、有意差を調べる検定方法
質問を見て頂きありがとうございます。 例えば、集団Aと集団Bがあったとします。 集団Aのサンプル数(n)は1つで、値を仮に10とします。 集団Bのサンプル数(n)は5つで、値を仮に2、3、5、6、7とします。 この集団AとBの間に有意差があるか調べることは可能でしょうか? また、可能な場合にどのような検定方法があるでしょうか? 当方は、主にエクセルの分析ツールを使ってます。 ご教授御願いします。
- みんなの回答 (7)
- 専門家の回答
みんなの回答
- gef00675
- ベストアンサー率56% (57/100)
お待たせしました。#6の式で間違いないようです。(#4~6はなかったことにしてください。お恥ずかしい。。。) 片方の集団が1個のときのt検定 集団Aの不偏分散を用いることができないため、集団Bの不偏分散だけでt値を計算することになります。以下は、t分布の定義式から導いた結果です。 集団Aのサンプルサイズ=1 集団Aのデータ値 a = 10 集団Bのサンプルサイズn=5 集団Bの平均 X=(X1+…+Xn)/n=4.6 帰無仮説:「集団Bの平均=a」 対立仮説:「集団Bの平均≠a」(両側検定) 自由度 k=n-1 =4 集団Bの不偏分散 V=((X1-X)^2+…+(Xn-X)^2)/(n-1) = 4.3 t値 T=(a-X)/√(V(1+1/n)) = 2.377 有意水準 α=0.05 t分布の両側5%点 t(α=0.05, k=4) = 2.776 Excelでの計算例 Bの平均=average(2,3,5,6,7) =4.6 不偏分散=var(2,3,5,6,7) =4.3 t値=(10-4.6)/sqrt(4.3*(1+1/5)) =2.377 t分布の両側5%点=tinv(0.05,4) =2.776 結論 |t値|<2.776なので、AとBに有意な差はない。 注意 t検定は、次のことを前提にしていることにご注意ください。 (1)集団AとBが、ともに正規分布にしたがっていること。 (2)集団AとBの分散が等しいこと。 上記の条件に当てはまると考えてよいかどうかは、実際の現象に関する経験からご判断ください。 分散が等しくない場合の検定はできません。Aのデータが1個だけの場合は、Aの分散に関する情報が得られないからです。
- gef00675
- ベストアンサー率56% (57/100)
ひえー、また間違えました。 正>t値 T=(a-X)/√(V(1+1/n)) = 2.37 (たよりない回答ですみません) もういっぺん検算しますので、もう少しの間締め切らないでくださいね。
- gef00675
- ベストアンサー率56% (57/100)
ごめんなさい。tの式に間違いがありました。 誤>t値 T=(a-X)/√V = 2.60 正>t値 T=(a-X)/√(V/(1+1/n)) = 2.85 正>|T|>2.78となったので、結論は「AとBに有意な差がある(p<0.05)。」 大変失礼しました。
- gef00675
- ベストアンサー率56% (57/100)
Aのサンプルサイズが1のときは、集団Aに関する情報は一つの数aだけしかありません。この場合は、 「分散が未知の集団Bの平均が定数aに等しいかどうか」 という仮説のt検定と、数学的に同じ扱いになると考えてください。(このことはt分布の定義からの直接の帰結ですが、詳細は略) ご質問の数値例で計算を試みますと、 集団Aのサンプルサイズ=1 集団Bのサンプルサイズ n=5 集団Aの値 a = 10 集団Bの平均 X=(X1+…+Xn)/n=4.6 集団Bの不偏分散 V=((X1-X)^2+…+(Xn-X))/(n-1) = 4.3 自由度 k=n-1 =4 t値 T=(a-X)/√V = 2.60 有意水準 α=0.05 t分布の両側5%点 t(α=0.05, k=4) = 2.78 以上から、|T|<2.78なので、結論は「AとBに有意な差はない(p≧0.05)。」となります。 Excelで計算するときは、 平均はaverage関数 不偏分散はvar関数 t値は(10-4.6)/sqrt(4.3) t分布の両側5%点は、tinv(0.05,4) などとして計算できます。サンプルサイズが1の場合はExcelの分析ツールは使えない ようですね。 注意:t検定は、次のことを前提にしています。 (1)集団AとBが、ともに正規分布にしたがっていること。 (2)集団AとBの分散が等しいこと。 上記の条件に当てはまると考えてよいかどうかは、実際の現象に関する経験からご判断ください。
- gef00675
- ベストアンサー率56% (57/100)
集団Aのサンプル数が1つというのは、単なる例なのでしょうか? それとも、片方の集団のサンプルが1つしかない場合にどうすればよいかというご質問なのでしょうか? 片方のサンプルが1つの場合でも、他方のサンプルが複数あればt検定の方法がないわけではないので、もし、そういう場合の検定をしたいのであれば、補足でお知らせください。
補足
gef00675様、ご回答ありがとうございます。 後者「片方の集団のサンプルが1つしかない場合」の場合に当たります。 もし、ご存知でしたらご教授お願いいたします。
- backs
- ベストアンサー率50% (410/818)
> この集団AとBの間に有意差があるか調べることは可能でしょうか? 計算はできるでしょう。しかし、それに意味があるかといえば多くの人は「無意味」というでしょう。 --- > A <- c(10) > B <- c(2, 3, 5, 6, 7) > t.test(A, B) --- R-2.8.0では「以下にエラー t.test.default(A, B) : 観測値 'x' の個数が不十分です」というメッセージが出てきます(日本語の場合)。観測値が1つであるということは、実質的に平均値を計算することに意味がないので、そもそも検定すること自体(平均値を比較すること自体)に意味がないということからでしょう。
- mame205
- ベストアンサー率37% (34/91)
有意差とは、集団が複数個から成り立つことを前提としています。 複数個で成り立つ集団AとBの値の平均値を比べ、その差が「意味のある差」なのか、「単なる偶然であり、意味があるとは言えない」のかを調べるのが統計学です。 2つの平均値を比べるということであればt検定がありますが、集団Aのサンプル数が1つであれば、単純に集団Bの平均値と10を比べて、等しくなければ「差」があるというだけの話です。
お礼
gef00675様、おはようございます。 大変、丁寧な解説ありがとうございます。 このような遅くの時間までお時間を取らせてしまい、本来なら直接お礼を申し上げるべきなんでしょうが、メールで失礼します。 本当にありがとうございました。