• ベストアンサー

ANOVA(分散分析)の標本人数に関して

標本人数の異なる4つのクラス 1)クラスA 50名 2)クラスB 70名 3)クラスC 40名 4)クラスD 65名  の「テストの平均点」を分散分析 してく思うのですが、標本人数が 違っても問題ないでしょうか?  

noname#197915
noname#197915

質問者が選んだベストアンサー

  • ベストアンサー
  • orrorin
  • ベストアンサー率65% (88/134)
回答No.1

各群の分散が著しく違っていなければ問題ないです。 経験的なことで言いますと、だいたい1条件あたり20のデータがあれば安定します。 この場合、一番少ない群でも40人分あるので、普通にやってしまって大丈夫です。

noname#197915
質問者

お礼

ご助言ありがとうございます。大変、助かりました。

関連するQ&A

  • 変則的データへの分散分析の適用の可否

    このデータで分散分析をして問題がないか教えてください。 例えば,ある小学校があり,各学年は3クラスから成り立ってます。 それぞれのクラスは,ある特定の根拠に基づいてクラスわけされています。 ただし,3年生だけはクラスわけされておらず,1クラスでなりたっています。 各クラスの構成人数は同数とします。 このような状態で一斉に行ったテストの結果があるとして, 学年による差異と,クラスわけの効果を評価したいとします。 例えば,実際に行ったテストのクラスごとの平均点は以下のようになったとします。     1年 2年 3年  4年 5年 6年 Aクラス  5 6     8  9 10 Bクラス  1 4  7  10  13 16 Cクラス  3 3     10  10 14 このようなデータの場合, 「仮に3年が3クラスだったとして」分散分析を行ってもよいものでしょうか? すなわち,3年A組,B組,C組にまったく同じデータを割り振って分散分析を行うということです。 3年のデータが同じになるので,クラスわけの主効果が小さくなるかもしれませんが, どちらかといえば,学年の効果が見たいので,そこは目をつむれます。 あるいは,いったん3年生だけを除いたデータで分散分析を行い, もし,クラスの主効果がなければ,各学年の3クラスをひとまとめにして, 学年の効果だけを見る,というやり方のほうがよいでしょうか。 ご意見をお聞かせ願えれば幸いです。どうぞよろしくお願いいたします。

  • 標本分散の合併について

    標本分散の合併についてわからないことがございます。 ------------------------------------------------------ 標本Aの分散:Σ{(Xi - Xmean)^2} / (n-1) 標本Bの分散:Σ{(Yi - Ymean)^2} / (n-1) 合併標本分散(A+B) Σ{(Yi - Ymean)^2} + Σ{(Xi - Xmean)^2} / (n-1) + (n-1) Xmean(Ymean)は標本A(B)の標本平均です。 分散は未知だが等しいことがわかっている。 ------------------------------------------------------ なぜ、AとBの分母同士、分子同士足し合わすのでしょうか? そのようなことをしてもよいのでしょうか? なぜ、 Σ{(Xi - Xmean)^2} / (n-1) + Σ{(Yi - Ymean)^2} / (n-1) では駄目なのでしょうか? 教えていただけましたら幸いです。 以上、宜しくお願いいたします。

  • 分散と標本分散についてです

    私の学校のテストなんですが、ある2変数の数値が10個ずつあり、分散、標本分散、共分散を求めろという問題がありました。 共分散を求めろはわかるのですが、いまいち分散と標本分散を求めろの意味がわかりません。この場合は不偏分散として求めればよろしいのですか? 教えてください。

  • ANOVA4の分散分析表の見方

    初めまして!ご覧頂きありがとうございます。 今回、2要因2水準被験者間内混合計画の実験を行い、ANOVA4で分散分析を行ったところ、結果の分散分析表中にerror[S(A)] 、error[BS(A)] という項目がありました。 errorなので誤差かと思ったのですが、S(A)、BS(A)の意味がよくわかりません。 Aは恐らく要因A、Bは要因Bだと思うのですが・・・。 ご存知の方、よろしくお願い致します。

  • 統計の質問:分散分析?カイ二乗?

    統計に詳しい方、お助け願います。私はほぼ初心者です。 例えば100名の協力者に対し、あるテストを行いました。解答は3パターン(仮にA・B・Cとします)に分類でき、どれかが正解というわけではありません。そういう意味ではアンケートに近いです。調べたいのはこのA・B・Cの解答の頻度(仮にA:20名、B:65名、C:15名とします)に有意差があるかどうかなのですが、A-B、B-C、C-Aのどこに差があるかまで見たい時は、 カイ二乗検定とその後の多重比較(ボンフェローニ法など)を行うべきでしょうか? それとも、100名の解答をA・B・Cに振り分けるとき、それぞれに1点ずつ加算していって平均点を出し(A:0.2、B:0.65、C:0.15)、ABCの平均点の差について対応なしの分散分析とその後の多重比較(t検定など)を行うべきでしょうか? 見当はずれなことを聞いているかもしれませんが、誰かアドバイスをお願いします。

  • 分散分析の交互作用について

    はじめまして、 SPSSの三要因分散分析についてお尋ねします。 (1) A×B×Cの三要因分散分析を行いました。すべて2水準です。 結果、主効果、交互作用ともに有意さはありませんでした。 (2) 次にA×B×Dの分散分析を同様に行いました。 すると、A×Bの交互作用が有意でした。 (1)と(2)におけるAとBは同じデータなのに、なぜ(2)では交互作用が生じてしまったのでしょうか。 ちなみにA、Bは被験者内要因、C、Dは被験者間要因です。 ご教授の程、どうぞ宜しくお願い致します。

  • 分散分析 交互作用

    熟達度(上下)×テストA得点(上下)×テストB得点(上下)×テストC得点(素点)の3元配置分散分析をかけたら 交互作用がでませんでしたが、産出されたグラフから、下位群のテストAとテストBには交互作用があると思い、シンタックスをいじって、pairwise comparisonsを出すと、有意なところと有意でないところが確かにありました。そこで、最初にデータを熟達度で分割する設定をした後、再度、テストA(上下)×テストB(上下)×テストCで2元配置分散分析をかけたところ、下位群にのみ、交互作用がありました。 このことの意味することと、報告の仕方を教えて頂けないでしょうか?

  • 三元配置分散分析に関して。

    現在,“アルコール問題と抑うつ性との関連性およびソーシャル・サポートによる緩衝効果”に関して研究を行っています。そこで,次の仮説(a)アルコール依存症指標尺度得点が低い群よりも高い群の方が,抑うつ性指標尺度得点は高い。(b)アルコール指標尺度得点および抑うつ性指標尺度得点が高い群より低い群の方が,ソーシャル・サポート指標尺度得点は高い。よって,(c)アルコール問題と抑うつ性との関連性は認められ,ソーシャル・サポートによる緩衝効果は大きい。 これに基づき4×2×2の被験者内三元配置分散分析(アルコール指標尺度(a)正常飲酒群309名,(b)問題飲酒予備群100名,(c)問題飲酒群20名,(d)重篤問題飲酒群89名,の4水準。また第2要因は,抑うつ指標尺度得点値のカットオフポイント16点未満を(a’)非抑うつ群203名,16点以上を(b’)抑うつ傾向群315名,の2水準。第3要因は,ソーシャル・サポート指標尺度得点値,中央値+1以上を(a”)高サポート群268名,中央値+1未満を(b”)低サポート群268名,の2水準)によって検討したいと思っているんですが,これで果たして仮説を検証出来ますでしょうか。 また,二要因以上の分散分析では各群の人数がふぞろいだと,F値が不安定になり,結果の信頼性が失われるとの文献を見たんですが,上の群分けであれば,かなり各群の人数がふぞろいなんですが,この場合のSPSSでの対処法があれば,ご教授願えたら嬉しいです。 以上から質問は2つです。まずは,(1)上記仮説から三元配置分散分析にて検証出来るのか?出来ないのであれば,どのような統計的処理が望ましいか?また,より好ましい統計的検定があれば,どのようなものが良いか?(2)三元配置分散分析にて上記仮説の検証が可能であるなら,各群の人数のふぞろいはそのままで大丈夫か?大丈夫でないのなら,SPSSにてどのような対処方略を行うべきか?以上です。 お手数かとは思いますが,簡潔でもよろしいのでよろしくご回答お願い致します。

  • 分散分析について

    分散分析についての質問なのですが 被験者間要因のみに注目をし分析する場合 同じ被験者が、同じ実験を繰り返し得られた結果のデータは 各被験者ごとに結果の平均をとってから、分散分析をしても問題はないのでしょうか? 回答よろしくお願いします。

  • 重回帰分析と分散分析の結果が違う

    次のようなRのコードを書きました。 x1~x7は因子で、1がなし2がありだと思ってください。 最後のxがデータです。これが大きい程よいと言う意味だと思ってください。 data <- data.frame( x1 = c("1","1","1","1","2","2","2","2"), x2 = c("1","1","2","2","1","1","2","2"), x3 = c("1","1","2","2","2","2","1","1"), x4 = c("1","2","1","2","1","2","1","2"), x5 = c("1","2","1","2","2","1","2","1"), x6 = c("1","2","2","1","1","2","2","1"), x7 = c("1","2","2","1","2","1","1","2"), x = c(35,48,21,38,50,43,31,22) ) data colnames(data) <-c("B","C","B:C","D","B:D","A","7","x") data summary(aov(x ~ A+B+C+D+B:C+B:D,data=data)) summary(lm(x ~ A+B+C+D+B:C+B:D,data=data)) 結果としましては、 分散分析では因子C以外は有意差がないという結論を出しており、 重回帰分析では因子Bと因子B:D以外は有意差がないという結論を出しています。 重回帰分析と分散分析は基本的に数学的にやっていることは同じと言われたのですが、結果が異なり戸惑っています。 なぜこのようなことになったのか心当たりがある方ご教授ください。 よろしくお願いします。