• ベストアンサー

変則的データへの分散分析の適用の可否

このデータで分散分析をして問題がないか教えてください。 例えば,ある小学校があり,各学年は3クラスから成り立ってます。 それぞれのクラスは,ある特定の根拠に基づいてクラスわけされています。 ただし,3年生だけはクラスわけされておらず,1クラスでなりたっています。 各クラスの構成人数は同数とします。 このような状態で一斉に行ったテストの結果があるとして, 学年による差異と,クラスわけの効果を評価したいとします。 例えば,実際に行ったテストのクラスごとの平均点は以下のようになったとします。     1年 2年 3年  4年 5年 6年 Aクラス  5 6     8  9 10 Bクラス  1 4  7  10  13 16 Cクラス  3 3     10  10 14 このようなデータの場合, 「仮に3年が3クラスだったとして」分散分析を行ってもよいものでしょうか? すなわち,3年A組,B組,C組にまったく同じデータを割り振って分散分析を行うということです。 3年のデータが同じになるので,クラスわけの主効果が小さくなるかもしれませんが, どちらかといえば,学年の効果が見たいので,そこは目をつむれます。 あるいは,いったん3年生だけを除いたデータで分散分析を行い, もし,クラスの主効果がなければ,各学年の3クラスをひとまとめにして, 学年の効果だけを見る,というやり方のほうがよいでしょうか。 ご意見をお聞かせ願えれば幸いです。どうぞよろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#108260
noname#108260
回答No.2

いまいち説明がよく分からないのですが、 2つのパラメータが有って、それらの一方を変化させた場合と両方を変化させた場合で、評価の分散がどの程度変化するか求めたいと言うことでしょうか? 評価値が比較対象の組み合わせと無関係に絶対的に決まるのであれば何度利用しても変わらないので使いまわして良いでしょう。 組み合わせの中で相対評価しているのであれば組み合わせの変化の影響を受けるので別途試験は必要になります。

ennogyoja
質問者

お礼

ありがとうございます。 組み合わせの影響をうけるはずです。 ですので,やっぱりこのままでは無理ですよね。 とりあえず,共通する部分のデータを省いて, 2要因分散分析を行った後,ひとつの要因の主効果がなければ, そちらのほうをくるめて,一元配置の分散分析をしたいと思います。

その他の回答 (2)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 統計学で、検定が必要な理由は、データが欠けている場合。 すなわち、データが欠けていると、その値を考慮(推定)して判断しないといけない(検定)からです。「危険率5%で有意差あり」というのは、推定したら、その危険性を考慮した確率で表現しているのです。  全員が受け、0.1点でも0.01点でも差があれば、数学的(=統計学的)には差があります。少ない人数なら、全員のテストをできるでしょうから、検定は必要ありません。私なら、全員が受けるようにします。  クラス分け以前の問題として、学年が上がると、能力は高くなります。クラス分けの効果より、学年の影響がはるかに大きいと想います。何と比較するのか、が検定では重要で、学年で比較するのは、検定しなくても「差がある」と推定出来ます。もちろん、学年が上がると低下すれば、大発見です。  ですから、検定以前に、方法自体を再検討をお勧めします。

ennogyoja
質問者

お礼

ありがとうございます。 ただ,学校の話はたとえなのです・・・。 みなさんが学校に関しての知識をもっておられるので, ミスリードしてしまっているようです。申し訳ないです。 1番目に回答してくださった方への補足で, もう少しましな例えばなしを出しているので,そちらをご参照ください。

noname#108260
noname#108260
回答No.1

とりあえず、何を求めたいのが具体的に定義してください。 提示したデータはまともに統計データとして使うには情報が少なすぎます。 また、学年が異なる場合は別のデータとして扱う必要があるのでは無いでしょうか。 何となく統計を分からないけど分析してみたい、みたいな印象を受けました。 基礎的な前提条件が成り立っていない分析結果は意味がありません。 私なら、クラスごとに個人レベルのデータの分散と平均値を求め、 学年ごとに集団が同一であるかの検定を行います。 そもそも異なるテストの点を同一の意味を持つとして分析すると、 テスト間の平均点の差が検定に表れ、クラスの差はマスクされるでしょう。 もちろん、それでクラス分けの効果が無いとか言ったらナンセンスです。 もう少し考えを整理して下さい。

ennogyoja
質問者

お礼

ご回答ありがとうございます。 学校の例を出したのはたとえでして,実際は実験のデータです。 たとえがたとえになっていなかったようですね。申し訳ありません 2要因被験者内で,3水準×5水準の計画です。 イメージとしては, a1 a2 a3 a4 a5 b1 b2 b3 b4 b5 c1 c2 c3 c4 c5 のようなデータなのですが,実験材料の都合上, a3,b3,c3に相当する課題は同一になってしまい,試行数も1回きりなのです。 このような場合でも,分散分析をしてもよいでしょうか?

ennogyoja
質問者

補足

これでもたとえが悪いかも・・・ あらためてたとえ直してみますが, a3 b3 c3 d3 e3 ←アルファベットのみ変化 a1 b2 c3 d4 e5 ←アルファベット数字の両方が変化 c1 c2 c3 c4 c5 ←数字のみ変化 があるとして, 例えば,各組み合わせに対しての好感度調査をするとします。 (組み合わせパターンは上述以外はないと考えてください) この場合,どの列にもc3ができてしまいます。 好感度調査なので,なんどもやるのは変です。 なので,c3は1回だけになってしまいますが, 3回やったと仮定して,分散分析をしてもよいでしょうか?

関連するQ&A

専門家に質問してみよう