• ベストアンサー

変則的データへの分散分析の適用の可否

このデータで分散分析をして問題がないか教えてください。 例えば,ある小学校があり,各学年は3クラスから成り立ってます。 それぞれのクラスは,ある特定の根拠に基づいてクラスわけされています。 ただし,3年生だけはクラスわけされておらず,1クラスでなりたっています。 各クラスの構成人数は同数とします。 このような状態で一斉に行ったテストの結果があるとして, 学年による差異と,クラスわけの効果を評価したいとします。 例えば,実際に行ったテストのクラスごとの平均点は以下のようになったとします。     1年 2年 3年  4年 5年 6年 Aクラス  5 6     8  9 10 Bクラス  1 4  7  10  13 16 Cクラス  3 3     10  10 14 このようなデータの場合, 「仮に3年が3クラスだったとして」分散分析を行ってもよいものでしょうか? すなわち,3年A組,B組,C組にまったく同じデータを割り振って分散分析を行うということです。 3年のデータが同じになるので,クラスわけの主効果が小さくなるかもしれませんが, どちらかといえば,学年の効果が見たいので,そこは目をつむれます。 あるいは,いったん3年生だけを除いたデータで分散分析を行い, もし,クラスの主効果がなければ,各学年の3クラスをひとまとめにして, 学年の効果だけを見る,というやり方のほうがよいでしょうか。 ご意見をお聞かせ願えれば幸いです。どうぞよろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#108260
noname#108260
回答No.2

いまいち説明がよく分からないのですが、 2つのパラメータが有って、それらの一方を変化させた場合と両方を変化させた場合で、評価の分散がどの程度変化するか求めたいと言うことでしょうか? 評価値が比較対象の組み合わせと無関係に絶対的に決まるのであれば何度利用しても変わらないので使いまわして良いでしょう。 組み合わせの中で相対評価しているのであれば組み合わせの変化の影響を受けるので別途試験は必要になります。

ennogyoja
質問者

お礼

ありがとうございます。 組み合わせの影響をうけるはずです。 ですので,やっぱりこのままでは無理ですよね。 とりあえず,共通する部分のデータを省いて, 2要因分散分析を行った後,ひとつの要因の主効果がなければ, そちらのほうをくるめて,一元配置の分散分析をしたいと思います。

その他の回答 (2)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 統計学で、検定が必要な理由は、データが欠けている場合。 すなわち、データが欠けていると、その値を考慮(推定)して判断しないといけない(検定)からです。「危険率5%で有意差あり」というのは、推定したら、その危険性を考慮した確率で表現しているのです。  全員が受け、0.1点でも0.01点でも差があれば、数学的(=統計学的)には差があります。少ない人数なら、全員のテストをできるでしょうから、検定は必要ありません。私なら、全員が受けるようにします。  クラス分け以前の問題として、学年が上がると、能力は高くなります。クラス分けの効果より、学年の影響がはるかに大きいと想います。何と比較するのか、が検定では重要で、学年で比較するのは、検定しなくても「差がある」と推定出来ます。もちろん、学年が上がると低下すれば、大発見です。  ですから、検定以前に、方法自体を再検討をお勧めします。

ennogyoja
質問者

お礼

ありがとうございます。 ただ,学校の話はたとえなのです・・・。 みなさんが学校に関しての知識をもっておられるので, ミスリードしてしまっているようです。申し訳ないです。 1番目に回答してくださった方への補足で, もう少しましな例えばなしを出しているので,そちらをご参照ください。

noname#108260
noname#108260
回答No.1

とりあえず、何を求めたいのが具体的に定義してください。 提示したデータはまともに統計データとして使うには情報が少なすぎます。 また、学年が異なる場合は別のデータとして扱う必要があるのでは無いでしょうか。 何となく統計を分からないけど分析してみたい、みたいな印象を受けました。 基礎的な前提条件が成り立っていない分析結果は意味がありません。 私なら、クラスごとに個人レベルのデータの分散と平均値を求め、 学年ごとに集団が同一であるかの検定を行います。 そもそも異なるテストの点を同一の意味を持つとして分析すると、 テスト間の平均点の差が検定に表れ、クラスの差はマスクされるでしょう。 もちろん、それでクラス分けの効果が無いとか言ったらナンセンスです。 もう少し考えを整理して下さい。

ennogyoja
質問者

お礼

ご回答ありがとうございます。 学校の例を出したのはたとえでして,実際は実験のデータです。 たとえがたとえになっていなかったようですね。申し訳ありません 2要因被験者内で,3水準×5水準の計画です。 イメージとしては, a1 a2 a3 a4 a5 b1 b2 b3 b4 b5 c1 c2 c3 c4 c5 のようなデータなのですが,実験材料の都合上, a3,b3,c3に相当する課題は同一になってしまい,試行数も1回きりなのです。 このような場合でも,分散分析をしてもよいでしょうか?

ennogyoja
質問者

補足

これでもたとえが悪いかも・・・ あらためてたとえ直してみますが, a3 b3 c3 d3 e3 ←アルファベットのみ変化 a1 b2 c3 d4 e5 ←アルファベット数字の両方が変化 c1 c2 c3 c4 c5 ←数字のみ変化 があるとして, 例えば,各組み合わせに対しての好感度調査をするとします。 (組み合わせパターンは上述以外はないと考えてください) この場合,どの列にもc3ができてしまいます。 好感度調査なので,なんどもやるのは変です。 なので,c3は1回だけになってしまいますが, 3回やったと仮定して,分散分析をしてもよいでしょうか?

関連するQ&A

  • 分散分析の交互作用について

    はじめまして、 SPSSの三要因分散分析についてお尋ねします。 (1) A×B×Cの三要因分散分析を行いました。すべて2水準です。 結果、主効果、交互作用ともに有意さはありませんでした。 (2) 次にA×B×Dの分散分析を同様に行いました。 すると、A×Bの交互作用が有意でした。 (1)と(2)におけるAとBは同じデータなのに、なぜ(2)では交互作用が生じてしまったのでしょうか。 ちなみにA、Bは被験者内要因、C、Dは被験者間要因です。 ご教授の程、どうぞ宜しくお願い致します。

  • 分散分析について

    統計初心者です。 分散分析についての質問です。 今実験データを分散分析にかけて主効果を見ようと試みています。 その中で要因が、「色1、色2、文字、環境」と 4要因あり4元配置で分析を行っています。 色1は、白、黒、灰で3水準、 色2は赤、青、黄、緑、白、黒、灰の7水準なのですが、 色1と色2が同じ色の組み合わせ (色1の白と、色2の白など) でのデータは存在していません。 つまり、色1には色2が6水準かかってくる。しかし、6水準は同じ種類ではない。といった状況です。 この状況で分散分析を行った場合、主効果として色1、色2は効いていると言えるのでしょうか? なんとなく腑に落ちません。よろしければどなたかよい方法を教えていただけると 大変助かります。 よろしくお願いいたします。

  • 分散分析について

    分散分析で分析をしたときの記述についてです。 以下の記述はおかしいところはありますか。 皮膚コンダクタンス反応の指標を、視線方向(直接目視、目を逸らす)、表情(笑顔、無表情)として、分散分析を行った。視線方向には主効果がありF(1, 18)=20.06, p<0.001であった。表情にも同じく主効果があり、F(1, 18)=15.60, p=0.001であった。視線方向と表情には交互作用があった(F(1, 18)=5.26, p=0.034)。 分散分析にお詳しい方がいらっしゃれば、ご教授よろしくお願い致します。

  • 分散分析について

    卒論で分散分析を行いたいのですが、適当に本を読み行ったのですが結果がいまいちなため、この分析であっているか否かを確認したく、質問させていただきました。  ある薬品ABCを3日間使用し、1日目~3日目のデータを集めました。  比較するのは「対照実験」「A」「B」「C」の間に差が生じているのか  さらに「対照実験」「A~C」において「1日目」「2日目」「3日目」の間に差が生じているか  これを比較するため、繰り返しのない2元配置分析分散法を用いて、分析してみました。  しかし薬品毎には有意な差が認められたのですが、実験日別のデータでは現れませんでした  しかしグラフを見てみますと、かなりバラバラな値が見られているため、実験日別のデータに差がないといわれても見た目的にはばらつきがあるように見られます  この場合℃の分散分析をすればよろしいのでしょうか。

  • ANOVA(分散分析)の標本人数に関して

    標本人数の異なる4つのクラス 1)クラスA 50名 2)クラスB 70名 3)クラスC 40名 4)クラスD 65名  の「テストの平均点」を分散分析 してく思うのですが、標本人数が 違っても問題ないでしょうか?  

  • 3要因の分散分析について

    A(2水準)×B(2水準)×C(2水準)の3つの独立変数から、Dの従属変数を比較する分析をおこなっています。 独立変数は3つとも対応のない要因です。 統計ソフトはSPSSを使っています。 最初に、仮説に沿うような部分だけで分析を実施しました。 Aの主効果、A×Bの交互作用、A×B×Cの交互作用を見たところ、Aの主効果とABCの交互作用が有意になりました。 この結果は仮説どおりで喜んでいたのですが、一応他の要因の主効果や、他の組み合わせの交互作用も検討しようと思い、 A、B、Cの主効果、A×B、A×C、B×Cの交互作用、A×B×Cの交互作用をみました。 その結果、1回目の分析で出ていたA×B×Cの交互作用は有意でなくなってしまい、Cの主効果とB×Cの交互作用が有意に出てきました。 おそらく分析の手順としては後から実施した方が正しかったのだと思いますが、 自分としては最初の分析結果の方が納得のいくものだったので、悩んでいます。 同じ交互作用をみても、投入する要因によっては有意確率が変わってしまうものなのでしょうか? また、最初の分析方法では筋が通っていないことになってしまいますか? 統計の初心者なので、よく理解できていないところが多いかと思いますが、 よろしくお願いします。

  • 分散分析 交互作用

    熟達度(上下)×テストA得点(上下)×テストB得点(上下)×テストC得点(素点)の3元配置分散分析をかけたら 交互作用がでませんでしたが、産出されたグラフから、下位群のテストAとテストBには交互作用があると思い、シンタックスをいじって、pairwise comparisonsを出すと、有意なところと有意でないところが確かにありました。そこで、最初にデータを熟達度で分割する設定をした後、再度、テストA(上下)×テストB(上下)×テストCで2元配置分散分析をかけたところ、下位群にのみ、交互作用がありました。 このことの意味することと、報告の仕方を教えて頂けないでしょうか?

  • t検定と分散分析

    1要因3水準以上の場合,A,B,C群として, AとB,AとC,BとC と 2組ずつ3回t検定をするのではなく, 分散分析をするのはなぜなのですか? t2乗=F で,一見同じことをやっているようにも見えますが, 要因の効果が誤差よりも十分に大きいことを確認してから 多重比較をする必要があるからなのでしょうか? 検定力が変わる,とどこかで聞いた気もするのですが,記憶があやふやで… f(^^; よろしくお願いします.

  • 分散分析の誤差について

    現在,心理学の統計で分散分析を行っています。 1要因に対応が無く,1要因に対応がある2要因の混合分散分析を行っています。(データ数が異なる) 現在使用しているソフトのバージョンでは混合分散分析ができないため手計算を行っています。 そこで問題が発生したのですが,参考書(心理学のためのデータ解析テクニカルブック)を見てやっているのですが, 平方和(SS)の誤差がどうしてもマイナスの値になってしまいます。 主効果の誤差は大丈夫なのですが,交互作用の誤差ででます。 良いのでしょうか? 以前,習った時にマイナスは出ないので出た場合には計算間違いだよ!と言われた気がして前に進めません。 すみませんが,よろしくお願いします。

  • 主成分分析における分散

    主成分分析の際、分散が一番大きくなるように第一主成分を決めますが、 射影したデータの分散が大きくなる=情報量が多いと解説されているものがあるのですが これがいまいちわかりません。ここらへんを詳しく教えてもらえないでしょうか。 よろしくお願いします。