• ベストアンサー

分散分析は

分散分析の、使っていい時、使うべきではない時を教えてもらえませんか? 例えば、反応時間は不適切のような気がするのですが、エラー数はやってもいいような…という感じでいまいちよくわかっていないのです。 初歩的なことですが、よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.1

分散分析の使用における前提のことですね. 特におさえておくべき前提として, (1)それぞれの変数は正規分布をしているか? (2)複数変数は等分散であるか? があります. 変数1と2と3を分析するとして,変数1の分散が「2.0」,変数2の分散が「10.4」,変数3の分散が「4.5」といった場合,(2)の問題があるわけです. とはいえ,全く同一の数字になるわけはないので,変数1と2は「統計的に分散が等しいのか,異なるのか」という前提となる検定が行われます.これで統計的には異なるとは言えない場合,複数の変数はほぼ等分散であるとして分散分析を適用する可能性がでてきます. 今のは(2)の問題ですが,質問者の方が例に挙げられている「反応時間×,エラー数○」というのは(1)に関する問題のことです.エラー数というのは正規分布画家呈されますが,反応時間の場合は,早い人や普通の人は比較的短い時間で反応するが,極端に遅い人はとことん時間がかかるという,分布の形としては右スソが大きく広がった形だと考えられます.要するに正規分布をしていないわけです.このため反応時間は×,エラー数は○となります. とはいえ,統計学を道具として使う心理学者にとっては,便利な分散分析を使えるように色々工夫をします.例えば反応時間は,右スソが広がっているが「対数変換」などを行うことによって正規分布にちかづけることができますので,変換後の数値を分析対象とすることもあります(但し,「結局変換した数値を分析したのであって,変換前の数値を分析したことにはならない」という批判もあります). もっと便利な言い訳?としては,「分散分析は頑健性がある」という名文句があります.これは分散分析は多少前提条件を満たしていなくても結果にそれ程影響しない→多少の前提条件無視もOk,という論理を導きます(しかし,等分散の前提は多少無視できても,正規性については無視できないようです). このように前提条件を満たしていない場合は,分散分析を初めとするパラメトリックな検定の代わりに,ノンパラメトリック検定を行うことになります.

bon-chan
質問者

お礼

回答ありがとうございます。 やっぱり難しいです(苦笑) 正規分布が仮定されない場合は不適切、ということでよいのでしょうか? ノンパラは、x二乗とかでよかったでしょうか(まだこれしか習っていないんですが)? いろいろとありがとうございました。

その他の回答 (1)

noname#21649
noname#21649
回答No.2

1の方に追加して. ノンパラを使うときには. 1山分布であること という条件がつきます。心理の場合に2山分布になっている場合が結構見られますので注意してください。

bon-chan
質問者

お礼

回答ありがとうございます。 ノンパラはまだχ二乗しか習っていないのですが、 注意が必要なんですね。 使うときが来たら注意するようにします。 ありがとうございました。

関連するQ&A

  • 分散分析?

    分散分析についてレポートを書かなければいけないのですが、 そもそも分散分析って何?って感じなので 分散分析について詳しくわかりやすいHPとかあったら教えてください お願いします。

  • 分散分析について

    分散分析で分析をしたときの記述についてです。 以下の記述はおかしいところはありますか。 皮膚コンダクタンス反応の指標を、視線方向(直接目視、目を逸らす)、表情(笑顔、無表情)として、分散分析を行った。視線方向には主効果がありF(1, 18)=20.06, p<0.001であった。表情にも同じく主効果があり、F(1, 18)=15.60, p=0.001であった。視線方向と表情には交互作用があった(F(1, 18)=5.26, p=0.034)。 分散分析にお詳しい方がいらっしゃれば、ご教授よろしくお願い致します。

  • ・・・どの分散分析?

    卒論で分散分析をやらなければならないのですが、どの分散分析を使えばいいのかわかりません。計7枚のそれぞれ床の色が違う部屋の写真を提示し、それぞれの写真につき13個の形容詞対をSD法で答えてもらいました。 色、被験者の数、形容詞対、どれが要因とかさっぱりわかりません。教えてください。締め切り間近なんです!!

  • 分散分析について。

    初歩的な質問ですみません。 ANOVA4を使い分散分析を行ったのですが、結果の見方と書き方が分かりません。 SS,df,ms,F,Pの項目があるのですが、どの値がどうなると、要因Aによってデータが変動するといえるのでしょうか? T検定まではなんとか理解できたのですが、分散分析でつまずいてしまいました…。 それと、もう一つ多重比較についてお聞きしたいことがあります。 P=0.05で実行したのですが、多重比較の結果がP<0.05なのにn.sになっています。 これはなぜでしょうか? 質問ばかりですみません。 色々検索したのですが、初心者向きのサイトが中々無かったもので。

  • 分散分析の誤差について

    現在,心理学の統計で分散分析を行っています。 1要因に対応が無く,1要因に対応がある2要因の混合分散分析を行っています。(データ数が異なる) 現在使用しているソフトのバージョンでは混合分散分析ができないため手計算を行っています。 そこで問題が発生したのですが,参考書(心理学のためのデータ解析テクニカルブック)を見てやっているのですが, 平方和(SS)の誤差がどうしてもマイナスの値になってしまいます。 主効果の誤差は大丈夫なのですが,交互作用の誤差ででます。 良いのでしょうか? 以前,習った時にマイナスは出ないので出た場合には計算間違いだよ!と言われた気がして前に進めません。 すみませんが,よろしくお願いします。

  • 分散分析のやりかたをご教授願います。

    当方アクティウォッチを使用し、入浴などを除いて7日間ずっとアクティウォッチを付けてもらい、活動量の測定をし解析中の者です。 先生に添付画像にあるA~Hの活動量の合計平均をそれぞれ朝・昼・夜で二元配置(繰り返しなし)の分散分析をしろと言われたのですが、どうやっても出来ず困っています。(Excel2010のデータ分析を使用しています。) 朝・昼・夜は1日をキリの良い0時から8時間毎に分けたものです。 最初、朝・昼・夜を1時間毎に分けてそれぞれを二元配置(繰り返しなし)の分散分析をしていたのですが、1時間毎ではあまり意味が無いと言われ、グラフにある合計平均A~Hの8つで分散分析をやったらどうかと言われました。 でもこれだと二元配置の分散分析は出来ないと思い、ぐるぐるとループしてしまい困っております。 文が苦手で分かりにくいとは思いますが、この添付画像の分散分析のやり方などご教授頂けないでしょうか? よろしくお願い致します。

  • 二元配置の分散分析、多重比較法のときデータの数が合わない場合は?

    反応時間を測定して分散分析を行ないたいのですが、外れ値を検出してそのデータを捨てると、各水準のデータの数が異なってくるため、繰り返しのある二元配置分散分析や多重比較(方法によっては)ができません。 ボタンを押して反応時間を測定してもらうため、押し間違えや押しそびれなどがどうしても生じてしまいます。そのためデータの数が少し異なってしまいます。 このような場合は平均値を代用値として使って埋めてもいいのでしょうか? 代用値の決め方や他の分析方法があればご教示のほうお願いします。

  • 共分散分析について教えてください

    共分散分析は,どのような時に使うべきなのかや, 共変量が何なのかかいまいちよくわかりません. また,3要因を手計算でするのは無謀でしょうか? 具体例をあげて教えていただけるとありがたいです. よろしくお願いします.

  • SPSSで、対応のある分散分析を繰り返したい

    全員が1日に1条件やり、3日かけて計3条件を行う被験者内計画です。各条件での実験はそれぞれ24時間続き、一時間に一個のデータが取れる実験計画で実験を行いました。 被験者は10人だとして、データは時間ごとに条件間で対応のある分散分析をしたいのです。 つまり、1時の10人の各条件での値(3つ)を対応のある比較 。2時の10人の各条件での値を対応のある比較。・・・と24回(24時間分)繰り返したいのです。 このような分析をする為には、一回一回こつこつと24回やらなくてはならないでしょうか? 対応のあるt検定だと、このような場合、対になる値ををふたつずつ選んでいけばいっぺんにできるので、分散分析でも出来ないものかと思っているのですが。。 分かる方いらっしゃれば教えていただけませんでしょうか?

  • 共分散分析について教えてください

    現在、卒業論文で「望ましい死と自尊感情の関係」について調べています。 実は、この研究の前には「望ましい死と死の準備状態の関係」について研究していました。 その結果、年齢や職業など死の準備状態が進んでいれば、望ましい死の得点が高くなるという結果となりました。 今回の「望ましい死と自尊感情の関係」では分散分析を行った結果、有意差が出ませんでした。 つまり、自尊感情の高低は望ましい死に影響を与えないという結果となりました。 しかし、納得がいかず、他の分析方法として共分散分析の案が浮上しました。 そこで私の考えとしては、 各世代(青年期、壮年期、老年期)の「望ましい死の得点」は「自尊感情の高低」によって違いがあるかを調べたい。 このとき、「望ましい死の得点」は年齢の違いに関連しているのではないかとも考えることができる。つまり年齢という時間的・成熟的な違いの共変量をあわせて用いたほうが、より正確な分散分析ができるのではないか。 と考えたのですが、いまいち自分が何をしようとしているのか わからなくなってしまいました。 統計学初心者なので、意味不明な質問になっているかと思いますが、 どうかご教授御願いします。