• 締切済み
  • 困ってます

ANOVAは推奨されないのでしょうか

#1921839で回答兼質問させていただいたものです。なんかわからなくなってしまったので質問を別にたてたいと思います。 質問内容はタイトル通りです。複数群の平均の検定にANOVAを使うというのは正しくないのでしょうか?(分散の均一性まではクリアしていることとします。)今まで、 a priori hypothesis なし --- ANOVA → post-hoc の多重比較 a priori hypothesis あり --- 多重比較 だと思っていたのですが、多重比較だけ使う方がより推奨されるのでしょうか?他の質問を見てもANOVAは推奨されていないように見えます。(eg. #1886531) 単に分野の違いとも思うのいですが。私の分野では a priori hypothesis はたてにくいです。分野によってはその結果にある程度見当がついてることの方が多く直接の多重比較が推奨されているのかもしれません。 また、ANOVAをGLMの一部として考えたいと思っているのですが、ANOVAが一般的でないとするとはGLMも一般的でないのでしょうか?よろしくお願いします。

noname#25799
noname#25799

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数732
  • ありがとう数3

みんなの回答

  • 回答No.2
  • dunnett
  • ベストアンサー率24% (16/66)

Dunnett(1955, 1965)の論文にANOVAは必要ないことが述べられています.理由はANOVAで有意差がなくてもDunnettでは有意差が認められるからです.私も数回遭遇しました.PCが普及する前の20年ぐらい昔は,必ず分散分析表を作成し論文中に表示しました.この表の誤差項が以後の検定(Dunnett, Tukey, Duncan)に必要なためです.現在はPCの普及によって分散分析を実施しなくとも誤差項は瞬時に計算できるからです.単にグループ間に差があるかを見る場合はANOVAのみでよいと思います.その他は#1さんの意見を推奨します.したがって,ノンパラメトリック・順位和検定のKruskal-Wailsも同様です.多重性を考慮し,検出力が高いSteelなどを推奨します.

共感・感謝の気持ちを伝えよう!

質問者からのお礼

追加質問をここに書かせていただきます。多重比較の前提は各群の正規性でしょうか、それとも各群間の分散の均一性でしょうか?#1921839では先生方の意見が違うのでよけいこんがらがっています。ANOVA使わないのなら正規性のみ、ANOVA使うなら分散の均一性が前提の気がしますが、如何でしょうか。 理解力がよくない方なのでご迷惑をおかけすると思いますがよろしくお願いします。

質問者からの補足

回答ありがとうございました。先生の(ですよね)立派なホームページも見させていただきました。確かに毒性試験でしたらtype I error の方が実際の影響がマイルドな気がします。逆にtype II errorの方が好まれる立場もあるのかもしれない(例えば副作用もある薬とか)と想像しました。(素人考えですみません。)単なる好奇心ですが1955年、1965年のDunnettの論文のあと何も論争はなかったでしょうか。 多元配置あるいは繰り返しのあるANOVAはpost-hocも許されるが、なるべく検出力の高いものが推奨されるわけですね。納得です。この場合、ANOVAはしなくてもいい(あるいはしない方がいい)という考え方もあるのでしょうか。あっても不思議はない気がしますが如何でしょうか。

関連するQ&A

  • SPSSのanovaとt検定

    こんにちは。統計初心者です。 対応のないt検定に関する質問 (1)tの値が2.97や.36、5.01になりました。5パーセント水準だと、5.01は帰無仮説を棄却できないということでしょうか。 (2)統計の本を見るとレポートにはt(自由度)=tの値,p<0.1とありますが、この最後のpの値はどのSPSSの、t検定のどの項目を見れば確実にp<0.1と確認できますか? anovaに対する質問 (1)SPSSの分散分析の項のグループ間、グループ内とはどういう意味でしょうか。 (2)anovaの自由度はグループ間+グループ内の数であっていますか? (3)F値ですが、0.1より小さければ有意ということですか。 (4)最後に記入するpの値ですが、t検定では0.1でしたがanovaでは.001になっていました。なぜですか。 (5)多重比較の項ですが、以下のような結果が出たとしたら、条件1と条件2、条件2と条件3の有意はどこを見ればいいのでしょうか。 (I)条件1 (J)条件 平均値の差 標準誤差 有意確立 条件1    条件2  -4.42857  .61721    .000         条件3 -1.85714 .61721 .020 参考書等を用いて勉強していますが、独学では理解しきれない部分も多く、皆様のお力をお借りできたらと投稿させていただきました。 1つでもかまいませんので解答お願いいたします。

  • 分散分析について。

    初歩的な質問ですみません。 ANOVA4を使い分散分析を行ったのですが、結果の見方と書き方が分かりません。 SS,df,ms,F,Pの項目があるのですが、どの値がどうなると、要因Aによってデータが変動するといえるのでしょうか? T検定まではなんとか理解できたのですが、分散分析でつまずいてしまいました…。 それと、もう一つ多重比較についてお聞きしたいことがあります。 P=0.05で実行したのですが、多重比較の結果がP<0.05なのにn.sになっています。 これはなぜでしょうか? 質問ばかりですみません。 色々検索したのですが、初心者向きのサイトが中々無かったもので。

  • 不等分散後の多重比較

    ANOVAを行うと同時にチェックしたところ、 不等分散という結果になった場合、SPSSを使用しているのですが、多重比較は何を使えばよいのでしょうか? Dunnet T3とDunnet Cは何が違うのでしょうか? 色々調べたのですが、お手上げ状態で、よろしくお願いいたします。

  • 回答No.1
  • solla
  • ベストアンサー率59% (45/76)

結果に見当がつけられるとか、a prioriに仮説がたてられるとか、そういう話ではありません。一言で言えばANOVAと多重比較検定を繰り返すことで、そこに検定の多重性が生じるからです。それでは何のために検定の多重性を考慮して多重比較を行うのかわからなくなってしまいます。 また、誤解されているようですが、これはANOVAを否定するものではありませんし、ましてやGLMが一般的でないなどとはまったく意味していません。ANOVAと多重比較を同時に用いるのが誤りだと言っているだけです。そもそもの興味が個別の群間比較にあるのなら、ANOVAではそこまで判らないのですから、初めから多重比較をするべきだというのが現在の通説です。平均値の一様性が棄却されれば十分な場合もあるでしょうし、多元配置の分散分析は単なる平均値の比較とは意味合いが異なりますから、そういう場合は分散分析が必要になります。GLMにあってはANOVAとは比べものにならないくらい広いクラスの分析を包含するモデルですから、まったくの見当違いをなされています。 確かに現在でも多くの文献で、ANOVA→post-hoc多重比較、と使われているのは事実ですが、多くの人がやっているからといって正しいことにはなりません。それだけ多くの人が誤って使っているのです。私の推測ですが、多重比較法があまり発達しておらず、コンピュータプログラムも限られていた頃は、Bonferroni法を除いては、Fisherの制限LSD法が多く使われていたのだと思います。そして制限LSDのANOVA→群間比較という手続きが他の多重比較法にも誤って慣用され、定着してしまったのではないかと考えています。ちなみにFisherの制限LSD法は4群以上の比較には正しくないことも現在では示されています。 ただしScheffeの方法だけは分散分析と同等なので、同時に用いても問題ありません。即ち分散分析で有意差があった場合はScheffeの方法で少なくとも一つ以上の対比に有意差があることを意味します。しかし、群間の対比較にはTukey、対照との比較にはDunnettが推奨されますから、Scheffeの方法は特殊な対比の検定の必要がある場合以外はあまり用いないと思いますが。

共感・感謝の気持ちを伝えよう!

質問者からの補足

詳細な説明ありがとうございます。できれば文献を紹介していただけないでしょうか。取り寄せて自分で勉強したいと思います。基本的な考え方に関しては理解しました。ただ、いくつか質問が残ります。 1. > 一言で言えばANOVAと多重比較検定を繰り返すことで、そこに検定の多重性が生じるからです。   >多元配置の分散分析は単なる平均値の比較とは意味合いが異なりますから、そういう場合は分散分析が必要になります。 とすると、多元配置の分散分析、あるいは繰り返しのある分散分析のあとのpost-hoc testは検定の多重性が生じるから推奨されないのか、あるいは可能なのかどちらでしょうか?もし可能なら、一元配置のみ多重性を否定されるのはエレガントさに欠けるというのか、少し抵抗を感じてしまいます。 2. 実学的ですが、SPSSという名前の統計ソフトを使っています。有名な統計ソフトと聞いていたのですが、「一元配置の分散分析 --- post-hoc」ができてしまいます。(需要があるから残してあるだけかもしれませんが。)もう少し正確な統計ソフトを使う方がいいと思うのですが、何か推奨のものがありましたら教えてください。

関連するQ&A

  • 多重比較 p<.05なのにn.sと出ます

    現在、論文執筆のために、ANOVAで統計を行っています。 一要因6水準の分散分析の結果、p<.05と結果が出た部分があったのですが、多重比較を行ってみると、どの水準でもn.sとなってしまいます。このことについて、 1.この結果をどう読みとったら良いのか、 2.私としては、少しでも有意差を示せる結果をだしたいと考えています。なので、他にどういった統計的手法が考えられるかを教えていただけたら、と思います。 すみません、よろしくお願い致します。

  • 二元配置分散分析 ノンパラメトリック検定

    卒論研究で得られたデータを統計解析しているところです。 Bartlett検定を行い、等分散であれば、二元配置分散分析(対応のない因子と対応のない因子)Two-way Factorial ANOVAを用いて解析し、Post-hoc testで優位差を検定しましたが、Bartlett検定で分散が等しくないと判断された場合、Two-way Factorial ANOVAに相当するノンパラメトリック検定を行えばいいと思ったのですが、その検定方法が見つかりません。もしかしたら、考え方が間違っているかもしれないのですが(独学なので)、何を用いればよいかご存じの方いらしたらご教授願います。

  • 統計学超初心者です。

    初めて質問させて頂きます。統計学超初心者なので、的外れな質問かも知れません。例えば、Yと言う薬を投与し、その経過を1ヶ月後、3ヶ月後、6ヶ月後に分けその変化を求める場合ですが、要因がA/Bと言うように分けるのであれば、Rpeated measure ANOVA(重複測定一分散分析法)で求められますよね?又、2つの期間(例えば1ヶ月後、3ヶ月後)の比較をするのであれば Paired t-test(対応のあるt検定)で求められますよね?しかし、3つの期間を1要因だけ比較したい場合、どのような検定方法を使えば良いのでしょうか?つまりpaird t と repeated measure ANOVA の間、名付けるとすれば、one factore repeated measure ANOVA又はtrio t testとか・・・一応、個体内要因に関しては、多重比較できませんと言うところまでは、理解出来るのですが・・・本当に統計学超初心者なので、的外れな質問かもしれませんが、ご教授の程宜しくお願い致します。

  • 等分散性が仮定されない分散分析、およびカイ二乗検定

    (誤って「生物学」カテゴリーで質問してしまったため再投稿します) SPSSを利用しています。 クラスター分析により4つのグループに分けた後、 30の質問項目について、1間配置分散分析でグループ間の平均値の比較を行おうとしています。各グループのサンプル数は、42、75、62、36です。 (1)グループごとのサンプル数はどの位あればよいのでしょうか? 上記サンプル数では問題がありますか? (2)ルビーンの等分散性の検定をしたところ、.05以下になる項目が7つほど見つかりました。 となると、普通はこれは分散分析ではなくノンパラ検定にすべきなのですよね? 他の方の質問で、Games-Howellなら分散分析のままで大丈夫とあったのですが本当でしょうか。 (3)もし(2)でGames-Howellで大丈夫とすると、その後の多重比較は、 ・等分散が仮定された項目は分散分析で有意であればTurkey-HSDで多重比較し、 ・等分散が仮定されなかった項目は分散分析で有意であればGames-Howellで多重比較する ということになるのですか? この場合、質問項目により多重比較の方法が分かれてしまいます。 それとも、全項目についてGames-Howellの方を見るのでしょうか? (4)あと、これは(1)~(3)と独立の問題かもしれませんが、 一部の質問にはNAデータがあるので、 全ての項目についてサンプル数が同じではありません。 これは分析上問題がありますか? 以上の4つについていずれでもよいので お分かりの方どうぞ教えてください。よろしくお願いします。

  • 因子の構成項目を分散分析・多重比較するのは,いけないことでしょうか?

    こんにちは。なにとぞ,よろしくお願い致します。  質問ですが,(1)20項目4因子からなる尺度で,被験者の属性により,尺度総得点および因子得点ごとに分散分析・多重比較をおこないました。(2)そのなかで,特にある因子が興味深く,その5つの構成項目それぞれを,被験者の属性により分散分析・多重比較をおこないました。この一連の手順は,たとえば,多重性とかの問題があるのでしょうか?(2)の手順に問題があるなら,(1)も同じ手順ですが・・・雑誌の中で,(1)は使われているように思います。的外れの質問課も知れませんが,よろしくお願い致します。

  • 分散分析の主効果について

    現在anova4により分散分析を行っています。 今回の質問は、1要因3水準の場合です。 (ここでは、要因をA、水準をa,b,cの再生率とさせてください) 分析結果として、要因の主効果が有意だったので、 「水準間に差があるのか~」 と思って画面をスクロールさせていくと、 下位検定でライアン法による多重比較の結果は、 水準間の差のところはすべて(n.s.)と表示されていました。 このような場合、どう考察すべきなのでしょうか? 私はてっきり、 「Aと言う要因の元で再生を行った場合、a,b,cの再生率に差が出る」 と言うような感覚で考えていましたが、 今回の場合はそれでは無理なようです。 また今回の下位検定では、 有意水準p=0.05で行っているのに、 p=0.0216613と言う値が提示されているところも(n.s.)でした。 これも何か重要なことなのでしょうか? どうぞよろしくお願いします。

  • 統計結果の表記方法をご指導ください。

    こんにちは。以前ご指導いただき1歩前に進むことが出来ました。ありがとうございました。たまよろしくお願い致します。 育児支援のスタッフをしております。母親を対象にした,あるアンケート結果を,5因子それぞれで,ネット上のフリーソフトを使用させていただき,『分散分析+シェフェの多重比較』を行いました。 ここからが質問ですが,内1つの因子で,バートレット検定の出力が,P=0.0123でしたので,等分散ではないということは,この因子に関しては,分散分析は使用できないということでクラスカル・ウォリス検定をすべきなのか?と思い,この因子に関してだけクラスカル・ウォリス検定を行いました。これにより,P=0.191を求め,有意な主効果がみられないということで,多重比較の必要もないと思いました。この一連の考え方で,よろしいのでしょうか?  もし,上記の手続きでよい場合に,文章なり,表なりは,どのように,検定の混在を表現すればよいのでしょうか?私が見た限りの文献では,数個の因子の「分散分析,そして,多重比較」が,すっきりと,一つのまとまった表に表されております。 わかりにくい表現もあるかと思いますが,ご指導よろしくお願い致します。

  • 平均の比較についての質問

    テストの平均点の比較についての質問です。 2008年前期、2008年後期、2009年前期の3回のテストの平均を比較したい。 テスト結果が着実に上がっていることを結論付けたい。 2008年前期→2008年後期:平均点が10点アップ(t-検定でも有意差あり)、2008年後期→2009年前期:平均点が15点アップ(t-検定でも有意差あり)と仮定します。 この2つの検定結果から2008年前期の平均点と2009年前期の平均点の差(25点)には有意差があると結論付けられますか? もちろんt-検定をしても有意差が見られます。 他者から3つの平均を比較する際はt-検定は使えない、分散分析だと指摘を受けましたが、このような時期が違う平均の比較(同時に比較する必要のない平均)の場合は、t-検定での多重比較で十分に結論づけられると思うのですが? もしだめな場合はやはり分散分析→多重比較法 という作業が必要でしょうか?

  • 分散分析と多重比較について

    こんにちは。いつもお世話になっています。 私は今、大学4年生で卒業論文を書いています。ほとんどの分析は終わり、文章を書きはじめているのですが、1点わからない事があり質問しました。 分散分析を行って有意差が認められたので、多重比較(テューキー法)を行ったのですが、有意差が認められるものが1つもありませんでした。 テキストを見ると、「保留にしておく」とだけあって、どうすればいいのかわかりません。 担当の先生も「う~ん」って感じで…。他の卒論をやっている友人に聞くと、分散分析の後、t検定を行っていたり、分散分析以外行わなかったりと様々です。 この場合どうする事が良いのでしょうか? 実験は質問紙調査で、いくつかのグループの意識の平均値の差があるかどうかを調べています。

  • 実験データのPost Hoc Testについて教えてください

    現在大学院生で研究の統計処理に迫られている者です。 薬物(偽薬と抗不安薬の2種類)が認知課題に与える影響を実験しました。 15人の被験者に対して2日間(偽薬の日と抗不安薬の日)、服用前・90分後・180分後・360分後の計4回、計測しました。 2元配置反復測定ANOVAで、薬物の主効果及び薬物×時間の交互作用で有意差を得ました。 具体的にどの時間で薬物による有意差がみられるか検定したいのですが、Tukey-Kramer post hoc testをしてみても、薬物間の検定(偽薬と実薬の検定)あるいは時間同士での検定(例えば90分後と180分後の比較)をするだけで、特定の時間における薬剤間の検定が出来ません。 私としては、例えば90分後では薬剤の有意な効果が見られるか?、ということを知りたいのですが、どのように検定すればよいか教えていただけますでしょうか? ちなみに解析にはStatViewを使っています。 よろしくお願いいたします。