• ベストアンサー

平均値の差が大きい場合のF検定

F検定(等分散検定)は2群の平均値の差があまり大きくない場合に適用される方法なのでしょうか。それとも、2群の平均値が大きく異なる(例えば数倍の)場合でも何らかの基準化(補正)なしで適用可能なのでしょうか。ある郡の分散(標準偏差)が大きいのは元の観測値が大きいからで、それらを小さい郡と比較しても意味がない(検定をするまでもなく分散に差が出て当然)、ということにならないのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

う~~ん……どのレベルで答えればいいのか分からないんで……。 あくまで基礎的なレベルに絞って話をします。 基礎的なレベルでは「等分散検定」を行う前に「平均の差の検定」をかける事は「まずあり得ません」。従って、「2群の平均値の差が大きいだろうと小さいだろうと」適用出来るのが「等分散検定」なんです。 これは歴史的な成立背景を加味して考えると次のような事なんですよ。 一番知りたいのは「2群の平均値が同じか否か」ってのがずーっとあったんです。ところがこれを知る決定打が無かった。ここで登場したのが「ゴセットのt分布」だったんですね。ここでいわゆる「t検定」が初めて成立しました。 ここで命題を考えます。「2群の平均値が同じか否か」を考える場合、構造的には「2群が同じ正規分布を成す集団からサンプリングしたものであるのかどうか」って事ですよね。そうなるとサンプリングされた2群の「母集団」がどんなものなのか考察しないといけない、って事です。 さて、古典的な文脈で言うと、等分散検定をかけた時点で、「2群の分散が(ある確率で)等しくない」と分かったらどうなるでしょうか?これは単に、「それら2群は同じ正規分布に従う母集団からサンプリングされたものでは無い」と言う結論になりますね。従って、これ以上は「考える必要が無くなる」って事なんです(あくまで古典的な文脈ですが)。 逆に「2群が全く違う母集団からサンプリングされた、と断じる証拠が無い場合」に初めてt検定に持ち込む、って事になるんですよ。ここで「平均に差が出たら」(ある確率で)違う母集団からサンプリングされたのだろう、と言う結論に至りますし、そうじゃないのだったら「疑う根拠は無いよね」と言う結論になる。 今の流れで見れば分かりますが、元々等分散検定、ってのは「平均値の差の検定を行う前の"前検定"」の性質が強い、んです。ですから手順としては「等分散検定」→「平均の差の検定」なんです。 これは実際、フィッシャー流の検定では元々の「流れ」なんです。そして、「分散が違う場合に平均値の差の検定は必要なのか否か?」ってんで過去散々揉めた事があったんです。今は分散が違った場合の「平均の差の検定」ってのがポピュラーになっていますが(Welch の方法、と呼ばれるものです)、確かフィッシャー側の立場では「そんなの知る必要無いだろ」と言う意見だったと思います。 こんな感じでしょうかね?

ksu1678
質問者

お礼

大変詳しいご説明ありがとうございました。よく理解でしました。

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

2群の平均値の差の検定の事前検定として行う、ということに対して質問しているのでしょうね。 2群の平均値の差が大きいか小さいかなど全く関係がありません。付け加えていうと、平均値の差の検定の事前検定(分散の均一性の検定)は行う必要はありません(なぜなら、それ自体が検定の多重性の問題に引っかかるから)。 > ある郡の分散(標準偏差)が大きいのは元の観測値が大きいからで、それらを小さい郡と比較しても意味がない(検定をするまでもなく分散に差が出て当然)、ということにならないのでしょうか。 確率的に考えるわけですから、検定をするということは「もしかしたら偶然的に今回の結果が得られただけなのかもしれない」ということを考えているわけです。だから、たとえ得られている標本Aの分散と標本Bの分散が異なっていても、検定する必要はないということはないのです。 ただ、質問者さんの疑問も重要で、実質的に検定を行う必要のないケースについて、検定を行うのは良くないことですね(参考: http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/caution.html)。

ksu1678
質問者

お礼

ご回答ありがとうございました。大いに参考になりました。

関連するQ&A

専門家に質問してみよう