• ベストアンサー

平均値の差が大きい場合のF検定

F検定(等分散検定)は2群の平均値の差があまり大きくない場合に適用される方法なのでしょうか。それとも、2群の平均値が大きく異なる(例えば数倍の)場合でも何らかの基準化(補正)なしで適用可能なのでしょうか。ある郡の分散(標準偏差)が大きいのは元の観測値が大きいからで、それらを小さい郡と比較しても意味がない(検定をするまでもなく分散に差が出て当然)、ということにならないのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

う~~ん……どのレベルで答えればいいのか分からないんで……。 あくまで基礎的なレベルに絞って話をします。 基礎的なレベルでは「等分散検定」を行う前に「平均の差の検定」をかける事は「まずあり得ません」。従って、「2群の平均値の差が大きいだろうと小さいだろうと」適用出来るのが「等分散検定」なんです。 これは歴史的な成立背景を加味して考えると次のような事なんですよ。 一番知りたいのは「2群の平均値が同じか否か」ってのがずーっとあったんです。ところがこれを知る決定打が無かった。ここで登場したのが「ゴセットのt分布」だったんですね。ここでいわゆる「t検定」が初めて成立しました。 ここで命題を考えます。「2群の平均値が同じか否か」を考える場合、構造的には「2群が同じ正規分布を成す集団からサンプリングしたものであるのかどうか」って事ですよね。そうなるとサンプリングされた2群の「母集団」がどんなものなのか考察しないといけない、って事です。 さて、古典的な文脈で言うと、等分散検定をかけた時点で、「2群の分散が(ある確率で)等しくない」と分かったらどうなるでしょうか?これは単に、「それら2群は同じ正規分布に従う母集団からサンプリングされたものでは無い」と言う結論になりますね。従って、これ以上は「考える必要が無くなる」って事なんです(あくまで古典的な文脈ですが)。 逆に「2群が全く違う母集団からサンプリングされた、と断じる証拠が無い場合」に初めてt検定に持ち込む、って事になるんですよ。ここで「平均に差が出たら」(ある確率で)違う母集団からサンプリングされたのだろう、と言う結論に至りますし、そうじゃないのだったら「疑う根拠は無いよね」と言う結論になる。 今の流れで見れば分かりますが、元々等分散検定、ってのは「平均値の差の検定を行う前の"前検定"」の性質が強い、んです。ですから手順としては「等分散検定」→「平均の差の検定」なんです。 これは実際、フィッシャー流の検定では元々の「流れ」なんです。そして、「分散が違う場合に平均値の差の検定は必要なのか否か?」ってんで過去散々揉めた事があったんです。今は分散が違った場合の「平均の差の検定」ってのがポピュラーになっていますが(Welch の方法、と呼ばれるものです)、確かフィッシャー側の立場では「そんなの知る必要無いだろ」と言う意見だったと思います。 こんな感じでしょうかね?

ksu1678
質問者

お礼

大変詳しいご説明ありがとうございました。よく理解でしました。

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

2群の平均値の差の検定の事前検定として行う、ということに対して質問しているのでしょうね。 2群の平均値の差が大きいか小さいかなど全く関係がありません。付け加えていうと、平均値の差の検定の事前検定(分散の均一性の検定)は行う必要はありません(なぜなら、それ自体が検定の多重性の問題に引っかかるから)。 > ある郡の分散(標準偏差)が大きいのは元の観測値が大きいからで、それらを小さい郡と比較しても意味がない(検定をするまでもなく分散に差が出て当然)、ということにならないのでしょうか。 確率的に考えるわけですから、検定をするということは「もしかしたら偶然的に今回の結果が得られただけなのかもしれない」ということを考えているわけです。だから、たとえ得られている標本Aの分散と標本Bの分散が異なっていても、検定する必要はないということはないのです。 ただ、質問者さんの疑問も重要で、実質的に検定を行う必要のないケースについて、検定を行うのは良くないことですね(参考: http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/caution.html)。

ksu1678
質問者

お礼

ご回答ありがとうございました。大いに参考になりました。

関連するQ&A

  • 有意差検定の種類について

    群データA 49.21、標準偏差 2.10、分散 1.03 、n=10 群データB 58.37、標準偏差 4.49、分散 13.13、n=9 というデータがあります。 このデータ群を比べて、AとBに有意差があり異なるものなのか、 AとBに有意差がなく同じものなのかを調べたいのですが、どの有意差検定を行ったらよいかわかりません。 t検定を行おうと思ったのですが、その前提であるF検定に合格せず等分散でないと証明されてしまいました。 できればエクセルで計算できるように関数も表示していただけるとありがたいです。

  • 母平均の差の検定について

    母平均の差の検定についての質問です。 母分散未知:非等分散の場合 このとき等価自由度というものが出てくるのですが、これがどのように導出されたのか分かりません。具体的な証明を教えていただけると嬉しいです。 どうかよろしくお願いいたします。

  • 2群間平均の差の検定 差が“ない”ことを示すには?

    2群間平均の差の検定 差が“ない”ことを示すには? お世話になってます。 2群の平均を比べて,両者の平均には差が“ない”という仮説を設定して検定したいと考えています。 通常の2群間の平均の差の検定は,両者の平均に差が“ある”ことを仮説として設定して, 帰無仮説に「2群の平均に有意な差がない」を設定し,対立仮説に「2群の平均に有意な差がある」を設定しています。 もし両者の平均には差が“ない”という仮説を検定したい場合には,単純にt検定を行って,棄却されなかった=「2群の平均に有意な差がない」という結論ではいけないと統計の授業で習った気がします。 その理由を説明できなくて申し訳ないですが・・・ そこで質問なのですが, 帰無仮説に「2群の平均に有意な差がある」を設定し,対立仮説に「2群の平均に有意な差がない」を設定してもよいのでしょうか? そして,「2群の平均に有意な差がある」という帰無仮説を検定するためにはどのような検定方法を用いればいいのでしょうか? お時間ございましたら,ご教示のほど宜しくお願い申しあげます。

  • 統計学のF検定、T検定、有意差について

    統計学のF検定、T検定、有意差について教えてください。 ●F検定…分散の有意差を求める検定。有意差がない=等分散 ●T検定…等分散なデータ同士の有意差を求める検定 F検定を行う→等分散であればT検定を行える 【例】 データA、B、CについてF検定を行う。 データA、B間に有意差なし。その他の間には有意差あり。 よってデータA、Bは等分散。 データA、Bの平均値についてT検定を行える。 という認識で合っているでしょうか? ご回答よろしくお願いします。

  • 分散値だけの検定方法

    統計の初心者です。 2群もしくはそれ以上の群の比較についての質問です。 一般的に、比べたい物が正規分布に属していると仮定した時、平均値の差をT検定を使って、差があるかどうかを検討します。 では、その2つのグループの平均値ではなく、分散値に差があるかどうかを考える事は可能なのでしょうか? すでに正規分布としていると前の文章で仮定しているので、分散値に差があるかどうかを検討するのはおかしい事なのかもしれませんが… 分散値の等分散性を考える上で、F検定やShapiro-Wilk検定なる物があると聞いたのですが、これはそれぞれの群が等分散になっているかを検討する物だと思っています。 では、お互いの分散値が同じなのか違う物なのかを検討するのは無理なのでしょうか? 例えば、2つの定規を作る機械があるとします。 1つの機械で30cm定規を作った時の、それを1つ1つきちんと計測できる測定器で計測すると、出来上がった定規にプラスマイナスで誤差が出てくると思います。 次にそのもう1つの機械で30cmの定規を作ったとします。 同じように計測すると、出来上がった定規にも誤差が出ると思います。 では、この機械は同じ性能を発揮しているのかどうかを検討する時、平均値には差が出てこないと思います。 しかし、これだとこの機械は精度的に大丈夫かどうかを考える時に、誤差つまり分散値のばらつきが同じかどうかを検討する必要があると思います。 こんな時はどうしたらよいのでしょうか? またもう1つ機械が増えて、3つの場合はどうなるのでしょうか? 作った個数が多いと、T検定をした時、ボンフェローニー補正をかけると思いますが、分散値の検定にもボンフェローニー補正をかけるのでしょうか? 長文でわかりにくい所があるかも知れませんが、統計の本やインターネットを検索していくとわからない事だらけで… 教えて下さい。よろしくお願いいたします。

  • 有意差検定

    個々の計測値のわかっているA群(83.3、78.5、94.7、・・・・・)と平均値、標準偏差のみわかっているB群(80.0±3.0)で、統計学的有意差を検定する方法はありますでしょうか。用語の使い方も不正確かもしれませんが、すみませんがよろしくお願い致します。

  • t検定の記述の仕方を教えてください。

    例えば、対応のあるt検定の結果 差の平均 -0.242424 差の分散 0.439394 t値 2.1009 t検定の際の自由度 32 危険率 4.36E-02 検定結果: * 0.01 < P < 0.05 と出てきました。 論文では、どのように書けばいいでしょうか? 教えてください。 また、対応のないt検定     サンプル 平均値  標準誤差  標準偏差 第一群 33 0.909091 5.08E-02   0.28748 第二群 45 1 0   0 危険率= 0.395991E-01 結果: * 0.01 < P < 0.05 とでました。 その場合の表記方法も教えてください

  • t検定にしか出来ないこと

    t検定と分散分析についてお聞きしたいことがございます。 t検定は2群の平均値の差の平均の時に用いますが、 分散分析でも2群の平均値の差を出すことが出来ます。 これではt検定を用いる意味が無くなってしまうと思いますが、 t検定にしか出来ないことと言うのは何かございますか? よろしくお願いします。

  • t検定とノンパラメトリック どっちが正しい?

    データが出たのですが差が有ると言っていいのかどうかがわかりません。/(。-。-。)\ マウス二群(A群n=20とB郡n=20)の生存期間を比較したいのですが差が小さい(差=7.8)ことも有って 対応の無いt検定ではp<0.05なのですがMann-WhitneyのU検定ではP>0.05です A群 平均126.1 標準偏差9.2 B群   133.9     11.6 F検定ではF値=0.621 P値=0.308 でありこれはt検定を使って良いとも解釈できますが ノンパラメトリックの方が正確であるとも聞きます この二群に統計的に有意な差はあるといえるのでしょうか? 御教授よろしくお願いいたしますm(_ _)m

  • 何故、分散分析と適合度は常に片側検定なのか?

    何故、分散分析と適合度は常に片側検定なのか? 教えて下さい、学生時代は何の疑問もなく検定してました…orz 以下、思いつく理屈です。 分散分析 平均値の差が大きく分散に影響するので、各要因間の平均値が仮に等しいとすれば、各要因間は等分散である。つまり、F検定を用いる事が出来る。 F=群間の分散/群内の分散 各郡間で異なるが、各郡内において同一である値を加算した場合、各郡内の平均値が変化する。しかし、各郡内の分散は各値と平均値が共に一定量増加するため、変化しない。変化するのは各群間の分散であり、各群間に加算した値の差異による増加しかしない。 ∴本質的に両側検定であるが、右側しか意味はないので片側検定のみ行う。 適合性分析 χ^2=Σ(実測値-理論値)^2/理論値において実測値=理論値(完全適合)の場合、χ^2=0で帰無仮説(適合性がある)は受容されるが、仮に両側検定であるなら棄却域に入る矛盾のため、右側検定のみ行う。 という認識は如何でしょうか?ご指導願います。