• ベストアンサー

エクセルのF検定

エクセルでF検定をすると,検定結果が表として出ます。その中で,上から平均,分散,観測数,自由度とあり,その下に観測された分散比,P(F<=f)両側,F境界値両側が表示されます。下3段の「答えを出した式」と「意味」を簡単に教えて下さい。

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.1

こんにちは.「分析ツール」を使って「F検定」をした場合の結果の解釈法ですね. F検定とは,二つの変数の分散がどの程度異なっているかを統計的に調べる方法です. 二つの変数を仮に変数Aと変数Bとします. 変数A:変数Aの分散を「分散A」,変数Aの個数を「個数A」 変数B:分散B,個数B(※上と同様) <観測された分散比> いわゆるF値のことです. このF値とは [個数A×分散A×(個数B-1)]/[個数B×分散B×(個数A-1)] という計算式から産出されます.上の式がごちゃごちゃしてよくわからない場合は,変数AとBの個数が同じ,すなわち「個数A=個数B」である場合を考えてみると,すっきりするでしょう.つまり…… 分散A/分散B となるわけです.まさに「(観測された)分散比」,分散の比なわけです. <P(F<=f) 両側> 上記で産出されたF値が(F=1,「すなわち二つの変数は同じ」を基準にした場合と比べて)どの程度珍しい現象なのかを,F分布を使って確率を計算したものです. この確率の計算式は……統計学の専門書を見てもらわないことにはどうにもなりません.ただし単純に数値を算出するのであれば,Excelの関数「fdist」を使えば産出できます(ただしfdistは,二つの分散のうち大きな数値の方を自動的に分母として確率計算をします). <F 境界値 両側> 分析ツールで入力するときに,「α(有意水準)」を設定する欄に「0.05」がデフォルトになっていたと思います.これは「統計的に有意水準(あるいは危険率)が5%である場合の」有意に,個数Aと個数Bにおけるこのデータにて二変数の分散が有意に異なるというためのぎりぎりのF値,という意味です.F値がこれ以上であれば,統計的に分散は異なる,という判断をすることができます.ただし確率が直接算出されているので,この情報はあまり意味はないですが ……(ただし,分散Aが分散Bに比べて小さい場合は,このF値は逆の解釈をしなければならないのかな? とにかく確率を直接参照する方がよいです) さて,以上のことを踏まえて,結局F検定は何を調べるかというと,変数AとBの分散である分散Aと分散Bが統計的に異なっているかどうかを判断するための検定です. もし分散Aと分散Bが同じ値であるならばF値は「1」になる,少なくともそれに近い値になるはずです.だけど,F値が2とか1.4とかである場合,両者の分散は同じであると判断して良いのかどうか,なかなか悩むところです.そこで統計学の力を使って判断をしようというわけです. 一般に確率が小さければ,αの数値(たいていはα=0.05)よりも小さければ,その分散比は「同じとは言えない→異なる」と判断をするようになっています. 詳細は,統計学の教科書の「F検定」を参照してください.

taketakechan
質問者

お礼

たいへん勉強になりました。お忙しいところ誠に有難うございました。詳しくて素人にも理解しやすい説明で学力が上がったような錯覚を覚えます・・・ また、よろしくお願いいたします。

関連するQ&A

  • ●excelのt検定の結果確認方法

    レベルの低い質問ですが、宜しくお願いします。あるサンプルを5回測定したデータの平均値と1回測定のデータで差があるかないかを調べるために、excelの分析ツールよりt検定を行いました。が、t検定自体いまいちよく解かっていません。有意水準を5%とし両側検定で考えます。t 境界値 両側(2.045229611)>t(0.296893746)であれば、「差がない」といえると思いますが、その差がないと言える確率は下記表のどこでわかる(もしくはどう計算をすれば、確率を出せる)のでしょうか? すみませんが宜しくお願いいたします。 t-検定 : 一対の標本による平均の検定 変数 1      変数 2 平均 0.358166667 0.358133333 分散 1.24713E-06 9.47126E-07 観測数 30 30 ピアソン相関 0.83550416 仮説平均との差異 0 自由度 29 t 0.296893746 P(T<=t) 片側 0.384331892 t 境界値 片側 1.699126996 P(T<=t) 両側 0.768663784 t 境界値 両側 2.045229611

  • 対応のあるt検定の結果の見方

    下記のような結果が出ました。 ・統計的に有意かどうかを見るには、どこを見ればいいんですか? ・それ以外の項目はどのように見たらいいんですか? ・論文には、どのように書くんでしょうか? 教えてください。 t-検定 : 一対の標本による平均の検定ツール 変数 1    変数 2 平均 0.961538462 0.935897436 分散 0.037462537 0.060772561 観測数 78      78 ピアソン相関      0.219838047 仮説平均との差異 0 自由度 77 t 0.81473499 P(T<=t) 片側 0.208868395 t 境界値 片側 1.664884621 P(T<=t) 両側 0.41773679 t 境界値 両側 1.991256795

  • どちらの値が通常使われるp値でしょうか?

    2つの生物群のある組織の大きさに差がある、ということを示したいので、まずF検定を行ったところ、データにばらつきがあり、分散は等しくありませんでした。 そこでt検定(Welch)を行ったところ下記のようなデータが出ました。 ---------------------- t-検定 : 分散が等しくないと仮定した2標本による検定 変数 1 変数 2 平均 0.522463874 0.46886014 分散 0.015053277 0.01384845 観測数 30 30 仮説平均との差異 0 自由度 58 t 1.727005691 P(T<=t) 片側 0.044744667 t 境界値 片側 1.671553491 P(T<=t) 両側 0.089489334 t 境界値 両側 2.001715984 ----------------- この場合、P値はP(T<=t) 両側を見るのか、それともP(T<=t) 片側なのかよくわかりません。どのように判断するのでしょう?通常の論文ではどちらを用いているのでしょうか?

  • 統計学 プログラムの処理計測データのt検定

    t検定、平均の検定についてです プログラムの処理計測のデータ100個取りました。 同じ計測プログラムでデータを取ったので 対応があるt検定とみて、 取ったデータをエクセルで一対の標本による平均の検定 を行なったところ、一番下のようになりました 質問は(1)、P(T<=t) 両側の値が0に近い値となっているのですが この場合 帰無仮説(H0):「2群間に差がない」と仮定する。 対立仮説(H1):「2群間に差がある」と仮定する として、P(T<=t) 両側 1.8672E-171 ---------(1)<0.05 より2つの母集合の平均値に有意差があると判断できる と考えてよいのでしょうか? t-検定 : 一対の標本による平均の検定 有意水準α=0.05 変数 1 変数 2 平均 1321.87973 293.041754 分散 42.3286546 368.4568926 観測数 100 100 ピアソン相関 0.04224447 仮説平均との差異 0 自由度 99 t 514.2684974 P(T<=t) 片側 9.3362E-172 t 境界値 片側 1.660391157 P(T<=t) 両側 1.8672E-171 ---------(1) t 境界値 両側 1.9842169

  • 統計解析 相場分析 T-検定 エクセル SPSS

    2つの母集団の平均差に有意差があるかを調べるためエクセルでT検定をしましたところ、ある異変に気づきました。 メニューの「ツール>分析ツール」で等分散を仮定した2標本による検定を選ぶと、"配列1"と"配列2"に各々の集団を入れることになります。ところが、それぞれの欄に入れる集団の順番を入れ替えると両側有意確率が.05以下だったものが、.05以上になってしまい、有意差の有無の結果が間逆になってしまいます。 分析の概要は以下のとおりです。 (F検定で等分散は確認済み) 標本1: 火曜日を除外した某先物の寄値-引値の価格差(デイトレードの成績) サンプル数→489個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:647 標本2: 火曜日だけのデイトレ成績 サンプル数→88個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:3215 2つの集団の平均差:2568 ****************************** 分析結果にみられる矛盾 >>>>>>>[標本1]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう以外 かよう 平均 646.8844483 3214.899617 分散 201365586.2 157505681.3 観測数 489 88 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t -3.178472095 P(T<=t) 片側 0.000780042 t 境界値 片側 1.647508725 P(T<=t) 両側 0.001560084 t 境界値 両側 1.964099283 >>>>>>>>[標本2]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう かよう以外 平均 3214.899617 646.8844483 分散 157505681.3 201365586.2 観測数 88 489 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t 9.38710200484845E-06(質問者が換算→0.00094%) P(T<=t) 片側 0.499996257 t 境界値 片側 1.647508725 P(T<=t) 両側 0.999992514 t 境界値 両側 1.964099283 ************************  以上のようにT値のあたい自体もかわってしまうのです。本で計算式を調べても違いは出ないはずなのに(統計初心者です。まちがってたらゴメンナサイ)どうしてでしょうか。サンプル数もしくは平均値の大きさによって、配列1,2に入れる順番を変えるべきなんでしょうか。おそらく右側検定とか、左側検定とかの概念と関係しているのかもしれませんが、本やネットで調べても判然としません。  ちなみに月、火、水、木、金と曜日別に成績をわけ、SPSSで一元配置の分散分析(ANOVA)、Welch検定, Brown-Forsythe検定, ボンフェローニの多重比較表でも確認したところ、曜日間に有意差はみられませんでした。  どうしてエクセルでは、配列の順番により結果が変化するのか、どなたさまかぜひ教えてください。統計初学者なので、珍妙なことを申し上げてるかもしれませんが寛大なご教示のほどよろしくお願いいたします。

  • エクセルの分析結果について

    心理学の実験でSPSSが使えなかったのでExcelの分析ツールで分散分析を行ったのですが、結果をどのように書けばいいのかわかりません。 「F(□,□) =□ p有意かどうか」を書きたいのですが、□になにを当てはめればいいかわかりません・・・。どなたか分かる方がいたら教えて頂けないでしょうか・・・? また、標本、列は要因A、Bという解釈でいいのでしょうか? 【標本】変動11.07692308 自由度1 分散11.07692308 分散比0.287377349 P-値0.59438179 F境界値4.042651985 【列】変動9.307692308 自由度1 分散9.307692308 分散比0.2414768 P-値0.625381088 F境界値4.042651985 【交互作用】変動99.69230769 自由度1 分散99.69230769 分散比2.586396142 P-値0.114343936 F境界値4.042651985 【繰り返し誤差】変動1850.153846 自由度48 分散38.54487179 【合計】 変動1970.230769 自由度51

  • 平均値の差が大きい場合のF検定

    F検定(等分散検定)は2群の平均値の差があまり大きくない場合に適用される方法なのでしょうか。それとも、2群の平均値が大きく異なる(例えば数倍の)場合でも何らかの基準化(補正)なしで適用可能なのでしょうか。ある郡の分散(標準偏差)が大きいのは元の観測値が大きいからで、それらを小さい郡と比較しても意味がない(検定をするまでもなく分散に差が出て当然)、ということにならないのでしょうか。

  • エクセル2003でのF検定時のP値

    こんにちは。 「エクセル2002でF検定を行った際、P値が両側と書いてあるにもかかわらず、実際は片側の数値である」というバグがあると聞きました。 いま、自分が使っているのはエクセル2003でありますが、これでF検定を行い、両側のP値を求める場合は数値を2倍しなければいけないのでしょうか。 よろしくお願いします。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • T検定とF検定

     T検定とは平均値間の差の検定であり、F検定とは分散が等しいかどうかの検定と理解しています。  そこで重回帰分析を行い、回帰係数の検定を行う際に二つの検定を行う必要があるそうなのですが、両検定の最終的な目的とは何なのでしょうか?本には互いに回帰の有意性の検定という内容が書いてあるため、明確な違いをご質問させてください。

専門家に質問してみよう