• ベストアンサー

差の検定

とある切削機械があり、ある条件下での切削部品が30個(A群)作製されたとします。っで、条件を変化させて新たに切削部品30個(B群)を作製したとします。 この部品A群とB群の寸法について、有意差の有無について、検定をしたいのですが、具体的にはどのような検定をすればよいのでしょうか? F検定?t検定? 今までは、A群、B群ともにそれぞれの個体の寸法が測れるので、なんとなく平均値で比較していただけなのですが、実際に検定という概念を使いたいのですが・・・。 すみませんが、よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • proto
  • ベストアンサー率47% (366/775)
回答No.2

>U × (1/Na+1/Nb)の 平方根のことなんでしょうか? >となると、Na=Nb=30なんで、U÷15ってことでしょうか? その通りです、かけ算の記号を省略して書きました。 >この意味がどうしてもはっきりわかりません。【Xa≠Xbとは言えない】と言っても【Xa=Xbと言える】とならないことは、知っているのですが、これは、つまりどういうことなんでしょうか?  >かいつまんで言うと、限りなく【Xa=Xb】 だけど、ほんのちょっとだけ、Xa≠Xbっていう可能性もある、ということなんでしょうか? 概ねそのような理解でいいと思います。 例えば、実際、A群とB群の平均値に差があったとします。 その平均の異なる母集団から標本を採って検定をするわけですが、標本数nが2とか3だった場合、自由度が低すぎるので、Xa≠Xbとは言えない場合がほとんどになります。 つまり標本数が少なければ、偶然差が出たと言いやすくなるのです。 このことはnが小さければ平均がばらつきやすいためにおこります。 統計では、ある量を測ったとき、真の値xに誤差σがついて、x+σが実際観測される値になると考えます。 もし誤差が無ければ、平均なんか取らなくても1個の部品を測ってしまえばいいことになりますよね。 平均を取る意味は、たくさんの平均を取ることで誤差が互いに打ち消し合って、結果平均値が真の値xに近づくだろうと信じるからなのです。 しかし標本数が少ないとこの誤差打ち消しの効果が少なく、偶然に平均値と真の値がかけ離れることも考えられます。 そのため、標本が少ないと対立仮説が棄却されにくくなるのです。 逆に言うとこのことは、標本数が多ければ、Xa=Xbだと思っていたものがXa≠Xbになることもあると言うことです。 例えばt分布の表を見てみると、 自由度10、α=0.01ではt<3.169ですね。 もし検定したいTの値が3.00だったとしたら、T=3.00<3.169よりXa≠Xbとは言えないと言うことになります。 でも、もっと標本を多く採ってきて自由度を120にしてみるとt<2.617で、T=3.00>2.617よりXa≠Xbと言える、という結果になります。 「なぁんだ、標本が少なかっただけでちゃんと有意差があったんだなぁ」ということです。 今回のご質問の検定でも、標本をそれぞれ30ずつ取ってきてXa≠Xbとは言えないという結果ですが、もし標本を300ずつとればXa≠Xbと言えるかもしれません。 ですから、"今回は"Xa≠Xbとは言えないよという風に考えて、あえてXa=Xbと断言はしないのです。 私は、人間を相手にした測定実験でよく検定をしていましたが、有意差が出なかったときでも、測定結果を見つつ「今はぎりぎり有意差出てないけど、nを増やせば有意差出そうだねぇ」というような話をしていました。 Xa≠Xbとは言えないという結果が出ながらも、本当はXa≠Xbだと信じてこのような話をしていたのですよ。

Life_is
質問者

補足

またまた早速ありがとうございます。非常にくわしく、かつ、わかりやすく説明してくださいまして、ありがとうございます。ただ読んでる途中まで理解してても、あれっ?って思えて、何度も読み返して、やっとこさ、うっすら理解できた程度です、すみません。 非常にお詳しい方のようですので、大変申し訳ないのですが、もう少しだけ質問したいことが出てくるかもしれないので、締め切りは少しおまちください。

その他の回答 (1)

  • proto
  • ベストアンサー率47% (366/775)
回答No.1

そのまま「平均値の差の検定」で検索したら参考になりそうなページが出てきましたよ。 http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html さて今回の場合、A群の平均値をXa,B群の平均値をXbとして、   Xa=Xb という仮説を立てて検定してみましょう。 検定する場合の考えは『平均値が等しければ、二群の平均の差を取れば0に近く成るはずだ』といった感じで行きます。 平均の他にも、それぞれの不偏分散をUa,Ub、それぞれの標本数をNa,Nbとしておきましょう。 今回は   Na=Nb=30 ですね。 また不偏分散を求めるときは、平均からの差の自乗の和を(標本数-1)で割ることに注意してくださいね。 さて、今回はt検定を使いたいので、A群とB群は両方正規分布に従い、母分散(真の分散)は等しいとしましょう。 もし母分散が等しくないかもと思ったら、等分散性の検定というのがあるので、分散が等しいかどうか検定してみてください。 母分散が等しく無ければt検定は使えません。その場合、Welch の方法による t 検定というのをやってみてください。 また分布が明らかに正規分布でない場合には、その分布に見合った検定をするか、または特別な分布を仮定しなくて済むノンパラメトリックな検定を試してください。 まぁ、とりあえずは気楽にt検定でやりましょう。 まずA群,B群をプールした(合わせた)分散をUとして計算します。   U = ((Na-1)Ua+(Nb-1)Ub)/(Na+Nb-2)    = (Ua+Ub)/2   (Na=Nbですからね) 次にUを用いて、統計量tを   T = |Xa-Xb|/√(U(1/Na+1/Nb)) で計算しましょう。 先ほども書いたように、平均が等しければXa-Xbは0に近いはずですから、このTも0に近い値になるはずですね。 さてこのようにして計算したTの値は自由度(Na+Nb-2)のt分布に従います。 ここで言う自由度とは、自由度が大きいほどt分布は正規分布に近づくし検定も正確になる、くらいに捉えておいてください。 一般的な価値観として、自由度は大きい方がいいです。 さてTの値が求まったので、t分布表を見て検定してみましょう。 http://aoki2.si.gunma-u.ac.jp/CGI-BIN/ttxp.html 表の縦の軸が自由度ν、横の軸が危険率αです。 αは検定結果を間違う率で、0.1だと10%くらいの確率で間違って、0.01だと1%の確率で間違うといった感じです。 普通は0.05を、シビアにやりたいなら0.01を使います。 今回、自由度(30+30-2)=58なので、表のν=40の段を見ましょうか。 ν=58の段があればいいのですが、無いのでしかたなく自由度を小さめに見積もります。 ちなみに対立仮説としてXa≠Xbを仮定するので両側検定です。 どちらかが大きいとかの検討がついていてXa>Xbみたいな対立仮説を立てるなら片側検定になります。 ν=40,α=0.05のときT<2.021、ですね。 これは、この条件でTの値は95%の確率で2.021より小さいと言うことです。 Tが2.021よりも大きければ、さてはXa=Xbじゃねぇな、と言うことでXa≠Xbと結論づけます。 Tが2.021よりも小さければ、Xa≠Xbとは言えないと言う結論に成ります。 α=0.01の場合は、ν=40,α=0.01の所を見て、T<2.704ですから。 この条件でTの値は99%の確率で2.704より小さいと言うことです。 後は先ほどと同様です。 これで、一応のところ検定は一通り出来るはずです。 統計の用語について知りたいとか、その他の場合にも検定したいとか思えば。 本1冊分くらいの内容になるので、専門の本を読みましょう。 不明な点がありましたら補足にでもどうぞ。

Life_is
質問者

お礼

さらに質問ですみません。仮に上記に私が記入した計算式が正しいと考えて、統計量tを計算したのですが、2.021よりも小さくなりました。 そこで、 「 Tが2.021よりも小さければ、Xa≠Xbとは言えないと言う結論に成ります。」 この意味がどうしてもはっきりわかりません。【Xa≠Xbとは言えない】と言っても【Xa=Xbと言える】とならないことは、知っているのですが、これは、つまりどういうことなんでしょうか?  かいつまんで言うと、限りなく【Xa=Xb】 だけど、ほんのちょっとだけ、Xa≠Xbっていう可能性もある、ということなんでしょうか? 本当にすみませんが、何卒、よろしくお願いします。

Life_is
質問者

補足

早速ありがとうございます。 いきなり質問ですが、以下の式の分母がわかりません。 T = |Xa-Xb|/√(U(1/Na+1/Nb)) 分散U = ((Na-1)Ua+(Nb-1)Ub)/(Na+Nb-2)は、計算できたのですが、このUの使い方がわかりません。ひょっとして、分母は、 U × (1/Na+1/Nb)の 平方根のことなんでしょうか? となると、Na=Nb=30なんで、U÷15ってことでしょうか?

関連するQ&A

  • 有意差検定

    個々の計測値のわかっているA群(83.3、78.5、94.7、・・・・・)と平均値、標準偏差のみわかっているB群(80.0±3.0)で、統計学的有意差を検定する方法はありますでしょうか。用語の使い方も不正確かもしれませんが、すみませんがよろしくお願い致します。

  • 2群間平均の差の検定 差が“ない”ことを示すには?

    2群間平均の差の検定 差が“ない”ことを示すには? お世話になってます。 2群の平均を比べて,両者の平均には差が“ない”という仮説を設定して検定したいと考えています。 通常の2群間の平均の差の検定は,両者の平均に差が“ある”ことを仮説として設定して, 帰無仮説に「2群の平均に有意な差がない」を設定し,対立仮説に「2群の平均に有意な差がある」を設定しています。 もし両者の平均には差が“ない”という仮説を検定したい場合には,単純にt検定を行って,棄却されなかった=「2群の平均に有意な差がない」という結論ではいけないと統計の授業で習った気がします。 その理由を説明できなくて申し訳ないですが・・・ そこで質問なのですが, 帰無仮説に「2群の平均に有意な差がある」を設定し,対立仮説に「2群の平均に有意な差がない」を設定してもよいのでしょうか? そして,「2群の平均に有意な差がある」という帰無仮説を検定するためにはどのような検定方法を用いればいいのでしょうか? お時間ございましたら,ご教示のほど宜しくお願い申しあげます。

  • 有意差検定の種類について

    群データA 49.21、標準偏差 2.10、分散 1.03 、n=10 群データB 58.37、標準偏差 4.49、分散 13.13、n=9 というデータがあります。 このデータ群を比べて、AとBに有意差があり異なるものなのか、 AとBに有意差がなく同じものなのかを調べたいのですが、どの有意差検定を行ったらよいかわかりません。 t検定を行おうと思ったのですが、その前提であるF検定に合格せず等分散でないと証明されてしまいました。 できればエクセルで計算できるように関数も表示していただけるとありがたいです。

  • カイ2乗検定

    ご存知の方がおられましたら教えてください。 以下のような2×3表でカイ2乗検定を行う際に、 単純にA群とB群の差の有無を検定するだけでなく、 どこに差があるか検定する方法はあるのでしょうか? (例:好きという回答は有意差があって、普通の回答には有意差はない)    好き 普通 嫌い A群  100  120 30 B群  80  140 10

  • t検定についての疑問

    2群の母平均に差があるかどうかを検定するためにt検定(独立した2群のt検定)を使います。 今、2群のそれぞれの平均、標準偏差、標本数は分かっています。(もちろん標本のです) A群とB群とします。例えばA群の平均は64だとします。B群の平均は58だとします。 t検定を行って有意差があるという結論を出したのですが、これは2群の母平均に差があるということは言えるのですが、「Aの方がBより母平均が大きい」と言っていいのでしょうか????? 「差がある」ことと、「どちらが大きいと言い切ること」は別問題でしょうか? もし別問題なら、Aの母平均>Bの母平均を言うためにはどうしたらいいでしょうか?

  • 統計学のF検定、T検定、有意差について

    統計学のF検定、T検定、有意差について教えてください。 ●F検定…分散の有意差を求める検定。有意差がない=等分散 ●T検定…等分散なデータ同士の有意差を求める検定 F検定を行う→等分散であればT検定を行える 【例】 データA、B、CについてF検定を行う。 データA、B間に有意差なし。その他の間には有意差あり。 よってデータA、Bは等分散。 データA、Bの平均値についてT検定を行える。 という認識で合っているでしょうか? ご回答よろしくお願いします。

  • 統計学 二つのグループの有意差検定?

    二つのグループのサンプルについて統計的な検定をしなければならないのですが、統計学が全く分からないもので、何検定を使ってどう検定したら良いのか分かりません。下記が検定をするデータで、「A群の方が値が大きく、ABの二群には有意な差がある」と結論付けたいのですが、やり方をご教授願えませんでしょうか?A、Bでサンプル数が異なっていてどういった検定を使うのが正解なのか全く分かりません。よろしくお願い致します。 A群 B群 3  2 4  1 2  1 3  2 3 3

  • 複数回の検定 統計

    多重検定・多重比較について教えて下さい。 例えば、A、B、C、Dの4群があるとします。 このとき、A群とD群およびB群とC群に関して平均値に有意差があるかどうかを検定したい場合、 t-検定を2回行う方法と1元配置の分散分析から多重比較を行う方法、どちらが適切なのでしょうか? また、A群とB群、B群とC群、C群とD群、D群とA群に関して平均値に有意差があるか検定したい場合、 t-検定を4回行う方法と、1元配置の分散分析から多重比較を行う方法、どちらが適切なのでしょうか?? 詳しい方、宜しくお願いします。

  • 3群の有意差検定について

    初めて質問致します。 統計学については素人ですので、的外れな質問でしたらすみません。 現在、A・B・Cの3群についてある値を算出し、その値によって3群が分類できるかどうかを検討しております。 A・B・Cはそれぞれ標本数が異なっており、対応はありません。 等分散性の検定→分散分析→多重比較という手順で以下のように行いました。 Levene検定(有意差なし)→一元配置分析(有意差あり)→Bonferroni検定 Levene検定(有意差あり)→kraskull- wallis検定(有意差あり)→Bonferroni検定 この検定方法(特にBonferroni検定の採用)は正しいのでしょうか。色々調べてみたのですが結論が出ないので質問させていただきました。 ご教授よろしくお願いします。

  • 統計(有意差の検定)について

    実験データの統計処理についての質問です。 A,B,C,Dという項目をそれぞれ3回ずつ測定し、以下のようなデータが得られました。 A (1)1.369 (2)1.58 (3)1.484 B (1)0.180 (2)0.169 (3)0.180 C (1)1.543 (2)1.648 (3)1.519 D (1)0.297 (2)0.300 (3)0.318 そこで、B/AとD/Cの2群について有意差があるのか検定したいと思っています。 しかし、このデータで、例えばB/Aに関して、 B(1)/A(1)、B(2)/A(2)、B(3)/A(3)のように(1)(2)(3)がそれぞれ対応しているわけではありません。 こういう場合、どのようにして有意差の検定をすればいいのでしょうか? 同じような質問を検索したのですが、見つからなかったため質問させていただきました。 よろしくお願いします。