• ベストアンサー

どんな検定をすればいいか分かりません。

卒業論文で、鶏の精子数の増減を調べています。 一応データは揃ったのですがそれを分析する統計的処理が知識がないために出来ません。実験前後で精子数が有意に増えたかどうかを証明する検定はどのようなものでしょうか。また、おかしい数値を抜き出す棄却検定というのがあるそうですがそれはどのようにやるのですか。それらはエクセルでも出来るのでしょうか。教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 月齢の揃った健康な雄鶏群からランダムに選んだ雄鶏たち(対照群)に通常の餌を与え、残りの雄鶏たち(実験群)にはネット通販で買ったトリアグラを同じ餌に混ぜて1週間喰わせ続けておいた。 そして雄鶏の精子の数を調べたところ、対照群ではX[i] (i=1,2,…, N)、実験群ではY[i] (i=1,2,…, M)であった。 というような話でしょうか。  対照実験をしないと、精子数の変化がトリアグラのせいなのか、他の要因のせいなのか、分からなくなります。例えば同じ雄鶏群についてトリアグラを喰わせる前後での比較をやったりすると、その間に雄鶏が加齢したために精子数が変化するとか、気象条件の違い、ケージの場所が変わった、夜中に暴走族がうるさかった、多くの雄鶏がナイスバディの雌鶏のファンになっただとか、その他いろんな要因が影響する可能性がある。  さて、 「おかしい数値を除く」ということができるためには、「おかしくない数値は、ある具体的に分かっている分布に従う」と確かに言えることが必要です。つまり、予め(トリアグラなしで)沢山のデータを取って、分布を調べておく必要がある。そうでない限り、「出したい結論にとって都合の悪い数値を勝手に捨てるというイカサマだ」と批判されてもしょうがない。最近はイカサマ論文が社会問題にまでなっていますから、要注意です。  また近頃は(すなわち、FDAが認めて以来)、薬の効果の有無はデータが少なくて済むベイズ統計を使って(つまり、ある追加の仮定のもとで)検定することが多くなってますけれど、それは苦し紛れ用としてとっておいて、まずはフツーにF検定でやってみましょう。必要なのはF分布表だけです。(なお「xが自由度nのt分布に従うならば、 x^2は自由度(1,n)のF分布に従う」という関係があるので、大抵のt検定はF検定と同じようなものです。) Step 0. NやMが十分大きい場合には、はじめに H0: 「雄鶏の出す精子の数は正規分布に従う」 という仮定が棄却できちゃったりしないかどうかを検定してみるのが本筋でしょう。でもま、実際にはそこまでやることは多くないんで、データがごく少なければ「H0を仮定する」と天下りに宣言してしまう。沢山データがあるときもヒストグラムを描いて見せる程度でお茶を濁すのが大抵です。だからこれは飛ばして、H0が成り立つという仮定のもとで次に進みます。 Step 1. 母集団の分散に差がないかどうかを検定します。 Xの方の標本平均を bx, 標本の分散をsx^2, 標本による母分散の不偏推定量を ux^2 = (sx^2)N/(N-1) Yの方の標本平均を by, 標本の分散をsy^2, 標本による母分散の不偏推定量を uy^2 = (sx^2)M/(M-1) とする。それぞれの母分散をσx^2, σy^2 とし、帰無仮説を H1: 「σx^2 = σy^2」 とする。H1(とH0)の仮定のもとでは、 a = ux^2/uy^2 は自由度が(N-1, M-1)のF分布に従う。  もしaがF分布の(例えば)5%点以上であれば、H1は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて精子数のばらつきが有意に大きい」と言えますし、aがF分布の(例えば)95%点以下であれば、H1は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて精子数のばらつきが有意に小さい」と言えます。いずれにせよ、もし棄却できたら、「トリアグラを喰わせるかどうかで、精子数のばらつきが有意に違う」という結論になり、Step2以下は適用できません。  一方、H1が棄却できなかった場合には「ux^2とuy^2はH1が棄却できない程度に似ている」とだけ分かります。  なお、xが自由度(A,B)のF分布に従うとき、1/xは自由度(B,A)のF分布に従います。だから、自由度(A,B)のF分布の95%点 = 1/(自由度(B,A)のF分布の5%点) Step 2. 「ux^2とuy^2はH1が棄却できない程度に似ている」場合に、H1が成り立つ事を前提にして、母集団の平均に差がないかどうかを検定します。(以下、Step1でH1が棄却できなかった場合の話です。) Xの方の母平均を mx Yの方の母平均を my とするとき、(もしH0とH1が正しければ) c = (((bx-mx-by+my)^2) (N+M-2) / ((1/N+1/M)(N(sx^2)+M(sy^2))) は自由度(1, N+M-2)のF分布に従う。  そこで、 H2(v):「my - mx = v」 という帰無仮説を考えると、この仮説(とH0とH1)のもとでは c(v) = ((bx-by-v)^2) (N+M-2) / ((1/N+1/M)(N(sx^2)+M(sy^2))) が自由度(1, N+M-2)のF分布に従う。  もしc(0)がF分布の95%点以下であれば、H2(0)は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて平均が少ない」と言えます。また、c(0)がF分布の(例えば)5%点以上であれば、H2(0)は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて平均が多い」と言えます。 Step 3. H2(0)が棄却できてもできなくても、H2(v)が95%以上の確からしさで棄却されるぎりぎりのv、というものが計算できます。つまり、c(v)がF分布の5%点に一致するようなv(これをV1とする)、c(v)がF分布の95%点に一致するようなv(これをV2とする)の二つです。H2(V1)とH2(V2)はどちらも95%以上の確からしさで棄却される。すなわち、95%以上の確からしさで「トリアグラを喰わせた群は、対照群に比べて平均がV1以上大きかったり、(-V2)以上小さかったりはしない」というのが結論です。

tenjinsan
質問者

お礼

回答ありがとうございます。 返信が遅くなって申し訳ありません。 (ちょっと所用で海外に行っていました。田舎でインターネット環境が整ってないところでしたので・・。) 本当に詳細な回答で感謝感激です!! 実験内容はstomachmanさんがされている感じのものです。統計は本当に難しいです。一応、理系で基本的な統計の勉強をしたのですが全く・・。今回教えていただいた方法で分析させていただきます。また、問題が発生した時は、助言をよろしくお願いします。

その他の回答 (1)

  • ssmarugoo
  • ベストアンサー率47% (84/176)
回答No.1

用いた鶉のサンプルサイズ(標本数)はどれくらいでしょうか? これが、多いのなら正規分布をすると仮定することができます。 そして、実験前後に有意に増えたか?を知りたいのなら、t検定が妥当だと思います。 対応のある2群のt検定です。 これで、母集団の差があるかどうかをみることができます。 有意に増えたいう仮説なら、片側検定ですね。 エクセルではやれません。論文にエクセルを用いてはいけません。計算の桁数が15桁までしかできないし、式自体もまちがっていることがあるようですから。 おかしい数値?は、除外していいと思いますよ。

tenjinsan
質問者

お礼

回答ありがとうございます。 御礼が遅くなって申し訳ありません。 エクセルは使えないのですか。。それだと、どこからか計算式を引っ張り出してこなくてはいけないということですね。頑張って分析進めていきたいと思います。 ありがとうございました!!!

関連するQ&A

  • 医学論文の有意差検定について

    現在卒業論文を行っていて、データの計測は行ったのですが、肝心のデータ間の有意差検定で何を用いていいか分からず困っています。 行いたい検定は継時的に変化する数値の最大値及び最少値が有意水準5%で同一である事の証明です。 情報が少なすぎて恐縮なのですが、ご回答お願いします。

  • 独立性の検定: 残差分析に有意傾向って?

    統計初級者です。わからない点があります。どうかお助けください。 独立性の検定の後の残差分析で有意傾向ってありますか? t検定などで「p<.10」の場合に、「有意傾向」があったと報告している文献を見ます。 残差分析だと、絶対値1.96以上のときに5%水準で、有意に観測度数が期待度数を上回った(下回った)と聞きますが、 たとえば絶対値が1.8や1.7のときって「有意傾向がある」と論文で述べることは 妥当でしょうか?仮に妥当だとすると、その数値の下限ってありますか?(p<.10みたいに) ご存知の方いらっしゃったら教えてください。

  • 回帰曲線の有意性検定

    回帰直線の有意性検定がしたいので、いろいろ勉強していますが、教科書を探しても下記の答えが見当たらず悩んでいます。質問は二つあります。 1) 重回帰分析の場合、T検定とF検定の違いは、各パラメータの検定と、全体的な検定の違いだと理解したのですが、単回帰分析(y=ax+b)の場合、T検定とF検定は全く同じことをしていることになるのでしょうか? 2) 単回帰分析(y=ax+b)の有意性検定(F検定)を行った場合、aが0に近ければ近いほど、少しのバラつきで有意でなくなると思うのですが、その認識はあってるでしょうか? その場合、有意でないものを棄却すると、aが0に近いものが多く棄却される傾向になり困っています。 (多数あるデータのうち、棄却されるものに偏りがでてきてしまう。) これを解決する方法はあるのでしょうか?

  • スミルノフ-グラベス棄却検定、両側検定について

    現在必要にせまられ、 スミルノフーグラベスの棄却検定を勉強しています。 有意点tの求め方について、わからなくなりました。 調査していると 有意点tを求める際のt分布で 両側検定を採用しているものと、片側検定を採用しているものとが あるようです。両者で有意点がやや異なるのですが。。。 このような棄却検定で、両側検定を行う意味がよくわかりません。 たとえばn=5で、3、3、3、3、14というデータ群があった場合 14は、あきらかに平均値より高い値のはずです。 つまり、棄却検定を行う場合は 「上側確率」あるいは「下側確率」が対象であることがはっきりするはずで、両方を含めて検定する必要性が感じられないのです。 棄却検定に両側検定を適用する意味があるのでしょうか。 統計に明るくなく、素人くさい質問ですみません。 もしよろしければ、詳しい方、おしえていただけませんでしょうか。

  • 2つの回帰直前の傾きの差の検定について

    2つのグループにおいて、xとyはそれぞれ有意な相関があり、グループごとに回帰直線y=ax+bを求めました。この二つのグループでは、傾きaが異なっていて、傾きに統計的に有意な差があるのかを検定したいです。論文ではグループで傾きが異なっていることを統計的に示したいと考えています。 R又はエクセルで計算し、正式な論文データとしてまとめたいと考えています。ネットの記事を見ると、共分散分析というみたいですが、よく理解できていません。 1.この検定の方法は何というのものなのか、論文で記載するときに何の検定と書けば良いのかを教えてください。 2.この検定方法を理解したいので、詳しく載っている書籍やウェブページなど教えてください。 よろしくお願いします。

  • 有意差検定について

    大学で論文書いてるのですが、統計本見てもよくわからないところがあります。 “有意差検定と言ってもたくさんの検定法があるかと思います。何とか簡単にできないものでしょうか?” 内容は「スーパーサイズミー」ではないですが、食物摂取前後の体重変化といった感じでしょうか。どなたか教えて下さい宜しくお願い致します。

  • これはどういう意味ですか(泣)

    帰無仮説 2つの標本の平均値は等しい。 標本数1 6 平均値1 8.46 標準偏差1 4.002 標本数2 6 平均値2 21.82 標準偏差2 8.145 有意水準 0.05 検定方法 両側検定 F値 4.14217085610118 確率 0.0724572476022886 t値 3.60605002946898 確率 0.00479946268108932 自由度 10 結論 等分散の仮定は棄却されませんでした。 帰無仮説は有意水準 0.05 で棄却されました。 自由度 10 におけるPの値は 0.00479946268108932 です。 ある実験の前後の統計を出したいので、統計ソフトで計算した結果、よくわからない言葉が出てきてしまいました(泣) ちなみに標本数・平均値・標準偏差1が実験前で、標本数・平均値・標準偏差2が実験後の結果です。 5%有意差があるかないかを調べたいのですが・・この結論の日本語がよくわかりません。 どなたか詳しく説明していただけませんか。 バカですみません。

  • 片側検定?両側検定?

    行動学の実験をしておりまして、T検定の統計手法で悩んでいます。 ある動物にAを呈示したときに餌を与えるという学習を条件付けており、条件付けの成立としてAへの接近行動が呈示前後に有意に増えるかという条件の下で実験を行っています。呈示前後ではサンプルデータは12ずつです。 呈示前後のデータが有意に増加しているかどうかの確認をするときにt検定を用いようと考えているのですが、その際「片側検定」と「両側検定」のどちらを使えばいいのでしょうか? 増加するという仮説なので「片側検定」かと考えているのですが、条件付けが完成するまでの過程で減少してしまう時もあり「両側検定」のほうが適切なのかとも考えてしまいます。 わかりにくい点など補足いたしますので、御教示願います。

  • 統計検定について

    統計で有意差があるか検定しようと思っていますが、どの検定を使えばよいかわかりません。 例えば、塾に行っている群と塾に行っていない群で合格・不合格に有意な差があるか検定するにはどうすればよいのでしょうか。また、サンプル数はどのくらいあれば統計的に信頼性があると言えるのでしょうか。 統計処理初心者のためよくわかりません。よろしくお願いいたします。

  • ExcelでのF検定の結果について。

    卒論で実験結果の有意差を検討することになり、統計はまったく学習したことがなく、色々調べながら行っています。 以下の数値をExcelの分析ツールのF検定をして分散を調べたのですが、P(F<=f)の値にE-07がついてしまいます。これはどのように解釈したらよいのでしょうか。Webで調べてみましたが見つからなかったので、教えていただければ幸いです。よろしくお願いします。 A群;0.38, 1.15, 0.29, 4.17 B群;0.26, 0.30, 0.28, 0.27, 0.33