• 締切済み

統計解析

統計解析に関する質問です。Fisherの直接確立計算法とKurskal-wallis検定について分かりやすく説明していただける方いらっしゃいますか?自分で調べてなんとなくはわかるのですが、統計用語が難しくていまいち理解に苦しんでおります。。

みんなの回答

  • solla
  • ベストアンサー率59% (45/76)
回答No.1

もしかして「数学」のカテゴリー間違いでしょうか? こういう質問の場合、質問者さんがどこらへんまで解っていてどこが解らないかを書いてもらえると、もう解っている部分は書かなくていいし、その理解を前提に解らない部分に的を絞って説明ができるので説明がしやすくなります。 ■ Fisherの直接確率 これは分割表の検定を行う際に用いる方法です。分割表の検定で最も一般的なのは(Pearson の)χ2 検定ですが、これはある程度以上の標本の大きさを前提に検定統計量がχ2 分布に近似することを利用しています。「ある程度以上」というのは明確に決められるわけではありませんが、経験的に各セルの期待度数が5以上という基準が一般に用いられます。 この条件が満たされない場合、χ2 検定で得られた有意確率は正しくない可能性があります。そこで考え方を変えて、周辺度数が実際のデータと同じになるように固定された条件の下で可能な表の場合の数 N を求め、そのうち実際にデータとして分析者の手元に得られている表と同じかそれより極端に偏った(正確には生起確率の小さな)表の場合の数 n がいくつあるかで、有意確率 P = n / N を求めるのがFisherの直接確率法です。検定統計量の(近似的)確率分布から有意確率を求めるのではなく場合の数から“直接”有意確率を求めるので、「直接確率」と呼ばれます。χ2 検定との対比で判るようにFisherの直接確率法はデータに対して特に前提を置くことなく適用できるメリットがありますが、表のサイズや標本数が大きくなると急激に計算量が膨大になるとか、データ数が極端に小さい場合は有意確率の不連続性の影響が無視できなくなるといったデメリットもあります。 ■ Kruskal-Wallis検定 一般的に多群の母平均の一様性の検定は分散分析が用いられますが、分散分析は測定値が各群の期待値の周りで正規分布(線形モデルの立場からは誤差項が正規分布に従う)し、しかも各群で分散は等しいという前提があり、いわゆるパラメトリックな分析方法です。この前提が満たされない場合は当然ですが適切な分析方法ではなくなります。これに対しKruskal-Wallis検定は特定の分布を仮定することなく多群の母平均の一様性を検定する、ノンパラメトリックな分析方法です。厳密にはKruskal-Wallis検定は「母平均の検定」というとちょっと違うのですが、意味的には同じと考えて差し支えないでしょう。特定の分布を仮定することなく適用できるので分散分析よりも自由度が高いといえますが、標本数が少ない場合には検定統計量の確率分布の漸近近似が成立しなくなるので適切ではなくなります。 2群の場合の分散分析が t 検定と同等であるのと同じく、2群の場合のKruskal-Wallis検定は Wilcoxon検定あるいは Mann-Whitney検定と呼ばれる t 検定のノンパラメトリック版と同等になります。

yukachance
質問者

お礼

sollaさん 早速詳しい回答有難うございました。とても参考になりました。確かにカテゴリーは数学の間違いですね。。これからはわからないところを明確にして質問するよう心がけるようにします。

関連するQ&A

  • 統計解析の方法について教えてください。

    統計解析の方法について教えてください。 2群で4項目(ノンパラのデータ)のものの出現頻度を出したいのですが、 この場合は、マンホイットニーでよいのでしょうか。 2群で2項目ではないので、フィッシャーの直接確率計算はやはり使えませんよね? どなたかご教授おねがいします。

  • 医学統計解析について

    初めまして、統計解析の手法で分からないところがあります。ある検査の値(仮にA)から、一定以上の値なら悪性、以下なら良性となる指標を求めたいです。この場合は、2x2クロス集計表でフィッシャーの直接確率計算法でAを1回ずつ指定して計算していくしかないのでしょうか。何か他にも良い方法がありそうな気がするのですが・・・。

  • 統計

    卒論のために、統計(検定?)を勉強しています。 データの数が多くなくて、2×2のχ二乗検定もしくはFisher解析をまず行いました。 その後、3群比較が必要になり、2×3の検定を行いたいのです。セルの期待度数が小さく、Fisher解析のほうがいいのかと思ったのですが、これは2×3はできないのでしょうか。 検討違いの質問内容でしたら、ご指摘下さい。 いろいろ本を見てみたのですが、 よくわからないのです、すいませんが よろしくお願い致します。

  • 統計解析について

    お世話になります。 最近、統計解析のソフトを使ってデータの解析をする事がある程度の初心者の質問です。 30人分の縄跳びを連続で跳んだ回数データがあります。挑戦した回数は10回です。このデータを統計的に解析したいのですが、既存のデータでは200回以上跳んだ場合200以上と記載されています。試しにソフトを使って検定を行うとそれなりの数値が計算されるのですが、この場合200回以上のデータをどう考慮されているのでしょうか?200回以上だと500や1000となると計算に影響すると思うのですが素人考えなのでしょうか?

  • 統計解析の検定について

    統計解析を独学で調べています。 ダイエット効果のあるサプリメント4種を以下のように摂取させたとします。 (サプリメントは一人1種とする) サプリAを100人 サプリBを80人 サプリCを50人 サプリDを20人 (計250人) それぞれに摂取してもらい、1カ月後、3カ月後と体重を測定して体重の変化量[kg]データを取ります。 1カ月後、3カ月後とそれぞれの時点で 「各サプリメントにダイエット効果(体重の減少量)の差はある」という説をKruskal-Wallis(クラスカル・ワリス、クラスカル・ウォーリス)法にて検定してもよいものでしょうか? この検定方法が不可な場合、各群の数が違っていても使用可な検定方法はありますでしょうか? 統計学ど素人で、ネットで得た知識だけで・・・ ご教授よろしくお願いします

  • 統計解析の方法を教えてください。

    品質管理に携わっているものですが、統計解析が良くわかりません。回りに聞く人もいません。 今、20ロットの液体の比重値の一覧があります。 20ロットの比重にばらつきがないことを確認したいがどのような統計解析をしたら良いのでしょうか。 1.決められた規格値の範囲に入っていることの確認→範囲内に入っている。 2.管理図の作成 ・エクセルの分析ツールで平均値(CL)、±3σを算出しCL±3σの範囲に入っている。 ここまでは確認しました。 次に20ロットの比重値にばらつきがあるのかどうかを確認したいのですが。 1.CL±3σの範囲に入っているので、する必要がない。→だったら良いのですが。 2.20ロットの比重値にばらつきが無いことを検定したほうがよい。→どのような検定・推定をしたら良いのでしょうか。 20ロットの比重値に例えば投与前後の対応があるわけでもないし、t検定(一対の標本による平均の検定)ではないですよね。どのような統計解析をすればよろしいのでしょうか。 ご教示お願いします。

  • 統計解析で何を用いればよいのか教えてください。

    メンタルヘルス教育で介入群(n=14)と非介入群(n=10)の前後の比較と、介入群(3群:n=7、8、9)に対する介入前後の比較の統計解析を行いたいのですが、何を用いればよいのか分からなくなってしまっています。サンプル数は10前後なのでノンパラメトリック検定となるのではないかと考えています。介入群と非介入群の比較については分散分析をすればと助言もいただいたのですが、ほとんど理解できていません。 抽象的な質問で分かりにくいかもしれませんが、助言を頂けるとありがたいです。

  • 統計学的解析を用いたおたまじゃくしの研究をしたいのですが・・・

    おたまじゃくしを題材に統計学的解析を用いる研究をしたいと思っています。T検定などを用いておたまじゃくしのなんらかの解析をしたいと思っているですが、テーマが思いつきません。簡単なテーマは無いでしょうか?加えておたまじゃくしのうまい捕獲の仕方を知っている方は教えていただきたいです。

  • ノンパラメトリックな分散分析(統計)

    ノンパラメトリック検定であるU-検定(Mann-Whitney検定)は等分散でないと行えないとの記述がありました。 そこで2標本が等分散であるかどうかを確認したいのですが、何が適しているでしょうか? 正規分布を示していないことは確認済みです。 当初、F-検定で分散を確認しようかと思っていたのですが、F-検定は正規分布が前提であるということで、利用できないと気付きました。 Kruskal-Wallisの順位検定法が良いかとも思ったのですが、手持ちの統計ソフトでは、3標本以上でないと計算してくれません。。。 中央値検定(Median検定)がF-検定のノンパラメトリック版なのでしょうか?? 詳しい方教えて下さい。

  • 統計と解析学の入門書

    生物学系(医学)の研究をしているものです。 実験データの統計処理にはもっぱら統計ソフトを使っていたので不便を感じなかったのですが、データの処理の仕方でいろいろと疑問なところが生じてきて、果たして自分の実験のデータをどう評価していいのか考えています。それで少し統計のことを勉強しようと思っています。 しかしながら私は理系出身であるにもかかわらず数学が大の苦手で、解析学が全くわからないのです。(高校の数学段階ででストップしています)統計学の入門書を読んでも微分積分だかがいっぱいでてきて理解できません。こんな私にも少しずつでもいいですから理解する助けになるような書物はないものでしょうか。 お恥ずかしい質問ですが、詳しい方、ご回答ください。よろしくお願いします。