パラメトリックなのかノンパラメトリックなのか

このQ&Aのポイント
  • Shapiro-WilkのW検定で棄却されてしまえば、それはもうノンパラメトリックなデータして扱うしかないのでしょうか。
  • 生化学のデータ(n=1200程度)はヒストグラムを描いたときその分布が左右対称でなく偏っており、Shapiro-WilkのW検定でも正規性が棄却されてしまいます(p<0.001)。
  • パラメトリックなデータとして扱うか、ノンパラメトリックなデータとして扱うかは、データの性質や他の研究者の採用方法による可能性があります。
回答を見る
  • ベストアンサー

パラメトリックなのかノンパラメトリックなのか

Shapiro-WilkのW検定で棄却されてしまえば、それはもうノンパラメトリックなデータして扱うしかないのでしょうか。それとも何か変数変換などしてパラメトリックなデータとしてみなすこともあるのでしょうか。 いま私は生化学のあるデータを扱っています。このデータ(n=1200程度です)はヒストグラムを描いたときその分布が左右対称でなく偏っており、Shapiro-WilkのW検定でも正規性が棄却されてしまいます(p<0.001)。そのためノンパラメトリックなデータとして扱っています。おそらく学校のテストのように 0~100 までの限定された領域にしか存在しない性質のデータのためかと思っています。しかし同様の分布をしていそうなデータを扱っている他の研究者のペーパーを見てみると中にはPaired t-testやStudent t-testを採択して論じているものがあります。これは単に間違いなのかどうか。 統計学の本を読み直しましたが、回答を見つけることはできませんでした。ご存知の方よろしくお願いします。

  • cossa
  • お礼率83% (88/105)

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 えとですね、正規分布は平均と分散、という2つのパラメータで完全に指定できる。でもね、パラメータで指定できる分布なんて、他に幾らでもありますし、それどころか自分で作ったっていいんです。  ともかく、ある確率密度関数φがパラメータ(a,b,c,...)を持っているとして、測定したデータがφ(a,b,c,...)に従う、と仮定する。そして、測定値からパラメータを推定したり、あるいは理論的にパラメータの値はコレに違いないと分かっているときに測定値がφ(a,b,c,...)に従っているかどうかを調べたりする。これが「パラメトリック」という意味です。 > 何か変数変換などして  よく使われる手抜きの方法は、学校のテストのように分布が歪んでいるとき、「学力は正規分布なんだけど、テストの点数という尺度が歪んでいるんだ」と解釈して、点数の累積頻度が正規分布の累積確率に合うように尺度の方を修正してしまう、というやりかたです。(こうやって計算したのがいわゆる「偏差値」。) でもこれって「正規分布ありき」であって、尺度を作るのに使ったデータを、その尺度で測って分析する訳ですから、ちょっとひどいですよね。  理論的に、たとえば「この測定方法は、正規分布する筈の変量の3乗の値を測っている」と分かっていれば、理論に従って変数の尺度を直すことによって正規分布に持って来るのは、何の問題もありません。

cossa
質問者

お礼

お礼が遅くなり申し訳ありませんでした。 私のデータが変換して正規分布にくるかどうか、そういった類のものなのかは定かではありませんが、「場合によってはそういうこと(正規分布に変化させる操作)をしても良い」ということを知ることができ、質問して良かったと思います。まだまだ勉強不足です。 ご回答ありがとうございました。

関連するQ&A

  • パラメトリック検定か、ノンパラメトリック検定か?

    サンプルが小さい場合、パラメトリックかノンパラメトリックかどちらを選択すべきなのでしょうか? 検定は、一標本t検定か、WILCOXONの符号付き順位和検定のどちらかなのですが、サンプルが正規分布するかどうかわかりません。こういう場合は、両方の検定を行い、いずれの場合も優位さがなければ、検定する2郡には優位差はないとしてよいのでしょうか?? 検定には全くの素人です。。 どなたか、ご教授ください。

  • パラメトリック検定か否かについて

    ある資格試験の事前予備短答問題で、 ”カイ2乗検定はパラメトリック検定である、○かXか?”、 という問題があり、答えはX、ノンパラメトリック検定である、ということでした。(聞き間違っていなかったらですが) パラメトリック、ノンパラメトリックは確率変数が従う確率分布を事前に決めるか決めないかで判断するので、カイ2乗分布を仮定するのだから〇(パラメトリック)じゃないのかなと思ったのですが。 ところで、このように検定の種類分けを覚える意味ってどういうことなのだろうと思います。それよりも、あるデータ群のある項目を検定する場合、どのような手法を選ぶのが妥当なのかを知ることじゃないかと思うのですが。そのとき、確率分布を決めておくか、決めないでおくべきか、を理由をつけて納得する方に意味があるんじゃないかと思うのですが。 ひとまず、カイ2乗検定はパラメトリック、ノンパラメトリックのどれになるでしょうか。

  • ノンパラメトリック検定とパラメトリック検定

    統計学初心者です。医療統計をはじめたばかりでどのような統計手法を使用すればいいかで迷っています。 以下のデータの平均の差の検定を行う場合には、ノンパラメトリック検定かパラメトリック検定のどちらを用いればいいのでしょうか?よろしくお願い致します。 A群のCTR 49.0% 41.5% 50.5% 64.0% 59.0% 64.0% 50.5% 46.0% 52.5% 51.5% 55.5% 52.5% 32.0% 52.0% 53.0% 59.3% 52.0% 52.3% B群のCTR 60.0% 46.0% 55.0% 56.0% 51.0% 50.0% 41.0% 51.0% 50.0% 48.0% 66.0% 48.0% 55.0% 48.0% 55.0% 54.0% 50.0% 51.0%

  • ノンパラ パラメトリックとは・・・

    現在、SPSS14.0Jを使用して統計解析を勉強しております。解析に当たってパラメトリック、ノンパラメトリック⇒対応ある・なしといった流れで解析を進めて行くのはわかるのですが、そもそもノンパラやパラメトリックは皆さんどう見分けているのでしょうか?尺度や等分散、正規分布など卓上の知恵ではなんとなくわかるのですか、実際のデータについて考えた際、よくわからない状態です。以上宜しくお願いいたします。

  • ノンパラメトリック検定の意味

    正規分布を仮定するパラメトリックな検定のt検定は、 標本からの平均、標準偏差から母集団に対して、母集団の平均に差があるかどうかを検定しますが、 ノンパラメトリック検定の場合はどうでしょうか? 例えば、対応のある2群を(前後の比較などで)ウイルコクスン符号付順位検定して、有意差がでたとします。 この場合も母集団に対して平均に差があるということなのでしょうか? それとも標本のみで平均に差があるかを言っているのでしょうか? (たぶん違うとは思うけど・・・) どうでしょうか? 教えてください。

  • 統計:正規分布と正規分布でない母集団を比較すると

    正規分布である母集団(n=30)と正規分布だない母集団(n=18)の差を比較するときはどうしたらよいのでしょか?パラメトリックとノンパラメトリックで正規分布の有無で検定方法が変わりますよね。この場合どうしたらよいのでしょうか?統計学あまり覚えてませんでして。

  • 統計_パラメトリック検定の仮定について

    パラメトリック検定をする上での仮定として、等分散・正規分布があります。 この等分散という点について質問させてください。 ある被験者集団の能力をある測度で測定し、全員分のデータでは正規分布でなかったとします。 ところが、当初の目的に沿って2群にわけたところ、各群でそれぞれ正規分布となりました。 この場合の比較について、パラメトリックな検定とノンパラではどちらが推奨されるでしょうか?

  • 統計学 正規分布と対数正規分布の比較方法

    統計学についての質問です。 比較使用としている群で、ひとつの群は正規分布( Shapiro-WilkのW検定、p<0.05)で、もう一つの群が対数正規分布(KolmogorovのD検定)となりました。この二群間にて数値の有意差を検定するときの検定方法は正規分布の二群間と同じようにt検定等といったパラメトリックな検定を用いて問題ないのでしょうか? また、正規分布と対数正規分布の二群を検定する検定方法はどのような方法が望ましいのでしょうか。 対数正規分布は標本数8検体で、正規分布のものは3検体~12検体となっています。

  • 確率分布の境界値とパーセント点

    正規分布やt分布で出てくる「パーセント点」と、検定で出てくる棄却域と採択域の「境界点(境界値)」ということばが同じ意味なのか、そうだとするとどんな使い分けをしたらいいか、よくわかりません。

  • 指数分布を持つ2群の検定

    指数分布に従うことが分かっている2群のサンプルの母集団の平均値が等しいかどうかを検定したいのですが、この場合ノンパラメトリックな手法しかないのでしょうか? もし指数分布に適用できるパラメトリックな検定をご存知でしたらご教示ください。 よろしくお願いいたします。