統計:等分散でないデータのデータ変換

このQ&Aのポイント
  • 等分散性が仮定できないグループ間の比較をノンパラメトリックな方法で検定をした結果、査読者から「なぜデータ変換をしてパラメトリックな方法で行なわないのか?」というコメントを受けました。
  • データ変換とは、非正規分布や等分散性の仮定が成り立たないデータに対して、正規分布や等分散性の仮定が成り立つように変換することです。
  • 例えば、動物の行動回数のデータが一方の群で0が多い場合でも、データ変換を行えばパラメトリックな検定が可能になります。
回答を見る
  • ベストアンサー

統計:等分散でないデータのデータ変換

教えてください。 等分散性が仮定できないグループ間の比較をノンパラメトリックな方法で検定をして論文を投稿したところ、査読者から、「なぜデータ変換をしてパラメトリックな方法で行なわないのか?」というコメントをいただきました。この場合のデータ変換とはどのようなものでしょうか? また、私のデータは、動物が示したある行動の回数なので、例えば、A群(8匹)のデータは、0, 0, 0, 0, 0, 0, 0, 0 で、B群(7匹)のデータは、0, 0, 3, 4, 4, 6, 7 という具合に、一方の群にやたらに0が多い2群間の比較です(観察時間内に動物がその行動を示さなければ0とし、実際にこの例のようにひとつの群の全てのデータが0になってしまうことがある)。このような2群間の比較でも「データ変換」をすればパラメトリックな検定が可能なのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • usokoku
  • ベストアンサー率29% (744/2561)
回答No.2

こういうのは、数学を教えている教授に聞くのが手っ取り早いのですが、 学閥などの問題で学校内で処理できない場合として 群馬大学の青木さんのところ http://aoki2.si.gunma-u.ac.jp/ 査読者が林さんの数量化のことを示しているのか、 林、数量化の理論とデータ処理、1982、朝倉 1990年頃に絶版になった、東大出版の本の内容(0を切り捨てて正規分布のような状態になるように横軸の幅を変更して統計処理と記憶していますが、立ち読みした直後に絶版になってしまい入手不能)をさしているのか ちょっと見当がつきません。

goonewt
質問者

お礼

usokokuさん、貴重な情報ありがとうございます。 それにしても0ばかりのデータを正規分布のようにする方法なんてあるのかどうか…

その他の回答 (2)

  • usokoku
  • ベストアンサー率29% (744/2561)
回答No.3

>0ばかりのデータを正規分布のようにする方法なんて nが有限の場合には、たとえば、nが10個、3σ以上離れる確率は1/1000くらいだから、3σ以上の位置は0と近似できる(例、管理図では3σ以上離れた点は異常値とする)でしょう。 危険率が5%ですと、95%の範囲で一致すれば良いから、1.65σ以降(かな、この数値の選定が間違っている場合があり)を0と近似して、、、、という一連の近似作業を行います。 ただ、私がこの珪酸をすると、必ず計算間違いをするので、誰かに検算してもらう必要が出てくるのです。

goonewt
質問者

お礼

usokokuさんありがとうございます。出張していてお返事遅れました。 しかし、難しくて生物学の私にはちょっと… 査読者にはノンパラメトリックで解析することを主張したいと思います。

  • tabi2007
  • ベストアンサー率10% (80/740)
回答No.1

共同執筆者や指導教官は何と言っていますか?

goonewt
質問者

補足

私自身がこの論文を投稿した学生の共同執筆者であり、指導教官です。 私は、例えばA群の例のように全てが同じデータで分散がない場合でも、何らかのデータ変換すればパラメトリック検定ができるのかどうか疑問です。そこで、A群、B群の比較にマンホイットニーのU検定を使ったのですが…

関連するQ&A

  • 統計_パラメトリック検定の仮定について

    パラメトリック検定をする上での仮定として、等分散・正規分布があります。 この等分散という点について質問させてください。 ある被験者集団の能力をある測度で測定し、全員分のデータでは正規分布でなかったとします。 ところが、当初の目的に沿って2群にわけたところ、各群でそれぞれ正規分布となりました。 この場合の比較について、パラメトリックな検定とノンパラではどちらが推奨されるでしょうか?

  • 統計学についてお願いします。

    統計について素人です。 A群(n=30)とB群(n=40)を比較して有意差があるか調べたいと思います。 検定の順序としては、A群とB群は対応のあるデータではないです。 その為、まずは正規性の検定を行うことになるのでしょうか。 次に正規性があれば、F検定で等分散か確認し、等分散であればステューデントのt検定、等分散でなければウェルチのt検定ということになるのでしょうか。 そして正規性が無ければノンパラメトリック検定となるのでしょうか。 ここまでは合ってますか? それでここからが本題なのですが、私はSPSSやエクセル統計などの統計ソフトを持っていません。 普通のエクセルのみで、このA群とB群を比較して有意差があるか調べる方法を教えていただけませんでしょうか? 手順等できるだけ詳しく教えていただけますと幸いです。 よろしくお願いいたします。 (最悪、エクセル統計であれば購入できそうですが…)

  • パラメトリック検定か否かについて

    ある資格試験の事前予備短答問題で、 ”カイ2乗検定はパラメトリック検定である、○かXか?”、 という問題があり、答えはX、ノンパラメトリック検定である、ということでした。(聞き間違っていなかったらですが) パラメトリック、ノンパラメトリックは確率変数が従う確率分布を事前に決めるか決めないかで判断するので、カイ2乗分布を仮定するのだから〇(パラメトリック)じゃないのかなと思ったのですが。 ところで、このように検定の種類分けを覚える意味ってどういうことなのだろうと思います。それよりも、あるデータ群のある項目を検定する場合、どのような手法を選ぶのが妥当なのかを知ることじゃないかと思うのですが。そのとき、確率分布を決めておくか、決めないでおくべきか、を理由をつけて納得する方に意味があるんじゃないかと思うのですが。 ひとまず、カイ2乗検定はパラメトリック、ノンパラメトリックのどれになるでしょうか。

  • SPSSでの3群間の多重比較について

    統計学初心者です。 SPSSを用いて統計をやっています。 3群間のデータ比較を行っていますが、下記の方法で正しいのでしょうか? まず3群のデータはそれぞれ正規分布していません。 なので、クラスカル・ワーリス検定を用いて検定をした結果、『有意差あり』となりました。 ここから、どの群間に有意差があるのかを調べたいのですが、SPSSではノンパラメトリック版の多重比較はできないのでしょうか? できない場合、それぞれの群間をマンホイットニー検定で比較することは正しいのでしょうか? 統計初心者で的外れなことを言っているかもしれませんが、よろしくご教授いただけたらを思います。 よろしくお願いします。

  • 統計手法について

    3段階あります 1.対応しない2群の標準偏差、サンプル数、平均点しか分かっていません。その2群間の平均点の有意差検定にはstudent-tもしくは、1変量のt検定 どちらが適切なのでしょうか? 2.その1群の中の分析で、ある因子の有無別に平均点の有意差を検定するには対応がありませんよね。その因子の有無別の等分散が肯定された場合はt検定、等分散が否定された場合はt-welch検定で良いのでしょうか? 3その1群の中で、治療前、治療後で比較するには、対応のあるt検定で良いのでしょうか? そして、これは全て正規分布を仮定しているものですよね?、もし、正規分布の検定で否定されたら、この3つの検定を同時に行うことは出来ないのですか?

  • 統計学 正規分布と対数正規分布の比較方法

    統計学についての質問です。 比較使用としている群で、ひとつの群は正規分布( Shapiro-WilkのW検定、p<0.05)で、もう一つの群が対数正規分布(KolmogorovのD検定)となりました。この二群間にて数値の有意差を検定するときの検定方法は正規分布の二群間と同じようにt検定等といったパラメトリックな検定を用いて問題ないのでしょうか? また、正規分布と対数正規分布の二群を検定する検定方法はどのような方法が望ましいのでしょうか。 対数正規分布は標本数8検体で、正規分布のものは3検体~12検体となっています。

  • 統計(検定方法)について

    お世話になります。 血液性状が正常な群(n=10)と、対象群1→治療開始時(n=11)、 対象群2→治療開始から1ヶ月の有意差を検定するため、(治療を始めて1ヶ月経っていない対象者もいるため、n=7) ノンパラメトリックの分散分析であるKruskal- Wallisの検定を行い、その後Bonferroniで群間の組み合わせについて有意差の検定をおこないました。 この検定方法で問題はないでしょうか。 よろしくお願いいたします。

  • 統計:正規分布を仮定するかどうか(検定手法)

    母平均に関して差があるかどうかを検定したいです。 サンプルに関してA群とB群があります。 t検定を行いたいのですが、この場合、A群・B群ともに正規分布を仮定できる分布でなくてはならないものだと思います。 しかし、A群・B群に関して比較する項目が5種類ありそのうち3種類は正規分布を仮定でき、あとの2種類は正規性を期待できません。 この場合、統一してノンパラメトリック検定を行うべきですか? それともt検定とノンパラ(マンホイットニーU)検定の両方を使うべきですか? あと、A群だけ正規分布を期待できてB群は正規分布を期待できない場合は?・・・やはりノンパラメトリック検定ですか? 両群とも正規分布を期待できてはじめてt検定ができるのでしょうか?

  • 統計手法の選び方

    実験のデータ分析で用いる検定の手法がよく分からず,質問をさせていただきました. 統計解析についての知識に乏しく,ご指導いただければ幸いです. 人間のある関節角度の,角度変化率を時系列で見たデータを扱っています. なお,動作の開始時を0%,終了時を100%として,動作を等しい20区間に分割し,標準時間の5%ずつ,角度変化率を算出するという方法をとっています.(グラフは,横軸に標準時間をとり,縦軸に角度の変化率をとるというものになります) 被験者をA群とB群の2群に分けており,A群とB群の間で角度変化率に差がないかを検定しようとしています.(例えば,標準時間15%と20%の時点で群間に差がある,といった具合です) 2群間での比較ですので,“独立したサンプルのt検定”を用いて,それぞれの区間で一回ずつ(計20回)検定するという方法かな,と思ったのですが,確証も持てません…. 適切な検定方法がありましたら,どなたか教えていただけますでしょうか. 説明が分かりにくいようでしたら,なんなりとお申し付けください. よろしくお願いいたします.

  • 統計:正規分布と正規分布でない母集団を比較すると

    正規分布である母集団(n=30)と正規分布だない母集団(n=18)の差を比較するときはどうしたらよいのでしょか?パラメトリックとノンパラメトリックで正規分布の有無で検定方法が変わりますよね。この場合どうしたらよいのでしょうか?統計学あまり覚えてませんでして。