- ベストアンサー
正規分布による分析
すみません、質問が複数あるので長文になります。 また当方、統計学については素人のため初歩的すぎる質問であったら失礼します。 前提:卒研でアンケート調査を行い結果を統計で分析することになりました。アンケート内容は「ある事項につき賛成~反対までを無段階で聞く」とうもので、その結果を正規分布にかけて5段階にわけ、各段階の割合を求める。というものです。 1:アンケート調査を行い結果を分析するにあたりそのアンケート結果が正規分布なのか検定する手段として、尖度、歪度は学んだのですが、この二つの検定方法はそれ以外の検定方法(カイ二乗検定など)に比べ信頼性に足るのでしょうか? 2:アンケート結果が正規分布にのっとらない場合、片端に偏ったり、中心が最少で両端に偏ったりした場合に、正規分布による分析をした時は信頼に足る結果は出ないという事になるのでしょうか? 3:上記のようなアンケート調査の場合に、正規分布にのっとらない場合に用いられる分布などがあれば教えていただきたいです。 以上、長文失礼しました。m(_ _)m
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
1についてですが、尖度や歪度で正規分布に近似しているかどうかを検定する方法は分かりません。少なくともカイ二乗検定は正規分布であるかどうかを確かめる検定ではありませんよ。 2については、アンケートの結果が正規分布になっていなくても、カイ二乗分布やt分布、F分布などを使った検定方法があります。むしろ実際上、正規分布に従ったデータというのは少ないのではないでしょうか。もしくはデータを標準化したりするのでは? 3は2と内容がかぶりますが、正規分布を用いない方法として、t分布を使ったt検定やF分布を使う分散分析などが代表的ではないでしょうか。
その他の回答 (1)
- at9_am
- ベストアンサー率40% (1540/3760)
> アンケート内容は「ある事項につき賛成~反対までを無段階で聞く」とうもので、その結果を正規分布にかけて5段階にわけ、各段階の割合を求める。というものです。 これがよく分からない。というのも、無段階にする必要がありますか? 最初から1~5の数値を聞けば充分ではないでしょうか? この段階で個々のデータが正規分布に従っているという強い仮定をおくのは拙いと思います。 分布の形は様々で、正規分布で近似できるとは思いません。ただ中心極限定理から、平均値は近似的に正規分布に近似出来ます。 したがって、アンケートの各回答をそのまま用いた分布を正規分布で近似するには少々無理があるように思います。ですので 2.で心配されているように > 正規分布による分析をした時は信頼に足る結果は出ない という結果になるでしょう。 個々のサンプルの分布が正規分布に則らない場合であれば、二項分布やその拡張である多項分布に則った分析があります。ただし分析の目的によっては、他の方法の法が適している場合があります。
補足
早速の返答ありがとうございます! >無段階にする必要がありますか? 言葉がたりなかったです・・・。過去の研究によりアンケート対象となる人にある数値(単位は年数です)を聞くと、ある事項についての賛成度(賛成~反対を0~1であらわしています)を計算で求める事できるのです。で、アンケートでは年数を聞いて、それを賛成度に直し、その賛成度の割合を分布で求めたいのです。 >二項分布やその拡張である多項分布に則った分析 少し二項分布のことを調べたのですが、「確立pの事象をN回したとき事象の回数」を求めるもので、かつ正規分布に近似されるものだと書かれていました(間違ってたらすみません)。それで他の分布も調べたのですが、対象の変数が1つ、さらに山が二つ出来て対応できる分布が見つけられませんでした・・・。そのような場合に処理する方法はあるのでしょうか?
補足
早速の返答ありがとうございます! >尖度や歪度で正規分布に近似しているかどうかを検定する方法は分かりません これは、尖度と歪度が大きすぎたり小さすぎるとマズイ、というような話をどこかで見た気がして・・・。それは正規かどうかの判断には用いれないのでしょうか? >カイ二乗検定は正規分布であるかどうかを確かめる検定ではありませんよ そうだったんですか!勘違いしていました・・・。 >カイ二乗分布やt分布、F分布などを使った検定方法があります。 少し調べてみたのですがt分布、F分布などは対象が二つの場合に用いるように書いてありました。今回は賛成度の割合のみを考えたいのでその場合でも対応できるのでしょうか? >データを標準化したりするのでは? 標準正規分布のことでしょうか? 標準正規分布は現在使っています。それで、標準化した場合は正規分布に当てはまらない値でも面積による割合は比較的正確に求められるのでしょうか? >正規分布を用いない方法 下の補足で書いた事とかぶってしまうのですが、山が二つ出来てしまうデータを入力した場合の対処方法などはあるのでしょうか? >t分布を使ったt検定やF分布を使う分散分析などが代表的 今回の分析は、賛成~反対を0~1の数値とし、その割合の分布(賛成が何%、反対が何%)のみを求め、賛成~反対の傾向をアンケート対象者の代表の人に返すという事を目的としています。t分布やF分布を用いてその目的をこなす方法がわかりません・・・。 下での補足と共々、初心者質問ばかりですみません・・・。