• ベストアンサー

統計学に詳しい方教えてください!!

統計学に詳しい方教えてください!! 統計学を勉強している大学生です。大学の友達の身長から日本の22歳の男児平均身長を予測したいのです。 友人は12人。有意水準0.05で計算すると・・・ 170.44cm<母集団平均<179.55cm  となりました。 総務省統計局のデータを見ると22歳平均が172.4cmで見事範囲に入りましたが、 エクセルで、「尖度=-1.39526」「歪度=0.2675」でした。 これは正規分布と言えるのでしょうか? この結果を正しく分析するならば、母集団平均予測は偶然だったというのが考察として適切なのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

>ただ今後のために1つ聞きたいのは、t分布による母集団平均の推定に関して、何に気をつければよいでしょうか?  理論は得意でないので、正確性にはかけますが、当たらずといえども遠からず、程度なら、 正規分布は、データー数が十分に多い場合の分布ですよね。t分布は、少数データの場合で、正規分布に近い分布、それゆえ、正規分布と同様に扱えると理解しています。したがって、t分布の平均値=(≒か)正規分布の平均値ではないでしょうか。データを全て得られない場合は、データは、t分布に従うのが一般的だと思います。  私は動物実験しかしないのでデータ処理にはあまり苦労しないのですが、社会学関係の先生の不満は、「データ集めに苦労するのに、集めたデータは勝手に利用される。自分の名前は出ない」ことです。論文には、謝辞を書きますが、数字を集めた人は苦労をしているので名前を明記して謝意を述べるべきかもしれませんが、数字そのものには著作権がなく(数字を書いた論文には著作権がある)、謝意を表す義務はありません。  前置きが長くなりましたが、平均値に意味があるのか、が肝心。正規分布やt-分布なら、平均は代表値として妥当。そうでないなら、たとえば個人の貯蓄額はF分布らしいので、平均は意味が無い。  t分布に限らず、データが無作為抽出されているか、が最も重要です。これが厳密でないと、データが偏ります。次に、データ数が十分に多いこと。(十分の文字で分かった気になりますが、実際にはいくつあれば十分かは明示しておらず、現実には役に立たない。気持ち良くさせてくれる文系の表現)  人間には、さまざまな人がいるので、患者であれば100人の調査は最少とのこと。以前は、「食物繊維は、がん予防」と盛んに言われました。しかし、アメリカでの10万人規模の調査では、効果は示せなかったこともあって、今では下火を過ぎて鎮火状態。  逆に、理化学の測定結果で、何回か繰り返し、平均と標準偏差を記述している論文もみますが、腕が悪いことをさらけだしているだけで、愚の骨頂。  

netsuper
質問者

お礼

かいとうありがとうございます。 自分の勉強不足もあって、わからないことをこのサイトにまるなげしてしまった自分に反省です。 いろんな書物を読んでもう少し自分なりに統計の基礎を築き上げてからもう一度問題にとりかかりたいと おもいます。

その他の回答 (3)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 No1と2です。二重回答になってしまいましたが、回答がスムーズにできなくなってしまって。以前もありましたが、これほどひどくは無かったのですが。 >有意差ありの結論というのは具体的にどのデータを見ればいいのでしょうか? これからは、明示はできません。しかし、比較対象が日本人の集団となると、同年齢でも100万人はいます。すなわち、データ数が異常に多いので、大概のものは有意差あり、になります。検定のデータ数が多くなればなるほど、有意差は出やすくなる、という性質があります。  統計の分野で、相関があります。データーが200ほどあれば、バラバラで『とても直線は描けない(=有意差は無い)』と見た目で判断しても、有意差あり、になることが多いのです。有意差を出したければ、データ数を増やすのが一番簡単です。 >尖度、歪度等を検討してT分布が正規分布としてみなせるかどうかで t分布は、正規分布の代用になりますので。したがって、ご質問は、この12人は正規分布か、という問いになります。  尖度、歪度等は、単語として目にしただけです。データの正規性については、正規確率紙を利用して判定、というのは読みました。任意に選んだのであれば、正規分布とみなす、として考えます。が、友人を選択、ならば友人というフィルターがかかっているので、正規分布は想定できません。12人の平均値が、日本人のものと一致しないのなら、原因はそのせいかも。

netsuper
質問者

お礼

回答ありがとうごいます。 私のレベルではかなり難しいかもしれませ。ただ今後のために1つ聞きたいのは、t分布による母集団平均の推定に関して、何に気をつければよいでしょうか?

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

詳しくはないですが、 >偶然だったというのが考察として適切なのでしょうか? 平均±2σの範囲から、偶然ではなく、予測は適正、と結論すべきだと考えます。  ただ、170~179.5と範囲が広すぎるので、予測とは言えない印象があります。 また、日本人の人数は多いので、日本人の集団と12人の集団(平均値は、175cm?)に少しの差があっても、「有意差あり」の結論になると想います。この場合は、2.5cmも平均値に差があるので、なおさらです。すると、2つの集団に差がある、という結論になり、予測が当たった、と言えるかどうか??

netsuper
質問者

お礼

回答ありがとうございます!有意差ありの結論というのは具体的にどのデータを見ればいいのでしょうか? ちなみに12人の身長データは170,167,170,187,179,183,175,183,165,170,181,171cmでした。 疑問がもうひとつあるのですが、標本から母集団を求めたい場合、尖度、歪度等を検討してT分布が正規分布としてみなせるかどうかで母集団平均の信頼を見極めるのでしょうか?

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>偶然だったというのが考察として適切なのでしょうか? 平均±2σの範囲から、偶然ではなく、予測は適正、と結論すべきだと考えます。  ただ、170~179.5と範囲が広すぎるので、予測とは言えない印象があります。 また、日本人の人数は多いので、日本人の集団と12人の集団(平均値は、175cm?)に少しの差があっても、「有意差あり」の結論になると想います。この場合は、2.5cmも平均値に差があるので、なおさらです。すると、2つの集団に差がある、という結論になり、予測が当たった、と言えるかどうか??

関連するQ&A

専門家に質問してみよう