• ベストアンサー

統計学に詳しい方教えてください!!

統計学に詳しい方教えてください!! 統計学を勉強している大学生です。大学の友達の身長から日本の22歳の男児平均身長を予測したいのです。 友人は12人。有意水準0.05で計算すると・・・ 170.44cm<母集団平均<179.55cm  となりました。 総務省統計局のデータを見ると22歳平均が172.4cmで見事範囲に入りましたが、 エクセルで、「尖度=-1.39526」「歪度=0.2675」でした。 これは正規分布と言えるのでしょうか? この結果を正しく分析するならば、母集団平均予測は偶然だったというのが考察として適切なのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

>ただ今後のために1つ聞きたいのは、t分布による母集団平均の推定に関して、何に気をつければよいでしょうか?  理論は得意でないので、正確性にはかけますが、当たらずといえども遠からず、程度なら、 正規分布は、データー数が十分に多い場合の分布ですよね。t分布は、少数データの場合で、正規分布に近い分布、それゆえ、正規分布と同様に扱えると理解しています。したがって、t分布の平均値=(≒か)正規分布の平均値ではないでしょうか。データを全て得られない場合は、データは、t分布に従うのが一般的だと思います。  私は動物実験しかしないのでデータ処理にはあまり苦労しないのですが、社会学関係の先生の不満は、「データ集めに苦労するのに、集めたデータは勝手に利用される。自分の名前は出ない」ことです。論文には、謝辞を書きますが、数字を集めた人は苦労をしているので名前を明記して謝意を述べるべきかもしれませんが、数字そのものには著作権がなく(数字を書いた論文には著作権がある)、謝意を表す義務はありません。  前置きが長くなりましたが、平均値に意味があるのか、が肝心。正規分布やt-分布なら、平均は代表値として妥当。そうでないなら、たとえば個人の貯蓄額はF分布らしいので、平均は意味が無い。  t分布に限らず、データが無作為抽出されているか、が最も重要です。これが厳密でないと、データが偏ります。次に、データ数が十分に多いこと。(十分の文字で分かった気になりますが、実際にはいくつあれば十分かは明示しておらず、現実には役に立たない。気持ち良くさせてくれる文系の表現)  人間には、さまざまな人がいるので、患者であれば100人の調査は最少とのこと。以前は、「食物繊維は、がん予防」と盛んに言われました。しかし、アメリカでの10万人規模の調査では、効果は示せなかったこともあって、今では下火を過ぎて鎮火状態。  逆に、理化学の測定結果で、何回か繰り返し、平均と標準偏差を記述している論文もみますが、腕が悪いことをさらけだしているだけで、愚の骨頂。  

netsuper
質問者

お礼

かいとうありがとうございます。 自分の勉強不足もあって、わからないことをこのサイトにまるなげしてしまった自分に反省です。 いろんな書物を読んでもう少し自分なりに統計の基礎を築き上げてからもう一度問題にとりかかりたいと おもいます。

その他の回答 (3)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 No1と2です。二重回答になってしまいましたが、回答がスムーズにできなくなってしまって。以前もありましたが、これほどひどくは無かったのですが。 >有意差ありの結論というのは具体的にどのデータを見ればいいのでしょうか? これからは、明示はできません。しかし、比較対象が日本人の集団となると、同年齢でも100万人はいます。すなわち、データ数が異常に多いので、大概のものは有意差あり、になります。検定のデータ数が多くなればなるほど、有意差は出やすくなる、という性質があります。  統計の分野で、相関があります。データーが200ほどあれば、バラバラで『とても直線は描けない(=有意差は無い)』と見た目で判断しても、有意差あり、になることが多いのです。有意差を出したければ、データ数を増やすのが一番簡単です。 >尖度、歪度等を検討してT分布が正規分布としてみなせるかどうかで t分布は、正規分布の代用になりますので。したがって、ご質問は、この12人は正規分布か、という問いになります。  尖度、歪度等は、単語として目にしただけです。データの正規性については、正規確率紙を利用して判定、というのは読みました。任意に選んだのであれば、正規分布とみなす、として考えます。が、友人を選択、ならば友人というフィルターがかかっているので、正規分布は想定できません。12人の平均値が、日本人のものと一致しないのなら、原因はそのせいかも。

netsuper
質問者

お礼

回答ありがとうごいます。 私のレベルではかなり難しいかもしれませ。ただ今後のために1つ聞きたいのは、t分布による母集団平均の推定に関して、何に気をつければよいでしょうか?

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

詳しくはないですが、 >偶然だったというのが考察として適切なのでしょうか? 平均±2σの範囲から、偶然ではなく、予測は適正、と結論すべきだと考えます。  ただ、170~179.5と範囲が広すぎるので、予測とは言えない印象があります。 また、日本人の人数は多いので、日本人の集団と12人の集団(平均値は、175cm?)に少しの差があっても、「有意差あり」の結論になると想います。この場合は、2.5cmも平均値に差があるので、なおさらです。すると、2つの集団に差がある、という結論になり、予測が当たった、と言えるかどうか??

netsuper
質問者

お礼

回答ありがとうございます!有意差ありの結論というのは具体的にどのデータを見ればいいのでしょうか? ちなみに12人の身長データは170,167,170,187,179,183,175,183,165,170,181,171cmでした。 疑問がもうひとつあるのですが、標本から母集団を求めたい場合、尖度、歪度等を検討してT分布が正規分布としてみなせるかどうかで母集団平均の信頼を見極めるのでしょうか?

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>偶然だったというのが考察として適切なのでしょうか? 平均±2σの範囲から、偶然ではなく、予測は適正、と結論すべきだと考えます。  ただ、170~179.5と範囲が広すぎるので、予測とは言えない印象があります。 また、日本人の人数は多いので、日本人の集団と12人の集団(平均値は、175cm?)に少しの差があっても、「有意差あり」の結論になると想います。この場合は、2.5cmも平均値に差があるので、なおさらです。すると、2つの集団に差がある、という結論になり、予測が当たった、と言えるかどうか??

関連するQ&A

  • 統計学の検定について

    統計の問題で以下のようなものがあります。 ある母集団から無作為に抽出した学生にテストを受けさせたところ 55 45 46 54 38 62 64 36 という標本が得られた。この母集団が正規分布している元のした時、得点の母平均が60である、という仮説を有意水準5%で検定せよ。 というものでしす。この時の検定の仕方はどうすればいいのでしょうか? またこの時の有意水準とは何の何に対する比率が5%なんでしょう? あとこの場合でなされる判断は、観測された結果をどのように考えた結果なされたものなのですか? よろしくお願いします!

  • 統計の質問

    (1)ある集団10人を無作為に抽出して身長(cm)と体重(kg)を測定したところ次のようになった。 身長:平均160.3 標準偏差8.5  体重:平均58.4 標準偏差9.0  身長と体重の共分散66.5 ただし(身長,体重)は二次元正規分布に従う。 問。身長と体重の間に相関があるかどうか有効水準5%以内で検定を行え。 (2)ある集団の身長は平均163.2cm、標準偏差7.5cmの正規分布に従うとする。 問。この集団100人の平均身長が163.2cmから2cm以上異なる確率を求めよ。 問。この集団から100人の組を二つ作り、それぞれA、Bとする。AとBの平均身長の差が2cm以内である確率を求めよ。

  • 統計の代表値から正規分布かどうかを知る

    タイトル通りですが、統計の代表値(平均 中央値 最大最小値 尖度 歪度)からその集団のデータが正規分布しているかどうかをしるにはどうしたらよいでしょうか??

  • 確率・統計です。 助けてください!

    母平均0,母分散1の標準正規分布に従う母集団から無作為抽出された標本X1,…,Xnを 用いて母平均μについて有意水準α=0.05で H0:μ=0 H1:μ≠0 の検定を行った時,「標本数n」により「正しい検定結果が得られる確率」がどのように変化するかについて検討せよ.乱数を用いたシミュレーション,思考実験,理論からの考察など手法は問わない 大学の課題なんですが、わかりません。 詳しく解説してもらえると助かります。 よろしくお願いしますm(__)m

  • 確率統計の課題…解き方を教えてください!

    以下の問題を26日までに解かなければなりません… 検定…?有意水準…?手も足も出ません。 最初は何から手をつければよいのでしょうか? 解き方を教えてください! (1)硬貨を1000回投げたところ、表が528回出た。この硬貨は、表と裏の出やすさに偏 りがあると判断してよいか。有意水準(危険率)5%で検定しなさい。 (2)ある県で、ある年の出生児から無作為に1000人を抽出したところ、528人が男児で あった。男児の出生率は女児の出生率よりも高いと判断してよいか。有意水準(危険 率)5%で検定しなさい。 (3)ある年の11歳男子の身長の全国平均は142.8cmであった。翌年の11歳男子から無作 為に2500人を抽出したところ、その年の平均は143.2cmであった。両年の11歳男子の 身長に差があると言えるか。有意水準(危険率)5%で検定しなさい。なお身長の母標 準偏差σは6.6cmとする。 お願いします!(>_<)

  • 統計学について

    下記の認識であっていますでしょうか? 例えば新しい機械と古い機械でデータをとります。新しい機械の平均が152、古いのも152だとします。平均値の差の検定で、0.33となり有意水準が0.05の場合、有意差なしで、この平均値は偶然ではないことが言える。 あってますでしょうか? また、新しい機械のデータと古い機械のデータに問題なく新しい機械を導入する場合に証明する時に使う統計学はなんでしょうか?

  • 統計学の問題について教えてください。

    統計学を独学で学んでいるのですが、コンセプトの所でつまずいています。 大学で統計学を学んだ方や、統計に詳しい方、教えてください。 {問題1} 変数の対(X,Y)ならびに(Y,Z)の両者に有意な相関が観測される場合、(X,Z)に関しては何が言えるか。以下の中から最も適当であると思われるものを選べ。 A、有意な相関がある。B、有意な相関はない。 C、どちらともいえない。 (私の答え)C、(X,Y),(Y,Z)に相関があっても、(X,Z)に相関があることは分からないと思う。 {問題2} ある無限母集団から1000個のサンプルを無作為に抽出しヒストグラムを描くと、かなり左裾が長い分布となった。その後、2000個のランダムサンプルを追加してもう一度ヒストグラムを描いた場合、その分布の形状はどうなると考えられるか。以下の中から最も可能性が高いと思われるものを選べ。 A、左右対称に近づく。B、右裾が長い分布となる。 C、左裾が長い分布となる。 (私の答え・疑問点)Nが増えるにつれてヒストグラムは左右対称に近づくと思う。しかしこの場合、無限母集団とランダムサンプリングとの違いが不明である。 {問題3} A大学の男子学生と女子学生の身長は、それぞれ正規分布をし、男性の平均は170cm、標準偏差は10cm、女性の平均は156cm、標準偏差は9.8cmであると仮定する。この大学の男子学生一人と女子学生一人をランダムに選んだ場合、選ばれた男子学生の身長が女子学生の身長より高い確率はおよそいくつか。以下の中から最も適当であると思われるものを選べ。なお、いかにPrで示した標準正規分布の下側確立を参考にせよ。 Pr(Z<0.7)=0.76 Pr(Z<1.0)=0.84  Pr(Z<1.3)=0.90 Pr(Z<1.4)=0.92 A、0.76 B、0.84 C、0.90 D、0.92 (私の疑問点)それぞれSDが分かっているが、生徒が何人いるのか分からないのでどう計算するのか分からない。

  • 統計用語(帰無仮説、有意水準)の使い方

    こんばんは、皆さん。 統計のテキストを読んでいますが、用語の使い方がしっくり来ません。 統計用語の使用方法について、次のような使い方は適切でしょうか? 言葉の使い方でおかしいところがあればご指摘ください。 帰無仮説を「推定母平均(母集団の平均値)は8である」と定義して、t検定を実施した。 採取したサンプルは1,2,3,4,5,10であった。 この時、推定母平均に基づくtは2.94484…であり、t分布表に基づくtは2.571であった。 よって、帰無仮説は有意水準5%で棄却される。 疑問点は次の箇所です。 ・「帰無仮説」の使い方 ・「推定母平均」という単語(googleではほとんど引っかからない) ・「有意水準」は「100-危険率」か?「有意水準=危険率」か? ・帰無仮説が棄却できない場合、「採択される」ことにしてしまってよいか? ・「帰無仮説が棄却される」ということは、「推定母平均は8ではない」と同義でよいか? ご教授お願いします。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 統計学

    統計学なのですが、標本平均の分布と母集団分布の関連性はどのようなものでしょうか?あと分布型、平均の分布の平均と標準偏差について教えてください