• ベストアンサー

統計学

統計学がわからないので教えてください。最近独学で統計学を学んでいるのですが、母平均の値と、標本平均の値は、かならずしも同じじゃないのはなぜですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • popesyu
  • ベストアンサー率36% (1782/4883)
回答No.2

同じじゃないからこそ統計学というものが生まれたわけで。 毎回毎回、母集団から何らかのデータが取れるならそもそも統計学的な検証は必要ありません。全データがそこにあるのですから、誤差も無いし、何らかの差が出たのであれば、そこには100%差があるということになるわけですから。 具体的に例示するなら、例えば日本人全員の平均身長を出して、特定の県の人の平均身長を出して、そこに1cmの差があったなら、それは特定の県の人は日本人の平均より1cm低いということが言えることになります。 ただ現実は日本人全員の平均身長を集計するということが不可能なため、サンプリングで全国の人から取ることになるし、特定の県も同様になります。で、そこで始めて統計学的な検証により、仮に1cmの差があったとするなら、それが誤差による偶然によるものなのか、そうでないのかを確率論的に言い表すことになるわけです。

その他の回答 (1)

回答No.1

 それは、 標本に バラツキ があるからです。  例えば、 クラス 100人全員 の平均身長(母平均)を求めたとします。 このクラスの内 10人だけ の平均身長(標本平均)をとったとすれば、 当然先の母平均とは異なります。  しかし標本の数を10人よりも20人、 20人よりも30人、 30人よりも40人・ ・ ・ と増やしていけば、 だんだん母平均に近づくはずです。

関連するQ&A

  • 統計学についての質問です。

    統計学に興味を持ち、簡単な統計の本を見ながら独学で勉強しています。 現在、「標本平均の差の信頼区間」ちょっと躓いております。 標本平均の差の信頼区間の式の中に、 (標本平均Aー標本平均B) が含まれていますが、 (標本平均Bー標本平均A)ではダメなんでしょうか? 入れ替えた場合、当然符号が変わり、信頼区間の符号も変わってしまうのはわかるんですが、なぜAーBなんでしょうか? 何に注目して、引かれる数と引く数を決めればいいのでしょうか? 以上、回答いただきければ幸いです。

  • 統計学

    統計学についての質問です。 平均u(ミュウ)、分散σ^2(シグマの2乗)の正規母集団から大きさ4の無作為標本の平均(標本平均)をX(Xバーのこと)とするとき、  確率P(|X(Xバー)-u|<σ)の値を求めよ。 まったく分からないので誰か助けてください・・・。

  • 統計の正規母集団に関する問題

    統計の問題なのですがわからなくて困っています。 正規母集団N(50,100)からの大きさ25の標本からつくられた標本平均をx ̅とするとき、 P(x ̅<λ)=0.90となるλの値を求めよ。 という問題です。統計を学び始めたばかりなので、詳しい解答をお願いします。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 統計学、自由度の意味がよくわかりません。

    「質問」 自由度の意味がわかりません 「質問の経緯」 統計学の学習をしています。自由度という言葉の意味がよく分からず困っています。 下記はあるウェブサイトからの自由度の説明の引用です "例えば、サンプルサイズが3のデータから算出された標本平均が5であるとき、1つ目の値と2つ目の値は自由に取ることができます。例えば、4と6とします。すると、3つ目の値は標本平均が5となるようにしなくてはならないので、「5」しか取ることはできません。つまり、自由に値を取れるデータの個数が1つ分減ってしまった(1つ分の情報量を失った)ことになります。したがって、自由度は「3-1=2」となります。" 全体的によくわからないのですが、上記の文章における >>1つ目の値と2つ目の値は自由に取ることができます が特に分かりません。例えば日本人の平均身長を標本から統計的推測をしたいとします。 この時、無作為に選んだ人間の身長の平均が標本平均となるはずです。 標本の中の一つ一つのデータについて、この人は平均身長は168で、とかこのひとは170でとか 値をつけることはないはずです。しかし上記の引用した文章においては まるで標本の中のデータの値を自分で勝手に決めているように思えます。 「質問まとめ」 自由度という言葉の意味がよく分かりません。 特に"1つ目の値と2つ目の値は自由に取ることができます" という、値を自由に取ることが出来る、という言葉が分かりません。 理解の手助けとなるようなアドバイスなどがあれば教えてほしいです。

  • 統計学の問題ですが、まったく分かりません。。

    統計学の問題ですが、まったく分かりません。。 どなたか回答していただけないでしょうか。 ある国出身の成人男性8人と成人女性10人について身長を測定し たところ、標本平均がそれぞれ 171.3 cm と 165.2 cm 、標本不偏 分散がそれぞれ 10.2 cm2 と 8.5 cm2 となった。男性と女性の身長 が正規分布に従っており、また、母分散の値が等しいとして、こ の国の成人男性と成人女性の平均身長の差を95%信頼係数で区 間推定せよ。 という問題です。 よろしくおねがいいたします。

  • 統計学

    統計学なのですが、標本平均の分布と母集団分布の関連性はどのようなものでしょうか?あと分布型、平均の分布の平均と標準偏差について教えてください

  • 統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っ

    統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っているならば、標本の大きさnの大小に関わらず、その平均の分布は正規分布」という記述があります。であるならば、母平均を区間推定する場合、zの値を用いて推定してもいいのかなと思いますが、ほとんどの書籍では、標本の大きさが小さい場合、tの値を用いて推定しています。なぜでしょうか?たぶん、自分がどこかで誤解をしているのだと思いますが、宜しくお願いします。

  • 薬の有効性を判定するにあたっての統計学について教えて下さい。

    薬学を学んでいます。その薬が有効であるかを調べるのに統計学を用いています。統計学でわからない箇所があるので、教えて下さい。統計学はあまりよくわかっていません。                    薬の有効性を調べる際、『有意水準95%の正常者』と、『正常者の95%が含まれる値を正常値とする』のでは、違いがあるのでしょうか?          具体的には・・・                  100人の正常者と思われる対象から得られた値の平均値が155、標準偏差25であるとき、                           1)有意水準95%の正常者の平均値の区間推定値         2)「正常者の95%が含まれる値」を正常値とする時の正常値の範囲                                         を求めたいのです。                                      どちらかは「標本値±信頼度×標準誤差」の式を用い、この場合、155±1.960×25÷√100 だと思うのですが。。。                    どうぞよろしくお願いします。                       

専門家に質問してみよう