• ベストアンサー

統計学?

初めて投稿します。まともに勉強もしないで生きてきて全然わからない問題あります。 Aの測定値は、平均値μ1、標準偏差のα1の分布 Bの測定値は、平均値μ2、標準偏差のα2の分布 Aの測定値の分布とBの測定値の分布から1つずつの値を抜き取ったとして Aの測定値-Bの測定値という値を計算すると、その分布は正規分布する。 正規分布の平均値と標準偏差は下記のとおりである。 平均値μ=μ1-μ2である。なぜこうなるのかを記述せよ。 さらに標準偏差を導きなさい。 言葉の意味も含めて教えていただけるとうれしいです。よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

まともに証明して説明すると,非常に面倒で,かえって理解できないかもしれません。 それで,直感的な話をします。 Aから,a1, a2, a3,... Bから, b1, b2, b3... とn回取ってきて,差を取り,その平均を求めると {(a1-b1)+(a2-b2)+(a3-b3)+.....+(an-bn)}/n ={(a1+a2+a3+...+an) - (b1+b2+b3+....+bn)}/n =(a1+a2+a3+...+an)/n - (b1+b2+b3+....+bn)/n となり,それぞれの集団から取った標本の平均の差になることがわかります。 この,それぞれの集団から取った標本の平均,という行為を何度も繰り返すと,それら平均値の分布は,正規分布となります。 これを,中心極限定理,と呼びます(非常に重要な定理)。 そして,そのようにしてできた平均の差の分布もまた正規分布となります。 これを,正規分布の再生性と言います。 一方,分散はどうなるかというと,和であるα1+α2となります。 これは,それぞれの標本の差を取ったわけですが,全体として出来上がった集団は,AとBが一緒になったもの,例えば,背が高い集団と低い集団が混じったような状態,であるから,それだけバラツキが大きくなったと言えるからです。

k-a0617
質問者

お礼

返信遅れて申し訳ございません。回答ありがとうございました。 おかげさまで助かりました。これからもよろしくお願いいたします。

関連するQ&A

  • 統計の質問

    (1)ある集団10人を無作為に抽出して身長(cm)と体重(kg)を測定したところ次のようになった。 身長:平均160.3 標準偏差8.5  体重:平均58.4 標準偏差9.0  身長と体重の共分散66.5 ただし(身長,体重)は二次元正規分布に従う。 問。身長と体重の間に相関があるかどうか有効水準5%以内で検定を行え。 (2)ある集団の身長は平均163.2cm、標準偏差7.5cmの正規分布に従うとする。 問。この集団100人の平均身長が163.2cmから2cm以上異なる確率を求めよ。 問。この集団から100人の組を二つ作り、それぞれA、Bとする。AとBの平均身長の差が2cm以内である確率を求めよ。

  • 統計学 正規分布 回答の手引きおしえてください。 

    今、文系の大学二年です。 今、初歩的な統計学を学んでいるのですが、どうしてもわからないので、ヒントでもおしえてください。 問題 (1)平均0、標準偏差1の正規分布で、0≦x≦1 である確率 (2)平均20、標準偏差5の正規分布で、-a≦x≦aである確率が95.4%である時、aの値 いろいろネットで調べてみましたが、さっぱりです。よろしくお願いします。

  • 統計学における標準化について

    A)標準化は、次のページの https://bellcurve.jp/statistics/course/19647.html サンプルxー平均値/標準偏差 であり、これで正規分布のz値と照らし合わせて確率を求めるというのは理解できました。 B)ただ、実践において、統計量Zを求める際に、次のサイトでは、 https://bellcurve.jp/statistics/course/9317.html z=x⁻(xの平均) -μ / √σ² * √n とあります。 分母が標準誤差です。 C)一方次のページでは、 https://bellcurve.jp/statistics/course/9490.html z=X-np / √np(1-p) とあり、こちらは標準偏差で割っています。 以下質問ですが、 1)Aは何も推定しておらず、すなわち記述統計で全サンプルが分かっている、すなわち母集団での話で、あるサンプルxiの全体のうちでの発生確率を示すために標準化してZ値を求めている、という考え方で正しいですか? 2)Bは標準誤差で割っているのは、母集団σ²から抽出した標本であり、抽出した確率変数Xについて、母集団が正規分布に従うのであれば、X~N(μ、σ²/n)に従うので、この分散の√を使っている(すなわち標準誤差を使う)という認識で正しいですか? 3)Cは二項分布のnが大きいときに中心極限定理で正規分布と近似させて解くという計算の話なのかと思いますが、これは、Aと同じように、変数Xから平均を引き、標準偏差で割っています。これは抽出した標本だと思うのですが、Aと同じ方法でいいのでしょうか?かといって。正規分布から抽出していませんが……。 それぞれの用語とかも良く調べましたが、いまいち使いこなせていません。A,B,Cそれぞれ分子も違うので、標準化を基本に色々やっているのだろうと思うのですが、使い分けというか、それぞれの出てくる場面とかも教えてほしいです。 よろしくお願いいたします。

  • 統計(品質管理)

    下記は、ある装置のJISに規定された試験条件です。 -------------------------------- ・標準試料を3回繰り返し測定する。(測定値s1,s2,s3) ・3回の測定値の平均値Aと各測定値(s1~s3)の偏差のうち、最大のものをdとする。 ・|d/A|<0.02であること -------------------------------- 測定値のばらつきは正規分布に従うと仮定して、この試験に高い確率(例えば95%以上)で合格するためには、測定値のばらつきのCV値(標準偏差/平均値)が何%ならいいのでしょう? たった3回だと不良品でも偶然測定値が揃って合格するおそれがあると思うのですが、それはともかくとして、何度テストしても合格する品質とはどれだけなのかを考えています。

  • 統計学の問題です

    これってどう解くんですか? ある検定試験の受験を控えたA君とB君は繰り返し検定の過去演習を行っている。 その結果、A君は平均50点、標準偏差5点、B君は平均45点、標準偏差15点の正規分布に従う成績をとっている。 検定試験の合格ライン60点とするとき、合格する可能性が高いのはA君とB君のどちらか 解き方と答え教えてください

  • 確立・統計の問題です。(正規分布)

    確立・統計の問題です。 (1)ある確立変数が標準偏差σ=21.5の正規分布に従うものとする。 この確立変数が120.5未満のある値をとる確立が90%であるとき、この分布の平均値をもとめよ。 (2)ある検問所で記録されたスピードのデータによると、そこを通過する車は平均時速60.5km、標準偏差7.4kmで、大体正規分布に従っている。 このとき (a)時速70kmを超えている車は全体の何%か (b)時速48kmよりも遅い車は全体の何%か (c)時速56kmから時速64kmまでの車は全体の何%か (3)ある商品の1ヶ月の売り上げ個数は、平均250個、標準偏差30個の正規分布をする。 90%の確立で品切れをおこさないようにするためには、月初めにどれだけの在庫を準備しておけばよいか。 ただし、各月の需要はすべてつき始めの在庫で満たすものとする。 (1)は答えが P{(120.5-μ)/21.5<z}=0.9 z=1.28であるからμ=92.98 と回答にあるのですが、zがどうしてそうなるのかがわかりません。21.5<zとなるのもどうしてでしょうか? zがわかったと仮定してμを計算すると、そっちは出るのですが・・・。 (2)は答えが(a)10% (b)4.6% (c)41.0%とあるだけで どうやって導いたらいいのかいまいち検討がつきませんでした。 比較的簡単にでそうな感じの問題だとは思うのですが。 (3)は250+1.28×30=288個と回答にありましたが、 1.28はどうやって出したのかがわかりません。 それになぜ標準偏差の30をかけるのでしょうか? よろしくお願いします。

  • 統計の考え方について

    問題「何れの国も出生体重の分布は正規分布を示し、2500g未満の出生児を低体重児と称している。2007年のA国における出生体重平均値±標準偏差=3000±250g、B国では3400±300gであった。A国、B国の低体重児の割合はそれぞれ何%と考えるとよいか。理由を示して答えよ。」という課題が出ました。 自分で考えた結果はA国が0.15%で、B国が0%なんじゃないかな・・・って思ったんですけど、正直よくわかりません・・・。 どなたか考えるヒント等教えていただけませんでしょうか。

  • 測定値について

    測定値について 測定値が正規分布を示す場合、平均値±標準偏差にふくまれる値は68%でしょうか。 また、求めたい測定値の質や量が異なっても、測定法は同じでなければならないのでしょうか。

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • 統計の問題について

    統計の問題を解いています。次の問題を教えてください。 (1)平均が168 標準偏差が6.0のとき正規母集団N(500,6.0^2)、P(X≦a)=0.95のときaはどうなるか。 (2)680人の入学募集人員にたいして10000人の希望者がいた。平均が500 標準偏差が60のとき正規分布N(500,60^2)、合格者の最低点は何点か。 以上2つです。よろしくお願いします。