確率統計の問題と中心極限定理について

このQ&Aのポイント
  • 質問文章では、確率密度関数f(X)=1(0<=X<=1) 0(その他)で与えられており、新しい確率変数Zを定義して、Z〜N(0,1)と近似できることを中心極限定理によって説明したいとのことです。
  • 質問者のやり方として、まずf(X)の平均と分散を求め、次にZを変形して表現した後、nが大きいときにZ〜N(0,1)と近似できるという性質を中心極限定理で説明しました。
  • しかし、問題文ではn=12であるため、質問者は何を「大きい」と捉えればいいのか分からない状況です。質問者は確率統計の初心者であり、何かしらの基準があるのか知りたいと述べています。
回答を見る
  • ベストアンサー

確率統計の問題

確率密度関数f(X)= 1(0<=X<=1)              0(その他) で与えられている。 Z=Σ(i=1,12)Xi-6 として新しい確率変数Zを定義するとき、Z~N(0,1)と近似できることを中心極限定理によって説明せよ。 という問題です。 私のやり方としては、まずf(X)の平均と分散を求める。 μ=1/2 σ^2=1/12 と求まります。 ここで、Zを変形すると、 Z=(1/√12)*(Σ(i=1,12)(Xi-1/2)/(√1/12)) となり、ここの12をnと置き換えればn→∞のときに Z~N(0,1)と近似できるとわかりますが、 中心極限定理ではn が大きいときに、 Z=(1/√n)*(Σ(i=1,n)(Xi-μ)/(σ)) の分布は標準正規分布でよく近似できるとありますが、 問題文ではn=12であって、これが何を持って大きいといえるのです。 確率統計の初心者ですので、馬鹿な質問になり、申し訳ありません。 わかる方がいらっしゃいましたら、ご教授お願いします!

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.3

> nと置き換える12はZ=(1/√12)*(Σ(i=1,12)(Xi-1/2)/(√1/12))の中の > 3つ全部だと思います。合っていますかな... いえ、二つだけです。 Z=(1/√n)*(Σ(i=1,n)(Xi-1/2)/(√1/12)) が正しい。 > E(Z)=0,V(Z)=1なので、ZはN(0,1)に近似する。 > これだけでいいですか?なんか中心極限定理を使ってないような気がします。 そうですね。 最初に、中心極限定理が何なのかを書いてないと、何故N(0,1)に近似できるのか説明できてませんね。 中心極限定理とはこういうものであり、だからこうするとこの確率変数はn→∞のとき標準正規分布に従う。 そして、問題のZはn=12のときである。 という流れです。 > ちなみに、μ=0,σ=1の分布はみんなN(0,1)に近似するのですか。 分散の存在する分布については如何なる分布でも、その独立な確率変数の和を正規化した分布は、n→∞のとき標準正規分布になります。

griffithxzb
質問者

お礼

ご回答、ありがとうございました。

その他の回答 (2)

noname#227064
noname#227064
回答No.2

> ちなみに、私のやり方は合っていますか? 中心極限定理自体は使って良いので、和の分布の平均と分散を求めて、和を平均0、分散1に正規化したものがZに一致することを示せば終わりです。 付け加えるとすれば、次の点です。 > Z=(1/√12)*(Σ(i=1,12)(Xi-1/2)/(√1/12)) > となり、ここの12をnと置き換えればn→∞のときに 12は3か所ありますが、どの12をnに置き換えればいいのですか?

griffithxzb
質問者

お礼

>12は3か所ありますが、どの12をnに置き換えればいいのですか? 説明不足ですみません。 nと置き換える12はZ=(1/√12)*(Σ(i=1,12)(Xi-1/2)/(√1/12))の中の 3つ全部だと思います。合っていますかな... >中心極限定理自体は使って良いので、和の分布の平均と分散を求めて、和を平均0、分散1に正規化したものがZに一致することを示せば終わりです。 でしたら、こんな感じですか。 E(Z)=0,V(Z)=1なので、ZはN(0,1)に近似する。 これだけでいいですか?なんか中心極限定理を使ってないような気がします。 ちなみに、μ=0,σ=1の分布はみんなN(0,1)に近似するのですか。

noname#227064
noname#227064
回答No.1

> 問題文ではn=12であって、これが何を持って大きいといえるのです。 もっともな疑問ですが、幾つからならいいのかという答えはありません。 30以上だったりする場合もありますし、100以上の場合もあるでしょう。 ではどうやって決めれば良いのかというと、近似をしてそれをどう使うのかで決めます。 それによって、確率密度の差が幾つ以内とか、分布関数の差が幾つ以内とか、nを決める条件がでてくるでしょう。 目的がなんなのかを明確にして、それを達成できる精度になるようにnを設定すれば良いのです。 nの設定に使えそうなものとして、Berry-Esseenの不等式を挙げておきます。 質問の場合ですと差を大きく見積もってしまいますが、いろいろな分布に使えるのが利点です。

参考URL:
http://en.wikipedia.org/wiki/Berry%E2%80%93Esseen_theorem
griffithxzb
質問者

お礼

丁寧なご回答ありがとうございます。 ちなみに、私のやり方は合っていますか? 本当に初心者なので(おまけに独学)、合っているかどうかかなり心配です。 後、この問題と一緒に出された問題を見ますとたぶんそんなハイレベルな問題じゃないと思いますので Berry-Esseenの不等式といういかにもハイレベルなものは使わないかもしれません。 私のやり方に問題があるかもしれません。もしquaestioさんが私が出した問題を解くとしたら、どういうふうに解きますか。

関連するQ&A

  • 確率・統計の問題について

    画像の問題の解説でX = X1 + X2 + …+X50は漸近的に正規分布N(0, 50/12)に従うと書いてあるところが理解できません。中心極限定理を用いた場合は確率変数はN(μ,σ^2/n)に従うので問題の確率変数XはN(0, 1/600)に従うのではないですか?

  • 確率・統計の問題です

    以下の問題がよく分らなかったので、解説お願いします 中心極限定理の分野です 実数値の小数第1位を四捨五入するとき、 生じる丸めの誤差Xは確率密度関数f(x)が f(x) = 1 (-0.5 <= x < 0.5) 0 (その他のx) の一様分布に従うとする 100個の実数に対する丸めの誤差X1,X2,...,X100が互いに 独立とするとき、 確立P( |X1+X2+...+X100| <= 5 )の近似値を求めよ X1,X2,...の数字は添え字の意味です よろしくお願いします_ _

  • 分布収束の問題

    こんにちは。元日ですが、具体的な設定における分布収束の問題についてご質問致します。 nを整数(n>4)、Xを一次元の確率変数、Qを自由度nの逆カイ二乗分布にしたがう確率変数、Cを正の定数とします。また、Xは以下のように構成されているとします。 X~nCQ 【Qにnと定数Cをかけている】 なお、QとXの期待値と分散はそれぞれ以下のようになります。 Qの平均: 1/(n-2) Qの分散: 2/{(n-2)^2×(n-4)} Xの平均: nC/(n-2)【n→∞のときCとなる】 Xの分散: 2×n^2×C^2/{(n-2)^2×(n-4)}【n→∞のとき0となる】 以上の設定において、nを大きくしたとき、√{n}×(X-C)の極限分布と漸近分散を求めたいのですが、√{n}×(X-C)が確率変数列の和という形になっていないので中心極限定理等が使えず、求め方が分からない状況となっています。 nを大きくしたとき、√{n}×(X-C)は分布収束するのでしょうか。また、分布収束する場合は、極限分布はどのように求めたらいいのでしょうか。 よろしくお願い致します。

  • 分布収束について

    こんにちは。分布収束について質問させていただきます。 (1) 確率変数列X_nが確率変数Xに分布収束、X_nとは別の確率変数列Y_nが確率変数Xに分布収束するとき、 X_n+Y_nが2Xに分布収束 は成り立つでしょうか? (2) X_i (iは1からnまで)を独立同分布で、平均0、分散vをもつとします。 また、S_n=X_1+X_2+...+X_nとします。したがって、中心極限定理より、S_n÷nはN(0,v)にしたがう確率変数Zに分布収束します。 このとき、 S_n/n+S_{n+1}/(n+1)+S_{n+2}/(n+2)がN(0,3v)に従う確率変数3Zに分布収束 (ただし、S_{n+1}=X_1+...+X_n+X_{n+1}とします) は成り立つでしょうか? よろしくお願い致します。

  • 加重平均 

    n個の確率変数X1,X2,...,Xn がN(μ,1)に従うとき X' = (1/n)Σ<1 n>Xi は nが十分大きいときに 正規分布 N(μ,1/n)に従うとみなしていいです(中心極限定理) それでは X' = Σ<1 n> w(i) * Xi ただし Σw(i)=1 (w(i)は数列{w(n)}の第n項) としたとき X'は正規分布に従いますか?? X'の平均はμ,分散Σ(w(i))^2 は分かったので N(μ,Σ(w(i))^2) かと思うのですが、確証がないので アドバイスをいただけないでしょうか。

  • 統計学の問題

    理系の大学一年生です 統計学の問題でいくら考えてもわかりません。 2つあるので、どちらかでも分かれば回答をお願いいたします。 [I]3つの確率変数X,Y,ZはVar(X)=Var(Y)=Var(Z)=1であり、Cov(X,Y)=Cov(Y,Z)=Cov(Z,X)=ρとする このときX+Y+Z,X+Y-Z,X-Y-Zを分散の大きい順に並べよ。 [II]t分布のパーセント点tn(α)とF分布のパーセント点f1,n(α)の間に {tn(α)}^2=f1,n(α) の関係があることを示せ

  • ベルヌーイ分布における独立な確率変数とは?

    統計学の問題についてです。 【問題】 次式の確率関数f(x)をもつベルヌーイ分布に従う、 互いに独立なn個の確率変数Xi(i=1,2,…,n)がある。 以下の問に答えよ。   f(x)={p(x=1),1-p(x=0)}ただし0≦p≦1 確率変数Xiの期待値と分散を求めよ。 問題を解こうとしたのですが、確率変数Xiがよくわかっていません。 ベルヌーイ分布はB(1,p)で、取りうる確率変数は0か1の2つであるのに 「互いに独立なn個の確率変数Xi(i=1,2,…,n)」について考えるというのは どういう意味なのでしょうか? 概念的なものが全然理解できていませんので、その辺りも踏まえて 回答をしていただけたらと思っています。よろしくお願いいたします。

  • 統計学 確率分布の問題

    こんにちは。統計学を勉強している者ですが、 次の問題が解けずに困っています。  n個の確率変数 X1, X2, … Xnが、  次の母集団分布からのランダム標本であるとする。  P(X=1)=p , P(X=0)=1-p=q  このとき、Y=X1+X2+…+Xnの確率分布を求めよ。  また、Yの平均と分散を求めよ。 という問題です。 Yの確率分布は、P(X=1)が選ばれる回数をkとすると nCk * p^k * q^(n-k) になると思うのですが…。 確率分布と言われると、どう答えてよいのかわかりません。 平均と分散は、この確率分布の答えをもとにして 出せばいいのですか? kやnをどう駆使して算出すればよいのでしょう? 答えの分かる方、詳しく解説してもらえると助かります。

  • PERT と中心極限定理

    中心極限定理は、次のような定理だと思います。 平均μ、分散σ2の母集団から無作為にn個の標本を抽出してその平均値mを求めることを繰り返すと、母集団がどのような分布を示す集団であるかに拘わらず、nが充分大きいとき、mの分布は平均μ、分散σ2/nの正規分布で近似される。 次に、PERTにおいて、n個の作業から成るプロジェクトの全体工程Tを求める方法は、一般に次のように説明されています。 作業iの所用時間の期待値ei、楽観値oi、最可能値mi、悲観値pi、分散σi2の間には次の関係がある。 ei=(oi+4mi+pi)÷6 (式-1) σi2=(pi-oi)2÷36  (式-2) 一般に平均と分散については加法定理が成り立つので、クリティカルパス上のn個の作業の総所要時間(n個の作業の所要時間の合計)Tの期待値eと分散σ2は次のように表される。 e=Σei  (式-3) σ2=Σσi2 (式-4) 中心極限定理により、Tは期待値e、分散σ2の正規分布で近似されるので、今、e=20、σ2=25であるとすると、・・・(と来て、Tの確率を求めるのですが、長くなるので以下省略します)。 ここで分からないのは、「中心極限定理により、Tは期待値e、分散σ2の正規分布で近似される」というところです。なぜ、いきなりこんなことが言えるのでしょうか。具体的に分からない点は次の(1)です。 (1)中心極限定理は、「平均μ、分散σ2の母集団から無作為にn個の標本を抽出してその平均値mを求めること」から始まる定理なのに、上記Tを求めた過程には、「平均μ、分散σ2の母集団」も「n個の標本の抽出」も「その平均値m」も、一切何もありません。一体これらは、上記Tにおいては、どこへ行ってしまったのでしょうか。

  • 正規分布の問題

    こんばんは。 正規分布の問題ですが、最近統計学を学び始めたので、全く理解できません。 どなたかご教示よろしくお願い致します。 解法を教えて頂けると助かりますが、お手数でしたらプロセスだけでもお願い致します。 問題  サイコロを42000回投げて出た目の総和がある値以上となる確立を0.002以下としたい。この値の最小値はおよそいくらか。  ただし、目の出る確率は1/6ですべて等しく、何回目にどの目が出るかは互いに独立な事象である。  なお、確立変数Zの平均E(Z),分散V(Z)が存在するとき、関係式 V(Z)=E(Z^2)-E(Z)^2 が成り立つ  また、{Xi} (i=1,2,..,n) が互いに独立かつ同一の確率分布に従う確率変数列で、E(Xi), V(Xi)が有限ならば、nが十分大きいとき、Y=ΣXiは近似的に正規分布に従うとみなせる。  さらに確立変数Yが正規分布に従うならば、(Y-E(Y))/√(V(X))は標準正規分布に従い、標準正規分布の確立密度関数,  f(x)=1/√(2π)・e^-x^2/2 に対し、  ∫f(x)dx=0.002 (x; 2.88~+∞) とする。 解は148000です。よろしくお願い致します。