ベストアンサー 中心極限定理についての質問。 2012/07/21 22:06 リンドバーグ条件を持つ中心極限定理の証明について調べています。 わかる方教えてください。 お願いします。 みんなの回答 (1) 専門家の回答 質問者が選んだベストアンサー ベストアンサー MagicianKuma ベストアンサー率38% (135/348) 2012/07/22 10:14 回答No.1 以下など参考になるのでは 参考URL: http://www2.math.kyushu-u.ac.jp/~taniguch/paper/b_thesis_ishizaki.pdf 質問者 お礼 2012/07/22 15:39 ありがとうございます(=^0^=) 頑張ってみます(´∀`*) 通報する ありがとう 0 カテゴリ 学問・教育数学・算数 関連するQ&A 中心極限定理についての質問です。 c言語で標準正規乱数を発生させるために中心極限定理を使用することについての質問なのですが、 まず、一様乱数[0-1]を発生させる関数を混合合同法を用いて作成しました。 この一様乱数発生関数を用いて中心極限定理に基づき、標準正規乱数を発生させる関数を作成したいのですが、中心極限定理の具体的な使用方法がどうしてもわかりません。 どうかアドバイスをよろしくお願いします。 中心極限定理について 一言でいうと、中心極限定理はいかなるときに、どのように役立つのですか? 中心極限定理について 中心極限定理で理解できないところがあります。 多分、何か勘違いをしているところがあると思うので、分かる方は教えてください。 平均値 μ*,分散 σ2* をもつ,任意の分布に従う乱数列 x1,x2, … ,xnがあるとき,その平均値 ave(xn) = (x1+X2+・・・+xn)/n の確率分布は,n が大きくなるとき,平均値 μ*,分散 σ2* / n である正規分布に収束する。 すなわち, (ave(xn) - μ*)/(σ*/√n) は,n が大きいとき,平均値 0,分散 1 の標準正規分布に従うとみなしてよい。 はどうやって証明するのでしょうか? また、12個の乱数rand()を発生させた場合、分散は12*1/12=1になるようですが、これは中心極限定理から分散がσ2/nの正規分布に近づくという結果(こちらは1/12を12で割っている)に矛盾しているように思うのですが、どこが勘違いしているのでしょうか? よろしくお願い致します。 中心極限定理 統計学初心者で全然分かりません!! 中心極限定理(ベルヌーイの大数の法則)と標準誤差について説明してください。 分布と中心極限定理 あらゆる〇〇分布はサンプル数が増えると正規分布になるという中心極限定理を習いました。 (たとえポアソン分布) ではなぜ〇〇分布は〇〇分布と定義されるのですか? 全部の分布が中心極限定理に従うならすべての分布が正規分布と定義されるべきだと思うのですが その境はどこでしてるのですか? 中心極限定理をポアソン分布へ 中心極限定理をポアソン分布に応用した際に、e^(-n) * Σ (n^j)/(j!) をn->無限大 にしたら1/2似収束するという事実はわかるのですが、これは証明できるのでしょうか?もし、そうであれば証明のアドバイスをください。 中心極限定理について お世話になります。 統計学で出てくる中心極限定理について基本的なことをうかがいます。 定理の内容はおよそ「母集団が任意の確率分布を持っていても、そこから抽出した標本分布は標本数nが無限大に近づくにつれて正規分布に近づく」といったことだと思いますが、nを無限大にもっていくとき母集団に近づくのに(というか母集団を超えることも)、たとえば母集団が正規分布していない場合でもそれが正規分布に近づいていくというのは矛盾がある気がするのですが、どこが誤っているのでしょうか。 詳しい方ご教示願います。 中心極限の定理について質問があります. ビュフォンの針の実験を行いπの近似値の平均値をとったところ,πの近似値は 2.6667 , 2.7778 , 3.3333 , 2.963 , 2.7778となった.(それぞれ100回針を投げてπの近似値を求めている.)計算した所このπの近似値の平均は2.90372, 分散は0.05519, 標準偏差は0.23492となった.標準偏差を0.01以下にするには何本針を投げればよいかを中心極限の定理を利用して求めなさい.どうすればよいのか教えてもらえると助かります. 中心極限定理と分布について 中心極限定理により、不規則変数の加算によってできる不規則変数は、 平均値を中心に正規分布するようになるため z= y-6 は、平均:0、標準偏差:1の正規乱数となり、基本となる正規分布:N(0,1)と書く。 と書いてあるのですが、正規分布Nというのは山なりの感じの図でよろしいのでしょうか? 後これだけ見てz=y-6が平均0で標準偏差1というのもよくわかりません・・・ ノートを見てもzというのは書いてないのですが、数学関係でいう専門用語のzはなんでしょう。 また中心極限定理もよくわかりません、すいません・・・ チェビシェフの定理、大数の法則、中心極限定理の関係 チェビシェフの定理、大数の法則、中心極限定理の3つの用語によって、統計的推測の理論的骨子について説明するっていうのは、どうやって説明すれば良いのでしょうか?教えてください。とりあえず、数学が苦手なのですが2つの意味は調べました。でも、数式を使った説明は分かりません。 チェビシェフの定理 データの平均から離れるにしたがって、だんだん、滅多に起こらない現象の割合が増える。このことを表したのがチェビシェフの定理である。 大数の法則 ある確率を測るとき、試行回数を増やせば増やすほど、正確な確率に近づく法則を、大数の法則と言う。 中心極限定理 (説明の中に、正規分布などという、意味がわからない語句がたくさんあったので分かりませんでした) こんな感じで調べてみました。中心極限定理の意味も教えて欲しいです。 あと、チェビシェフの定理によって大数の法則が導かれ、大数の法則によって中心極限定理が導かれるのはどうしてですか? なんだか質問が多くなってしまって申し訳ありませんが、できたら教えてください。できるだけ、難しい語句や数式的なことは避けて説明していただきたいのですが、よろしくお願いいたします。 中心極限定理 実験 中心極限定理に、 『母集団分布の平均、分散をμ、σ^2とすると、その分布が何であっても、nが大きければ、 Sn=X1+X2+...+Xnは、N(nμ, nσ^2)に、 Xmean=(X1+X2+...+Xn)/nは、N(μ, (σ^2)/n)に、従う。』 とあります。 これを実証しようと、エクセルで乱数を作りました。 RAND関数なので、母集団の平均μ=0.5、σ^2=0.083です。 サンプル10,000個を作成しました。 その合計Sn=S10,000のデータを30件取り、平均、分散を求めました。 平均は 5001.608 となり、 中心極限定理通りn×μに近い値になりましたが、 分散は460程度となってしまいました。 定理によれば、830付近になるとのことですが、このズレはなぜ発生するのでしょうか? よろしくお願いします。 中心極限定理の証明 exp{ (t^2)/2 } 統計学入門で中心極限定理の証明を解いています。 添付画像をご覧ください。 証明の最後のところで exp{ (t^2)/2 }になる計算過程を教えて下さい。 eの展開式のxに(t^2)/2を入れてみたのですが、 何か違う方向に行っているようです…。 全体をn乗しているのをどう再現すればいいのかも分かりません。 どうか教えて下さい。お願いします。 PERT と中心極限定理 中心極限定理は、次のような定理だと思います。 平均μ、分散σ2の母集団から無作為にn個の標本を抽出してその平均値mを求めることを繰り返すと、母集団がどのような分布を示す集団であるかに拘わらず、nが充分大きいとき、mの分布は平均μ、分散σ2/nの正規分布で近似される。 次に、PERTにおいて、n個の作業から成るプロジェクトの全体工程Tを求める方法は、一般に次のように説明されています。 作業iの所用時間の期待値ei、楽観値oi、最可能値mi、悲観値pi、分散σi2の間には次の関係がある。 ei=(oi+4mi+pi)÷6 (式-1) σi2=(pi-oi)2÷36 (式-2) 一般に平均と分散については加法定理が成り立つので、クリティカルパス上のn個の作業の総所要時間(n個の作業の所要時間の合計)Tの期待値eと分散σ2は次のように表される。 e=Σei (式-3) σ2=Σσi2 (式-4) 中心極限定理により、Tは期待値e、分散σ2の正規分布で近似されるので、今、e=20、σ2=25であるとすると、・・・(と来て、Tの確率を求めるのですが、長くなるので以下省略します)。 ここで分からないのは、「中心極限定理により、Tは期待値e、分散σ2の正規分布で近似される」というところです。なぜ、いきなりこんなことが言えるのでしょうか。具体的に分からない点は次の(1)です。 (1)中心極限定理は、「平均μ、分散σ2の母集団から無作為にn個の標本を抽出してその平均値mを求めること」から始まる定理なのに、上記Tを求めた過程には、「平均μ、分散σ2の母集団」も「n個の標本の抽出」も「その平均値m」も、一切何もありません。一体これらは、上記Tにおいては、どこへ行ってしまったのでしょうか。 PERT と中心極限定理 2 中心極限定理は、次のような定理だと思います。 平均μ、分散σ2の母集団から無作為にn個の標本を抽出してその平均値mを求めることを繰り返すと、母集団がどのような分布を示す集団であるかに拘わらず、nが充分大きいとき、mの分布は平均μ、分散σ2/nの正規分布で近似される。 次に、PERTにおいて、n個の作業から成るプロジェクトの全体工程Tを求める方法は、一般に次のように説明されています。 作業iの所用時間がベータ分布に従うと仮定すると、その期待値ei、楽観値oi、最可能値mi、悲観値pi、分散σi2の間には次の関係がある。 ei=(oi+4mi+pi)÷6 (式-1) σi2=(pi-oi)2÷36 (式-2) 一般に平均と分散については加法定理が成り立つので、クリティカルパス上のn個の作業の総所要時間(n個の作業の所要時間の合計)Tの期待値eと分散σ2は次のように表される。 e=Σei (式-3) σ2=Σσi2 (式-4) 中心極限定理により、Tは期待値e、分散σ2の正規分布で近似されるので、今、e=20、σ2=25であるとすると、95%の確率でTが完了する工期は、標準正規分布表の95%点=1.960から、20-1.960×5≦T≦20+1.960×5となる。 それで、次の(1)、(2)が分かりません。 (1)中心極限定理は、「平均μ、分散σ2の母集団から無作為にn個の標本を抽出してその平均値mを求めること」から始まる定理なのに、上記Tを求めた過程には、「平均μ、分散σ2の母集団」も「n個の標本の抽出」も「その平均値m」も、一切何もありません。母集団、抽出、平均値にあたるものは、上記Tを求めた過程のどの値または計算なのでしょうか。 (2)「中心極限定理により、Tは期待値e、分散σ2の正規分布」とありますが、いったいどう考えればTを正規分布であるとみなせるのでしょうか。 中心極限定理 一様分布 平均値の意味 統計学からの疑問です。 以前も中心極限定理について質問したことがあったのですが、また疑問が発生しました。 中心極限定理は、母集団が何分布であれ、そこからサンプリングされた標本の平均値は正規分布に従って分布するということで、この定理があるからこそ色んな統計手法を使うことができますよね。 例えば、プレス機の設定荷重を5.0トンに設定し、実荷重を複数回測定するとします。 この場合、実荷重は、4.9トンとか5.1トンとか、誤差的にばらつきますよね。 なので複数回測定した実荷重の平均値=プレス機の実力であると言えると思います。 では母集団が一様分布、例えばサイコロの場合、 サイコロを2個以上振って出た目の平均値は3.5ですが、この値は一体何を意味してるのでしょうか?サイコロは3.5の目がもっともよく出るというわけはありませんし・・・ 中心極限定理を解説するために、サイコロを使った説明があり、 母集団が一様分布であっても中心極限定理がちゃんと現れることは確認できたのですが、 母集団が一様分布の場合の統計量(平均値)の意味がわかりません。 変な質問かもしれませんが、疑問を解決したいのでどなたか教えて下さい。 よろしくお願いします。 中心極限定理がわかりません 中心極限定理の解説を見ると、【サイコロの出目のような一様分布の母集団から、サンプルを複数抽出して、その平均値をプロットすることを繰り返すと、そのプロットは正規分布に近づく】などと記述されています。 正規分布に近づいていくことについてはわかるのですが、 実際生産現場などで、サンプルを抽出する場合、『複数のサンプルの平均値』を取得するようなことはしないので、一様分布なら一様分布のままだと思うのですが、どの書籍を見ても解説はここまでで、実際どういうことなのか理解できません。 どなたか解説していただけませんか? 有限母集団の中心極限定理 訳あって確率統計の勉強をしておりますが、中心極限定理について質問があります。 「母集団の平均をm、分散をvとすると、そこから抽出したn個の標本の平均の分布は、平均m、分散v/nという分布になり、標本数をn→無限大とすると、分布は母集団の分布によらず正規分布に近づく。」 とありますが、母集団が有限個(N個)の集合ならどうなるでしょうか。 その場合、標本数をnがNに等しくなった時点で平均はm、分散0、つまり標本から母集団の平均が完全に推定(決定)することになります。 ●有限母集団の場合も中心極限定理は成り立つのか? ●成り立つならn→Nで分散が0になるという点はどう表現されるのか? このあたりを教えてください。 中心極限定理を利用した問題 サイコロを1000回投げたとき, 1が160回以上出る確率の近似値を中心極限定理を用いて求めるとどれくらいになるのでしょうか。 とある本でこの問題を見て解いてみたのですが、解答がどうやら誤植みたいなのです。 i回目に1がでたとき、X_i = 1,1以外が出たときX_i=0とすると、 S_{1000}が1000回サイコロを投げたときの1が出た回数. ここで中心極限定理より, P( {S_{1000} - E[S_{1000}]} / √V[S_{1000}] > a ) = ∫_{a to ∞}1/√(2π) exp{- 1/2 x^2} dx ここではE[S_{1000}] = 1000/6, V[S_{1000}] = 5000/6 上の式の左辺の中身は S_{1000} > {1000 + a√(5000)} / 6 ここで解答では {1000 + a√(5000)} / 6 = 160 よりa= 0.57 よって1が160回以上でる確率は0.2843 (*N(0,1)の上側α点の値 0.57 - 0.2843 ) このようになっておりますが、明らかにここがまずいですよね. 正しくはa=-0.57となり求める確率は 1-0.2843で0.71くらいになるとおもうのですが、これであってますでしょうか。 中心極限定理の演習 一枚のコインをn回投げるとき、表の出る回数をXとする。 確立P(0.45≦X/n≦0.55)が0.9以上となるためには、 コインを何回投げれば良いか。 という問題について 中心極限定理によりこの二項分布は N~(np,np(1-p)) に近似でき、半数補正において (X-np-0.5)/√(np(1-p)) と標準化できる ここまではわかるのですが、この後に どう展開すればよいのかわかりません。 nが変数であるので標準正規分布表を用いようにも 値を求めることができません。 回答またはここまでの私の考え方に間違いがあるとお思いになる 方がいらっしゃったら是非ご指摘の方をよろしくお願いします。 中心極限定理とパレート分布 (1)所得はパレート分布もしくは対数正規分布をすると言われていますが、パレート分布においても、中心極限定理があてはまり、サンプリングを繰り返した時、正規分布するのでしょうか?もし、正規分布をするのであっても、母集団がパレート分布するはずの所得に対して、中心極限定理から導かれた分散、σ/√nを利用して所得の平均の信頼区間を推測することに違和感を感じます。大学の授業で先生が計算していました。 (2)所得の分布では、平均を見るよりも中央値の方が事実に近い結果を示すと言われていますが、平均(Σx_i/n)ではなく、期待値(Σx_i*P(X=x_i))で計算する方が、高額所得者に対しても低確率で重みづけられて、平均で計算するよりも妥当な値が得られそうなのですが、インターネットでも期待値で計算している例はありませんでした。統計学的に、このような計算をしない理由があれば教えてください。 初学者なので、間違いがあれば指摘していただけると幸いです。
お礼
ありがとうございます(=^0^=) 頑張ってみます(´∀`*)