• 締切済み

【確率・統計】X1 ≦ X2 ≦ X3 となる確率

分布関数 F(x)、密度関数 f(x) という分布に独立に従う確率変数 X をサンプルしていったとき、 サンプル取得順に X1 ≦ X2 ≦ X3 と増加していったときの X3 の分布は どのように求めれば良いのでしょうか? 「順に(時間的に)増加」という概念があるので、単純な最大値分布にはならないとは思うのですが、 どう求めれば良いのかわかりません。 本を御提示いただくだけでも構いませんので、 御教授お願いいたします。

  • icann
  • お礼率42% (3/7)

みんなの回答

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.7

ANo.6の続きです。 3 G(z, x)の考え方でI(z)を計算 G(z, x)の分母、分子をそれぞれxでならして、I(z)を計算できます。Xの実現値をξ(グザイ)で表すことにします。   I(z) = Pr(Z≦z| X<Y<Z)= Pr(Z≦z, X<Y<Z) / Pr(X<Y<Z)   = ∫[-∞ to z]Pr(Z≦z, ξ<Y<Z)f(ξ)dξ / ∫[-∞ to z]Pr(ξ<Y<Z)f(ξ)dξ です。なお、ここで、I(z)は、G(z, x)そのものをxで積分して∫[-∞ to z] G(z,ξ)f(ξ)dξとするのでなく、分子、分母それぞれを積分していることに注意してください。 3.1 分子の計算 1.1により、   分子 = ∫[-∞ to z] {(1/2)(F(z)-F(ξ))^2}f(ξ)dξ です。B(ξ) = (-1/6) (F(z)-F(ξ))^3 と置けば、{(1/2)(F(z)-F(ξ))^2}f(ξ) = (d/dζ)B(ζ) ですから、分子は、次のように計算されます。   分子 = B(z) - B(-∞) = (1/6)F(z)^3 3.2 分母の計算 分母は、分子の式でz = ∞と置けばいいので、   分母 = B(∞) - B(-∞) = 1/6 です。 3.3 結論 以上により、   I(z) = 分子 / 分母 = F(z)^3 です。 4 H(z, x)の考え方でI(z)を計算 H(z, x)の分母、分子をそれぞれxでならして、I(z)を計算できます。   I(z) = Pr(Z≦z| X <Z, Y<Z)= Pr(Z≦z, X <Z, Y<Z) / Pr(X <Z, Y<Z)   = ∫[-∞ to z] Pr(Z≦z, ξ<Z, Y<Z)f(ξ)dξ / ∫[-∞ to z] Pr(ξ<Z, Y<Z) f(ξ)dξ 4.1 分子の計算 2.1により、   分子 = ∫[-∞ to z] {(1/2)( F(z)^2 - F(x)^2)}f(ξ)dξ です。C(ξ) = (1/2) F(ξ)F(z)^2 - (1/6)F(ξ)^3 と置けば、{(1/2)( F(z)^2 - F(x)^2)}f(ξ) = (d/dζ)C(ζ) ですから、分子は、次のように計算されます。   分子 = C(z) - C(-∞) = (1/3)F(z)^3 4.2 分母の計算 分母は、分子の式でz = ∞と置けばいいので、   分母 = C(∞) - C(-∞) = 1/3 です。 4.3 結論 以上により、   I(z) = 分子 / 分母 = F(z)^3 です。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.6

1 G(z, x)=Pr(Z≦z|X=x, X<Y<Z)の計算   Pr(Z≦z|X=x, X<Y<Z)= Pr(Z≦z|x<Y<Z)   = Pr(Z≦z, x<Y<Z) / Pr(x<Y<Z) です。そこで、分子、分母をそれぞれ計算します。 1.1 分子の計算 z≦xのときPr(Z≦z|x<Y<Z)=0となるのは明らかなので、z>xの場合を考えます。以下、Yの実現値をη(イータ)、Zの実現値をζ(ゼータ)で表すことにします。   分子 = Pr(Z≦z, x<Y<Z)=∫[x to z]{∫[x to ζ]f(η)dη}f(ζ)dζ   =∫[x to z]{F(ζ)-F(x)}f(ζ)dζ です。A(ζ)=(-1/2) (F(ζ)-F(x))^2とすれば、{F(ζ)-F(x)}f(ζ)=(d/dζ)A(ζ) ですから、分子は、次のように計算されます。   分子 = A(z)-A(x)=(1/2)(F(z)-F(x))^2 1.2 分母の計算   分母 = Pr(x<Y<Z)=∫[x to ∞]{∫[x to ζ]f(η)dη}f(ζ)dζ   =∫[x to ∞]{F(ζ)-F(x)}f(ζ)dζ です。よって、上と同じA(ζ)を使って、分母は、次のように計算されます。   分母 = A(∞)-A(x)=(1/2)(1-F(x))^2 すなわち、分母は、分子の式で、z=∞として計算できます。 1.3 結論 以上により、z>xのとき、   Pr(Z≦z|X=x, X<Y<Z) = 分子 / 分母 = (F(z)-F(x))^2 / (1-F(x))^2 です。 2 H(z, x) = Pr(Z≦z|X=x, X< Z, Y<Z)の計算   Pr(Z≦z|X=x, X< Z, Y<Z)= Pr(Z≦z|x< Z, Y<Z)   = Pr(Z≦z, x< Z, Y<Z) / Pr(x< Z, Y<Z) です。そこで、分子、分母をそれぞれ計算します。 2.1 分子の計算 z≦xのときPr(Z≦z, x< Z, Y<Z)=0となるのは明らかなので、z>xの場合を考えます。 分子 = Pr(Z≦z, x< Z, Y<Z)です。   Yがx以下のとき「Z≦z, x< Z, Y<Z ⇔ x< Z」   Yがxより大きいとき「Z≦z, x< Z, Y<Z ⇔ Y< Z」 ですから、これらで場合分けして、次のようになります。 分子 =  ∫[-∞ to x]{∫[x to z]f(ζ)dζ}f(η)dη     + ∫[x to z]{∫[η to z]f(ζ)dζ}f(η)dη   = ∫[-∞ to x]{F(z)-F(x)}f(η)dη + ∫[x to z]{F(z)-F(η)}f(η)dη   = (F(z)-F(x))∫[-∞ to x] f(η)dη + (A(z)-A(x))   = (F(z)-F(x))F(x) + (1/2) (F(z)-F(x))^2   =(1/2)( F(z)^2 - F(x)^2) 2.2 分母の計算 分母は、分子の式でz=∞と置けばいいので、   分母 =(1/2)( 1 - F(x)^2) です。 2.3 結論 以上により、z>xのとき、   Pr(Z≦z|X=x, X< Z, Y<Z) = 分子 / 分母    = (F(z)^2 - F(x)^2) / (1 - F(x)^2) です。 (続く)

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.5

失礼。ANo.4で計算間違いがありました。下図が正しいと思います。

icann
質問者

お礼

お返事が遅くなってしまい大変申し訳ございませんでした。 御回答ありがとうございます。 御提示いただいた確率の式を上から順に G(z, x), H(z, x), I(z) とおいたとき、G(z, x), H(z, x) はどのように導出すれば良いのでしょうか。 また G(z, x), H(z, x) のそれぞれを x で積分すれば I(z) と一致すると思うのですが、そういう認識で良いのでしょうか。 そもそも私には x 積分をどう実行すれば良いのかわかりませんが、G と H の積分結果が一致してかつ I になるとは思えないのです。 お手数おかけしますが、お暇なときにでも御回答いただければ幸いです。 よろしくお願いいたします。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.4

私の計算では、次のようになりました。X1=X, X2=Y, X3=Zと書きます。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.3

ANo.1です。追加のご質問にお答えします。 1 標準正規分布のケースについて A 「初期値 X1 が 5 だった場合、その実現確率はかなり小さく、X1 ≦ X2 となる確率もかなり小さくなり、さらにX2 ≦ X3 となる確率も恐ろしく小さくなる」 ⇒ この部分は正しいと思います。 B 「求めたい確率は初期値 X1 の実現確率によらず、単にサンプル取得数(質問文では 3)にのみ依存することになり」 ⇒ この部分は間違いだと思います。次のCのように言い換えれば、正しくなります。 C 「求めたい確率は、単にサンプル取得数(質問文では 3)にのみ依存することになり」 「初期値 X1 の実現確率によらず」という言葉が入っているかどうかが、分かれ目です。Φの定義には、X1の初期値の条件が含まれていないことを確認してください。実現値では、X1=5のときもあれば、X1=-100のときもあるでしょう。X1のいろいろな初期値でならしたX3の分布が、Φなのです。 次のように言えば、納得していただけるでしょうか。  Φ’=「X1=5かつ X1 ≦ X2 ≦ X3という条件付きのX3の分布」  Ψ’=「X1=5かつX1, X2,X3の最大値がX3という条件付きのX3の分布」 とすれば、Φ’≠Ψ’です。Φ’≠Φ、Ψ’≠Ψでもあります。 2 さいころのケースについて まず、断っておきますが、ANo.2で説明をさぼった部分があります。それは、Pr(X1=X2)=0、すなわち、X1=X2となる確率が0であることを前提としていることです。ご質問の中に「密度関数 f(x)」という記述があったので、密度関数が存在すると解釈して、上のことが当然成立すると考えた次第です。 そこで、以下、X1とX2が同じ目にならない、という前提で説明します。ついでに、話を簡単にするため、さいころの目は、4, 5, 6の3種類しかないものとし、どれも等確率で出るものとします。 ΦとΨを実際に求めてみましょう。それぞれの分布関数をG(x)、H(x)とします:  G(x)=Pr(X3≦x | X1≦X2≦X3)  H(x)= Pr(X3≦x | X1≦X3, X2≦X3) まず、G(x)を調べます。X1≦X2≦X3となるパターンは、(4,5,5)、(4,5,6)、(4,6,6)、(5,6,6)の4種類です。X3≦4となるパターンが0個、X3≦5となるパターンが1個、X3≦6となるパターンが4個ですから、G(4)=0/4=0、G(5)=1/4、G(6)=4/4=1です。 次に、H(x)を調べます。X1≦X3, X2≦X3となるパターンは、(4,5,5)、(4,5,6)、(4,6,6)、(5,6,6)、 (5,4,5)、(5,4,6)、(6,4,6)、(6,5,6)の8種類です。X3≦4となるパターンが0個、X3≦5となるパターンが2個、X3≦6となるパターンが8個ですから、H(4)=0/8=0、H(5)=2/8=1/4、G(6)=8/8=1です。 以上により、G(x)=H(x) が分かり、したがって、Φ=Ψが分かります。

icann
質問者

お礼

御回答ありがとうございます。 私の質問文が不適切だったのかもしれません。 私の知りたいのは、ご指摘いただいたΦ’、 すなわち他のご指摘も踏まえて等号を消してしまえば 「X1 = x1 かつ X1 < X2 < X3という条件付きのX3の分布」 のことです。数式的に書けば Pr ( X3 ≦ x | X1 = x1 and X1 < X2 < X3 ) となることと思います。私の知りたいのはこの確率です。 申し訳ありません。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.2

ANo.1です。 題意を読み違えていたかも知れないので、もう1つ補足します。  Φ=「X1 ≦ X2 ≦ X3という条件付きのX3の分布」  Ψ=「X1, X2,X3の最大値がX3という条件付きのX3の分布」 としたとき、ΦとΨは違うのではないか、というのがご質問の趣旨だとすれば、答は「いいえ」です。つまり、Φ=Ψ、すなわち、Φは、「単純な最大値分布」です。 これは、  「X1, X2, X3の最大値がX3」 ⇔ 「X1 ≦ X2 ≦ X3またはX2 ≦ X1 ≦ X3」 ということと、  「X1 ≦ X2 ≦ X3という条件付きのX3の分布」と、「X2 ≦ X1 ≦ X3という条件付きのX3の分布」が等しい ということを使って証明できます。

icann
質問者

お礼

>ΦとΨは違うのではないか、というのがご質問の趣旨だとすれば、 御回答ありがとうございます。 はい、それが質問の趣旨といって間違いありません。 しかしΦ=Ψであるということにあまり納得できませんでした。 たとえば X が標準正規分布に従うとして定性的に考えると、 初期値 X1 が 5 だった場合、その実現確率はかなり小さく、 X1 ≦ X2 となる確率もかなり小さくなり、さらに X2 ≦ X3 となる確率も恐ろしく小さくなることは明らかだと思います。 しかし御提示いただいた考え方を適用すると、求めたい確率は 初期値 X1 の実現確率によらず、 単にサンプル取得数(質問文では 3)にのみ依存することになり、 予想に反すると思います。 また御提示いただいた 「X1, X2, X3の最大値がX3」 ⇔ 「X1 ≦ X2 ≦ X3またはX2 ≦ X1 ≦ X3」 はもちろん理解できますが、これをサイコロで言い換えてみると、 (1回目,2回目,3回目)=(4,5,6) となる確率を求めたいのに、おおざっぱに言って (4,5,6)または(5,4,6)となる確率を求めるは、最大値が6となる確率を求めれば良い といっているだけで、別の確率を求めようとしていることになると思うのですが、それで良いのでしょうか。 お忙しい中、余暇を費やしての御教授ありがとうございます。 よろしければまた御回答いただければ幸いです。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

(1)X1,X2,X3の分布関数がF(x) (2)X1,X2,X3が独立 という条件だけで、X1,X2,X3の結合分布は一意的に決定されます。したがって   Φ=「X1 ≦ X2 ≦ X3という条件付きのX3の分布」 も(1)と(2)で一意的に決定されます。上のΦは、X1,X2,X3が時間の順に並んでいるかどうかに無関係です。 本ということですが、例えば下のようなスタンダードな教科書で「分布」の定義を調べ、分布が何によって決定されるかをチェックすると分かると思います。 伊藤清「確率論」(1953年)岩波書店

関連するQ&A

  • 確率・統計の問題です

    以下の問題の解答をお願いします。 連続確率変数Xの累積分布関数はFx(x) = P{X≦x}で与えられる。区間[0, 1]で定義された、二つの独立な確率変数X1, X2の累積分布関数Fx1(x), Fx2(x)が図で与えられるとき、以下の問いに答えよ。 Y=X1+X2とおくと、Yの累積分布関数Fy(y)はX1,X2の結合密度関数f12(x1, x2)を用いて Fy(y) = ∫[-∞→∞] ∫[-∞→y-x1] f12(x1, x2)dx2dx1 で与えられる。このことを利用してYの確率密度関数fy(y)を求め図示せよ。

  • 統計学での確率変数Xと観測値xの使い分けについて

    全く別物だと思うのですが、理解できなくて質問いたします。 確率変数Xは、その値をとる確率が決まっている変数であり、 観測値xは、ただ実際に出現した値、であることは理解しています。 確率密度関数では横軸が確率変数であり、Pr(X)の値が縦軸である、というのがわかりやすかったです(以下ブログを参考)。 https://bellcurve.jp/statistics/blog/14006.html 1)しかし、この考えでは次のブログのことを理解できませんでした。 http://igakubugakushi.com/ctl1/ 互いに独立であり、同一分布に従う確率変数X1、、、Xnとあります。1つの確率密度関数には、複数の観測値xを決まった確率で取りうる確率変数Xが1つある理解でした。1つの確率密度関数に複数の独立の確率変数があるというのはどういうことでしょうか。 2) また、同じブログの「母集団が正規分布だった場合」 http://igakubugakushi.com/interval-estimation1/ X1~N(μ、σ²)  : Xn~N(μ、σ²)とすると、正規分布の再生性により、 x1~+xn~N(nμ,nσ²) よって、x⁻(観測値xの平均)~N(μ,σ²/2) との記述があります。複数の確率密度関数が同じ正規分布に従っている、のは一先ずおいておくとして、そのあとの正規分布を再生する観測値x1~xnは、どの確率分布から出てきたものなのでしょうか? 3)また、2)で出てきた、x1~+xn~N(nμ,nσ²) → x⁻(観測値xの平均)~N(μ,σ²/2) になるのはなぜでしょうか?x⁻~N(μ、σ²)ではないですか?(nで全てを割るのであれば) ただのブログの書き間違えなのか、私がよくわかっていないのかわからず、解説いただきたいです。

  • f(x1,x2)=12x1x2(1-x2) (0<x1<1,0<x2<1の時)0 (その他の時)における確率変数X1とX2が独立である

    [問]同時確率密度関数f(x1,x2)= 12x1x2(1-x2) (0<x1<1,0<x2<1の時) 0 (その他の時) における確率変数X1とX2が独立である事を示せ。 が示せず困っています。 どのようにして示せますでしょうか? 一応,定義は下記の通り,調べてみました。 確率空間(Ω,F,P)(Fはσ集合体,(F上の関数)Pを確率とする) そしてΩからR^dへの写像を確率ベクトルという。 この確率空間(Ω,F,P)と別の集合Sがある時,Sの値をとるΩの上の確率変数Xが与えら れた時, B_X:={E⊂S;X^-1(E)∈F}とすると新しい確率空間(S,B_X,P_X)が得られる。 このP_Xを確率分布といい,特にXがX=(X1,X2)という確率ベクトルになっている時, P_XをX1,X2の同時分布という。 独立とは∀A1,A2∈Fに於いて,P(X1∈A1,X2∈A2)=P(X1∈A1)P(X2∈A2)が成り立つ事で ある。 「確率分布関数 f(x,y)において、 f1(x)=∫[-∞,∞]f(x,y) dy f2(y)=∫[-∞,∞]f(x,y) dx と定義すると、確率変数x,yが独立であることの必要十分条件は f(x,y)=f1(x)f2(y)」 と思いますので f1(x1)=∫[-∞~∞]12x1x2(1-x2)dx2 =∫[-∞~∞](12x1x2-12x1x2^2)dx2 =[6x1x2^2-4x1x2^3]^∞_-∞ f2(x2)=∫[-∞~∞]12x1x2(1-x2)dx1 =∫[-∞~∞](12x1x2-12x1x2^2)dx2 =[6x1^2x2-6x1^2x2^2]^∞_-∞ と求めましたがこれから先に進めません。どのようにすればいいのでしょうか?

  • 確率統計

    確率変数X,Yは独立同分布で一様分布U(0,1)に従うとする。 このときX+Yの密度関数h(x)を求めよ。 ただしXとYの密度関数f(x)は f(x)=1(0 <_ x <_ 1), 0 (otherwise) h(x)=∫(-∞→∞)f(x-y)f(y)dy なのですがh(x)をとくさいにf(x-y)っていうのはどうあらわすんですか? あといまいちどうかいとうすればいいかもわかりません ご指導お願いします

  • 確率の問題が解けません。

    次の3問が分かりません。何方か解ける方がいらっしゃったら解説をよろしくお願いします。 [1] 確率密度関数f(x)が f(x) ={c(1 - x ²)} (lxl≤1のとき)                  ={ 0 } (lxl>1のとき) と与えられている。  1)規格化定数cの値を求めよ。  2)分布関数F(x)を求めよ。 [2]確率変数X₁、X₂、X₃が互いに独立で、標準正規分布N(0,1)に従うとき、確率      Pr{0 ≤ (X₁+X₂+X₃)/ 3 ≤ 0.5} を求めよ。 [3]確率変数X、Yは独立で、それぞれ自由度4のχ²分布、自由度6のχ²分布に従うとき、             Pr( X ≥λY )=0.05 となるλを求めよ。

  • 確率・統計の問題です。

    以下の問題の解答をお願いします。 確率変数Xの確率密度関数f(x)が図のように与えられているとする。 確率密度関数f(x)の分布に従う標本が2個得られたとき、それらの値の合計が1/3以下となる確率を求めよ。

  • 最大値統計量の密度関数?

    統計の問題ができずに困っています。 問題 確率変数X1、X2が独立で、同じ密度関数f(x;θ)=3x^2/θ^3をもつとする。ただし、θ>0で0<x<θとする。 このとき、最大値統計量 Y=max{X1、X2} の確率密度関数を求めよ。 考え方がわからず、確率分布を微分すれば求められるかなと思い、確率分布を出そうとしてみました。が、、、 P(Y=y)=P(X1=y、X2<=y)+P(X1<y、X2=y)      =P(X1=y)P(X2<=y)+P(X1<y)P(X2=y)      =…      =6y^5/θ^6 と出ましたが、この先どうすればよいのかわからず行き詰まってしまいました。。。 この問題の考え方を教えていただきたいです。

  • 確率変数の変換について(2つの確率変数の和)

    毎々お世話になっております. このたびは,2変数の確率変数の変換について質問させていただきます. [問] X1およびX2はi.i.d.でそれぞれ[0,1]の区間で一様に分布している. Y=X1+X2の確率密度関数を求めなさい. 上記の問いに関してですが, X1,X2の密度関数はf(xi)=1 for 0<=Xi<=1 i=1,2 であり, 同時確率はf(x1,x2)=1 for 0<=x<=1 であるというところまでは分かりました. また,X1=Y-Z,X2=Zとすることで,ヤコビヤンJ=1であるというとろこまではできました. しかし,これ以降,どのように考えれば良いのかが分かりません. 直感的に,X1とX2が一様に分布しているために,Y=X1+X2は0<=y<=2の範囲に分布し, y=1のときにg(y)が最大になるのであろうと考えられ, g(y)=y for 0<=y<=1 g(y)=2-y for 1<y<=2 1という確率密度関数になるであろうことは分かります. このような考え方が正しいかどうかも含めて,この問題の解法をご教示いただけないでしょうか? 何卒よろしくお願いいたします.

  • 統計学での確率変数Xと観測値xの使い分けについて2

    確率変数は数量が対応付けられていてある数値になる確率が決まっている変数、と理解しています。確率変数X~N(μ,σ²)ならば、確率変数Xは横軸にあたり、ある変数になる確率が縦軸で表されていて、すなわち、μを平均値として分散σ²の正規分布になる、というイメージでした。また最近、確率変数がX1、X2、、、Xnと存在することがあり、これは同じ確率密度関数から複数回施行して、1回目をX1、二回目をX2にする等すれば有りうるようです(確率変数Xを分解している?)。 以下質問です。次のサイトの、「解放の手順」についてが主な質問です。 http://igakubugakushi.com/mean-difference-t-test1/ 1)②に、正規分布の再生性より確率変数の和X1+X2+、、、+Xn~N(nμ、nσ²)よって、X⁻(確率変数の平均)~N(μ、σ²/n) と記述があります。これは間違っていませんか?正規分布の再生性とは、母集団から一度抽出しているサンプルx1~xnも、正規分布になりますよ、ということですよね。スモールエックス ̄~N(μ、σ²/n)ではないですか? 2)もしくは、同じ②に、 正規母集団N(μ、σ²)から無作為に得られた標本 n 個をX1、X2、X3…Xnのように定めると、正規分布の再生性より確率変数の和 X1+⋯+Xn は N(nμ, nσ21) に従う。 とありますが、X1、X2は標本値と定義するのであれば、そのあとの確率変数の和、という記述はおかしくないですか?ラージエックスは確率変数では既にないと思うのですが。 3)同じページに問題1があり、標本平均X⁻=64.2、とあります。標本平均とあるので、この場合問題ないのですが、なぜスモールエックスで書かないのですか?統計学ではよくあるのですか?単なる間違いですか?

  • 確率密度関数を求める問題

    確率変数X1,X2が独立で区間[0, 1]における一様分布に従うとき, 確率変数T = max{X1, X2}の確率密度関数fT(t)を求めよ. という問題があるのですが,どのように考え出せばいいのかわかりません. T = X1 + X2といった形式ならわかるのですが,maxとなるとどうすればいいんでしょうか? どのような方針で解いていけばいいのか教えてください.