統計の平均と2乗の平均に関する質問

このQ&Aのポイント
  • 確率変数X_iはx_iと(1-x_i)の2値をとります。E[X_i]とE[X_i^2]を表すために使用できるのか質問です。
  • E[X_i] = 2E[x_i^2] - 2[x_i] + 1、E[X_i^2] = 3E[x_i^2] - 3[x_i] + 1という答えが得られましたが、それぞれについての違和感があります。
  • E[X_i]やE[X_i^2]の求め方について考える中で疑問が生じ、解答を求めています。
回答を見る
  • ベストアンサー

統計に関する質問です.

統計の平均と,2乗の平均に関する質問です. 独学で統計やってるため,統計の書き方が変かもしれないので, 変な部分があったら言ってください. 確率変数X_iはx_i と(1-x_i)の2値をとることができ,P(X_i == x_i) = x_i,P(X_i == 1-x_i) = 1-x_i とします. この時,E[x_i] ,E[x_i ^2] …が存在すると仮定できる場合,これらを用いてE[X_i]とE[X_i^2]を表すことは可能ですか? ちなみに,E[X_i]はX_i(i=0,1,…n-1)の平均を表すものとします. もしかしたら,E[(1/n)Σ_{i=0}^{n-1}X_i]が正しい表記なのかもしれないです. 紛らわしい書き方でごめんなさい. ちなみに,自力で解いてみたのですが, ・E[X_i] = 2E[x_i^2] - 2[x_i] + 1(特に理由なくほぼ直感で解いた) ・E[X_i^2] = E[-X_i(1-X_i)+X_i] =3E[x_i^2]-3[x_i]+1 となり,どちらも最大次数がE[x_i^2]なのが違和感を持っているのと, 途中式がどのように書いていいかわからないので, 回答をお願いします!

  • mttya
  • お礼率100% (5/5)

質問者が選んだベストアンサー

  • ベストアンサー
noname#181024
noname#181024
回答No.5

質問を解釈してみましたがこれで合ってますか? (記号を少し変えてあります。) (1) Q(小文字x_iに対応)というのが[0,1]上の確率変数。 (2) Q=qの時の確率変数X(大文字X_iに対応)の条件付き分布はP(X=q|Q=q)=q、P(X=1-q|Q=q)=1-q。 (3) このときX、X^2の(条件付きでない)期待値が知りたい。 しかしそうすると1つ疑問なのですが、Q=1/2のときのXの条件付き分布は(2)だけでは決まらないのでは。 もしP(Q=1/2)=0ならこれは問題にならず、 E(X)=E[E(X|Q)](E(X^2)=E[E(X^2|Q)])と書けるから、 E(X)=E(Q^2+(1-Q)^2)=2E(Q^2)-2E(Q)+1、 E(X^2)=E(Q^3+(1-Q)^3)=-E(Q^3)+2E(Q^2)-2E(Q)+1。 あとここまでの内容と関係ないですが、E(aX+bY)=aE(X)+bE(Y)は XとYが独立でなくても成り立つと思います。

mttya
質問者

お礼

すごいです,まさにこの通りです. こう書かれると本当に統計って感じします! 問題はもともと自分で作った(というより,ある問題をモデル化して考えたらこうなった)のですが, 自分でどうやって統計的に表記してよいのかわからなかったため, とても参考になりました. 回答者様の回答に理解がついていっていないのですが, 「Q=1/2のときのXの条件付き分布は(2)だけでは決まらない」 とあるのはこれは 「P(X=q|Q=q)=q、P(X=1-q|Q=q)=1-q」 の定義から,X は 1/2 の値しかとりえないのに,その確率が1/2となるからですか? こういう曖昧性が含まれる場合は基本的に未定義扱いされるのですか? あと, 「E(X^2)=E(Q^3+(1-Q)^3)=-E(Q^3)+2E(Q^2)-2E(Q)+1」 の式が自分の算出した式と少し違うみたいなので, よろしければ式変形等を 少しでも書いていただけるとありがたいです. 独立性は期待値の線形性とは関係なく, P(XY)=P(X)P(Y) のみでしたっけ? とりあえず,勉強不足が分かりました. 勉強しなおします.

その他の回答 (4)

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.4

なんか、問題が変わったみたいだけど… A No.3 補足の問題は、質問の問題と同じには見えません。 気を取り直して、新しいほうの質問に答えてみます。 X_i たちが、独立に X' の分布に従うのであれば、 前にも書いたように、独立分布に対する E の線型性 E[ aX_i + bX_j ] = a E[X_i] + b E[X_j] (i≠j) から、 E[ (1/n)Σ(X_i)^k ] = (1/n) Σ E[(X_i)^k] = (1/n) Σ E[(X')^k] = (1/n) n E[(X')^k] = E[(X')^k] です。 k = 1 のときは E[ (1/n)ΣX_i ] = E[X'], k = 2 のときは E[ (1/n)Σ(X_i)^2 ] = E[(X')^2] ですよ。 E[ (1/n)ΣX_i ] = 2E[X'] - 2E[X'] + 1 には、ちょっとなりそうにない。その式は、 A No.3 とも違うけれど、どこから出た式でしょうか? よく判らないけど、あるいは、分散の計算 V[ (1/n)ΣX_i ] = E[ { (1/n)ΣX_i - E[(1/n)ΣX_i] }^2 ] = E[ { (1/n)Σ(X_i - E[X']) }^2 ] = E[ (1/n^2)Σ(X_i - E[X'])^2 + (1/n^2)2Σ[i<j](X_i - E[X'])(X_j - E[X']) ] = (1/n^2) Σ E[ (X_i - E[X'])^2 ] + (2/n^2) Σ[i<j] E[ (X_i - E[X'])(X_i - E[X']) ] = (1/n^2) n E[ (X' - E[X'])^2 ] + (2/n^2) Σ[i<j] CoV[X_i.X_j] = (1/n) V[X'] + 0 あたりと、混同があるのかなあ?

mttya
質問者

お礼

本当に自分の頭の中で勝手に脳内変換された問題書いてしまって 申し訳ありませんでした. また自分のミスがあり,その式には 「^2」が抜けてました. 本当に何度もすいません... 自分の中では以下のように解釈してたのですが,間違ってますか? E[X_i] = {x_i * x_i + (1-x_i) * (1-x_i)} = {x_i^2+(1-x_i)^2} = 2x_i^2 -2x_i +1 E[1/nΣX_i]=(1/n)E[X_0 + X_1 + …] =(1/n)Σ 2x_i^2 -2x_i +1 =2E[X'^2] - 2E[X'] + 1 えっと,とりあえず,おそらく私の感覚だと この問題の場合,ΣX_i = X’ ではないので 回答者様のような結果にはならないと思っていたのですが... できれば, (1/n) Σ E[(X_i)^k]= (1/n) Σ E[(X')^k] の部分について詳しく教えてください. 自分では納得したつもりでしたが,間違えてる可能性が出てきたため 掲示板の締切も延長したいと思います.

mttya
質問者

補足

誤解されている点が分かりました. 本当に日本語能力がなくて申し訳ありません. もう一度,自分が意図している問題を頑張って書きます. ある確率変数X’が存在して,確率密度関数(または確率関数)が定義されてるとします. この確率変数に従う乱数によりn個の数を生成します. これをx_0,x_1,....,x_n-1とします. これらの数値x_0,x_1,...を基にして,確率変数X_0,X_1,...を定義します. このときのX_iの定義が,P(X_i=x_i)=x_i,P(X_i=1-x_i)=1-x_i となります. (この最後の文が抜けていました.) この時,E[X'],E[X'^2],E[X'^3]...が与えられていると仮定した場合,これらを用いて E[X_i]とE[X_i^2]が求めることはできますか?という問題です No.5様が私の意図している問題をちゃんとした数学的な表記で 書かれていると思うので,そちらを参考にしていただいた方が早いかもしれません.

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.3

個々の X_i の確率分布が何であるかよりも、 添字の異なる X_i と X_j (i≠j) が独立であるかどうかが大切。 独立であれば、E(X_i + X_j) = E(X_i) + E(X_j) だから、 E((1/n)ΣX_i) = (1/n)ΣE(X_i) = (1/n)Σx_i となる。 独立でなければ、X_i たちの結合確率分布についての情報が必要になる。

mttya
質問者

お礼

事象としては独立だと思います. No1さまの回答欄にも書いたんですが, 自己の再確認の意味を含めてもう一度書いておきます. ある確率変数X’が存在して,確率密度関数(または確率関数)が定義されてるとします. この確率変数に従う乱数によりn個の数を生成します. これをx_0,x_1,....,x_n-1とします. これらの数値x_0,x_1,...を基にして,確率変数X_0,X_1,...を定義します. この時,E[X'],E[X'^2],E[X'^3]...が与えられていると仮定した場合,これらを用いて E[X_i]とE[X_i^2]が求めることはできますか?という問題です. ちなみに,質問文のE[x_i]はE[X']の意味合いで用いています. 誤表記申し訳ありません. この場合は独立だと思っていたので,同時確率密度関数は算出していなかったのですが, 大丈夫でしょうか? また,alice_44様の意見だと結局E[X']を用いて表すと, E[(1/n)ΣX_i]=2E[X']-2E[X']+1 という解釈でよろしいでしょうか?

mttya
質問者

補足

もともとは,x_iは単なる数字ではなく,確率変数のように用いたつもりだったのですが, たとえそうだとしても,質問文みたいな表記はないということが分かり,勉強になりました. 問題の再定義は補足欄に書いた通りです. とりあえず,回答者様たちの意見を元に考えてみた場合, 元々の質問文に書いた回答であっているという見解になりました. 今から1日後に回答を閉め切ろうと思います. 間違い等あればご指摘ください! ご回答ありがとうございました!!

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

X_i の確率分布に関する「平均」と 添字 i による算術的な「平均」が ゴッチャにされており、何がしたいのか よく解らない。

mttya
質問者

お礼

質問者です. 回答ありがとうございます. とりあえず,私の中では確率変数X_0,X_1,... (同一の分布に従うとは限らない)が存在して, それらすべての確率変数の平均?がE[X_i]のつもりです. そしてそれらの2乗和の平均がE[X_i^2]のつもりで使っています. とりあえず書き方が分からないのですが,これであっていますか? 勉強不足で申し訳ないです.

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

とりあえず、記法は『ものすごく』変です。。 >確率変数X_iはx_i と(1-x_i)の2値をとることができ,P(X_i == x_i) = x_i,P(X_i == 1-x_i) = 1-x_i とします. >この時,E[x_i] ,E[x_i ^2] …が存在すると仮定できる場合,これらを用いてE[X_i]とE[X_i^2]を表すことは可能ですか? まず、確率変数はX_iであって、x_iは単なる数字ですから、E[x_i]ではなくて、E[X_i]です。そして、0≦x_i≦1 とすれば、定義から E[X_i] = x_i^2 + (1-x_i)^2 E[X_i^2] = x_i^3 + (1-x_i)^3 と簡単に計算できます。(当然、存在します) このとき、 E[(1/n)Σ_{i=0}^{n-1}X_i] = (1/n)Σ_{i=0}^{n-1} E[X_i] = (1/n)Σ_{i=0}^{n-1} {x_i^2 + (1-x_i)^2} です。

mttya
質問者

お礼

もともとは,x_iは単なる数字ではなく,確率変数のように用いたつもりだったのですが, たとえそうだとしても,質問文みたいな表記はないということが分かり,勉強になりました. 問題の再定義は補足欄に書いた通りです. とりあえず,回答者様たちの意見を元に考えてみた場合, 元々の質問文に書いた回答であっているという見解になりました. 今から1日後に回答を閉め切ろうと思います. 間違い等あればご指摘ください! ご回答ありがとうございました!!

mttya
質問者

補足

回答ありがとうございます. 自分でもどう書けばいいのかわからないのですが, ある確率変数X’の実測値?としてx_i が存在します. そして,その実測値に対応するX_i を考えている...といったところでしょうか. 例えば,ある分布に従う確率変数X'が存在するとします. その確率変数を何回か計測?して,実数値x_0,x_1,....,x_nが得られたとします. その計測された実測値に対して,質問文の確率変数X_0,X_1,...を考えます. その時,そのすべての確率変数X_iの和の平均(または2乗和の平均)は元のX'の平均等を用いて表せますか?という質問です. なので,質問のE[x_i]はE[X']と同義で用いていると解釈していただけたら多分大丈夫です. これで書き方があってるのかよくわかりませんが,よろしくお願いします.. 誤表記申し訳ありませんでした.

関連するQ&A

  • 統計学について

    統計学の問題です。平均はできたのですが、分散ができなくて困っています。解答、解説をどうかよろしくお願いします。問題は以下です。 確率変数X、Yは独立で、それらの平均と分散はE(X)=μ1、E(Y)=μ2、V(X)=σ1、V(Y)=σ2であるとする。εはベルヌーイ分布Ber(p)に従う確率変数であり、X、Yとは独立であるとする。そのとき、確率変数Z=εX+(1-ε)Yの平均と分散を求めよ。 ちなみに、答えは、E(Z)=pμ1+(1-p)μ2、V(Z)=pσ1+(1-p)σ2+p(1-p)(μ1-μ2)^2 です。

  • 確率・統計について少し質問です。お願いします><

    確率・統計について少し質問です。お願いします>< 指数分布についてなんですが、 E(x)=1/λ で P(0<=x<=4)=? の?を求めたいのですが、途中までできて f(x)=λe^-λx で P(0<=x<=4)=∫0→4( xλe^-λx )dx ここまでの式はたつのですがこの後積分をどのように解法していったらいいのかわかりません。 できたらできるだけ詳しく教えてください。 お願いします>< ^は何乗かを表します。例えば^2だったら二乗という意味です。 0→4は積分範囲です。 もし途中までの式が間違っていたらそこも指摘をお願いします><

  • 統計学について質問です。

    統計学で質問があります。自分でやってみたのですが、答えと一致しませんでした。どうか、解答、解説をよろしくお願いします。 問題:確率変数Xが正規分布N(5,4)に従うとき,Xが母平均μから3以上離れる確立P(|X-μ|>=3)を求めよ。 教科書の解答:0.134

  • 統計学

    統計学についての質問です。 平均u(ミュウ)、分散σ^2(シグマの2乗)の正規母集団から大きさ4の無作為標本の平均(標本平均)をX(Xバーのこと)とするとき、  確率P(|X(Xバー)-u|<σ)の値を求めよ。 まったく分からないので誰か助けてください・・・。

  • 統計の質問です

    n=3、平均μ、分散σ^2=1の正規母集団から無作為抽出 1. 期待値E(∑(x_i-x.bar)^2)=? 2. E(∑(x_i-μ)^2)=? 3. E(x.bar-μ)^2)=?/? 4.n(x.bar-μ)^2は自由度?のx^2分布にしたがう どうやって解けばいいのでしょう?解き方も知りたいです。 よろしくお願いします。

  • 確率・統計について少し質問です。お願いします><

    確率・統計について少し質問です。お願いします>< 指数分布についてなんですが、 E(x)=1/λ で P(0<=x<=4)=? の?を求めたいのですが、途中までできて f(x)=λe^-λx で P(0<=x<=4)=∫0→4( λe^-λx )dx 置換積分法をつかい -λx=t -λ=dt/dx dx=dt/-λ と置き 積分範囲が t 0→-4λ に変わり代入して ∫ 0→-4λ λ・e^t・dt/-λ となりλが消えて ∫ 0→-4λ -e^t dt -[e^t]0→-4λ -(e^-4λ-1) =-e^-4λ+1 となると思うのですがこの後はどうしたら良いのでしょうか??さっぱりです。 教えて下さい>< ^は何乗かを表します。例えば^2だったら二乗という意味です。 0→4は積分範囲です。 もし途中までの式が間違っていたらそこも指摘をお願いします><

  • 確率・統計について少し質問です。お願いします><

    確率・統計について少し質問です。お願いします>< 指数分布についてなんですが、 E(x)=1/λ で P(0<=x<=4)=? の?を求めたいのですが、途中までできて f(x)=λe^-λx で P(0<=x<=4)=∫0→4( λe^-λx )dx 置換積分法をつかい -λx=t -λ=dt/dx dx=dt/-λ と置き 積分範囲が t 0→-4λ に変わり代入して ∫ 0→-4λ λ・e^t・dt/-λ となりλが消えて ∫ 0→-4λ -e^t dt -[e^t]0→-4λ -(e^-4λ-1) =-e^-4λ+1 となると思うのですがこの後はどうしたら良いのでしょうか??さっぱりです。 教えて下さい>< ^は何乗かを表します。例えば^2だったら二乗という意味です。 0→4は積分範囲です。 もし途中までの式が間違っていたらそこも指摘をお願いします><

  • 統計学を教えて

    次の問題に苦しんでいます。教えてくれると助かります。 確率変数X.Yは独立で、それらの平均と分散は、E(X)=μ1、E(Y)=μ2、V(X)=σ1^2、V(Y)=σ2^2 であるとする。εはベルヌーイ分布Ber(p)に従う確率変数であり、X.Yとは独立であるとする。そのとき、確率変数Z=εX+(1-ε)Yの平均と分散を求めよ。 出来れば、解説もしてもらえると助かります。

  • サイコロのある目が出る確率に関する検定(数理統計)

    サイコロのある目が出る確率に関する検定(数理統計) 現在、数理統計学を独学で勉強していますが、以下のところで 詰まっています。詳しい方のご回答お待ちしております。 サイコロをn回振るとする. p_i を i の目が出る確率としたとき, 帰無仮説 H_0 : p_i = 1/6 , 有意水準εで検定する方法を教えてください。 χ2乗分布に従う統計量をとり、それを使い棄却域を設定するようですがどのような統計量を取れば良いのか分かりません。 解説をみると, 以下のようになっています. (n=120のとき.) i の目がでた回数を f_i (i=1,...,6) としたとき 統計量T = Σ_{i} {(f_i-20)^2 /20} は自由度5のχ2乗分布に従う. この統計量Tが自由度5のχ^2分布に従う根拠はどうなっているのでしょうか。 (うまく確率密度関数を計算できません.) また一般にn回サイコロを振るとすると T= Σ_{i} {(f_i - (n/6))^2 / (n/6)} は自由度 5 のχ2乗分布に従うのでしょうか。 よろしくお願い致します。

  • 確率統計

    ◆ 確率分布とパラメータ:指数分布 λ>0 確率・確率密度関数P(X=x)またはPx(x):{Px(x)=λe^(-λx) (x>0) , Px(x)=0 (その他)} 特性関数 φx(jt):(1-jt/λ)^(-1) 平均値 E[X]:1/λ 分散 Var[X]:1/(λ^2) ◆ 確率分布とパラメータ:幾何分布 0<p<1 確率・確率密度関数P(X=x)またはPx(x):Px(X=x)=pq^x, x=1,2,・・・ q=1-p 特性関数 φx(jt):p/(1-qe^(jt)) 平均値 E[X]:q/p 分散 Var[X]:q/(p^2) ◆ 確率分布とパラメータ:負の2項分布 r=1,2,・・・, 0<p<1 確率・確率密度関数P(X=x)またはPx(x):Px(X=x)=【r+x-1,x】(p^r)(q^x) , x=0,1,2,・・・ q=1-p 特性関数 φx(jt):{p/1-qe^(jt)}^r 平均値 E[X]:rq/p 分散 Var[X]:rq/p^2 これらの確率分布について、(1)連続確率変数と離散確率変数のどちらか、(2)全体の確率P(-∞<X<∞)=1となることを計算せよ、(3)これらの確率変数について、平均E(X)と分散 V(x)が求められることを計算せよ。 ってところがわかりません。よろしくお願いします。