• ベストアンサー

分散の加成性について

統計学を勉強している者ですが、分散の性質について、具体的なイメージがつかめないためか理解のできない問題の個所があるので質問させていただきます。 設問は以下です。 単位をgとして、 リンゴ1個の重さの期待値が200、分散が400、1gあたり3円 ミカン1個の重さの期待値が100、分散が100、1gあたり1円 バナナ1個の重さの期待値が150、分散が900、1gあたり2円 として、 1)リンゴ1個とミカン1個とバナナ1本を購入した時の値段の期待値と分散を求めよ。 2)リンゴ3個とミカン1個とバナナ2本を購入した時の総重量の期待値と分散を求めよ。 このとき、期待値はどちらもE[aX+b]=aE[X]+bの公式より、 3*200+1*100+2*150=1000 となりそうなのですが、分散に関してV[aX+b]=a^2V[X]の公式をどちらに適用したらいいのかがわかりません。確率変数が独立かそうでないかが関係していると思うのですが、この二問の違いと求め方について教えていただきたいのです。 基本的なことで申し訳ないのですが、重要な単元だと思いますので、しっかり理解したいと思います。どうかよろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kumipapa
  • ベストアンサー率55% (246/440)
回答No.2

1) の問題は、X, Y が独立な確率変数、a, b が定数のとき E [ aX + bY ] = a E [ X ] + b E [ Y ] V [ aX + bY ] = a^2 V [ X ] + b^2 V [ Y ] を利用 2) の問題は、1) に比べて確率変数の数が増えたけれど、定数が絡んでこない問題と考えることができます。 以下、リンゴ、ミカン、バナナ各1個の重さの平均を r, m, b、分散を (σr)^2, (σm)^2, (σb)^2 と表すことにします。 1) リンゴ1個とミカン1個とバナナ1本を購入した時の値段の期待値と分散 確率変数を、R : リンゴの重さ、M : ミカンの重さ、B : バナナの重さ、と定めてみましょう。リンゴとミカンとバナナの重さは互いに無関係であり、R, M, B は互いに独立。 さらに、確率変数 Xr, Xm, Xb を、Xr : リンゴの値段、Xm : ミカンの値段、Xb : バナナの値段と定めれば、Xr = 3 R, Xm = M, Xb = 2 B であり、R, M, B が独立であるから Xr, Xm, Xb も互いに独立。 値段の期待値と分散は E [ Xr + Xm + Xb ] = E [ 3 R + M + 2 B ] = 3 E [ R ] + E [ M ] + 2 E [ B ] = 3 r + m + 2 b V [ Xr + Xm + Xb ] = V [ 3 R + M + 2 B ] = 3^2 V [ R ] + V [ M ] + 2^2 V [ B ] = 3^2 (σr)^2 + (σm)^2 + 2^2 (σb)^2 説明がくどくなりましたが、こういうことです。 2) リンゴ3個とミカン1個とバナナ2本を購入した時の総重量の期待値と分散 今度は、総重量を確率変数 W で表して、W = 3 R + M + 2 B というようには表せませんね。リンゴが3個ならリンゴに関する確率変数は3つ、バナナが2本だからバナナに関する確率変数は2つ、とそれぞれちゃんと確率変数を用意して考えるのが良いでしょう。 R1, R2, R3 : 3個のリンゴそれぞれの重さ、M : ミカンの重さ、B1, B2 : 2本のバナナそれぞれの重さ、と確率変数を定めると、問題から察するに R1, R2, R3, M, B1, B2 はすべて互いに独立としてよいでしょう。また、 E [ R1 ] = E [ R2 ] = E [ R3 ] = r , V [ R1] = V [ R2 ] = V [ R3 ] = (σr)^2 E [ B1 ] = E [ B2 ] = b, V [ B1 ] = V [ B2 ] = (σb)^2 総重量は W = A1 + A2 + A3 + O + B1 + B2 なので、その期待値と分散は、 E [ W ] = E [ A1 + A2 + A3 + O + B1 + B2 ]    = E [ A1 ] + E [ A2 ] + E [ A3 ] + E [ O ] + E [ B1 ] + E [ B2 ]    = 3 r + m + 2 b V[W] = V [A1 + A2 + A3 + O + B1 + B2 ]    = V [ A1 ] + V [ A2 ] + V [ A3 ] + V [ O ] + V [ B1 ] + V [ B2 ]    = 3 (σr)^2 + (σm)^2 + 2 (σb)^2 これも説明がグダグダと長くなりましたが、丁寧に考えるとこういうことです。

OOOuniv
質問者

お礼

ご回答ありがとうございます。とても丁寧な解説をしてくださったおかげで理解することができました! 今まで、1)でXr = 3 R, Xm = M, Xb = 2 Bとすると、値段の合計がXr + Xm + 2X = 3R + M + 2Bと表せるのに対して、2)では総重量がR1 + R2 + R3 + M + B1 + B2と表されることの違いがわかりませんでした。 確かに、この問題のねらいはこの違いがわかるかだと思います。 また、このことの理解には何と何が独立なのかを明確にしないといけないと感じました。(今回の問題では、リンゴ、ミカン、バナナの重量(及び価格)が個体ごとに独立であるとうことですね) 独立は重要な概念だとは聞いていましたが、具体的に説明していただいたおかげで、また丁寧で噛み砕いた解説のおかげで私でも理解することができました。この度はありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • kumipapa
  • ベストアンサー率55% (246/440)
回答No.3

#2 です。回答の最後のほう、なにやら確率変数が変になっちゃってましたね。察して頂けたようですが、ごめんなさい。謹んで訂正。 総重量は W = R1 + R2 + R3 + M + B1 + B2 なので、その期待値と分散は、 E [ W ] = E [ R1 + R2 + R3 + M + B1 + B2 ]    = E [ R1 ] + E [ R2 ] + E [ R3 ] + E [ M ] + E [ B1 ] + E [ B2 ]    = 3 r + m + 2 b V[W] = V [R1 + R2 + R3 + M + B1 + B2 ]    = V [ R1 ] + V [ R2 ] + V [ R3 ] + V [ M ] + V [ B1 ] + V [ B2 ]    = 3 (σr)^2 + (σm)^2 + 2 (σb)^2 また、分かっておられるとは思いますが、誤解させたら申し訳ないので以下補足。 E [ aX + bY ] = a E [ X ] + b E [ Y ] は X, Y が独立でなくても常に成立。独立が問題なのは分散の方で V [ aX + bY ] = a^2 V [ X ] + b^2 V [ Y ] は X, Y が独立であるときに成立。独立でなければ共分散の項が出てきます。 > この問題のねらいはこの違いがわかるかだと思います。 多分そうなんでしょうね。

OOOuniv
質問者

お礼

ご丁寧に訂正していただき、ありがとうございます。確率変数は英語の頭文字だったので、すぐ理解できました。 共分散がCov(X,Y)= E[XY] - E[X]Y[Y]なので、X,Yが独立でなければ共分散の項が出てきてしまうということですね。 仰るように、このあたりを意識しないでいると、つい間違えてV[XY] = V[X]V[Y]などとしてしまいそうになります。 今回教えて頂いたことによって、確率変数をなんとなく使っていたということが明らかになり、イメージが持ちづらかった期待値、分散の加法性に実例をもって取り組むことができました。そして、とても解りやすい解説をしていただき、大変勉強になりました。この度は本当にありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。
  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

>どちらに適用したらいいのかがわかりません 適用すべきなのは 1)ですけど、どう説明すればいいものか。 とりあえず、答えは 1) V = 3^2*400 + 1^2*100 + 2^2*900 2) V = 3*400 + 1*100 + 2*300 なわけですが、計算式を見てなんとなく理解できますか?

OOOuniv
質問者

お礼

ご回答ありがとうございました。皆様のおかげで、理解することができました。 すぐに教えていただきたい時に、素早く教えていただけたので考えをかなりまとめやすくなりました。(それ以前は、答えすら間違っていましたので…。) 疑問について解決いたしましたので、回答を締め切らせていただきます。 この度は、お力添えしていただきありがとうございました。

OOOuniv
質問者

補足

ご回答ありがとうございます。何となく理解できたと思います。 教えていただく前は逆に考えていました。式を見て考えたのですが、 リンゴとミカンとバナナの確率変数をX1,X2,X3とすると、 1)は重量[1g]に応じて価格が3倍、1倍、2倍と変わるからV[3*X1+1*X2+2*X3] = 3^2*400 + 1^2*100 + 2^2*900=7300 2)は単純に重量のバラつきだから3*V[X1] + 1*V[X2] + 2*V[X2] = 3*400 + 1*100 + 2*300=1900 確率変数は取りえる値だから単位は[g]。 というような解釈でいいでしょうか。 お手数ですが、補足説明をよろしくお願いできますか?

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 分散…

    分散の数式を解きたいのですが… ある確率変数Xの期待値α=E(X)=∫-∞~∞xp(x)dxとします。p(x)は確率密度関数です。 Xの関数f(X)の期待値はE〔f(X)〕=∫-∞~∞f(x)p(x)dxであります。 Xの分散Var(X)はf(x)をf(x)=(x-α)^2としたものの期待値なので Var(X)=E(X-α)^2 を解くと,E(X^2)-α^2になります。 では,Var(aX+b)だとどう計算すればいいのでしょうか?a,bは定数です。E(aX+b-α)^2でいいのでしょうか? 答えはa^2Var(X)となっています。 また確率変数がX1,X2の2つで,各期待値がα,βとする時,Var(X1+X2) はどうでしょうか?E(X1-α)^2+E(X2-β)^2でしょうか? 答えは,Var(X1)+Var(X2)+2E〔(X1-α)(X2-β)〕となっています。 はじめの式で,合っているのか違っているのかわからない状態です… よろしくお願いします。

  • 平均と分散

    ある集合体Xの平均をα、分散をβとします。 Y=X+4 Z=3X  W=3X+4 V=W+Y (=4X+8) それぞれの平均と分散を求めなさい。という問題で Yの平均はα、分散はβ Zの平均は3α、分散は9β Wの平均は3α+4、分散は9β Vの平均は4α+8、分散は16β となるようなんです。 平均値の方は感覚で理解出来たのですが、分散の値が どうしてこうなるかわかりません。 分散に関して γの二乗=(aγ)の二乗という公式があるようなのですが どうしてこれが成り立つのかわかりません。 出来れば、平均値の方もうまく言葉で説明して 頂けると嬉しいです。 早く回答頂けるとほんとに助かります!

  • 数学を教えてください。

    数学を教えてください。 いくつか質問です。 *比と割合について (I) A:B=a:bのとき (1)A×b=B×a (2)A=ax,B=bx と二つの公式がありますよね。これらはどう見分けて使えばいいのですか? 例えば、 「4x=60」ならば(1)を使うのは分かります。 ですが、 「学生760人のうち男子学生と女子学生の比は5:3である。 女子学生は何人か。」 という問題では、 760×3/(5+3) または (760-x):x=5:3 と式を立てて解いていました。 それから、 「五角形の5つの角の大きさの比が2:3:4:5:6であるとき、最小角は何度か。」 という問題では、 540×2/(2+3+4+5+6) と式を立てていました。 これらは公式は関係なく、この計算の仕方を暗記するしか無いのかな?と思ったのですが、 「ある学年の男子と女子の人数の比は6:5で、その差は18人である。 この学年の人数を求めよ。」 という問題では公式の(2)を使っていて、こんがらがってしまいました。 「A君とB君の所持金の比は3:2であり、同じ製品を買うと、 A君は8000円余りB君は7000円足りなくなるという。 A君の所持金はいくらか。」 という問題も(2)の公式でした。 どんな問題が(1)or(2)なのか、はたまた公式ではなく別の解き方なのか…。 見分け方、覚え方を教えてください。 (II) 「みかんとりんごが1箱ずつある。AとB2人にみかんを1:2,りんごを2:1の割合で分けたところ、 各人の合計個数の比が2:3になった。最初にあったみかんとりんごの個数の比を求めろ。」 という問題で、 (x+2y):(2x+y)=2:3 という式は立てることは出来たのですが、最後に x=4y したがってa:b=4:1 となるようなのですが、そこが理解できませんでした。 x=4yからどうやって比を出したのでしょうか? *濃度について 「容器Aには濃度30%の砂糖水が200g、容器Bには濃度10%の砂糖水が400g入っている。 AからBに100g移し、よくかきまぜてからBからAに100g戻すとき、Aの濃度は何%になるか。」 解説を読んでも全くわかりませんでした…。 回答よろしくお願いしますm(_ _)m

  • エクセルで縦に並んだデータを横に並び替えたい

    エクセルで↓ のようなデータがあります  | A | B | C | D 1|A店|りんご| 2 | 2|A店|みかん| 3 | 3|A店|バナナ| 4 | 4|B店|りんご| 3 | 5|B店|バナナ| 2 | これを以下のようなかたちにしたいのですが、一つずつ移動する以外に方法はありますか?  | A | B | C | D | E | F | G | 1|A店|りんご| 2 |みかん| 3 |バナナ| 4 | 2|B店|りんご| 3 |バナナ| 2 | 100以上データがあり、手作業で移すのは大変です。 ちなみにVBAなどはほとんど理解できません。 何か解決策があればと質問させていただきたました。 よろしくお願いします。

  • 単回帰係数の分散の分布

    単回帰係数の分散は V(b^)=σ^2/Σ(xi-mean(x))^2 カイ2乗分布の比ですからF分布ですよね. それでは原点比例式の係数の分散 V(b^)=σ^2/Σxi^2 は何分布でしょうか. 分母が非心カイ2乗分布だから非心F分布でしょうか? また,この場合,V(b^)の 平均の期待値と 分散の期待値は何になるんでしょうか?

  • Excel 散布図

    下記のような表に対し、X軸:前年比、Y軸:売上とした分散図を出したいのですが、うまくできません。 売上、前年比がバラバラになり、8つのデータになってしまいます。     売上 前年比 りんご 13   6 みかん 22   2 ばなな  3   2 いちご 53   31 りんご、みかん、ばなな、いちご、それぞれを散布させるにはどうしたら良いのでしょうか。

  • 確率統計の分散についての質問です。

    英語の統計学の本の内容を授業で説明しなければならないのですが、理解できない個所がありました。 たくさんあるりんごの中からりんごを選んで重さを計る例についてです。 母集団を Y(整数に四捨五入されたみかんの重さ)=X(みかんの実際の重さ)+γ(Xを整数にするための量) 目盛りの単位をh(hは1グラム)で、 γは区間[-h/2, h/2]に一様分布しているものとします。 そして、Var[γ]=h^2/12、E[γ]=0と書いてあります。 次に Under quite wide assumption regarding the distribution of X,it(Xの分散) can be shown that とあり、 Var[Y]≒Var[X]+h^2/12   …(1) とあるのですが、「≒」が使われている理由が分かりません。 自分の考えでは V[Y] =V[X+γ] =E[((X+γ)-E[X+γ])^2] =E[(X-E[X])^2]+E[(γ-E[γ])^2]-2E[(X-E[X])(γ-E[γ])]   …(2) ここで、(2)式の1項目がVar[X]、2項目がVar[γ]=h^2/12であり、 γが一様分布なため確率変数Xとγが独立であり、3項目が0になると思うのですが、 その場合、(1)式の「≒」の説明がつきません。 統計学について詳しい方がいらっしゃれば、(1)式の「≒」の意味と私の間違いを指摘 していただけないでしょうか。 よろしくお願いいたします。

  • エクセル のマクロで 複数の表を1つにまとめたい

    エクセル のマクロで 複数の表を1つにまとめたい 下記のようなシートがあります。 Sheet1 A B C E F G I J K 1 日付  品名 数 日付  品名 数 日付  品名 数 2 1/1  みかん 100 1/2 りんご 50 1/1 バナナ 30 3 1/5  みかん 50 1/6 りんご 25 1/7 バナナ 20 4 1/10 みかん 30 1/11 りんご 15 1/10 バナナ 10 5 1/12 りんご 30 1/11 バナナ 10 6 1/13 りんご 50 みかん・りんご・バナナのそれぞれの表をマクロで下記のような1つの表ににまとめたいのですが どのようにしたら良いかご教授お願いいたします。 (初心者なので可能であればマクロ内で’コメント付きで解説いただけると助かります)  M N O 1 日付 品名 数 2 1/1 みかん 100 3 1/1 バナナ 30 4 1/5 みかん 50 5 1/6 りんご 25 6 1/7 バナナ 20 7 1/10 みかん 30 8 1/10 バナナ 10 9 1/11 りんご 15 10 1/11 バナナ 10 11 1/12 りんご 30 12 1/13 りんご 50 うまく説明できないのでイメージ画像を添付いたします。

  • エクセル 関数 範囲のタイトルを1つのセルに帰す

    こんなことをしたいのですが、関数でできますでしょうか?         りんご みかん ばなな   A子   2   1   0    りんご、みかん B子   0   0   1    ばなな、 C子   1   1   1    りんご、みかん、ばなな D子   0   0   0   E子   0   4   0    みかん ・ ・ X子 例のように、A子~X子までがそれぞれりんご、みかん、ばななを買ったとき、買ったものの名前だけを、それぞれの名前と同じ行で、1つのセルに表示したいのです。果物の種類は10個以下で、どんな順番に記入されてもかまいません。実際はX子以上にたくさんいます。 よろしくお願いします。

  • 平均値と分散について質問させてください

    タイトル通り、期待値と分散について質問させてください。 たとえば、 1,2,3,4,5 という集合があるとします。 これの平均値E(x)は E(x)=(1+2+3+4+5)/5=3 と出ると思います。 また、分散V(x)は V(x)=〔(1+4+9+16+25)/5〕-9=2 となると思います。 平均値3というのは、この集合の中心が3だなぁ、ということが分かるのです。 では分散2という数字。この2はどういう数字なのでしょうか・・・。 分散の意味は「ばらけ具合」というように覚えておりますが、実際数字としてでたときに、その数字が表す「ばらけ具合」はどれくらいのものか分からないのです・・・。 たとえば、特に数字の集合が与えておらず、分散=2です。といわれたときに、これはばらけてるなぁ~。とか、あまりばらけてないなぁ~。とか分かるものなのでしょうか? それとも、平均が3で分散が2とセットで分かったときに「ばらけ具合」が分かるものなのでしょうか・・・。 よろしければ回答をよろしくお願いいたします。

このQ&Aのポイント
  • ブラザー製品のDCP-J552N-ECOでパソコンとの無線接続ができない問題について解決方法をお伝えします。
  • DCP-J552N-ECOの単体では無線接続ができているが、印刷すると白い紙しか出てこない問題についても解決方法をご紹介します。
  • Windows10を使用している場合に限り、DCP-J552N-ECOとの無線接続が認識されない場合のトラブルシューティング方法をご案内します。
回答を見る