• ベストアンサー

重みつき最小二乗法

Yiに重みWiがあるとき、Y=aXに対して線形回帰を行うと、正規方程式より a = [WXY]/[WX^2] となるとおもうのですが、このときaの分散はどうなりますか? また、Xが正規分布に従うとき、c/Xはどのような分布に従うのでしょうか?やはり正規分布のような気はしているのですが・・・ よろしくおねがいします。

noname#112755
noname#112755

質問者が選んだベストアンサー

  • ベストアンサー
  • at9_am
  • ベストアンサー率40% (1540/3760)
回答No.2

#1です。 1) WY = aWX です。 分散不均一の時、この手法を用います。Y=Xb+u というモデルで E[ui^2]≠E[uj]の時、Wi=1/σiを考えればE[Wi ui] = E[Wj uj] となり分散は均一になります。 したがってvi=Wiui、yi=WiXi、xi=WiXiとおけば、yi=a xi + viは一般的な仮定をみたすので最小自乗法が使える、ということになります。これを行列にまとめ、誤差項を省いたものが y = a WX になります。 2) 正しいです。ただし、行列P,Qがあったとして、PQ≠QP ですので、P(Q)^(-1)かQ^(-1)Pか分からなくなるため P/Q とは書きません。 3) すいません。ここのところ、前回ちょっと書き間違えです。加重の所を書き忘れていました。導出は↓です。 a が縦ベクトルだとすれば、元々のモデル(理論モデル)は Y=Xa+u と書けます。 今、uが分散が不均一な誤差項であり v = Wu とおけば E[vv'] = σ^2 I であるとすれば、(WY=)y=WXa+vとすれば通常の最小自乗法が使えます。ここで最小自乗推定値 a~は a~= (X'WWX)^(-1)X'Wy = (X'WWX)^(-1)X'W(WXa+v) ←y=WXa+v を代入 = (X'WWX)^(-1)X'WWXa + (X'WWX)^(-1)X'Wv ←括弧内を展開 = a + (X'WWX)^(-1)X'Wv ←(X'WWX)^(-1)X'WWXを約分 なので var(a~)= E[(a~-a)(a~-a)'] = E[(X'WWX)^(-1) X'W vv' WX(X'WWX)^(-1)] = (X'WWX)^(-1) X'W E[vv'] WX(X'WWX)^(-1) = σ^2 (X'WWX)^(-1) X'WWX (X'WWX)^(-1) = σ^2 (X'WWX)^(-1) となります。 ∴var(a~)= σ^2 (X'WWX)^(-1) こういうことに詳しい教科書、といえば、例えばGreene "Econometric Analysis"ですとかでしょうか。 私は経済学が専門なので、経済学部でよく用いられている教科書です。和書でもあると思いますが、私は余り詳しくないので...。

その他の回答 (1)

  • at9_am
  • ベストアンサー率40% (1540/3760)
回答No.1

Yi に重み Wi がある場合、W=diag(Wi) を考えて y=WY とおき、y = a WX というモデルを考えます。ここで diag(Wi) とは対角要素が Wi でその他が0の正方行列です。 すると、正規方程式より最小自乗推定量a~は a~=(X'WWX)^(-1)・(X'Wy) となります。 a~の分散は、a~の期待値が a になりますから var(a~)=E[(a~-a)(a~-a)']=σ^2 (X'X)^(-1) になります。ここで誤差項の分散σ^2 は、残差ベクトル e=y-y~= y-a~X からの推定値 s^2 = e'e/(n-k) を求めます。ただし、n はデータの数、k は独立変数(説明変数)の数(rank(X))です。 ここで a がスカラーだとすれば、 a~=Σ(XiWi^2Yi)/Σ(Xi^2 Wi^2) と書き表すことができます。また分散は ei = yi-a~WiXi として var(a~)=Σei^2/((n-1)ΣXi^2) と書き表すことができます。 > Xが正規分布に従うとき、c/Xはどのような分布に従うのでしょうか? cは定数で、Xは分母に来ているのですよね。この場合、正規分布にはなりません。計算していませんが、分布に名前も付いていない、面倒くさい関数になります。

noname#112755
質問者

補足

ごめんなさい、よく理解できません。 一応確認で、Wi=1/σi^2 です。Xiは分散ゼロです。不明点: 1) y = WY = a WX で結局Y=aXになってしまうのでは?Y=aWXでしょうか。 2)確認で、正規方程式は∂(y-aWX)'(y-aWX)/∂a で、計算より、a~ = X'WY/X'WWX でよいでしょうか。 3)var(a~)=E[(a~-a)(a~-a)'] = σ^2 (X'X)^(-1)がどう導出したか、よくわかりません。 できれば、行列を用いた数理統計学の良書をご存知でしたら教えてください、絶対的に知識不足なようなので。わがままいうようですが、よろしくおねがいします。

関連するQ&A

  • 最小二乗法において

    y=ax^2+bx=c とおいたとき、最小自乗法から a,b,cの値を求めるには?という問題で、 S=Σ(yi-(axi^2 + bxi + c))^2 とおき、 ∂S/∂a=-2Σxi^2(yi-(axi^2 + bxi + c)) ∂S/∂b=-2Σxi(yi-(axi^2 + bxi + c)) ∂S/∂c=-2Σ(yi-(axi^2 + bxi + c)) となり、 aΣxi^4 + bΣxi^3 + cΣxi^2 = Σxi^2yi aΣxi^3 + bΣxi^2 + cΣxi = Σxiyi aΣxi^2 + bΣxi + cΣ = Σyi というとこまでは出来たのですが、ここから先と誤差の求め方がわかりません。 初心者なので出来ればわかりやすく教えて下さい。

  • 最小二乗法について

    xは操作条件で、yは実験結果のプロットに対して、 最小二乗法でy=ax+bという回帰直線を引きました。 すると、aとbでは、aのほうが信頼性があるというのですが、 これはどういうことなのでしょうか?

  • 最小二乗平面

    ある複数の空間座標(x1,y1,z1)~(xn,yn,zn)(nは3以上)から、平面近似式である最小二乗平面の方程式を求める関数を作ろうと考えています。 平面方程式はz=ax+by+c(a,b,cが定数)であらわされ、引数を座標と座標個数n、戻り値をa,b,cにします。 ここ(http://oshiete1.goo.ne.jp/qa2802443.html)を参考に 最小二乗平面の連立方程式を解くコードを書いたのですが、 どうも答えが合いません。どなたかご教授願えないでしょうか? 開発環境はC++Builder2007です。 ↓の数式をコードにしましたが、コードが間違っているのか、 数式自体がダメなのかさっぱりわかりません。 //与えられるn個の3次元座標(xi,yi,zi)から平面方程式を求める //平面方程式:z = ax + by + c //最小二乗平面を求める連立方程式は下記のようになる。 // aΣxi^2 + bΣxiyi + cΣxi = Σxizi // aΣxiyi + bΣyi^2 + cΣyi = Σyizi // aΣxi + bΣyi + cn = Σzi //これを行列で解く // |Σxi^2 Σxiyi Σxi | |a| = |Σxizi| // |Σxiyi Σyi^2 Σyi | |b| = |Σyizi| // |Σxi Σyi n | |c| = |Σzi | //ここで // |Σxi^2 Σxiyi Σxi | // A = |Σxiyi Σyi^2 Σyi | // |Σxi Σyi n | // // |Σxizi| // B = |Σyizi| // |Σzi | // // |a| // C = |b| // |c| // //とすると // // C = B・A^-1 // //で求めることができる

  • 最小2乗

    (1) (x,y)=(-3,4),(-2,1),(-1,0),(0,-1),(1,1),(2,2),(3,3)を 方程式 y = ax^2 + bx + c で最小2乗法に当てはめたときの a,b,cを求める (2) 要素(x,y,z)=(1,3,2),(2,1,1),(3,2,4),(4,5,3),(5,4,5)が z = ax + by + p とモデル化されるとき、残差の2乗Σp^2 が 最小になるように定式化して、最小となるa,bを求める という問題です。 これらを行列を用いて解きたいのですが、どのようにすればよいか分かりません。よろしくお願いします。

  • 最小二乗法

    n組のデータ (xi, yi) を,特定点(X0, Y0) を通る直線 y = ax+b でフィッティングしたい。最小二乗法で係数a,bを求めるため の式を導きなさい。 という問題で 各データの残差を二乗した和が最小になるときのa,bを求めるのですが 特定点(X0,Y0)を通るにはどうすればよいでしょうか? ただ単に、特定点を通らずフィッティングするやりかたはわかるのですが・・・。 よろしくお願いします。

  • 遂次最小二乗法について

    遂次最小二乗法についてです。 y=a*x+b*dx+c というように 微分dxが入る場合も2次方程式の場合と同様にして解けるのでしょうか。 未知パラメータベクトルθを(a b c) データベクトルXを(x dx 1)としてy=θXを考え 共分散行列Pを3×3の行列として解けばいいのでしょうか。 どなたか教えていただけると幸いです。 よろしくお願いします。

  • 最小二乗法の分散の求め方

    http://oshiete1.goo.ne.jp/qa3077638.htmlに関連しての質問です。 例えば、y=Xβ+εに関して最小二乗解を求めると b = [ nΣ(xi yi) - (Σxi) (Σyi)]/[ nΣ(xi^2) - (Σxi)^2 ] となります。ここから分散を求めるためにはどうすればよいのでしょうか?教科書を引っ張ってみると求め方の行列の式しか書いていなくいまいちピンときません(確かに計算すれば正しい結果を得られるようですが)。具体的にこの式だけを使って分散を求めるということはできないのですか?

  • 統計学: 尤度推定量、最小二乗法

    統計学なのですが、悩んでいるところは 微分の極値問題 なので 微分ができる方にも アドバイスをお願いしたいです。 さて、問題ですが L = - Σ(i=1->n)(Yi - θ*Xi)^2/(2*σ^2) - (n/2)ln(2*π*σ^2) を最大化するθ,σ^2を求め、 そのθとσ^2がLを最大化していることを示せ。という問題です。  ただし X1,X2,...,Xn と Y1,Y2,...,Yn は定数扱い。 また θ>= 0 , n は自然数,σ^2 > 0 です。 もとは 統計学の問題で 線形回帰モデル  Yi = θ*Xi + εi ,εi は 正規分布 N(0,σ^2) に従う。 を考えたとき θとσ^2の最尤推定量を求め、その推定量が尤度を最大化していることを証明せよ。 という問題で (対数)尤度L を計算すると L = - Σ(i=1->n)(Yi - θ*Xi)^2/(2*σ^2) - (n/2)ln(2*π*σ^2) となり、 あとは極値問題を解くだけというところから 分からなりました。 この先、私が考えたのは ∂L/∂(σ^2) =0 かつ ∂L/∂θ =0 を満たす θ,σ^2 を求めること(grad(L)を導出) 前者は  σ^2 = Σ(Yi-θ*Xi)^2 /n 後者は  Σ(Yi-θ* Xi)*Xi = 0 という 形に変形できたのですが、 後者の式をこれ以上 くずせませんでした。 ここでアドバイスがほしいのです。 統計、もしくは解析ができる方、アドバイスをいただけないでしょうか。 文が長くなってしまいましたが、よろしくお願いします。

  • 東工大 物理問題 教えて 最小二乗法

    y=ax xを変えながら測定を行い、N組の測定値xi,yiを得た 最小二乗法を用いてaの最確値を表す式を求めよ x、yの各測定における測定誤差は等しいとする

  • 最小二乗法 行列

    現在以下のページを参考に最小二乗法の勉強をしています。 誤差の二乗ノルムを求めるときに、  || e || ^2 = e*e = (y-Ax)*(y-Ax) = (y*-x*A*)(y-Ax) = y*y - y*Ax -x*A*y + x*A*Ax  (1) この次に        = y*y - 2y*Ax + x*A*Ax と変形できるのはなぜなんでしょうか? (1)の第3項目 x*A*y が第2項目と等しくなる過程が分かりません。 後、次の二乗ノルムを微分する過程も良くわかりません。 すみませんが、よろしくお願いします。 http://www.star.t.u-tokyo.ac.jp/~kaji/leastsquare/leastsquare_main.htm