複素ベクトルの微分、最小二乗誤差法

このQ&Aのポイント
  • 複素ベクトルの微分、最小二乗誤差法を用いて評価関数を最小にする値を求めようとしています。
  • 複素ベクトルで構成された式を微分する際、なぜかベクトルの共役をとって微分していました。
  • これには何かメリットがあるのでしょうか?なぜ共役をとって微分するのかが分かりません。
回答を見る
  • ベストアンサー

複素ベクトルの微分、最小二乗誤差法(MMSE) 

最小二乗誤差法を用いて評価関数を最小にする値を求めようとしています。 この評価関数が複素ベクトルと複素行列で構成されているので微分できずに困っています。 何冊か本を読んだのですが、この複素ベクトルで構成された式を微分する際、なぜかベクトルの共役をとって微分していました。 なぜ共役をとって微分するのかが全く分かりません。 どなたか知っている人がいらっしゃいましたらよろしくお願いします。 例:J=w'Rw-w'r-r'w ・・・(1) J:評価関数 w:ウエイトベクトル R:行列 r:ベクトル ':複素共役転置 この(1)を最小にするようなwは、 Jをwで微分してその値が0という条件を使うと思います。 しかし大抵の本のやり方はwの共役で微分していました。ここが分かりません。何かメリットでもあるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

メリットというほどのことはありません。wで偏微分してもw'で偏微分しても全く同じ結果が得られます。簡単のため1複素変数で  J=w'Rw-w'r-r'w J:評価関数、w:複素変数、R:実数 ':複素共役 を考えてみましょう。w'で偏微分した場合は  ∂J/∂w' = Rw - r = 0 より w = r/R wで偏微分した場合は  ∂J/∂w = Rw' - r' = 0 より w' = r'/R 複素共役をとって w = r/R つまり全く同じです。強いて言えばw'で偏微分するとwの方程式が得られるのに対し、wで偏微分するとw'の方程式になり、wを得るためには共役を取らなければならないことがw'で偏微分するメリットです。 さてここで問題です。wとw'は共役の関係にあります。それなのにwとw'は独立変数であるように見なして  ∂(w'Rw)/∂w = Rw' , ∂w'/∂w = 0 として良いのでしょうか? 結論を言うとこれで良いのです。その理由はwの実部と虚部は独立にとれることがwとw'は独立変数と見なせることに対応しているのです。分かりにくいにも拘わらず本には説明していないことがいくつかありますが、これはその一つだと思います。

corneli
質問者

お礼

大変めちゃくちゃ分かりやすいご回答本当にありがとうございました! 本にも書いてなく行き詰まっていたのでほんとうにうれしいです。 あの、そこでさらに質問したいのですが、最後の >>その理由はwの実部と虚部は独立にとれることがwとw'は独立変数と見なせることに対応しているのです。 というところがいまいちピンとこなかったのですが、 これはwの実部と虚部が独立なので、wとw’は独立な実部、虚部をもつ変数であるといえるということでしょうか? 書き方が悪くて伝わりにくいかもしれませんが、よろしければ教えていただきたいです。 よろしくお願いいたします。

その他の回答 (1)

回答No.2

二つの実変数x, y の函数 f(x,y) が最小になる点は  ∂f/∂x = 0 かつ ∂f/∂y = 0  …(1) という条件から求められます。ここで  w = x + iy、 w' = x - iy とおくと微分についての変数変換の公式より  ∂f/∂x = (∂f/w)(∂w/∂x) + (∂f/w')(∂w'/∂x)  = (∂f/w) + (∂f/w')  ∂f/∂y = (∂f/w)(∂w/∂y) + (∂f/w')(∂w'/∂y)  = i[(∂f/w) - (∂f/w')] よって条件(1)は  ∂f/∂w = 0 かつ ∂f/∂w' = 0 と同値になります。こうして偏微分する段階ではwとw'は独立変数であるように見なして良いのです。もう一つ付け加えることがあります。それは f が実であるときは∂f/∂w = 0 と∂f/∂w' = 0 は同値になることです。こうして元は(1)の様にして最小を求める問題が、∂f/∂w' = 0 で置き換えられているのです。

corneli
質問者

お礼

ありがとうございました! ばっちり謎が解けました。 こういうことだったんですね・・・ 本にもこのくらい詳しく書いて欲しかったです。 本当にありがとうございました!!

関連するQ&A

  • 複素微分について

     複素関数   f(z) = u(x,y) + iv(x,y) ・・・・・ u≠0、v≠0 は、2つの実数関数 u と v の組で表されるので、実数で微分したり積分したりすることはできると思いますが、   g(z) = u(x,y) ・・・・・ v = 0   h(z) = iv(x,y) ・・・・・ u = 0 は C-R の方程式を満たさないから、h や g を複素数で微分することは不可能なのですよね?  つまり、実関数を複素関数の一部と見なしても、実関数を複素数で微分することはできないと考えてよいかということです。  あんまり当たり前のことなのか(笑)、私が持っている2つの複素関数の本にはその類いの説明はありません。

  • 最小二乗法について

    最小二乗法では二乗和の誤差 Σ[i=1~n]{Yi-(α+βXi )}^2 (iは添え字です) を最小化するα,βを推定することを考えますが、 これは単純にα,βで偏微分してそれを0とおいて 連立方程式を解くだけでよいのですか? といいますのも、2変数関数の極値を求める場合、 Hessianを計算して判別しますよね? ただ一階偏導関数が0になるからといって、 そこで極値をとるとは限らない気がしたので… それとも最小二乗法の場合は必ずとるようになっているのでしょうか? 手元の本には、 「この二乗和は非負値なので、αとβで偏微分したものを0とするα,βが上式を最小にする値である」 とあるのですが、一般に非負値だとこの ようなことが言えるのでしょうか?

  • 複素関数の微分について

    かなり乱暴な質問だと思いますが、回答をよろしくお願いします。 複素関数f(z)がz。において微分可能であることを示すときに 「zがあらゆる方向からz。に近づいてきても ((f(z)-f(z。))/(z-z。)がある値に近づく」 というくだりがよくわかりません。 2変数関数の偏微分みたいに、方向によって値が違っていても いいような気がしますが、複素関数では同じになるのでしょうか? それとも同じになる時に限って微分可能と定義付けるのでしょうか?

  • 一般化逆行列と最小二乗法

    最小二乗法は割と簡単に理解することができますし、式の誘導も簡単ですが、分数が出てきたら分母がゼロでないとか、逆行列が存在するとか理想的な条件を仮定しているように思います。そこでその理想的な条件が存在しない場合、すなわち逆行列が存在しない場合、”一般化逆行列を用いて計算する”とサラリと書いてある本がありました。データ解析ソフトRなどもそれに対応しているかもしれません。一般化逆行列というのはすんなり受け入れられるものでしょうか。何か別の指標があってそれを最小化するとか何らかのペナルティとか損失を甘受した上で計算していると思うのですが、いきなりピンチヒッターとして出てくることができるみたいに書いてありました。数理統計の本には共線性がある場合とか行列式が極めて小さな値になるとかの場合に出てくるようです。少し読んでみると固有値・固有ベクトル(正規直交行列を構成)で行列を展開したもののような記述もあり、これはこれで普通のことのように思うのですが。一般化逆行列とはどのようなものだと思えばいいでしょうか。

  • ベクトルによる微分

    (1) あるスカラー a(1×1) をベクトルb (k×1) で微分するときに  ※( )内は行列のサイズです※ da/db = [da/db_1, da/db_2,....da/db_k]' というように一階の導関数ベクトルができますが、講義資料によりますと、このときの導関数ベクトル(正式な呼び名は知りませんが)のサイズは、bと同じ、つまり (k×1)の列ベクトルになるとなっています(上野表記に転置記号をつけたのはそのためです)。 (1×k)の行ベクトルにしないことに理由はあるのでしょうか? それともbに合わせると決まっているだけと考えてよいのでしょうか? (2) また、(n×1)のベクトルaを、(k×1)のベクトルbで微分することを考えた場合に、 da/db は (n×k)で定義されることについてはどうでしょうか? これも決まりと思って良いのでしょうか? (3) 最後に、(n×m)の行列Aを(k×1)のベクトルbで微分する、というような場合に、どのようなサイズのどのような行列になりますか? またはそもそもそういうことを考えますか?

  • 遂次最小二乗法について

    遂次最小二乗法についてです。 y=a*x+b*dx+c というように 微分dxが入る場合も2次方程式の場合と同様にして解けるのでしょうか。 未知パラメータベクトルθを(a b c) データベクトルXを(x dx 1)としてy=θXを考え 共分散行列Pを3×3の行列として解けばいいのでしょうか。 どなたか教えていただけると幸いです。 よろしくお願いします。

  • 逆行列の行列による微分

    今、あるシステムを構成したく行列方程式を解こうとしているのですが、行き詰ってしまったので質問させていただきます。 YとAを5×1行列、Bを5×3行列、Xをスカラ、Wを5×5行列、Hを3×1行列,B'はBの共役転置行列として、 Y = (A+BH)X・・・(1) H = -inv(B'WB)B'WA・・・(2) とします。 ((2)を(1)に代入した状態で)Y'Y=Jとおいて、∂J/∂W=0となるようなWを求めようとしているのですが、逆行列の行列による微分などが出てきてしまい、まったくわからなくなってしまいました。 これは解けるのでしょうか? 行列をvec関数を使ってベクトルになおしてみたりしたのですがinv()の部分がわからなくて・・・。 逆行列の行列による微分さえわかれば何とかなるような気もするのですが・・・。 解けるとすればどのようになるのでしょうか? 解法のヒントや参考になるページなどありましたら紹介していただきたいです。

  • ベクトルの微分について

    ●関数の微分値は、 {f(t+Δt)-f(t)}/Δt におけるΔtを 0でない値をとりながら 正側と負側の両側から0に近づけて(Δt→±0)、 極限値が+0の場合も、-0の場合も同じ値となることで、 微分値として正しいと確認しました。 ●ベクトルを微分する場合、正側から近づけた場合と 負側から近づけた場合で、 ベクトルの方向が正反対になってしまいます。 ベクトル微分は(定義も含め)どのように 考えれば宜しいのでしょうか。 ご回答、宜しくお願い致します。

  • ベクトルの微分と積分についてです.

    ベクトルの微分と積分についてです.よろしくお願いいたします. ベクトル関数 r=r(u)について,rとr'が単位ベクトルならば r×(r'×r'')=-r' であることを証明せよ. よろしくお願いいたします.

  • 行列式を最小にする固有ベクトル

     行列B,Eにおいて 行列式 |BE| を最小とするEは、Bの転置とBの内積の最小固有値に対応する固有ベクトルとなるのはなぜなのでしょうか?  Bの値は変えられませんが、Eの値を変えられます。  ご教授お願いします。