• ベストアンサー

Σc_(i)^2 を最小化するc_i

ある定数の和Σc_(i)=1 (i=1,2,3...,n)が成り立つ時、Σc_(i)^2を最小にするc_iが1/nになるのはなぜでしょうか?御回答よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#75273
noname#75273
回答No.9

シュワルツの不等式を知っていますか。 (a + b + c) (x + y + z) ≧ (ax + by + cz)^2 が成立します。 また、n 個に拡張したときは、 { Σ[i = 1 ~ n] (a_i)^2 } * { Σ[i = 1 ~ n] (x_i)^2 } ≧ { Σ[i = 1 ~ n] (a_i * x_i)^2 } が成立します。 本問題について考えると上記公式に a_i に 1 を代入   x_i = c_i を代入 すると、 { 1^2 * n } * { Σ( c_i )^2 } ≧ { Σ[i = 1 ~ n] (1 * c_i) ] よって、 n * Σ( c_i )^2 ≧ 1 よって、 Σ( c_i )^2 ≧ 1 / n ■

その他の回答 (8)

  • koko_u_
  • ベストアンサー率18% (459/2509)
回答No.8

ラグランジュの未定乗数法を使うにせよ、公式に当て嵌めるだけでは「なぜ」に答えることはままならないでしょう。 今のこの特定の状況が数学的に何を意味しているのかを考える必要があります。

  • guuman
  • ベストアンサー率30% (100/331)
回答No.7

補足の z=1-x-yをx^2+y^2+z^2に代入して整理すると x^2+y^2+z^2=2{x+(y-1)/2}^2 +3/2(y-1/3)^2 + 1/3より x=y=z=1/3 の時x^2+y^2+z^2の最小値は1/3となる。 は問いかけの趣旨が分かっていない 3個をn個に拡張できるような一般性を持った解き方を要求している ことが裏にある できればよいというものではない 機械的システマティックにできるのがベターということだろうから やはり文明の利器 ラグランジュの未定乗数法を使うことを薦める 技巧を凝らさずそれで解いてみい

  • nettiw
  • ベストアンサー率46% (60/128)
回答No.6

↑a・↑c≦|↑a||↑c| a1c1+a2c2+・・・+ancn ≦√[(a1)^2+(a2)^2+・・・+(an)^2]√[(c1)^2+(c2)^2+・・・+(cn)^2] a1=a2=・・・=an=1 c1+c2+・・・+cn=1 1≦√n・√[(c1)^2+(c2)^2+・・・+(cn)^2] 1≦n・[(c1)^2+(c2)^2+・・・+(cn)^2] 1/n≦[(c1)^2+(c2)^2+・・・+(cn)^2] 等号条件、 c1/a1=c2/a2=・・・=cn/an c1=c2=・・・=cn より、 c(i)=1/n という話なんでしょうか。

  • quaRk-6
  • ベストアンサー率32% (13/40)
回答No.5

#5です。 回答の訂正・補足をお許しください。 「c=k/3」→「a=b=c=k/3」 あと、ちゃんと証明しようと思ったらa,b,cでなくc1,c2,c3などを用いないといけませんね。 すみません。

  • quaRk-6
  • ベストアンサー率32% (13/40)
回答No.4

まずa+b=kのときのa^2+b^2を考えると a^2+b^2=a^2+(k-a)^2 =2a^2-2ka+k^2 =2(a-k/2)^2+(k^2)/2 だからa^2+b^2はa=b=2/kのとき最小値(k^2)/2をとる…(1) 次にa+b+c=kのときのa^2+b^2+c^2を考えると a^2+b^2に関して、(1)より最小値は{(k-c)^2}/2 よってa^2+b^2+c^2の最小値は{(k-c)^2}/2+c^2の最小値と同じなので {(k-c)^2}/2+c^2=(3/2)c^2-kc+(k^2)/2 =(3/2)(c-k/3)^2+(k^2)/3より c=k/3のとき最小値(k^2)/3をとる。…(2) 以下同様に考えて、数学的帰納法を用いた証明にまとめて、さいごに(1),(2),…にk=1を代入すれば、証明はできます。  しかしながら、証明は必ずしも「なぜ」という素朴な疑問に答えてくれないのも確かです。文字式の変形など、自然な感覚とはかけ離れていることもしばしば。  とはいえ、この「なぜ」という疑問に満足に答えられるだけの技量は持ってないので、とりあえず証明の方法のみ述べさせていただきました。

uenao1
質問者

お礼

数学的帰納法での証明をご丁寧に回答していただきありがとうございます。参考になりました。

noname#75273
noname#75273
回答No.3

コーシー・シュワルツ・・・・

  • incd
  • ベストアンサー率44% (41/92)
回答No.2

一言で言うと凸関数だからかな。 各c(i)を2乗していますよね。放物線を描けば分かるのですが、変化の割合がだんだん大きくなっていくので、一箇所に集中している方が全体が大きくなるんです。 なぜと言われるとこういう感じですが、計算によって1/nを求めるには、ラグランジュの未定乗数法などを使って最小化問題を解きます。

  • koko_u_
  • ベストアンサー率18% (459/2509)
回答No.1

なぜか。難しいこと聞くね。 ひとまず証明してから理由を考えようか。その中で色々前提条件などが明らかになるだろう。 証明を補足にどうぞ。

uenao1
質問者

補足

ラグランジュ関数をL(c_1,c_2,...c_n;λ)=Σc_i^2+λ(1-Σc_i) (λ∈R)として最適解の候補を求める。 ∂L/∂λ =1-Σc_i =0  ...(1) ∂L/∂c_i =2c_i -λ=0 ...(2) (2)よりc_i =λ/2 これを(1)に代入するとλ=2/n,c_i =1/n 故にΣc_(i)^2 を最小化するc_iは1/nとなりました。

関連するQ&A

  • C/C++での最小二乗法について

    いつもお世話になっております。 初めての質問で不備があるかと思われますがよろしくお願いします。 現在Excelのソルバー機能で、測定した値とは別に 計算式f(x)で求めた推定値との残差二乗和((測定値-推定値)^2の和)から 計算式f(x)の変数a,bを算出しています。(変数a,bの初期値は適当な値を設定) このソルバーでの最小二乗法の計算をc/c++にて実装するにはどのようにすれば良いのでしょうか。 (ソルバー機能では目的値を残差二乗和、変化対象を変数a,bとし、準ニュートン法より最小値を求めています。) 御教授よろしくお願いします。

  • 最小二乗法について

    最小二乗法では二乗和の誤差 Σ[i=1~n]{Yi-(α+βXi )}^2 (iは添え字です) を最小化するα,βを推定することを考えますが、 これは単純にα,βで偏微分してそれを0とおいて 連立方程式を解くだけでよいのですか? といいますのも、2変数関数の極値を求める場合、 Hessianを計算して判別しますよね? ただ一階偏導関数が0になるからといって、 そこで極値をとるとは限らない気がしたので… それとも最小二乗法の場合は必ずとるようになっているのでしょうか? 手元の本には、 「この二乗和は非負値なので、αとβで偏微分したものを0とするα,βが上式を最小にする値である」 とあるのですが、一般に非負値だとこの ようなことが言えるのでしょうか?

  • 確率公式の式変形が。P(∪[i=1..n]C(i))=Σ[i=1..n]P(C(i))-Σ[i,j=1..n, i<j]P(C(i)∩C(j))+

    確率の公式の証明です。 P(∪[i=1..n]C(i))=Σ[i=1..n]P(C(i))-Σ[i,j=1..n, i<j]P(C(i)∩C(j))+P(∩[i=1..n]C(i))…(*) 帰納法でi=3の時 P(C(1)∪C(2)∪C(3))=P(C(1))+P(C(2))+P(C(3))-P(C(1)∩C(2))-P(C(1)∩C(3))-P(C(2)∩C(3))+P(C(1)∩C(2)∩C(3))は明らかに成立。 i=n-1(n>3)の時,(*)式成立と仮定すると (見やすいようにD:=∪[i=1..n-1]C(i)と置くと) P(D∪C(n))=P(D)+P(C(n))-P(D∩C(n)) =Σ[i=1..n-1]P(C(i))+Σ[i,j=1,2,…,n-1, i<j]P(C(i)∩C(j))+P(∩[i=1..n-1]C(i))+P(C(n))-P(∪[i=1..n-1]C(i)∩C(n)) =Σ[i=1..n]P(C(i))+Σ[i,j=1,2,…,n-1, i<j]P(C(i)∩C(j))+P(∩[i=1..n-1]C(i))-P(∪[i=1..n-1]C(i)∩C(n)) から(*)式に辿り着けません。 どう変形すればいいのでしょうか?

  • 最小値

    最小値 問題 以下の式で表されるSが正方形であるとき、正の整数xの最小値を求めよ。 S = (x+20)+(x+21)+(x+22)+...+(x+100) 自分の考え・解答 S=81x+4860 これが正方形なので 81x+4860=n^2 (nは定数) となるような最小のxを求めればよい。 x=n^2/81-60 x>0だから n^2/81-60>0 n^2>4860 n>=70,n<=-70 よって最小のxはn=-70のときで x=0.4938... 正の整数xにならない!といった具合で詰まってます。 正しいやり方を誰か教えてください。お願いします。

  • 非線形最小二乗によるコールコールパラメータの求め方

    非線形最小二乗法によりコールコールパラメータを求めたいのですがよくわかりません。 詳細は以下の通りです。 コールコールの式ρ(iω)=ρ(0)*(1-m*(1-(1/(1+(iωτ)C))))の、複素比抵抗ρ(iω)が測定データであり、ωが測定周波数でこれが既知の値となっています。 ここから ρ(0):直流比抵抗 m:充電率 τ:時定数 c:周波数依存係数 の4つのパラメータを非線形最小二乗法(修正マルカート法など)を用いてρ(iω)=ρ(0)*(1-m*(1-(1/(1+(iωτ)C))))にフィッティングさせて求めたいのですが上手くいきません。コールコールの式のように複素数の式であり、さらにiにc乗がかかっている場合はどのように考えたらいいのでしょうか?例えば 誤差二乗和(χ2)→実部と虚部に分けて考え誤差二乗和を求めるときに足すのか? ヤコビアン行列→複雑な式を無理やり各パラメータで偏微分するのか? などです。(上記に挙げた考え方自体間違っているかもしれません。。。) どなたか複素インピーダンスなど複素数の式を数値計算する時の考え方など、経験がある方がいらっしゃればアドバイスして頂きたいです。宜しく御願い致します。

  • 数Iの問題です

    2次関数 y=-x^2+2x+m (-1≦x≦2) の最大値と最小値の和が0である時、定数mの値と最大値、最小値を求めよ。 【答え】 m=1、最大値2、最小値-2 この問いのmの値の求め方を教えてください。 という問題がありましたが とりあえずm=1なので y=-x^2+2x+1=(x+1)^2 なので最小値はx=-1のときy=1 最大値はx=2のときで9 になる気がするんですけどどこが間違っているのでしょうか?

  • I.E.とN.C.

    普段はI.E.を主に使っているのですが、たまたま良く行くHPをN.C.で見たら、どうもN.C.の方が内容が新しい(更新されてる)ようです。I.E.では、リロードしてもN.C.のような最新の内容になりません。なぜでしょう?

  • 最小二乗法?

    i 個の測定点 (x[i],y[i]) を,最小二乗法などを用いて下記の式にフィッティングさせようと考えています。Visual Basic で作成した測定プログラムの中で使用したいのですが,具体的にどのようなアルゴリズムでフィッティングを行えばいいのか分かりません。 Y = A * sin(X - C)^2 + B 実測する x[i] の範囲は狭く,例えば -15°~ +15°まで 0.2°毎の計 151 プロット,といった感じです。そして定数 A,B,C の内,最も高い精度で求めたい定数は C です。測定の段階で x の範囲を狭めているのは,正確な C (通常 1°未満)を求めるためです。 この測定は x[i] にはほとんど誤差が含まれませんが y[i] には誤差があります。y[i] の含まれている誤差は試料によってまちまちなので,一概には言えません。目視ではほとんど誤差が分からない綺麗なカーブの場合,逆に目視で辛うじて下に凸の曲線が分かる程度の場合,どちらもあり得ます。 考え方だけでも構いませんので,どうかご教授下さい。よろしくお願いいたします。

  • 三角形の1辺がある1点の周りを動くときのsの最小

    三角形の2辺が固定され、1辺がある1点の周りを動くときの2s=a+b+c(a,b,cは3辺の長さ)の最小値を考えています。 添付図で、半直線Ox、OYとその角の内部に点Aが与えられたとします。 点Aを通る直線を考え、Oxとの交点をM、Oyとの交点をNとします。 三角形OMNの周囲の長さの和が最小になるのはどういったときなのでしょうか? もし、MNの長さだけに注目すれば、MNの長さが最小になるのは、MNが フィローの直線(Philo line)と呼ばれる幾何学的な特徴を持つ直線のときになります。その件は、 http://okwave.jp/qa/q7541879.html を見てください。 三角形OMNの周囲の長さの和が最小になるときの幾何学的な特徴を知りたく思います。

  • 最小二乗法について

    最小二乗法について 最小二乗誤差E2は、 E2=Σ(i=1,m)yi^2-2Σ(j=0,n)aj(Σ(i=1,m)yixi^j)+Σ(j=0,n)ajΣ(k=0,n)ajak(Σ(i=1,m)xi^(j+k)) とする時、 ∂E2/∂aj=-2Σ(i=1,m)yixi^j+2Σ(k=0,n)akΣ(i=1,m)xi^(j+k) ですが。 一番後ろの項Σ(j=0,n)ajΣ(k=0,n)ajak(Σ(i=1,m)xi^(j+k))の偏微分が2Σ(k=0,n)akΣ(i=1,m)xi^(j+k)になる理由が分りません。 分りやすい説明をお願いします。