- ベストアンサー
偏微分についての疑問
- 偏微分について疑問があります。yとy'が独立でない場合、どのように考えればよいのでしょうか?
- 最速降下線を求める問題での偏微分について疑問があります。
- 偏微分の計算で、yとy'が独立であるかのように扱われていて疑問を感じています。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
偏微分を考えるときは常に「いまどの変数を独立変数として考えているか (=どの変数を固定して微分を行うか)」を意識して考えなければなりません。これは逆にいえば文脈によって「どの変数を独立変数として考えているか」が変わるということです。単に (∂/∂y) などと書いたとしても文脈によってその意味は異なるので、一般的に ∂y/∂y'=0 なのかどうかということを論じることはできません。どのように考えて (∂/∂y), (∂/∂y') を導入・定義したかに依存します。では、変分法のEuler方程式に出てくる (∂/∂y), (∂/∂y') の場合はどうなのか、というと Euler方程式の出てきた経緯から理解する必要があります。 汎関数微分だとわかりにくいので、まずはもっと単純な例で考えます: f(t,x) という2変数関数があったとして、これを x=x(t) という軌道上で (つまり f(t, x(t)) を) t 微分したいとします。普通は「x(t) を f に代入してから t で一発で微分する」のではなくて、 (d/dt) f(t, x(t)) = [(dt/dt) (∂/∂t) f(t, x) + (dx(t)/dt) (∂/∂x) f(t,x)]|_{x=x(t)} として f の直接の t の依存性からくる部分と、x(t) を通した依存性からくる部分を別々に計算しますよね。その方が計算の見通しが良いからです(数学的理由からというより単に計算上の都合からです)。このとき、[] の内側の x は、x(t) と同じ記号を使ってはいますが x(t) とは異なるもので、t と独立な変数と考えています。そして微分が終わった後で改めて x=x(t) を代入しているのです。混乱がないようにはっきりと両者 x, x(t) の区別をつけて書くとしたら、例えば (t,s) を独立変数として (d/dt) f(t, x(t)) = [(dt/dt) (∂/∂t) f(t, s) + (dx(t)/dt) (∂/∂s) f(t,s)]|_{s=x(t)} となるでしょうか。 Euler方程式を出すときも同じようなもので、 (δ/δy(x2)) f(y(x), dy(x)/dx) = [(δy(x)/δy(x2)) (∂/∂p) f(p,q) + (δ[dy(x)/dx]/δy(x2)) (∂/∂q) f(p, q)]_{p=y(x), q=dy(x)/dx} と書くところを横着して = (δy(x)/δy(x2)) (∂/∂y) f(y,y') + (δ[dy(x)/dx]/δy(x2)) (∂/∂y') f(y, y') などと書いているだけです。従って、Euler方程式に登場する (∂/∂y), (∂/∂y') というのはそもそもからして (y, y') を独立変数とする偏微分として登場したもので、それらの偏微分が終わった後で y = y(x) や y' = y'(x) (= dy(x)/dx) が代入されるものと解釈しなければなりません。 因みに、関数の一次独立性と偏微分のときの独立変数は全く関係ないように思います。
その他の回答 (3)
- akinomyoga
- ベストアンサー率85% (100/117)
すみません。ごちゃごちゃと書きすぎたせいで却って混乱させている様な気がしてきました。結局の所、初めの回答 (No.2) に書いた (δ/δy(x2)) f(y(x), dy(x)/dx) = [(δy(x)/δy(x2)) (∂/∂p) f(p,q) + (δ[dy(x)/dx]/δy(x2)) (∂/∂q) f(p, q)]_{p=y(x), q=dy(x)/dx} …(※1) という式変形(公式・連鎖律)をEuler方程式の導出で使ったということに尽きています。回答No.3は連鎖律 (※1) がどういうことなのかの説明になります。 (またこれもNo.2の冒頭で書いたことですが) 偏微分を考える時は、文脈 (何を考えているのか、何を知りたいのか) に依存して偏微分で固定する変数を明確に自分で設定しなければならないということを意識して下さい。単に ∂/∂y と書いただけでは、その意味は不明瞭です。∂/∂y に際してどの変数を固定してどの変数を固定しないのか、ということは完全に計算をする人の裁量で目的に応じて決めるもので、事前に決まっているものではありません。"∂/∂y [ ... ] = 0 なのか 1 なのか" といった類の問は、"∂/∂y" が一番初めに登場した時に、自分でどちらか(どの変数を固定するか)を定める種類の物です。 一応以下に各疑問に対して回答?を書いておきますがそれを読むよりは、上の項目について意識して自分で再考された方が良いのではないかという気がします。その後で興味があれば以下をご覧になってみてください。 ----- > 「f(y,y')= y-(y'^2)/4 を y=(y'^2)/4 を代入して f(y,y')=0 としてから y や y' で偏微分してはいけない。偏微分が終わるまでは y=y(x) でも y=y(y') でも y'=y'(x) でもない。」 > この話から、 > 偏微分する以前で、偏微分上独立とみなす変数間の関係式を使ったり、これらの変数をパラメータ表示していた場合、偏微分するときにはこの式変形?を元に戻してから偏微分しなければならない...と解釈しました。 > (この点が奇妙に感じられます。何らかの計算結果を偏微分しようと思ったら、場合によっては変数間の関係式を使った所から計算し直す必要がある...) もう書くのは3回目の様な気がしますが y, y' と y(x), y'(x) は異なるものです。今後 y, y' は p, q と書くことにします。式変形を元に戻すのではなく、そもそもその様な式変形はできません。(※1) という公式を使った時点で、p や q はただの変数で (そもそも xの関数ですらない) あって、p' = q などのような関係式はありませんしそもそも p' = dp/dx というものを考えることもできません(xの関数ではないのですから)。 > 偏微分上独立とみなす変数間 と書かれていますがこの辺りももしかすると勘違いされているかもしれません。p, q は『本当は独立ではないが偏微分をするときにだけ規則上独立と見なす』 の**ではなく**、意味的にも規則的にも本当に独立な変数です。あるいは、実際の計算の上では y, y' と書いて規則上独立と考えますが、無闇矢鱈にそのような非論理的なことをするのではなく、背景にちゃんとした考えがあるということです。正しく計算するためにはその背景を理解していないといけないということです。 > (この点が奇妙に感じられます。何らかの計算結果を偏微分しようと思ったら、場合によっては変数間の関係式を使った所から計算し直す必要がある...) どこで偏微分を実行するのかというのはただのタイミングの問題ではなくて「何を偏微分したいのか」・「何の傾きを求めたいのか」ということと関わっています。ただ単になんでも良いから「偏微分」という名前のものを計算したい、というのであればどの段階で偏微分しても良いです。ただし、偏微分した段階に応じた様々な傾きが得られます。しかし、目的があって偏微分をするのであればその目的に合った所で偏微分しなければなりません。 というか、これは偏微分に限ったことではなくて通常の微分でも言えることです。 y = f(x) = x^2 の x=a における傾きを求めなさい という問題に対して、答えは f'(a) = df(x)/dx|_{x=a} = 2x|_{x=a} = 2a になりますが、先に x=a を代入すると (d/dx)(f(x)|_{x=a}) = (d/dx) a² = 0 になります。しかしだからと言って矛盾だ何だということになる訳ではなく、求めているものが異なるだけです。その点での傾きを求めたいのであれば、先に a を代入して微分するのではなく、微分してから a を代入するということです。どちらが正しいのかは、自分の知りたいものの意味を考えて、その意味に対応する物を選ばなければなりません。 > y'を固定してyで微分することを[∂/∂y]y'と書くことにします。 > もし、y=x^2 の関係を使わずに x^2-(y'^2)/4 と言う式が出てきた場合、 > [ (∂/∂y){x^2-(y'^2)/4} ]y' = 0 > (∵ 偏微分が終わるまでは y=y(x) でも y'=y'(x) でもない) > これであっているでしょうか? > それとも、パラメータ表示が禁止されるのは固定する変数だけで、y=x^2 は使って良いとして、 > [ (∂/∂y){x^2-(y'^2)/4} ]y' = 1 > でしょうか? これは初めの回答No.2 でも書いたことですが、偏微分 (∂/∂y) と単に書いても文脈によって意味は様々ですので、文脈に応じてどちらにもなりえます。重要なことは 偏微分 (∂/∂y) と書くときは、固定する変数固定しない変数を明確にしなければならない ということです。(y, y', x) を独立変数と見なすのであれば、 [ (∂/∂y){x^2-(y'^2)/4} ]y' = 0 …(※2) ですし、(y, y') を独立変数と考えて x(y)=±√y と考えるのであれば [ (∂/∂y){x^2-(y'^2)/4} ]y' = 1 …(※3) です。そして、その文脈で何が独立変数になっているのか、というのはその偏微分が出てきた経緯を辿らなければなりません。あるいは自分の目的に応じて適切に独立変数を定めなければなりません。Euler方程式の導出では (y, y') と x は独立と考えるので (※2) になります。 > パラメータ表示が禁止されるのは固定する変数 パラメータ表示を禁止するわけではありません。パラメータ表示があるのであれば、パラメータ表示はいつでも有効です。場当たり的な例外などありません。連鎖律に出てくる y, y' (ないし p, q) は、そもそも出てきた経緯からして y(x) や y'(x) とは一切関係のない、パラメータ表示もない独立変数です。 > 3変数 p,v,t が pv=t の関係にあるとします。 > ここで T を定数とし p = T/v の関係を使って、 > [∂p/∂v]t = [(∂/∂v)(T/v)]t = -T/(v^2) > として良いでしょうか?(これは"道から外れない"偏微分もあるということ?) > それとも、p=T/v を使ってしまうと"道の上の話"になってしまうので、p=T/v はだめだけど p=p(v) と言う"道"とは無関係の関係式があると見て偏微分する?("道"と無関係な関係式ってなんだー) [∂p/∂v]_T と書いた時点で普通は p = p(v, T) = T/v の中での話と考える、という前提の下で [∂p/∂v]_T = [(∂/∂v)(T/v)]_T = -T/(v^2) でOKです。(逆に (p, v, T) を独立変数と考える場合には [∂p/∂v]_T の様な書き方をせずに [∂p/∂v]_{T,p} などと書きます)。何れにしても、偏微分を考える時は文脈(今、何を考えているのか、何を考えたいのか)によります。 例えば、理想気体の熱力学では「状態方程式に従って変化する気体」を熱したり圧縮したり色々な操作をした時のことについて知りたいので、状態方程式 p = p(v, T) という "道" の外には出ません。ただし状態方程式という"道"は、3変数から2変数に減らすだけなので "道" とはいいつつも2次元的です: つまり2つの変数 v, T に依存しています。ところで実際に気体に対して熱したり圧縮したりという操作をするときは気体の状態の変化は1次元的なので、〈状態方程式で決められる2次元的な"道"(A)〉の中に更に〈実際に気体がたどる状態の経路という"道"(B)〉が埋め込まれる形になります。熱力学で出てくる偏微分は全て「(B) という道について考えたいが直接考えると複雑なので、"道"(B) を飛び出て (A) の中で考える」ということになります。"道"(A) 自体を飛び出てどうのこうのという事は考えません。 しかし、もっと自由に変化する変な気体を仮想的に考えたければ (p, v, T) を独立変数として計算することも可能です(普通そのようなことを考えないのは、『数学的に事前に決まっている』とか『数学的に良い悪い』ということ**ではなく**て、ただ単に考えても意味がないからというだけのことです)。
お礼
丁寧な説明を何度もしていただいて、本当にありがとうございます。おかげで理解できたと思います。 結局、何を求めたいかで偏微分の答えは変わってくるわけですね。何度も説明されてやっとわかりました。 どうも、1つの記号に対しては1つの値?が対応するに違いない、と言う先入観に引っ張られていたようです。[∂f/∂y]_y'= g であれば、どのように計算しても(考えても) [∂f/∂y]_y' は g になるべきだ...といった感じです。(まだ誤解があるかもしれませんが...) 様子を見てから、No.2 の回答をベストアンサーに選びたいと思います。
- akinomyoga
- ベストアンサー率85% (100/117)
> ただ、偏微分が終わってからy=y(x)等を代入する、と言う部分が気になります。 > (中略) > 変な勘違いを長々と書いているかもしれませんが、ご指摘お願いします。 やはり勘違いしていらっしゃる様に思います。説明に登場する y と y(x) や y' と y'(x) はそれぞれ異なる変数です。つまり、「偏微分が終わってからy=y(x)等を代入する」までは y=y(x) でもないし y'=y'(x) でもありません。「後で y(x) や y'(x) を代入する」という理由のみにおいて変数名として y や y' を選んではいますが、これら y や y' は p や q などと置き換えて考えていただいた方が混乱しなくて済むかもしれません。(ただ、微分の基本である連鎖律を考える場合はほとんど常にこの様な「略記」を習慣的に行うので、これらは厳密には違うということを理解した上で今後受け入れる必要はあるかと思います。) ----- もう少し具体的な状況で考えたほうが分かりやすいかもしれません。 例えば、傾いた平面 z = h(x,y) = ax + by があったとします。h(x,y) は地点 (x,y) における地面の高さとでも思って下さい。その上に方向 (c,d) の斜めの道があって、媒介変数 t を用いて (x(t), y(t)) = (ct, dt) と書けるとします。道の t に対応する地点の高さは z(t) = h(x(t), y(t)) で与えられます。今、道の傾き (すなわち t を増やした時にどれだけ高さ z(t) が変わるか) を知りたいとします。道の傾きは多変数の連鎖律を以て: (d/dt) z(t) = (d/dt) h(x(t), y(t)) = (dx/dt) (∂h(x,y)/∂x)|_{x=x(t), y=y(t)} + (dy/dt) (∂h(x,y)/∂y)|_{x=x(t), y=y(t)} = ac + bd となります。ただし、∂h(x,y)/∂x は y を固定して x だけ動かした時の微分で、∂h(x,y)/∂y は x を固定して y だけ動かした時の微分です。この時に注意して欲しいのは、この様な微分は「道を外れる方向」へ動いて微分を行っているということです。本来考えている道 (x(t), y(t)) では x(t) と y(t) の間に t を介して関係がある (より直接に書けば y(t) = (d/c) x(t) となる) わけですが、その道の上を歩くことに拘らずに、(1) 周囲の状況を調べ(∂h/∂x, ∂h/∂y)た上で (2) そこに道の情報を代入して(x=x(t), y=y(t)) 道の傾きをいわば再構築しているわけです。 ・この周囲の情報を調べている段階 (1) では x=x(t), y=y(t) が成り立つとは考えません。 ・道の位置 (x(t), y(t)) と地面の位置 (x, y) は別の変数で、道の位置の場合は x(t) と y(t) は独立変数ではありませんが、地面の位置 (x, y) については x と y は独立変数になります。 この議論は (δ/δy(x2)) f(y(x), y'(x)) の場合にもそのまま焼き直せます。考えたいのは (p=y(x), q=y'(x)) という"道"の上での話です(実際には道的なイメージではないですが、上の話と対比する為に "道" と書きます)。しかしながら直接に "道" の上で考えると面倒なので、(1) 先ずは独立な変数 (p,q) について f(p, q) の様子を探って、(2) その後で p=y(x), q=y'(x) を代入して道の上での情報を得るということをしています。 ・周囲の情報を調べている段階 (1) では、"道" (p=y(x), q=y'(x)) は全く関係ありません ・"道" (y(x), y'(x)) を記述する y(x) と y'(x) は独立ではありません。しかし (p, q) は勝手に導入した独立変数です。 少し注意しなければならないのは、最速降下線の f(y(x), y'(x)) は「dx あたりの所要時間」という意味を持っていますが、勝手に出してきた f(p, q) (p, q は独立変数) は特に意味を持たないということです。f(p, q) は計算を簡単にするために (連鎖律を使うために)、「道の周りに勝手に作った(もともとなかった)地面」のようなもので、純粋に数式上の物体ですので意味は深く考えないで下さい。 ----- 因みに、偏微分はこの「道を外れた方向の微分を足し合わせることで道に沿った向きの微分を求めることができること (連鎖律)」という便利な性質を使うためにあると言っても過言ではありません。ところで、この連鎖律が常に成立するのか疑問に思われるかもしれませんが「関数が微分可能ならば」成立します。実のところ、多変数関数の微分可能性 (フレシェ微分可能性) はこの連鎖律が成り立つように決められたようなものなので "連鎖律が成立するものは成立するし成立しない物は成立しない" ぐらいのことです。しかし、実際、人間の考えるような大抵の関数はこの意味で微分可能なので、都合の良い関数では (厳密な数学的議論以外では) 常に連鎖律は成り立つと思って問題はありません。 ----- > ここで f(y,y')= y-(y'^2)/4 を考えると、 > ∂f/∂y= (∂/∂y){y-(y'^2)/4} =1 > (∵ yとy'は独立とする。y=x^2=(y'^2)/4 の代入もしない。) OK です > 一方で y=(y'^2)/4 だから f(y,y')=0 ∴∂f/∂y=0 だめです。y=(y'^2)/4 とした時点で "道" の上での話になっています。道の上でしか使えない情報 "f(y, y')=0" を使って、道の外の微分 "∂f/∂y" を計算することはできません。 > x を x,x+1 を独立変数と見て偏微分する場合、 x, x+1 は独立変数にはなりえません。 > xに対してx+1を定数(aとする)とみなすなら、 これも無理です。従って以降の計算も意味をなしません。 少し言明を修正して以下のようにしてみましょうか: > x を (x, a) を独立変数と見て偏微分する場合、 > ∂x/∂x = ∂{(x+1)-1}/∂x (ただの式変形) > ここで直線 a=x+1 の上で考えると > ∂{(x+1)-1}/∂x = ∂(a-1)/∂x = 0 > ∂x/∂x = 1 と矛盾する? これは ∂{(x+1)-1}/∂x = ∂(a-1)/∂x が駄目です。(∂/∂x) は (x, a) を独立変数と思って行う微分なのに、a=x+1 という独立変数であることを崩すような式を用いて変形していることが問題です。あるいは、あくまで微分は道の外側に向かって行われる物なのに a=x+1 という道の上でしか成り立たない式を使って微分対象を変形してしまっている、ということもできます。 ---- ※説明で使った "道" だとか "地面" だとか "周囲の様子" だとかいう言葉は、説明のために使ったたとえなので、数学的用語ではないことに注意して下さい。
補足
大変丁寧な説明、ありがとうございます。 恐縮ながら、まだ理解しきれていません。 「f(y,y')= y-(y'^2)/4 を y=(y'^2)/4 を代入して f(y,y')=0 としてから y や y' で偏微分してはいけない。偏微分が終わるまでは y=y(x) でも y=y(y') でも y'=y'(x) でもない。」 この話から、 偏微分する以前で、偏微分上独立とみなす変数間の関係式を使ったり、これらの変数をパラメータ表示していた場合、偏微分するときにはこの式変形?を元に戻してから偏微分しなければならない...と解釈しました。 (この点が奇妙に感じられます。何らかの計算結果を偏微分しようと思ったら、場合によっては変数間の関係式を使った所から計算し直す必要がある...) y'を固定してyで微分することを[∂/∂y]y'と書くことにします。 もし、y=x^2 の関係を使わずに x^2-(y'^2)/4 と言う式が出てきた場合、 [ (∂/∂y){x^2-(y'^2)/4} ]y' = 0 (∵ 偏微分が終わるまでは y=y(x) でも y'=y'(x) でもない) これであっているでしょうか? それとも、パラメータ表示が禁止されるのは固定する変数だけで、y=x^2 は使って良いとして、 [ (∂/∂y){x^2-(y'^2)/4} ]y' = 1 でしょうか? 3変数 p,v,t が pv=t の関係にあるとします。 ここで T を定数とし p = T/v の関係を使って、 [∂p/∂v]t = [(∂/∂v)(T/v)]t = -T/(v^2) として良いでしょうか?(これは"道から外れない"偏微分もあるということ?) それとも、p=T/v を使ってしまうと"道の上の話"になってしまうので、p=T/v はだめだけど p=p(v) と言う"道"とは無関係の関係式があると見て偏微分する?("道"と無関係な関係式ってなんだー)
- bran111
- ベストアンサー率49% (512/1037)
>普通、yとy'は独立でないはず。 私自身、ここで躓いた記憶があります。 質問者の「関数の独立」の定義を振り返ってみてください。 y=x^2とy'=2xは一次独立です。 y=sinxとy'=cosxも一次独立です。 唯一 y=e^xとy'=e^xは一次従属です。
補足
yとy'の一次独立(線形独立)についてはわかったと思います。 しかし、一次独立だけで∂y/∂y'=0 等が言えるのか、ピンときません... たとえば、y=x^2 、y'=2x は一次独立ですが、 y=(y'^2)/4 と表せるので ∂y/∂y'= y'/2 =x となりませんか?
補足
とりあえず、だいぶ理解が進んだように思えます。ありがとうございます。 ただ、偏微分が終わってからy=y(x)等を代入する、と言う部分が気になります。 (2段落飛ばして「ここで f(y,y')=...」から読んでくれてもわかると思います) y=x^2 、y'=2x を例にして話を進めます。 まず、∂/∂y' と ∂/∂y を考えるために、yとy'は偏微分の計算上は独立だとします。 すると∂y/∂y'を計算するとき(後の本題ではyで偏微分しますが...)、本来独立でない2つの変数y,y'を、片方(y)を固定しつつもう片方(y')を動かすため、必然的に偏微分の計算中はyにy=y(y')=(y'^2)/4 を代入できない。(とは言っても、実際にy'を動かしつつ(y'^2)を固定するということをやることになりますが、偏微分中はとにかく他の独立変数を定数として計算する。) (もし代入するとしても、他の独立変数を固定するという偏微分の定義に矛盾しないためには y=(y'^2)/4=a (a:定数) として∂y/∂y'=∂a/∂y'=0 と計算することになる、と理解しています。) ここで f(y,y')= y-(y'^2)/4 を考えると、 ∂f/∂y= (∂/∂y){y-(y'^2)/4} =1 (∵ yとy'は独立とする。y=x^2=(y'^2)/4 の代入もしない。) 一方で y=(y'^2)/4 だから f(y,y')=0 ∴∂f/∂y=0 このように 1=0 の矛盾が生じます。 もう1つ例を上げると、 x を x,x+1 を独立変数と見て偏微分する場合、 ∂x/∂x = ∂{(x+1)-1}/∂x (ただの式変形) xに対してx+1を定数(aとする)とみなすなら、 ∂{(x+1)-1}/∂x = ∂(a-1)/∂x = 0 ∂x/∂x = 1 と矛盾する? 最速降下線の偏微分は、偏微分中は独立変数間の関係式を代入しない(使わない)という規則に則って計算されているように見えるので、この計算規則自体は正しそうですが... 変な勘違いを長々と書いているかもしれませんが、ご指摘お願いします。