偏微分
偏微分(へんびぶん、Partial differentiation)とは、多変数の関数に対して、その変数を一旦固定して定数と見なし、一つの成分のみを変数として動かして、その成分方向への瞬間の増分を与える微分法である。偏微分法。偏微分によって得られた微分係数や導関数のことを、偏微分係数、偏導関数あるいは単に偏微分 (Partial derivative) という。
物理学においては、例えば位置と時間を変数として波の形状をある瞬間に観察するときは、時間をある瞬間に固定して考えることにより位置に対する波の波高値を観察するというような形で偏微分が用いられる。
定義
2変数の場合
簡単のため、2 変数の場合のみを詳しく述べる。z = f(x, y) を R2 のある領域上で定義された実数値関数で、x と y とは関数関係を持たずに独立に変化することができるとする。そして y を任意の値 b で固定すると、これを z = f(x; b) = f1(x) という変数 x の関数だと思うことができる。このとき、この z = f1(x) の x = a における微分係数
- <math>\begin{align} \frac{df_1}{dx}(a)
&= \lim_{\Delta x\to 0}\frac{f_1(a+\Delta x)-f_1(a)}{\Delta x}\\ &= \lim_{\Delta x\to 0}\frac{f(a+\Delta x,b)-f(a,b)}{\Delta x}
\end{align}</math> を z = f(x, y) の、点 (a, b) における x に関する偏微分係数とよぶ。この極限を
- <math>\left.\frac{\partial z}{\partial x}\right|_{(x,y)=(a,b)}
= \frac{\partial z}{\partial x}(a,b) = f_x(a,b) = z_x|_{x=a,y=b}
</math> などのように記す。z = f(x, y) を曲面と考えると、偏微分係数 fx(a, b) は領域上の点 (a, b) における、z の x 方向の傾きを表している。領域 D ⊂ R2 の各点 (x, y) で x に関する偏微分係数が存在するとき、これを x, y の関数と見た
- <math>\partial_x f(x,y) = f_x(x,y)=\frac{\partial z}{\partial x}
=\lim_{\Delta x\to 0}\frac{f(x+\Delta x,y)-f(x,y)}{\Delta x}
</math> を z = f(x, y) の x に関する偏導関数と呼ぶ。領域 D の各点で偏導関数が定義できるとき、z は領域 D において x に関して偏微分可能であるという。
同様に、x を任意の値 a で固定してできる z = f(a; y) = f2(y) という y についての関数が、ある領域 D に属する y について微分可能なら
- <math>f_y(x,y) = \frac{\partial z}{\partial y}
:= \lim_{\Delta y \to 0} \frac{f(x, y+\Delta y)-f(x,y)}{\Delta y}
</math> を z の y についての偏微分といい、z は D において y について偏微分可能であるという。
形式的な定義
一般の場合、u = f(x1, x2, ..., xn) の変数 xi (1 ≤ i ≤ n) に関する偏微分または偏導関数とは、Rn のある領域 D の各点において極限
- <math> \lim_{\Delta x_i \to 0}
\frac{ f(x_1,\ldots,x_i+\Delta x_i,\ldots,x_n) -f(x_1,\ldots,x_i,\ldots,x_n) }{ \Delta x_i }
</math> が存在するとき、その極限として得られる D 上の関数のことをいい
- <math>\frac{\partial f}{\partial x} = f_x = \partial_x f = u_x</math>
などであらわす。他に使われている変数を明示するときは
- <math>\left(\frac{\partial f}{\partial x}\right)_{y,z},\quad
\partial_x f(x,y,z), \quad u_x|_{x_1,x_2,\ldots,x_n}</math>
などの記法が使われる
高階偏導関数
偏導関数がさらに偏微分可能ならば、偏微分を繰り返して高階(高次)の偏導関数
- <math>\frac{\partial^2 f}{\partial x^2} = f_{xx} = \partial_{xx} f</math>
- <math>\frac{\partial^2 f}{\partial x\,\partial y} = f_{xy} = f_{yx} = \partial_{xy} f = \partial_{yx} f</math>
などを考えることができる。一般に多重指数 α = (a1, a2, ..., an) に対して |α| = a1 + a2 + ... + an として
- <math>\partial_\alpha f = \frac{\partial^{|\alpha|}f}{\partial x_1^{a_1}\,\partial x_2^{a_2}\cdots\partial x_n^{a_n}} = f^{(\alpha)}</math>
を定義することができる。
たとえば 2 変数の関数 f(x, y) が偏微分可能で、さらに二つの偏導関数 fx , fy が偏微分可能なとき、f の二階の偏導関数は
- fxx , fxy , fyx , fyy
の 4 つが定義できる。ここで、二つの偏導関数 fxy , fyx は一般には異なる関数であるが、これらの偏導関数が連続、つまり元の関数が C2-級であるならば、両者は一致する(ヤングの定理)。 また、一致しないものとしては、たとえば全平面で定義される関数
- <math>f(x,y) = \begin{cases}
\cfrac{xy(x^2-y^2)}{x^2+y^2} & (x,y)\ne (0,0), \\[10pt] 0 & (x,y) = (0,0).
\end{cases}</math> が挙げられる。実際このときは fxy(0, 0) ≠ fyx(0, 0) となる。
なお、二階の偏導関数は、まとめて行列の形
- <math>\frac{\partial^2 f}{\partial x_i\,\partial x_j} = H(f)_{ij}</math>
で扱うと便利な場合があり、ヘッセ行列という名前で呼ばれる。関数fが C2-級であれば、ヘッセ行列は対称行列となる。ヘッセ行列は二次形式の理論の基に多変数関数の極大値(極大点)や極小値(極小点)を調べることに役立つ。
全微分
二次元の領域 D 上定義された実数値関数 z = f(x, y) が x, y に関して偏微分可能であれば、各成分方向への瞬間の増分はその偏微分で与えられるので z の増分 dz は、大抵の場合(たとえば偏導関数が全て連続なとき)には
- <math>dz = \frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}dy</math>
と表せる。そしてこのようにあらわせるとき微分可能であると言う。このように各変数方向への偏微分と無限小の積を全ての変数について加えたものを z の全微分(ぜんびぶん、Total derivative)あるいは単に z の微分という。
- 一変数の関数に対して単にその「微分」というとき、それが導関数(微分係数)を意味するのか全微分を意味するのかは(文脈上明らかであるはずだが)区別を要する。全微分は dy = (dy/dx)dx の形になるが、右辺の最後の dx は x の無限小増分、左辺の dy は x の増分 dx に対する y の増分を表すものであり、同じに見える記号が微分係数 dy/dx に含まれ(ていて、形式上は "約分" が行われているかのように見え)るけれども、それらとは無関係の異なる概念である。
全微分は曲面 z = f(x, y) の点 (x, y) における一次近似を記述するものであり、
- <math>z-dz =
\left(x-\frac{\partial z}{\partial x}dx\right) + \left(y-\frac{\partial z}{\partial y}dy\right)
</math> を満たす点の集合という意味で接平面を表す。z が十分滑らかであれば、さらに dz を全微分することを考えることができて、
- <math>d^2z = \frac{\partial^2 z}{\partial x^2}dx^2 + 2\frac{\partial^2 z}{\partial x \partial y}dxdy + \frac{\partial^2 z}{\partial y^2}dy^2</math>
となり、以下同様にして一般に高階の全微分は、二項係数を用いて
- <math>d^m z = \sum_{k=0}^{m} {m \choose k}\,
\frac{ \partial^m z }{ \partial x^k\, \partial y^{m-k} }\,dx^k\,dy^{m-k} </math>
となることがわかる。これを以下のように略記する。
- <math>d^m z = \left(
\frac{\partial}{\partial x}dx + \frac{\partial}{\partial y}dy
\right)^m z.</math>
変数の数が増えても同様で、n 変数のとき十分滑らかな関数 u = f(x1, x2, ..., xn) の全微分は
- <math>du =
\frac{\partial u}{\partial x_1}dx_1 + \frac{\partial u}{\partial x_2}dx_2 + \cdots + \frac{\partial u}{\partial x_n}dx_n
</math> であり、高階の全微分は
- <math>d^m u = \left(
\frac{\partial}{\partial x_1}dx_1 + \frac{\partial}{\partial x_2}dx_2 + \cdots + \frac{\partial}{\partial x_n}dx_n
\right)^m u</math> と書くことができる。
多変数の合成関数の微分公式・変数変換
合成関数に関する偏微分には連鎖律 (chain rule) が成り立つ。たとえば、
- <math>\begin{cases}
z = f(x,y) \\ x = x(t)\\ y = y(t)
\end{cases}</math> で定まる関数 z = f(x, y) = F(t) は、t の一変数関数であり、この微分 dz/dt = dF(t)/dt は
- <math>\frac{df(x(t),y(t))}{dt} =
\frac{\partial f(x,y)}{\partial x} \frac{dx(t)}{dt} + \frac{\partial f(x,y)}{\partial y} \frac{dy(t)}{dt}
</math> で与えられる。また例えば、
- <math>\begin{cases}
z = f(x,y) \\ x = x(u,v) \\ y = y(u,v)
\end{cases}</math> で定まる関数z = f(x, y) = F(u,v) は、u、v の二変数関数で、これの偏微分が
- <math>\begin{cases}
\dfrac{\partial z}{\partial u} = \dfrac{\partial z}{\partial x} \dfrac{\partial x}{\partial u} + \dfrac{\partial z}{\partial y} \dfrac{\partial y}{\partial u}\\[16pt] \dfrac{\partial z}{\partial v} = \dfrac{\partial z}{\partial x} \dfrac{\partial x}{\partial v} + \dfrac{\partial z}{\partial y} \dfrac{\partial y}{\partial v}
\end{cases}</math> で与えられる。一般に u = f(x1, x2, ..., xn), xi = xi(t1, t2, ..., tm) (1 ≤ i ≤ n) が t = (t1, t2, ..., tm) について微分可能ならば、
- <math>\begin{pmatrix}
\dfrac{\partial u}{\partial t_1}\\[16pt] \dfrac{\partial u}{\partial t_2}\\[16pt] \vdots\\[16pt] \dfrac{\partial u}{\partial t_m}
\end{pmatrix} = \begin{pmatrix}
\dfrac{\partial u}{\partial x_1} \dfrac{\partial x_1}{\partial t_1} + \dfrac{\partial u}{\partial x_2} \dfrac{\partial x_2}{\partial t_1} + \cdots + \dfrac{\partial u}{\partial x_n} \dfrac{\partial x_n}{\partial t_1}\\[16pt] \dfrac{\partial u}{\partial x_1} \dfrac{\partial x_1}{\partial t_2} + \dfrac{\partial u}{\partial x_2} \dfrac{\partial x_2}{\partial t_2} + \cdots + \dfrac{\partial u}{\partial x_n} \dfrac{\partial x_n}{\partial t_2}\\[16pt] \vdots\\[16pt] \dfrac{\partial u}{\partial x_1} \dfrac{\partial x_1}{\partial t_m} + \dfrac{\partial u}{\partial x_2} \dfrac{\partial x_2}{\partial t_m} + \cdots + \dfrac{\partial u}{\partial x_n} \dfrac{\partial x_n}{\partial t_m}
\end{pmatrix}</math> となる。これを、連鎖律の公式 (chain rule)という。
また、変数 u = (u1, u2, ..., un) を
- ui = ui(t) (1 ≤ i ≤ n)
により変数 t = (t1, t2, ..., tn) に変数変換したときの関数行列式(ヤコビアン)を ∂(u)/∂(t) と書くことにすると、さらに t を
- ti = ti(x) (1 ≤ i ≤ n)
により x = (x1, x2, ..., xn) に変数変換したとき
- <math>\frac{\partial(\mathbf{u})}{\partial(\mathbf{x})} = \frac{\partial(\mathbf{u})}{\partial(\mathbf{t})}\frac{\partial(\mathbf{t})}{\partial(\mathbf{x})}</math>
が成り立つ。特に u = x のとき
- <math>1 = \frac{\partial(\mathbf{u})}{\partial(\mathbf{t})}\frac{\partial(\mathbf{t})}{\partial(\mathbf{x})}</math>
が成り立つ。n = 1 のときは合成関数の微分公式 du /dx = du /dt · dt /dx であるからこれもその一般化になっている。
多変数の平均値定理・テイラーの定理
一変数の場合を利用すると多変数の場合にもテイラーの公式を拡張することができる。 Rn の領域 D で定義された十分滑らかな関数 u = f(x) を考える。D の任意の点 x = (x1, x2, ..., xn) とその十分近くの点 x + h ∈ D (h = (h1, h2, ..., hn))に対し、F(t) = f(x + th) (t ∈ [0, 1]) は t に関して十分滑らかなのでテイラーの公式より
- <math>F(t) = \sum_{k=0}^{m-1}\frac{t^k}{k!}F^{(k)}(0) + \frac{t^m}{m!}F^{(m)}(\theta t)</math>
となる 0 < θ < 1 が存在する。ここで、
- <math>F^{(k)}(t) = \left(\sum_{i=1}^{n}h_i\frac{\partial}{\partial x_i}\right)^k f(\mathbf{x} + t\mathbf{h}) = d^k f(\mathbf{x} + t\mathbf{h})</math>
を代入して t = 1 とすると
- <math>f(\mathbf{x+h}) = \sum_{k=0}^{m-1}\frac{1}{k!}d^k f(\mathbf{x}) + \frac{1}{m!} d^m f(\mathbf{x} + \theta\mathbf{h})</math>
を得る。これが多変数のテイラーの公式である。特に m = 1 のときの式は
- <math>f(\mathbf{x+h}) - f(\mathbf{x}) = df(\mathbf{x} + \theta\mathbf{h})</math>
で、これが多変数の場合の平均値の定理である。