多元微分学(1)

· · 学习·文化课

偏导数与全微分

1 偏导数与全微分

1.1 方向导数与偏导数

定义 1.1 (方向导数)
设二元函数 f(x, y) 在点 (x_0, y_0) 有定义,\mathbf{e} = (\cos\theta,\ \sin\theta) 是一个方向向量。若极限

\lim_{t \to 0} \frac{f(x_0 + t\cos\theta,\ y_0 + t\sin\theta) - f(x_0, y_0)}{t}

存在,则称该极限为函数 f 在点 (x_0, y_0) 沿方向 \mathbf{e}方向导数,记作

\frac{\partial f}{\partial \mathbf{e}}(x_0, y_0) \quad \text{或} \quad \partial_{\mathbf{e}} f(x_0, y_0).

定义 1.2 (偏导数)
方向导数沿坐标轴正方向(即 \mathbf{e} 分别取 (1,0)(0,1))的特殊情形称为偏导数。采用以下记号之一:

注意:即使 f(x, y)(x_0, y_0) 沿任意方向的导数都存在,也不能推出 f 在该点连续,因为极限路径未必是直线。

1.2 全微分

定义 1.3 (可微性与全微分)
设二元函数 f(x, y) 在点 (x_0, y_0) 有定义。若存在实数 A, B,使得当 \sqrt{(\Delta x)^2 + (\Delta y)^2} \to 0 时,成立

f(x_0 + \Delta x,\ y_0 + \Delta y) - f(x_0, y_0) = A\Delta x + B\Delta y + o\!\left(\sqrt{(\Delta x)^2 + (\Delta y)^2}\right),

则称 f 在点 (x_0, y_0) 可微,并称线性主部 A\Delta x + B\Delta yf(x_0, y_0)全微分,记作

\mathrm{d}f(x_0, y_0) = A\,\mathrm{d}x + B\,\mathrm{d}y.

定理 1.1 (可微蕴含连续)
f(x, y)(x_0, y_0) 可微,则 f 在该点连续。

证明:由可微定义直接可得。 \square

定理 1.2 (可微蕴含各方向导数存在)
f(x, y)(x_0, y_0) 可微,则 f 在该点沿任意方向 \mathbf{e}=(\cos\theta,\ \sin\theta) 的方向导数均存在。

证明:在可微表达式中取 \Delta x = t\cos\theta,\ \Delta y = t\sin\theta,即得结论。 \square

推论 1.1 (全微分与偏导数的关系)
f(x, y)(x_0, y_0) 可微,且 \mathrm{d}f(x_0, y_0) = A\,\mathrm{d}x + B\,\mathrm{d}y,则

\frac{\partial f}{\partial x}(x_0, y_0) = A, \qquad \frac{\partial f}{\partial y}(x_0, y_0) = B.

即全微分中的系数即为相应的偏导数。

1.3 连续可微函数

定理 1.3 (连续可微则必可微)
若函数 f(x, y) 的各个偏导数在点 (x_0, y_0) 的某个邻域内存在,且它们在 (x_0, y_0) 连续,则 f(x_0, y_0) 可微。

证明
h = \Delta x = x - x_0k = \Delta y = y - y_0。应用一元函数的有限增量公式:

\begin{aligned} & f(x_0 + h,\ y_0 + k) - f(x_0, y_0) \\ = & \bigl[f(x_0 + h,\ y_0 + k) - f(x_0,\ y_0 + k)\bigr] + \bigl[f(x_0,\ y_0 + k) - f(x_0, y_0)\bigr] \\ = & f_x(x_0 + \theta h,\ y_0 + k)\,h + f_y(x_0,\ y_0 + \omega k)\,k, \qquad 0 < \theta,\ \omega < 1. \end{aligned}

由偏导数的连续性,可写

f_x(x_0 + \theta h,\ y_0 + k) = f_x(x_0, y_0) + \alpha, \quad f_y(x_0,\ y_0 + \omega k) = f_y(x_0, y_0) + \beta,

其中当 (h, k) \to (0, 0) 时,\alpha,\ \beta \to 0。代入得

f(x_0 + h,\ y_0 + k) - f(x_0, y_0) = f_x(x_0, y_0)h + f_y(x_0, y_0)k + \alpha h + \beta k.

注意到

\left|\frac{\alpha h + \beta k}{\sqrt{h^2 + k^2}}\right| \leq |\alpha| + |\beta| \to 0,

\alpha h + \beta k = o\!\left(\sqrt{h^2 + k^2}\right),从而

f(x_0 + h,\ y_0 + k) - f(x_0, y_0) = f_x(x_0, y_0)h + f_y(x_0, y_0)k + o\!\left(\sqrt{h^2 + k^2}\right).

f(x_0, y_0) 可微。 \square

1.4 m 元函数的一般情形

本节将前述二元函数的核心概念(方向导数、偏导数、全微分与可微性)自然推广到 m 元函数的情形。

定义 1.4 (m 元函数的方向导数与偏导数)
m 元函数 f(\mathbf{x}) = f(x_1, x_2, \dots, x_m) 在点 \mathbf{x}^0 = (x_1^0, \dots, x_m^0) 的某邻域内有定义,\mathbf{e} = (e_1, e_2, \dots, e_m) 是一个单位方向向量(即 \|\mathbf{e}\| = \sqrt{e_1^2 + \dots + e_m^2} = 1)。若极限

\lim_{t \to 0} \frac{f(\mathbf{x}^0 + t\mathbf{e}) - f(\mathbf{x}^0)}{t} = \lim_{t \to 0} \frac{f(x_1^0 + te_1, \dots, x_m^0 + te_m) - f(\mathbf{x}^0)}{t}

存在,则称此极限为函数 f 在点 \mathbf{x}^0 沿方向 \mathbf{e}方向导数,记作 \dfrac{\partial f}{\partial \mathbf{e}}(\mathbf{x}^0)\partial_{\mathbf{e}} f(\mathbf{x}^0)

特别地,沿坐标轴正方向 \mathbf{e}_i = (0,\dots,1,\dots,0)(第 i 个分量为 1)的方向导数称为对自变量 x_i偏导数,记作:

\frac{\partial f}{\partial x_i}(\mathbf{x}^0),\quad f_{x_i}(\mathbf{x}^0), \quad \text{或} \quad D_i f(\mathbf{x}^0).

定义 1.5 (m 元函数的可微性与全微分)
m 元函数 f(\mathbf{x}) 在点 \mathbf{x}^0 的某邻域内有定义。若存在一组实数 A_1, A_2, \dots, A_m,使得对于增量 \Delta \mathbf{x} = (\Delta x_1, \dots, \Delta x_m),当 \|\Delta \mathbf{x}\| = \sqrt{(\Delta x_1)^2 + \dots + (\Delta x_m)^2} \to 0 时,成立

f(\mathbf{x}^0 + \Delta \mathbf{x}) - f(\mathbf{x}^0) = \sum_{i=1}^{m} A_i \Delta x_i + o(\|\Delta \mathbf{x}\|),

则称函数 f 在点 \mathbf{x}^0 可微。线性主部 \sum_{i=1}^{m} A_i \Delta x_i 称为 f 在点 \mathbf{x}^0全微分,记作

\mathrm{d}f(\mathbf{x}^0) = \sum_{i=1}^{m} A_i \mathrm{d}x_i.

定理 1.4 (m 元函数可微的性质)

  1. 可微蕴含连续:若 f 在点 \mathbf{x}^0 可微,则 f 在该点连续。
  2. 可微蕴含方向导数存在:若 f 在点 \mathbf{x}^0 可微,则 f 在该点沿任意方向 \mathbf{e} 的方向导数均存在。
  3. 全微分系数即偏导数:若 f 在点 \mathbf{x}^0 可微,且 \mathrm{d}f(\mathbf{x}^0) = \sum_{i=1}^{m} A_i \mathrm{d}x_i,则 \frac{\partial f}{\partial x_i}(\mathbf{x}^0) = A_i, \quad i=1,2,\dots,m.

    因此,全微分可唯一地写为:

    \mathrm{d}f(\mathbf{x}^0) = \sum_{i=1}^{m} \frac{\partial f}{\partial x_i}(\mathbf{x}^0) \mathrm{d}x_i.

证明思路
性质1与2的证明与二元情形完全类似,只需将二元情形下的表达式替换为对应的 m 维形式即可。性质3的证明可通过在可微性定义中分别取 \Delta \mathbf{x}(0,\dots, \Delta x_i, \dots, 0) 并利用方向导数的定义直接得到。

定理 1.5 (连续可微则必可微)
m 元函数 f(\mathbf{x}) 的所有一阶偏导数 \dfrac{\partial f}{\partial x_1}, \dots, \dfrac{\partial f}{\partial x_m} 在点 \mathbf{x}^0 的某个邻域内存在,且都在点 \mathbf{x}^0 连续,则函数 f 在点 \mathbf{x}^0 可微。

证明思路(多次应用有限增量公式)
\Delta \mathbf{x} = (h_1, \dots, h_m)。将函数值的增量视为依次只变动一个自变量的结果:

\begin{aligned} & f(x_1^0+h_1, \dots, x_m^0+h_m) - f(x_1^0, \dots, x_m^0) \\ = & \ [f(x_1^0+h_1, x_2^0, \dots, x_m^0) - f(x_1^0, \dots, x_m^0)] \\ + & \ [f(x_1^0+h_1, x_2^0+h_2, x_3^0, \dots, x_m^0) - f(x_1^0+h_1, x_2^0, \dots, x_m^0)] \\ + & \ \dots \\ + & \ [f(x_1^0+h_1, \dots, x_m^0+h_m) - f(x_1^0+h_1, \dots, x_{m-1}^0+h_{m-1}, x_m^0)]. \end{aligned}

对上述每一行应用一元函数的有限增量公式,再利用各偏导数的连续性,即可将每项写为 \dfrac{\partial f}{\partial x_i}(\mathbf{x}^0) h_i 加上一个高阶无穷小项。最终可证得存在满足定义的关系式 f(\mathbf{x}^0+\Delta \mathbf{x}) - f(\mathbf{x}^0) = \sum_{i=1}^m \dfrac{\partial f}{\partial x_i}(\mathbf{x}^0) h_i + o(\|\Delta \mathbf{x}\|)\square

2 复合函数的偏导数与全微分

2.1 复合函数求导的链式法则

定理 2.1 (复合函数求导的链式法则)
设有 mk 元函数 \varphi^{i}(t)=\varphi^{i}(t^{1},t^{2},...,t^{k}),它们在点 t_0=(t_0^1,t_0^2,...,t_0^k) 处对所有 t^j 的偏导数都存在,且 \varphi^1(t_0)=x_0^1,\varphi^2(t_0)=x_0^2,...,\varphi^m(t_0)=x_0^m。又设 m 元函数 f(x^1,x^2,...,x^m) 在点 x_0=(x_0^1,x_0^2,...,x_0^m) 可微,那么复合函数

F(t)=f(\varphi^1(t),\varphi^2(t),...,\varphi^m(t))

在点 t_0 对所有 t^j 的偏导数也都存在,并且

\frac{\partial F}{\partial t^j}(t_0)=\sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0)\frac{\partial \varphi^i}{\partial t^j}(t_0).

证明
由于 fx_0 可微,故有:

f(x_0 + \Delta x) - f(x_0) = \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \Delta x^i + o(\|\Delta x\|),

其中 \Delta x = (\Delta x^1, \dots, \Delta x^m)\|\Delta x\| = \sqrt{\sum_{i=1}^m (\Delta x^i)^2}

现考虑复合函数 Ft_0 处对 t^j 的偏导数。令 \Delta t^jt^j 的增量,记 \Delta t = (0, \dots, \Delta t^j, \dots, 0)(仅第 j 个分量非零)。相应地,令

\Delta \varphi^i = \varphi^i(t_0 + \Delta t) - \varphi^i(t_0),\quad i=1,\dots,m.

\varphi^it_0 处对 t^j 可偏导,知

\Delta \varphi^i = \frac{\partial \varphi^i}{\partial t^j}(t_0) \Delta t^j + o(|\Delta t^j|).

于是复合函数的增量为:

\begin{aligned} F(t_0 + \Delta t) - F(t_0) &= f(\varphi^1(t_0 + \Delta t), \dots, \varphi^m(t_0 + \Delta t)) - f(\varphi^1(t_0), \dots, \varphi^m(t_0)) \\ &= f(x_0 + \Delta \varphi) - f(x_0), \end{aligned}

其中 \Delta \varphi = (\Delta \varphi^1, \dots, \Delta \varphi^m)

代入 f 的可微性表达式:

\begin{aligned} F(t_0 + \Delta t) - F(t_0) &= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \Delta \varphi^i + o(\|\Delta \varphi\|) \\ &= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \left[ \frac{\partial \varphi^i}{\partial t^j}(t_0) \Delta t^j + o(|\Delta t^j|) \right] + o(\|\Delta \varphi\|). \end{aligned}

注意到 \Delta \varphi^i\Delta t^j 的线性函数加高阶无穷小,故存在常数 C,使得当 |\Delta t^j| 充分小时,\|\Delta \varphi\| \le C |\Delta t^j|,从而 o(\|\Delta \varphi\|) = o(|\Delta t^j|)。于是

F(t_0 + \Delta t) - F(t_0) = \left[ \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \frac{\partial \varphi^i}{\partial t^j}(t_0) \right] \Delta t^j + o(|\Delta t^j|).

因此

\frac{\partial F}{\partial t^j}(t_0) = \lim_{\Delta t^j \to 0} \frac{F(t_0 + \Delta t) - F(t_0)}{\Delta t^j} = \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \frac{\partial \varphi^i}{\partial t^j}(t_0). \square

2.2 微分表示的不变性

定理 2.2 (全微分形式不变性)
不论 x=(x^1,x^2,...,x^m) 是自变元,或者是依赖于另外的变元 t=(t^1,t^2,...,t^k) 的可微函数,函数 f(x)=f(x^1,x^2,...,x^m) 的全微分都具有相同的形式:

\mathrm{d}f(x)=\sum_{i=1}^m \frac{\partial f}{\partial x^i}(x)\,\mathrm{d}x^i.

证明
x 是自变元时,由全微分的定义即得。

xt 的可微函数时,考虑复合函数 F(t)=f(x(t))。由链式法则(定理2.1),对任意 j=1,\dots,k,有

\frac{\partial F}{\partial t^j} = \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \frac{\partial x^i}{\partial t^j}.

于是 F 的全微分为:

\begin{aligned} \mathrm{d}F &= \sum_{j=1}^k \frac{\partial F}{\partial t^j} \,\mathrm{d}t^j \\ &= \sum_{j=1}^k \left( \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \frac{\partial x^i}{\partial t^j} \right) \mathrm{d}t^j \\ &= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \left( \sum_{j=1}^k \frac{\partial x^i}{\partial t^j} \mathrm{d}t^j \right) \\ &= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \,\mathrm{d}x^i, \end{aligned}

其中 \mathrm{d}x^i = \sum_{j=1}^k \frac{\partial x^i}{\partial t^j} \mathrm{d}t^j 正是 x^i 的全微分。 \square

定理 2.3 (微分运算法则)
u(x)v(x) 是可微函数,\lambda \in \mathbb{R},则有

  1. \mathrm{d}(u(x)+v(x))=\mathrm{d}u(x)+\mathrm{d}v(x)
  2. \mathrm{d}(\lambda u(x))=\lambda\,\mathrm{d}u(x)
  3. \mathrm{d}(u(x)v(x))=v(x)\mathrm{d}u(x)+u(x)\mathrm{d}v(x)
  4. \mathrm{d}\left(\dfrac{u(x)}{v(x)}\right)=\dfrac{v(x)\mathrm{d}u(x)-u(x)\mathrm{d}v(x)}{(v(x))^2}$,其中 $v(x)\neq 0

证明

  1. \begin{aligned} \mathrm{d}(u(x)+v(x)) &= \sum_{i}\frac{\partial (u+v)}{\partial x^i}\mathrm{d}x^i \\ &= \sum_{i}\left(\frac{\partial u}{\partial x^i}+\frac{\partial v}{\partial x^i}\right)\mathrm{d}x^i \\ &= \sum_{i}\frac{\partial u}{\partial x^i}\mathrm{d}x^i + \sum_{i}\frac{\partial v}{\partial x^i}\mathrm{d}x^i \\ &= \mathrm{d}u(x)+\mathrm{d}v(x) \end{aligned}
  2. \begin{aligned} \mathrm{d}(\lambda u(x)) &= \sum_{i}\frac{\partial (\lambda u)}{\partial x^i}\mathrm{d}x^i \\ &= \lambda\sum_{i}\frac{\partial u}{\partial x^i}\mathrm{d}x^i \\ &= \lambda\,\mathrm{d}u(x) \end{aligned}
  3. \begin{aligned} \mathrm{d}(u(x)v(x)) &= \sum_{i}\frac{\partial (uv)}{\partial x^i}\mathrm{d}x^i \\ &= \sum_{i}\left(v\frac{\partial u}{\partial x^i} + u\frac{\partial v}{\partial x^i}\right)\mathrm{d}x^i \\ &= v\sum_{i}\frac{\partial u}{\partial x^i}\mathrm{d}x^i + u\sum_{i}\frac{\partial v}{\partial x^i}\mathrm{d}x^i \\ &= v\mathrm{d}u(x) + u\mathrm{d}v(x) \end{aligned}
  4. \begin{aligned} \mathrm{d}\left(\frac{u(x)}{v(x)}\right) &= \sum_{i} \frac{\partial}{\partial x^i}\left(\frac{u(x)}{v(x)}\right)\mathrm{d}x^i \\ &= \sum_{i} \frac{v(x)\frac{\partial u}{\partial x^i} - u(x)\frac{\partial v}{\partial x^i}}{(v(x))^2}\mathrm{d}x^i \\ &= \frac{v(x)\mathrm{d}u(x) - u(x)\mathrm{d}v(x)}{(v(x))^2} \end{aligned} \square

3 高阶偏导数

3.1 高阶偏导数的定义

定义 3.1 (高阶偏导数)
m 元函数 f(\mathbf{x}) = f(x_1, \dots, x_m) 在区域 D \subseteq \mathbb{R}^m 上有定义。

  1. 一阶偏导数:若对某个 i \in \{1, \dots, m\},极限

    \frac{\partial f}{\partial x_i}(\mathbf{x}) = \lim_{h \to 0} \frac{f(x_1, \dots, x_i + h, \dots, x_m) - f(\mathbf{x})}{h}

    \mathbf{x} \in D 处存在,则称 f\mathbf{x} 处对 x_i 可偏导,并称该极限值为 f\mathbf{x} 处对 x_i 的一阶偏导数。

  2. 高阶偏导数(归纳定义):假设对于某个正整数 n \geq 2f 的所有 n-1 阶偏导数已在 D 上定义。若某个 n-1 阶偏导数函数

    g(\mathbf{x}) = \frac{\partial^{n-1} f}{\partial x_{i_1} \cdots \partial x_{i_{n-1}}}(\mathbf{x})

    \mathbf{x} \in D 处对 x_{i_n} 可偏导,则称该偏导数为 f\mathbf{x} 处的一个 n 阶偏导数,记作

    \frac{\partial^n f}{\partial x_{i_1} \cdots \partial x_{i_n}}(\mathbf{x}) = \frac{\partial}{\partial x_{i_n}} \left( \frac{\partial^{n-1} f}{\partial x_{i_1} \cdots \partial x_{i_{n-1}}} \right)(\mathbf{x}).

3.2 混合偏导数与求导顺序

定理 3.1 (二元函数二阶偏导数关于求导顺序的不变性)
若函数 f(x,y) 的两个二阶混合偏导数 f_{xy}(x,y)f_{yx}(x,y) 在点 (x_0,y_0) 邻近存在,且在点 (x_0,y_0) 连续,那么就有

f_{xy}(x_0,y_0)=f_{yx}(x_0,y_0).

证明
构造一元函数

\varphi(x)=f(x,y_0+k)-f(x,y_0), \quad \psi(y)=f(x_0+h,y)-f(x_0,y).

结合一元函数有限增量公式我们有

\begin{aligned} \varphi(x_0+h)-\varphi(x_0) &= \varphi'(x_0+\theta_1 h)h \\ &= (f_x(x_0+\theta_1h,y_0+k)-f_x(x_0+\theta_1h,y_0))h \\ &= f_{xy}(x_0+\theta_1 h,y_0+\theta_2 k)hk. \end{aligned}

同理

\psi(y_0+h)-\psi(y_0) = f_{yx}(x_0+\theta_3 h,y_0+\theta_4 k)hk.

再结合

\begin{aligned} \varphi(x_0+h)-\varphi(x_0) &= f(x_0+h,y_0+k)-f(x_0+h,y_0)-f(x_0,y_0+k)+f(x_0,y_0) \\ &= \psi(y_0+k)-\psi(y_0). \end{aligned}

联立三式,我们让 (h,k) \to (0,0) 取极限得到

f_{xy}(x_0,y_0)=f_{yx}(x_0,y_0). \quad \square

定义 3.2 (r 阶可微函数)
\Omega\mathbb{R}^m 中的开集,若函数 f 和它的直到 r 阶的所有偏导数都是可微连续的,那么我们说函数 f 在开集 \Omega 上是 r 阶可微连续的。我们约定 C^r(\Omega) 表示所有在 \Omegar 阶可微连续的函数组成的集合。

定理 3.2 (偏导数关于求导顺序的不变性)
\Omega\mathbb{R}^m 中的开集,f \in C^r(\Omega),则函数 f 的任意 2 \leq k \leq r 阶偏导数与求导顺序无关。

证明
易证。 \square

(未完待续)