多元微分学(1)
GODTREE
·
2026-01-08 23:49:58
·
学习·文化课
偏导数与全微分
1 偏导数与全微分
1.1 方向导数与偏导数
定义 1.1 (方向导数)
设二元函数 f(x, y) 在点 (x_0, y_0) 有定义,\mathbf{e} = (\cos\theta,\ \sin\theta) 是一个方向向量。若极限
\lim_{t \to 0} \frac{f(x_0 + t\cos\theta,\ y_0 + t\sin\theta) - f(x_0, y_0)}{t}
存在,则称该极限为函数 f 在点 (x_0, y_0) 沿方向 \mathbf{e} 的方向导数 ,记作
\frac{\partial f}{\partial \mathbf{e}}(x_0, y_0) \quad \text{或} \quad \partial_{\mathbf{e}} f(x_0, y_0).
定义 1.2 (偏导数)
方向导数沿坐标轴正方向(即 \mathbf{e} 分别取 (1,0) 与 (0,1) )的特殊情形称为偏导数 。采用以下记号之一:
对 x 的偏导:\dfrac{\partial f}{\partial x}(x_0, y_0) , f'_x(x_0, y_0) , f_x(x_0, y_0)
对 y 的偏导:\dfrac{\partial f}{\partial y}(x_0, y_0) , f'_y(x_0, y_0) , f_y(x_0, y_0)
注意 :即使 f(x, y) 在 (x_0, y_0) 沿任意方向的导数都存在,也不能推出 f 在该点连续,因为极限路径未必是直线。
1.2 全微分
定义 1.3 (可微性与全微分)
设二元函数 f(x, y) 在点 (x_0, y_0) 有定义。若存在实数 A, B ,使得当 \sqrt{(\Delta x)^2 + (\Delta y)^2} \to 0 时,成立
f(x_0 + \Delta x,\ y_0 + \Delta y) - f(x_0, y_0) = A\Delta x + B\Delta y + o\!\left(\sqrt{(\Delta x)^2 + (\Delta y)^2}\right),
则称 f 在点 (x_0, y_0) 可微 ,并称线性主部 A\Delta x + B\Delta y 为 f 在 (x_0, y_0) 的全微分 ,记作
\mathrm{d}f(x_0, y_0) = A\,\mathrm{d}x + B\,\mathrm{d}y.
定理 1.1 (可微蕴含连续)
若 f(x, y) 在 (x_0, y_0) 可微,则 f 在该点连续。
证明 :由可微定义直接可得。 \square
定理 1.2 (可微蕴含各方向导数存在)
若 f(x, y) 在 (x_0, y_0) 可微,则 f 在该点沿任意方向 \mathbf{e}=(\cos\theta,\ \sin\theta) 的方向导数均存在。
证明 :在可微表达式中取 \Delta x = t\cos\theta,\ \Delta y = t\sin\theta ,即得结论。 \square
推论 1.1 (全微分与偏导数的关系)
若 f(x, y) 在 (x_0, y_0) 可微,且 \mathrm{d}f(x_0, y_0) = A\,\mathrm{d}x + B\,\mathrm{d}y ,则
\frac{\partial f}{\partial x}(x_0, y_0) = A, \qquad \frac{\partial f}{\partial y}(x_0, y_0) = B.
即全微分中的系数即为相应的偏导数。
1.3 连续可微函数
定理 1.3 (连续可微则必可微)
若函数 f(x, y) 的各个偏导数在点 (x_0, y_0) 的某个邻域内存在,且它们在 (x_0, y_0) 连续,则 f 在 (x_0, y_0) 可微。
证明 :
记 h = \Delta x = x - x_0 ,k = \Delta y = y - y_0 。应用一元函数的有限增量公式:
\begin{aligned}
& f(x_0 + h,\ y_0 + k) - f(x_0, y_0) \\
= & \bigl[f(x_0 + h,\ y_0 + k) - f(x_0,\ y_0 + k)\bigr] + \bigl[f(x_0,\ y_0 + k) - f(x_0, y_0)\bigr] \\
= & f_x(x_0 + \theta h,\ y_0 + k)\,h + f_y(x_0,\ y_0 + \omega k)\,k, \qquad 0 < \theta,\ \omega < 1.
\end{aligned}
由偏导数的连续性,可写
f_x(x_0 + \theta h,\ y_0 + k) = f_x(x_0, y_0) + \alpha, \quad
f_y(x_0,\ y_0 + \omega k) = f_y(x_0, y_0) + \beta,
其中当 (h, k) \to (0, 0) 时,\alpha,\ \beta \to 0 。代入得
f(x_0 + h,\ y_0 + k) - f(x_0, y_0) = f_x(x_0, y_0)h + f_y(x_0, y_0)k + \alpha h + \beta k.
注意到
\left|\frac{\alpha h + \beta k}{\sqrt{h^2 + k^2}}\right| \leq |\alpha| + |\beta| \to 0,
故 \alpha h + \beta k = o\!\left(\sqrt{h^2 + k^2}\right) ,从而
f(x_0 + h,\ y_0 + k) - f(x_0, y_0) = f_x(x_0, y_0)h + f_y(x_0, y_0)k + o\!\left(\sqrt{h^2 + k^2}\right).
即 f 在 (x_0, y_0) 可微。 \square
1.4 m 元函数的一般情形
本节将前述二元函数的核心概念(方向导数、偏导数、全微分与可微性)自然推广到 m 元函数的情形。
定义 1.4 (m 元函数的方向导数与偏导数)
设 m 元函数 f(\mathbf{x}) = f(x_1, x_2, \dots, x_m) 在点 \mathbf{x}^0 = (x_1^0, \dots, x_m^0) 的某邻域内有定义,\mathbf{e} = (e_1, e_2, \dots, e_m) 是一个单位方向向量(即 \|\mathbf{e}\| = \sqrt{e_1^2 + \dots + e_m^2} = 1 )。若极限
\lim_{t \to 0} \frac{f(\mathbf{x}^0 + t\mathbf{e}) - f(\mathbf{x}^0)}{t} = \lim_{t \to 0} \frac{f(x_1^0 + te_1, \dots, x_m^0 + te_m) - f(\mathbf{x}^0)}{t}
存在,则称此极限为函数 f 在点 \mathbf{x}^0 沿方向 \mathbf{e} 的方向导数 ,记作 \dfrac{\partial f}{\partial \mathbf{e}}(\mathbf{x}^0) 或 \partial_{\mathbf{e}} f(\mathbf{x}^0) 。
特别地,沿坐标轴正方向 \mathbf{e}_i = (0,\dots,1,\dots,0) (第 i 个分量为 1 )的方向导数称为对自变量 x_i 的偏导数 ,记作:
\frac{\partial f}{\partial x_i}(\mathbf{x}^0),\quad f_{x_i}(\mathbf{x}^0), \quad \text{或} \quad D_i f(\mathbf{x}^0).
定义 1.5 (m 元函数的可微性与全微分)
设 m 元函数 f(\mathbf{x}) 在点 \mathbf{x}^0 的某邻域内有定义。若存在一组实数 A_1, A_2, \dots, A_m ,使得对于增量 \Delta \mathbf{x} = (\Delta x_1, \dots, \Delta x_m) ,当 \|\Delta \mathbf{x}\| = \sqrt{(\Delta x_1)^2 + \dots + (\Delta x_m)^2} \to 0 时,成立
f(\mathbf{x}^0 + \Delta \mathbf{x}) - f(\mathbf{x}^0) = \sum_{i=1}^{m} A_i \Delta x_i + o(\|\Delta \mathbf{x}\|),
则称函数 f 在点 \mathbf{x}^0 可微 。线性主部 \sum_{i=1}^{m} A_i \Delta x_i 称为 f 在点 \mathbf{x}^0 的全微分 ,记作
\mathrm{d}f(\mathbf{x}^0) = \sum_{i=1}^{m} A_i \mathrm{d}x_i.
定理 1.4 (m 元函数可微的性质)
可微蕴含连续 :若 f 在点 \mathbf{x}^0 可微,则 f 在该点连续。
可微蕴含方向导数存在 :若 f 在点 \mathbf{x}^0 可微,则 f 在该点沿任意方向 \mathbf{e} 的方向导数均存在。
全微分系数即偏导数 :若 f 在点 \mathbf{x}^0 可微,且 \mathrm{d}f(\mathbf{x}^0) = \sum_{i=1}^{m} A_i \mathrm{d}x_i ,则
\frac{\partial f}{\partial x_i}(\mathbf{x}^0) = A_i, \quad i=1,2,\dots,m.
因此,全微分可唯一地写为:
\mathrm{d}f(\mathbf{x}^0) = \sum_{i=1}^{m} \frac{\partial f}{\partial x_i}(\mathbf{x}^0) \mathrm{d}x_i.
证明思路 :
性质1与2的证明与二元情形完全类似,只需将二元情形下的表达式替换为对应的 m 维形式即可。性质3的证明可通过在可微性定义中分别取 \Delta \mathbf{x} 为 (0,\dots, \Delta x_i, \dots, 0) 并利用方向导数的定义直接得到。
定理 1.5 (连续可微则必可微)
若 m 元函数 f(\mathbf{x}) 的所有一阶偏导数 \dfrac{\partial f}{\partial x_1}, \dots, \dfrac{\partial f}{\partial x_m} 在点 \mathbf{x}^0 的某个邻域内存在,且都在点 \mathbf{x}^0 连续,则函数 f 在点 \mathbf{x}^0 可微。
证明思路(多次应用有限增量公式) :
令 \Delta \mathbf{x} = (h_1, \dots, h_m) 。将函数值的增量视为依次只变动一个自变量的结果:
\begin{aligned}
& f(x_1^0+h_1, \dots, x_m^0+h_m) - f(x_1^0, \dots, x_m^0) \\
= & \ [f(x_1^0+h_1, x_2^0, \dots, x_m^0) - f(x_1^0, \dots, x_m^0)] \\
+ & \ [f(x_1^0+h_1, x_2^0+h_2, x_3^0, \dots, x_m^0) - f(x_1^0+h_1, x_2^0, \dots, x_m^0)] \\
+ & \ \dots \\
+ & \ [f(x_1^0+h_1, \dots, x_m^0+h_m) - f(x_1^0+h_1, \dots, x_{m-1}^0+h_{m-1}, x_m^0)].
\end{aligned}
对上述每一行应用一元函数的有限增量公式,再利用各偏导数的连续性,即可将每项写为 \dfrac{\partial f}{\partial x_i}(\mathbf{x}^0) h_i 加上一个高阶无穷小项。最终可证得存在满足定义的关系式 f(\mathbf{x}^0+\Delta \mathbf{x}) - f(\mathbf{x}^0) = \sum_{i=1}^m \dfrac{\partial f}{\partial x_i}(\mathbf{x}^0) h_i + o(\|\Delta \mathbf{x}\|) 。 \square
2 复合函数的偏导数与全微分
2.1 复合函数求导的链式法则
定理 2.1 (复合函数求导的链式法则)
设有 m 个 k 元函数 \varphi^{i}(t)=\varphi^{i}(t^{1},t^{2},...,t^{k}) ,它们在点 t_0=(t_0^1,t_0^2,...,t_0^k) 处对所有 t^j 的偏导数都存在,且 \varphi^1(t_0)=x_0^1,\varphi^2(t_0)=x_0^2,...,\varphi^m(t_0)=x_0^m 。又设 m 元函数 f(x^1,x^2,...,x^m) 在点 x_0=(x_0^1,x_0^2,...,x_0^m) 可微,那么复合函数
F(t)=f(\varphi^1(t),\varphi^2(t),...,\varphi^m(t))
在点 t_0 对所有 t^j 的偏导数也都存在,并且
\frac{\partial F}{\partial t^j}(t_0)=\sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0)\frac{\partial \varphi^i}{\partial t^j}(t_0).
证明 :
由于 f 在 x_0 可微,故有:
f(x_0 + \Delta x) - f(x_0) = \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \Delta x^i + o(\|\Delta x\|),
其中 \Delta x = (\Delta x^1, \dots, \Delta x^m) ,\|\Delta x\| = \sqrt{\sum_{i=1}^m (\Delta x^i)^2} 。
现考虑复合函数 F 在 t_0 处对 t^j 的偏导数。令 \Delta t^j 为 t^j 的增量,记 \Delta t = (0, \dots, \Delta t^j, \dots, 0) (仅第 j 个分量非零)。相应地,令
\Delta \varphi^i = \varphi^i(t_0 + \Delta t) - \varphi^i(t_0),\quad i=1,\dots,m.
由 \varphi^i 在 t_0 处对 t^j 可偏导,知
\Delta \varphi^i = \frac{\partial \varphi^i}{\partial t^j}(t_0) \Delta t^j + o(|\Delta t^j|).
于是复合函数的增量为:
\begin{aligned}
F(t_0 + \Delta t) - F(t_0) &= f(\varphi^1(t_0 + \Delta t), \dots, \varphi^m(t_0 + \Delta t)) - f(\varphi^1(t_0), \dots, \varphi^m(t_0)) \\
&= f(x_0 + \Delta \varphi) - f(x_0),
\end{aligned}
其中 \Delta \varphi = (\Delta \varphi^1, \dots, \Delta \varphi^m) 。
代入 f 的可微性表达式:
\begin{aligned}
F(t_0 + \Delta t) - F(t_0) &= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \Delta \varphi^i + o(\|\Delta \varphi\|) \\
&= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \left[ \frac{\partial \varphi^i}{\partial t^j}(t_0) \Delta t^j + o(|\Delta t^j|) \right] + o(\|\Delta \varphi\|).
\end{aligned}
注意到 \Delta \varphi^i 是 \Delta t^j 的线性函数加高阶无穷小,故存在常数 C ,使得当 |\Delta t^j| 充分小时,\|\Delta \varphi\| \le C |\Delta t^j| ,从而 o(\|\Delta \varphi\|) = o(|\Delta t^j|) 。于是
F(t_0 + \Delta t) - F(t_0) = \left[ \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \frac{\partial \varphi^i}{\partial t^j}(t_0) \right] \Delta t^j + o(|\Delta t^j|).
因此
\frac{\partial F}{\partial t^j}(t_0) = \lim_{\Delta t^j \to 0} \frac{F(t_0 + \Delta t) - F(t_0)}{\Delta t^j} = \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x_0) \frac{\partial \varphi^i}{\partial t^j}(t_0).
\square
2.2 微分表示的不变性
定理 2.2 (全微分形式不变性)
不论 x=(x^1,x^2,...,x^m) 是自变元,或者是依赖于另外的变元 t=(t^1,t^2,...,t^k) 的可微函数,函数 f(x)=f(x^1,x^2,...,x^m) 的全微分都具有相同的形式:
\mathrm{d}f(x)=\sum_{i=1}^m \frac{\partial f}{\partial x^i}(x)\,\mathrm{d}x^i.
证明 :
当 x 是自变元时,由全微分的定义即得。
当 x 是 t 的可微函数时,考虑复合函数 F(t)=f(x(t)) 。由链式法则(定理2.1),对任意 j=1,\dots,k ,有
\frac{\partial F}{\partial t^j} = \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \frac{\partial x^i}{\partial t^j}.
于是 F 的全微分为:
\begin{aligned}
\mathrm{d}F &= \sum_{j=1}^k \frac{\partial F}{\partial t^j} \,\mathrm{d}t^j \\
&= \sum_{j=1}^k \left( \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \frac{\partial x^i}{\partial t^j} \right) \mathrm{d}t^j \\
&= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \left( \sum_{j=1}^k \frac{\partial x^i}{\partial t^j} \mathrm{d}t^j \right) \\
&= \sum_{i=1}^m \frac{\partial f}{\partial x^i}(x(t)) \,\mathrm{d}x^i,
\end{aligned}
其中 \mathrm{d}x^i = \sum_{j=1}^k \frac{\partial x^i}{\partial t^j} \mathrm{d}t^j 正是 x^i 的全微分。 \square
定理 2.3 (微分运算法则)
设 u(x) 和 v(x) 是可微函数,\lambda \in \mathbb{R} ,则有
\mathrm{d}(u(x)+v(x))=\mathrm{d}u(x)+\mathrm{d}v(x)
\mathrm{d}(\lambda u(x))=\lambda\,\mathrm{d}u(x)
\mathrm{d}(u(x)v(x))=v(x)\mathrm{d}u(x)+u(x)\mathrm{d}v(x)
\mathrm{d}\left(\dfrac{u(x)}{v(x)}\right)=\dfrac{v(x)\mathrm{d}u(x)-u(x)\mathrm{d}v(x)}{(v(x))^2}$,其中 $v(x)\neq 0
证明 :
\begin{aligned}
\mathrm{d}(u(x)+v(x)) &= \sum_{i}\frac{\partial (u+v)}{\partial x^i}\mathrm{d}x^i \\
&= \sum_{i}\left(\frac{\partial u}{\partial x^i}+\frac{\partial v}{\partial x^i}\right)\mathrm{d}x^i \\
&= \sum_{i}\frac{\partial u}{\partial x^i}\mathrm{d}x^i + \sum_{i}\frac{\partial v}{\partial x^i}\mathrm{d}x^i \\
&= \mathrm{d}u(x)+\mathrm{d}v(x)
\end{aligned}
\begin{aligned}
\mathrm{d}(\lambda u(x)) &= \sum_{i}\frac{\partial (\lambda u)}{\partial x^i}\mathrm{d}x^i \\
&= \lambda\sum_{i}\frac{\partial u}{\partial x^i}\mathrm{d}x^i \\
&= \lambda\,\mathrm{d}u(x)
\end{aligned}
\begin{aligned}
\mathrm{d}(u(x)v(x)) &= \sum_{i}\frac{\partial (uv)}{\partial x^i}\mathrm{d}x^i \\
&= \sum_{i}\left(v\frac{\partial u}{\partial x^i} + u\frac{\partial v}{\partial x^i}\right)\mathrm{d}x^i \\
&= v\sum_{i}\frac{\partial u}{\partial x^i}\mathrm{d}x^i + u\sum_{i}\frac{\partial v}{\partial x^i}\mathrm{d}x^i \\
&= v\mathrm{d}u(x) + u\mathrm{d}v(x)
\end{aligned}
\begin{aligned}
\mathrm{d}\left(\frac{u(x)}{v(x)}\right) &= \sum_{i} \frac{\partial}{\partial x^i}\left(\frac{u(x)}{v(x)}\right)\mathrm{d}x^i \\
&= \sum_{i} \frac{v(x)\frac{\partial u}{\partial x^i} - u(x)\frac{\partial v}{\partial x^i}}{(v(x))^2}\mathrm{d}x^i \\
&= \frac{v(x)\mathrm{d}u(x) - u(x)\mathrm{d}v(x)}{(v(x))^2}
\end{aligned}
\square
3 高阶偏导数
3.1 高阶偏导数的定义
定义 3.1 (高阶偏导数)
设 m 元函数 f(\mathbf{x}) = f(x_1, \dots, x_m) 在区域 D \subseteq \mathbb{R}^m 上有定义。
一阶偏导数 :若对某个 i \in \{1, \dots, m\} ,极限
\frac{\partial f}{\partial x_i}(\mathbf{x}) = \lim_{h \to 0} \frac{f(x_1, \dots, x_i + h, \dots, x_m) - f(\mathbf{x})}{h}
在 \mathbf{x} \in D 处存在,则称 f 在 \mathbf{x} 处对 x_i 可偏导,并称该极限值为 f 在 \mathbf{x} 处对 x_i 的一阶偏导数。
高阶偏导数(归纳定义) :假设对于某个正整数 n \geq 2 ,f 的所有 n-1 阶偏导数已在 D 上定义。若某个 n-1 阶偏导数函数
g(\mathbf{x}) = \frac{\partial^{n-1} f}{\partial x_{i_1} \cdots \partial x_{i_{n-1}}}(\mathbf{x})
在 \mathbf{x} \in D 处对 x_{i_n} 可偏导,则称该偏导数为 f 在 \mathbf{x} 处的一个 n 阶偏导数,记作
\frac{\partial^n f}{\partial x_{i_1} \cdots \partial x_{i_n}}(\mathbf{x}) = \frac{\partial}{\partial x_{i_n}} \left( \frac{\partial^{n-1} f}{\partial x_{i_1} \cdots \partial x_{i_{n-1}}} \right)(\mathbf{x}).
3.2 混合偏导数与求导顺序
定理 3.1 (二元函数二阶偏导数关于求导顺序的不变性)
若函数 f(x,y) 的两个二阶混合偏导数 f_{xy}(x,y) 和 f_{yx}(x,y) 在点 (x_0,y_0) 邻近存在,且在点 (x_0,y_0) 连续,那么就有
f_{xy}(x_0,y_0)=f_{yx}(x_0,y_0).
证明 :
构造一元函数
\varphi(x)=f(x,y_0+k)-f(x,y_0), \quad \psi(y)=f(x_0+h,y)-f(x_0,y).
结合一元函数有限增量公式我们有
\begin{aligned}
\varphi(x_0+h)-\varphi(x_0) &= \varphi'(x_0+\theta_1 h)h \\
&= (f_x(x_0+\theta_1h,y_0+k)-f_x(x_0+\theta_1h,y_0))h \\
&= f_{xy}(x_0+\theta_1 h,y_0+\theta_2 k)hk.
\end{aligned}
同理
\psi(y_0+h)-\psi(y_0) = f_{yx}(x_0+\theta_3 h,y_0+\theta_4 k)hk.
再结合
\begin{aligned}
\varphi(x_0+h)-\varphi(x_0) &= f(x_0+h,y_0+k)-f(x_0+h,y_0)-f(x_0,y_0+k)+f(x_0,y_0) \\
&= \psi(y_0+k)-\psi(y_0).
\end{aligned}
联立三式,我们让 (h,k) \to (0,0) 取极限得到
f_{xy}(x_0,y_0)=f_{yx}(x_0,y_0). \quad \square
定义 3.2 (r 阶可微函数)
设 \Omega 是 \mathbb{R}^m 中的开集,若函数 f 和它的直到 r 阶的所有偏导数都是可微连续的,那么我们说函数 f 在开集 \Omega 上是 r 阶可微连续的。我们约定 C^r(\Omega) 表示所有在 \Omega 上 r 阶可微连续的函数组成的集合。
定理 3.2 (偏导数关于求导顺序的不变性)
设 \Omega 是 \mathbb{R}^m 中的开集,f \in C^r(\Omega) ,则函数 f 的任意 2 \leq k \leq r 阶偏导数与求导顺序无关。
证明 :
易证。 \square
(未完待续)