函数极值点:从一元到多元

· · 个人记录

前言

  1. 本文所有函数均为实函数
  2. 涉及到的芝士:
    • 多元函数全微分:链接
    • 矩阵有定性的判别:待更

极值点

极小值点:对于函数 f,若 P_0 存在邻域 U(P_0, \delta) 满足 \forall P \in U(P_0, \delta)f(P) 有定义且 \boldsymbol{f(P) \ge f(P_0)},则称 P_0f 的极小值点。

极大值点:对于函数 f,若 P_0 存在邻域 U(P_0, \delta) 满足 \forall P \in U(P_0, \delta)f(P) 有定义且 \boldsymbol{f(P) \le f(P_0)},则称 P_0f 的极大值点。

极值点:极小值点与极大值点的统称。

驻点

一元函数极值

命题:对于一元函数 fx_0f极值点

引理一:若 x_0 满足命题,且 x_0 处可导,则 f'(x_0) = 0

证明:考虑反证,假设 f'(x_0) \neq 0

引理二:对于驻点 x_0,若 f''(x_0) > 0,则 x_0 是极小值点。

证明

定理一:对于驻点 x_0,若 f''(x_0) > 0x_0 是极小值点,若 f''(x_0) < 0x_0 是极大值点。

总之,根据驻点处二阶导的正负性,可推出其是极大值点还是极小值点。

那如果 f''(x_0) 也为 0 呢?典型的例子是 f(x) = x^4, f(x) = -x^4f(x) = x^3x_0 = 0 都是它们的驻点且二阶导均为 0,但 x_0 分别是极小值点,极大值点和非极值点。此时,需要考察更高阶的导数,具体不再赘述。

多元函数极值

定义 n 元函数 g,满足其在 P = (x_1, x_2, \cdots, x_n)有定义

定理二:若 Pg 的极值点,则 \forall x_i,若 \frac {\partial g} {\partial x_i} |_P 存在则 \frac {\partial g} {\partial x_i} |_P = 0

为方便叙述,下面我们将省略 | P,默认是在 P 处求偏导。

其实是写完之后发现忘记加子,懒得一个一个改子

定义 n 元函数 f,满足 \forall x_i, x_j\frac {\partial^2 f} {\partial x_i \partial x_j}P = (x_1, x_2, \cdots, x_n)连续

显然 fP 处可微。形式化地,存在 P 的领域 U(P_0),满足 \forall P' = (x'_1, x'_2, \cdots, x'_n) \in U(P_0)

f(x'_1, x'_2, \cdots, x'_n) = f(x_1, x_2, \cdots, x_n) + \sum_{i = 1}^n \frac {\partial f} {\partial x_i} \Delta x_i + o(\rho)

其中 \Delta x_i = x'_i - x_i\rhoP, P' 的欧氏距离。

由于所有二阶偏导连续,从而所有一阶偏导都连续。任取方向向量 \boldsymbol{v} = (v_1, v_2, \cdots, v_n),考察 f\boldsymbol{v} 上的一阶偏导,有

\frac {\partial f} {\partial v} = \sum_{i = 1} ^ n \frac {v_i} {|\boldsymbol{v}|} \frac {\partial f} {\partial x_i} = 0

再考察二阶偏导

\frac {\partial^2 f} {\partial v^2} = \sum_{i = 1} ^ n \sum_{j = 1} ^n \frac {v_iv_j} {|\boldsymbol{v}| ^ 2} \frac {\partial^2 f} {\partial x_i \partial x_j}

由于偏导连续,混合偏导相等,可定义二次型矩阵

H = \begin{bmatrix} \frac {\partial^2 f} {\partial x_1^2} & \frac {\partial^2 f} {\partial x_1 \partial x_2} &\cdots &\frac {\partial^2 f} {\partial x_1 \partial x_n} \\ \frac {\partial^2 f} {\partial x_2x_1} & \frac {\partial^2 f} {\partial x_2^2} &\cdots &\frac {\partial^2 f} {\partial x_2 x_n} \\ \vdots &\vdots &\ddots &\vdots \\ \frac {\partial^2 f} {\partial x_n \partial x_1} &\frac {\partial^2 f} {\partial x_n \partial x_2} &\cdots &\frac {\partial^2 f} {\partial x_n^2} \end{bmatrix}

\frac {\partial^2 f} {\partial v^2} = \frac {1} {|\boldsymbol{v}| ^ 2} \left(\boldsymbol{v} H \boldsymbol{v}^T\right)

我们只关心 vHv^T 的正负性,因此:

定理三:令 H 为多元函数在 P 处的 Hessian 矩阵,则

根据定理三,足以导出课本上二元函数极值点的判断准则。

定理四:设 z = f(x, y)驻点 (x_0, y_0) 处有连续的二阶偏导,令 A = f'_{xx}(x_0, y_0)B = f'_{xy}(x_0, y_0)C = f'_{yy}(x_0, y_0),那么:

证明:显然 H = \begin{bmatrix} A &B \\ B &C \end{bmatrix},其两个顺序主子式为 A,\ AC - B^2

对于任意多元函数,根据定理二,可先找到所有驻点,随后逐一检查 Hessian 矩阵的有定性。

至此,我们基本解决了多元函数极值点问题。