高代笔记 3

KellyFrog · 2025-05-27 11:39:01 · 个人记录

高等代数 2 笔记

第九章实内积空间（剩余内容）

9.9 奇异值分解

定理：设 V,W 是实内积空间，T:V\to W 是线性映射，则存在 V,W 的单位正交基 v_1,\ldots,v_n，w_1,\ldots,w_m 和唯一确定的 \sigma_1\ge\sigma_2\ge\ldots\ge\sigma_p\ge 0 使得 Tv_i=[i\le p]\sigma_iw_i，其中 p=\min\{n,m\}。

首先证明奇异值 \sigma_1,\ldots,\sigma_p 的唯一性。注意到 (T(v_i+v_j)|w_i)_W=((v_i+v_j)|Tw_i)=\sigma_i，T^*w_j=[j\le p]\sigma_jv_j，因此 \sigma_i^2 都是 T^*T 的特征值，由此唯一确定。

同样地，由于 T^*T 是半正定的，可以正交对角化并重排得到 \sigma_1\ge\ldots\ge\sigma_p\ge 0 并确定 v_1,\ldots,v_n，由此确定 w_i=\sigma_i^{-1}Tv_i，容易验证 (w_i|w_i)_W=(v_i|\sigma_i^{-2}T^*Tv_i)_V=1，同时 (w_i|w_j)_W=(v_i|\sigma^{-2}T^*Tv_j)_V=0，然后将 w_1,\ldots,w_p 扩充成一组基，即证。

如此可以得到奇异值分解的矩阵形式，记 P=(v_1|\ldots|v_n)，Q=(w_1|\ldots|w_m)，\Sigma\in M_{m\times m} 是由 \sigma_1,\ldots,\sigma_p,0,\ldots,0 排列而成的对角矩阵，那么有 AP=Q\Sigma，或者等价地写成 A=Q\Sigma P{^\text{t}}。

9.10 Moore-Penrose 广义逆

定义：设 V,W 是实内积空间，T:V\to W 是线性映射，若 S:W\to V 满足以下条件，则称 S 是 T 的 Moore-Penrose 广义逆：

TST=T
STS=S
(ST)^*=ST
(TS)^*=TS

接下来将说明 Moore-Penrose 广义逆存在且唯一，并根据奇异值分解给出一个构造。

定理：上述 S 存在且唯一，并有如下的构造给出：对于任意的 v\in V,w\in W，将其分解为 v=v'+v''，w=w'+w''，其中 v'\in\ker T，v''\in(\ker T)^\perp，w'\in\operatorname{im} T，w''\in(\operatorname{im}T)^\perp。对于 w\in W，任取一个 v\in T^{-1}w'，令 Sw=v''。

这确实是良定的，因为所有 T^{-1} 中的元素差一个 \ker T，同时容易验证 TSTv=TSTv''=Tv''=Tv，STSw=STv''=Sw'=Sw，这同样说明了 TS 和 ST 分别是 \operatorname{im}T 和 \ker T 的正交投影，正交投影自动是自伴的，因此 S 确实存在。

如果存在两个 Moore-Penrose 广义逆 S 和 R，那么可以得到 S=STS=S(TS)^*=SS^*T^*=SS^*(TRT)^*=S(TS)^*(TR)^*=STR，类似的论证也给出 R=STR，因此有 S=R，即证。

关于 Moore-Penrose 广义逆的构造，从矩阵角度来说，一种方便的方法是先作奇异值分解 T=Q\Sigma P^\text{t}，随后取 S=P\Sigma'Q^\text{t}，其中 \Sigma' 表示将 \Sigma 非零部分取逆得到的对角矩阵（两维大小交换），上述各条性质都容易验证。

9.11 极小化极大原理

设 V 是实内积空间，B 是对称双线性形式，那么可知存在 S\in\text{End}(V) 使得 B(v_1,v_2)=(v_1|Sv_2)，由于 B 和内积都是对称的，交换两个变量可以得到 B(v_1,v_2)=B(v_2,v_1)=(v_2|Sv_1)，因此 S 自伴。

选取适当的单位正交基使 S 对角化，那么 S 的最大、最小特征值由 \displaystyle\max_{|v|=1}B(v,v) 和 \displaystyle\min_{|v|=1}B(v,v) 给出，下面这则定理给出了从大到小每个特征值的刻画：

\lambda_k=\min_{U\subseteq V,\dim U=n-k+1}\max_{v\in U,|v|=1}B(v,v)

\lambda_k=\max_{U\subseteq V,\dim U=k}\min_{v\in U,|v|=1}B(v,v)

这则定理的直观理解在于选取维数为 n-k+1 的子空间必然会包含 \left<v_1,\ldots,v_k\right> 中的一个元素，其中 v 是单位正交基，这导致右边的最大值 \ge\lambda_k，而取到 \lambda_k 有显然的构造，类似的论证对于后一个式子也成立。

9.12 Perron–Frobenius 定理

这一章主要关心正矩阵（所有元素都为正）和正向量（所有元素都为正）的一些性质。

约记：设 A,B\in M_{n\times n}(\R)，称 A>B（或 A\ge B）当且仅当 A_{i,j}>B_{i,j}（A_{i,j}\ge B_{i,j}）对所有 1\le i,j\le n 都成立，特别地，当 B=0_{n\times n} 时也记作 A>0 或 A\ge 0。

引理：设 A>0，v\ge 0 是列向量且不为 0，则 Av>0。

这是显然的，在 v 中找一项不为 0 的即可。

定义：设 A\in M_{n\times n}(\C)，定义 A 的谱半径为 \rho(A):=\max\{|\lambda|\}，其中 \lambda\in\C 是 A 的特征值。

引理：设 A\in M_{n\times n}(\R)，且 A>0，则：

存在 \rho>0 和 v\in\R^n 满足 v>0 使得 Av=\rho v。
上述 \rho 可以取到谱半径 \rho(A)。

证明：考察 S:=\{x\in\R^n:|x|=1,x\ge 0\}，这是紧集，因此在其上的连续映射有最大值和极值，考察映射 \mathcal L:S\to\R_{>0} 映 x\mapsto\min\{(Ax)_i/x_i:x_i\neq 0\}，这确实是连续的，命 \rho 为 \mathcal L 的一个极大值且在 v 处取到，下面证明确实有 Av=\rho v 能被取到。

首先有 Av\ge\rho v，如果不等号取不到，则 A(Av-\rho v)>0，取足够小的 \epsilon 使得 A(Av-\rho v)>\epsilon Av，于是有 A(Av)\ge (\rho+\epsilon)Av，命 w=Av，则 Aw\ge (\rho+\epsilon)w，这和 \rho 最大矛盾，因此当 \rho 最大时等号确实可以取到。

对于后一半，考虑 \mu\in\C 和 w\in\C^n 非零使得 \mu w=Aw，那么有 |\mu|\cdot |w_i|=|(\mu w)_i|=|\sum_{j} A_{i,j}w_j|\le \sum_j A_{i,j}|w_j|，命 w'=(|w_1|,\ldots,|w_n|)，上述不等式说明 |\mu w'|\le |Aw'|，适当伸缩使得 |w'|=1，得到 \mathcal L(w')\ge\mu，这说明 \rho\ge\rho(A)，而由于 \rho 确实是特征值，因此 \rho\le\rho(A)，因此此时确有 \rho=\rho(A)。

定理：设 A\in M_{n\times n}(\R)，A>0，则下属性质成立：

\rho(A)>0$，且存在 $v\in\R^n$ 使得 $Av=\rho(A)v
若 \mu\in\C 是 A 的特征值，且 \mu\neq \rho(A)，则 |\mu|<\rho(A)
对应 \rho(A) 的特征子空间是 1 维的

(i) 是引理的内容。

(ii) 考虑 (i) 引理的内容，论证过程中的不等式等号必须成立，即 \sum_jA_{i,j}|w_j|=|\sum_jA_{i,j}w_j| 成立，由于 A_{i,j} 都是实的，w_j 必然处在一条复平面的直线上，设此时 w=cv，其中 v\ge 0，那么 w 和 v 有相同的特征值，而 v 是实的，因此特征值也正实数，此时特征值必然是 \rho(A)，即证。

(iii) 如若不然，则存在 v,v' 不线性相关使得 \rho(A)v=Av，\rho(A)v'=Av'，引理保证了存在一个 v>0，因此对于充分小的 \epsilon，有 v-\epsilon v'\ge 0，其中至少一个分量为 0，但是 \rho(A)(v-\epsilon v')=A(v-\epsilon v')>0，这是显然的矛盾。

(iv) 显然 \rho(A) 转置不变，取 u\in\R^n 使得 \rho(A)u=A^\text tu，那么 \left<u\right>^\perp=\{x\in\R^n:u^\text tx=0\} 是 A-不变子空间，这是由于此时 u^\text t Ax=(A^\text tu)^\text tx=\rho(A)u^\text tx=0，且由于 u,v>0，总有 u^\text tv>0，因此可以作 A-不变直和分解 A=\Rv\oplus\left<u\right>^\perp，如果 \rho(A) 不是单根，那么其在 \left<u\right>^\perp 中也会有特征子空间，运用 (iii) 中的论证可知矛盾。

定理：若将上一条定理的条件减弱为 A\ge 0，在存在 m\in\mathbb Z_{\ge 1} 使得 A^m>0 时，四条性质仍然成立。

由于 A^m 的特征值是 A 的特征值取 m 次幂，取 A^m>0，此时后三条性质自动成立。对于第一条，考虑最大特征值 \rho(A)=|\lambda_1|，A^m 中显然会有 \rho(A^m)=|\lambda_1^m|，取 v\in\C^n 满足 Av=\lambda_1v，这满足 A^mv=\lambda_1^mv，通过之前的论证得知必然存在 v>0 满足这个条件，于是 \lambda_1 v=Av\ge 0，这说明 \lambda_1\ge 0，同时显然 \lambda_1\neq 0，这证明了 (i)。

定理：将正权强联通有向图视作邻接矩阵 A\in M_{n\times n}(\R)，则：

\rho(A)>0
存在 v\in\R^n 使得 v>0 且 Av=\rho(A)v

第十章复内积结构

对于复数 z，其模长为 \overline z\cdot z。如果我们想表达一个复向量的长度的话，其模长的平方就应该对应每一维模长的平方相加，也即 ^\dagger v\cdot v，其中 ^\dagger 表示共轭转置。从这个角度来看，仿照实内积空间引入实二次型，复内积空间上也可以引入复二次型 B(v,w)，随后让 B(v,v) 充当内积的角色，但这个结构并不能是双线性映射，这是由于第一个变量的纯量乘法会差一个共轭，因此就延伸出了复空间上的半双线性映射。

10.1 半双线性形式

定义（半线性映射）：若复向量空间之间的映射 T:V\to W 满足 T(v_1+v_2)=T(v_1)+T(v_2) 且 T(tv)=\overline tT(v)（其中 t\in\C），则称 T 是半线性映射。

半线性映射自然是 \R 线性的（将 \C 看作 \R 向量空间）。

定义（复共轭空间）：设 V 是 \C 向量空间，定义其复共轭 \overline V，其中 \overline V 的加法和 V 相同，纯量乘法差一个共轭（即 t\odot v=\overline t\cdot v）。

由此可知 \overline{\overline V}=V。

以下是一些例子：

映射 z\mapsto \overline z 给出 \C-向量空间的同构 \overline{\C} \overset{\sim}\to C
设 V_1,V_2 是 \C-向量空间，则 \overline{V_1}\oplus \overline{V_2}=\overline{V_1\oplus V_2}（这里理解为存在元素映到自身的同构）
设 W 是 \C-向量空间，有同构 \overline{W}^\lor\to \overline{W^\lor}。它映 \lambda\in \overline W 为 \overline{\lambda}:v\mapsto \overline{\lambda v}

在一些时候，复空间的某些自同构也满足上述性质，只是同构应映射有所改变，如对于 $\C^n$，这样的一个同构是逐维取共轭，因此在讨论 $\C^n$ 的时候，取复共轭空间就可以看作一般的数值共轭。 **定义（半双线性映射和半双线性形式）**：设 $V,W,X$ 是 $\C-$向量空间，半双线性映射是指 $B:V\times W\to X$ 的映射，其中 $B$ 对第一个变元是半线性的、对第二个变元是线性的。限制 $V,W,X$，则所有半双线性映射构成一个空间，记作 $\text{Sesq}_{\mathbb{C|R}}(V,W;X)$；当 $X=\C$ 时，称双线性映射为双线性形式，构成的向量空间记作 $\text{Sesq}_{\mathbb{C|R}}(V,W)$。操演定义，得到 $\text{Sesq}_{\mathbb{C|R}}(V,W;X)=\text{Bil}(\overline V,W;X)$。 **定义（左右根和非退化）**：设 $V,W$ 是有限维 $\C-$ 向量空间，其左根、右根、非退化的定义同一般双线性形式相同。其余性质也适用，即非退化的必要条件是 $\dim V=\dim W$，此时左右根非空等价。类似双线性形式，半双线性形式也可以由矩阵表示。对于列向量的情形，有同构 $M_{m\times n}(\C)\simeq \text{Sesq}_{\mathbb{C|R}}(\C^m,\C^n)$，同构映射映 $A\mapsto [B(v,w):={^\dagger}vAw]$。对于一般的向量空间，选定基后也有矩阵到半双线性形式的同构。列向量 $\C^n$ 和我们需要的 $(\overline{\C^n})^\lor$ 之间过渡，用到的就是共轭转置（类似双线性形式中的转置）。设 $B$ 依 curry 化对应到 $\varphi\in\text{Hom}(\C^n,(\overline{\C^m})^\lor)$，问题的关键在于确定同构 $\C^m\simeq (\overline{\C^m})^\lor$，这样可以使半双线性映射映到矩阵上，这个同构可以采取映 $v$ 为半线性映射 $v_1\mapsto {^\text t}v\,\overline{v_1}$，据此让 $\varphi$ 对应到 $\text{Hom}(\C^n,\C^m)$ 亦即 $M_{m\times n}(\C)$，那么有 $B(v,w)=\left<\varphi(w),v\right>={^{\text t}}(Aw)\overline v$，继续转置即得结果。 **定义（Hermite 形式）**：设 $V$ 是 $\C-$向量空间，$\epsilon\in\{\pm 1\}$，若半双线性形式 $B:V\times V\to\C$ 满足 $B(u,v)=\epsilon\overline{B(v,u)}$，则称 $B$ 是 $\epsilon-$Hermite 形式，$\epsilon$ 取正负 1 时称为 Hermite 形式和反 Hermite 形式。 **定义（Hermite 矩阵）**：设 $\epsilon\in\{-1,1\}$，若 $A\in M_{n\times n}(\C)$ 满足 $^\dagger A=\epsilon A$，则称 $A$ 为 $\epsilon-$Hermite 矩阵，当 $\epsilon$ 取正负 1 时称为 Hermite 矩阵和反 Hermite 矩阵。正 Hermite 矩阵对应位置实部相等，虚部相反；反 Hermite 矩阵对应位置虚部相等、实部相反。 **定义（伴随映射）**：给定两个半双线性形式 $B_1:V_1\times W_1\to \C$ 和 $B_2:V_2\times W_2\to\C$，其中 $B_1$ 非退化，定义 $T\in\text{Hom}(V_1,V_2)$ 的右伴随映射 $T^*$ 为满足 $B_2(Tv_1,w_2)=B_1(v_1,T^*w_2)$ 的 $T^*$；类似地，定义 $T\in\text{Hom}(W_1,W_2)$ 的左伴随映射 $^*T$ 为满足 $B_2(v_2,Tw_1)=B_1(^*Tv_2,w_1)$ 的 $^*T$。事实上左右伴随必然唯一，刻画也类似双线性形式，以右伴随为例，有 $^\dagger v_1{^\dagger}TA_2w_2={^\dagger}(Tv_1)A_2w_2={^\dagger}v_1A_1T^*w_2$，可以得到 $T^*=A_1^{-1}{^\dagger}TA_2$，类似地，有 $^* T={^\dagger}A_1^{-1}{^\dagger}T{^\dagger}A_2$。从这个刻画可以看出，当 $B_1,B_2$ 都是 $\epsilon-$Hermite 形式时，左右伴随总相同，此时无歧义地将 $T$ 的伴随映射写成 $T^*$，$T^*$ 的性质和双线性映射版本的伴随矩阵完全相同。 **定义（自伴和反自伴）**：对于一个半双线性形式 $B:V\times V\to\C$，设 $T\in\text{End}(V)$，若 $T=T^*$，则称 $T$ 自伴；若 $T^*=-T$，则称 $T$ 反自伴。 $T$ 自伴等价于 $cT$ 反自伴，其中 $c$ 是纯虚数。 **定义（正规映射）**：给定非退化 $\epsilon-$Hermite 形式 $B:V\times V\to\C$，称满足 $TT^*=T^*T$ 的线性映射 $T:V\to V$ 是正规的。自伴和反自伴映射自然是正规的，一般的映射可以写成两类的和。 **定理**：给定非退化 $\epsilon-$Hermite 形式 $B:V\times V\to\C$，则对于任意 $T\in\text{End}(V)$，存在唯一的 $T',T''$ 满足 $T'$ 自伴，$T''$ 反自伴使得 $T=T'+T''$，若 $T$ 正规，则 $T'T''=T''T'$。命题的前一半是容易证明的，取伴随得到 $T^*=T'-T''$，解得 $T'=(T+T^*)/2$，$T''=(T-T^*)/2$。当 $T$ 正规，操演定义得到 $TT^*=(T'+T'')(T'-T'')=T'^2-T''^2=(T'-T'')(T'+T'')=T^*T$，即证。 ### 10.2 Hermite 形式的分类仿照实二次型，二次型的半双线性映射版本由 $$ f(x_1,\ldots,x_n)=\sum_{1\le i,j\le n}\overline{x_i}A_{i,j}x_j $$ 给出，当 $A$ 是 Hermite 矩阵时，这个二次型的取值总是实的；当 $A$ 是反 Hermite 矩阵时，这个二次型的取值总是纯虚数。这是显然的，对整个式子取共轭，可以得到 $$ \overline{f(x_1,\ldots,x_n)}=\sum_{1\le i,j\le n}x_i\overline{A_{i,j}x_j}=\sum_{1\le i,j\le n}\overline{x_iA_{j,i}}x_j $$ 即证。仿照实二次型和双线性形式，容易定义半双线性形式上的同构。 **定义（半双线性形式的同构）**：设 $B_1:V_1\times V_1\to\C$，$B_2:V_2\times V_2\to\C$ 都是半双线性形式，且存在同构 $\varphi:V_1\to V_2$，且 $B_1(v,w)=B_2(\varphi(v),\varphi(w))$，则称 $\varphi$ 是一个 $(V_1,B_1)$ 到 $(V_2,B_2)$ 的同构，无歧义地也可以成为 $B_1$ 到 $B_2$ 的同构。同构映射自然是可逆的和可合成的，因此自动是等价关系。这一同构可以在诸多半双线性形式的表现下描述： - $A,A'\in M_{n\times n}(\C)$ 是 $\epsilon-$Hermite 矩阵，$A'={^\dagger}CAC$，其中 $C$ 可逆（作保距变换 $B_1(v,w)=B_2(Tv,Tw)$，这相当于给 $B_1$ 对应的矩阵做一个 $^\dagger CAC$ 的变换） - $f,f':\C^n\to \C$ 是 $n$ 元 $\epsilon-$Hermite 型，$f'=f\circ \varphi$，其中 $\varphi:\C^n\to\C^n$ 是可逆线性变换（看作变量的变换） **命题（$\epsilon-$Hermite 型的对角化）**：任意 $n$ 元 $\epsilon-$Hermite 型 $f$ 都同构于形如 $(x_1,\ldots,x_n)\mapsto a_1|x_1|^2+\ldots+a_n|x_n|^2$ 的 $n$ 元 $\epsilon-$Hermite 型。当 $\epsilon=+1$ 时，$a_i\in\R$；当 $\epsilon=-1$ 时，$a_i\in \text i\R$。这一命题可以用配方法说明，在此之后，实二次型的惯性定理仍然适用。 **定理（Hermite 型的惯性定理）**：任意 $n$ 元 $\epsilon-$Hermite 型 $f$ 都同构于恰好一个形如 $(x_1,\ldots,x_n)\mapsto |x_1|^2+\ldots+|x_p|^2-|x_{p+1}|^2-\ldots-|x_{p+q}|^2$，称 $p,q$ 为 $f$ 的正/负惯性系数，$p-q$ 为 $f$ 的符号差。这一则结果是实二次型论证的同意反复。 **定义（Hermite 形式的正定）**：设 $B:V\times V\to\C$ 是 Hermite 形式，且对于所有 $v\in V$ 有 $B(v,v)\ge 0$，则称 $B$ 正定；如果等号只在 $v=0$ 时取到，则称 $B$ 正定。 ps：这个内容似乎不太重要。 ### 10.3 复内积空间和酉变换 **定义（复内积）**：复向量空间 $V$ 上的 Hermite 内积（复内积）指满足以下条件的映射 $(\cdot|\cdot):V\times V\to\C$ 满足 $(\cdot|\cdot)$ 是 $V$ 上的 Hermite 形式，且 $(\cdot|\cdot)$ 正定。成这样的资料 $(V,(\cdot|\cdot))$ 为复内积空间、Hermite 空间或酉空间。仿照实内积空间的论证，可以得知复内积空间的正交向量族线性无关，且维度有限或可数的向量空间总存在单位正交基。 **定义（保距和同构）**：设 $(V,(\cdot|\cdot)_V)$ 和 $(W,(\cdot|\cdot)_W)$ 是复内积空间。 - 若 $\varphi:V\to W$ 满足 $(v_1|v_2)_V=(\varphi(v_1)|\varphi(v_2))_W$，则称 $\varphi$ 保距。 - 若 $\varphi:V\to W$ 是同构，且 $\varphi$ 保距，则称 $\varphi$ 是复内积空间的同构。和实内积空间一样，自同构是一个重要的课题。 **定义（酉变换）**：设 $T\in\text{End}(V)$ 是 $(V,(\cdot|\cdot))$ 的自同构，则称 $\varphi$ 是一个酉变换。 **定理**：设 $(V,(\cdot|\cdot))$ 是复内积空间，则 $T\in\text{End}(V)$ 是酉变换等价于 $T^*=T^{-1}$。这个论证和之前无异，$(Tv|w)=(v|T^{-1}w)$ 表明 $T^{-1}$ 是 $T$ 的伴随；相同的论证说明 $T^*=T^{-1}$ 导出 $T$ 保距，因此自然是同构。 **定义（标准复内积）**：在 $\C^n$ 上的内积 $(\cdot|\cdot):(v,w)\mapsto {^\dagger}vw$ 称为标准内积。在配备了标准内积的复内积空间中，$T^*={^\dagger}T$。和实内积空间类似，复内积空间上的线性映射 $T:V\to W$ 总有 $rk(TT^*)=rk(T^*)$，$rk(T^*T)=rk(TT^*)$，$\ker(TT^*)=\ker(T)$，$\ker(T^*T)=\ker(T^*)$，$\text{im}(TT^*)=\text{im}(T)$，$\text{im}(T^*T)=\text{im}(T^*)$。 ### 10.4 正规算子的酉对角化回忆正规算子的定义：给定复内积空间 $(V,(\cdot|\cdot))$，正规算子是指 $TT^*=T^*T$ 的线性映射。 **定理（正规算子的谱分解）**：设 $T\in\text{End}(V)$，则 $T$ 是正规算子等价于存在单位正交基 $v_1,\ldots,v_n\in V$ 和 $\lambda_1,\ldots,\lambda_n\in\C$ 使得 $Tv_i=\lambda_iv_i$。对于标准复内积的情形，正规算子是指 $^\dagger AA=A\,{^\dagger}A$ 的矩阵 $A$，证明这个需要觉用伴随的性质 $(t_1T_1+t_2T_2)^*=\overline{t_1}T_1^*+\overline{t_2}T_2^*$ 和 $(T_1T_2)^*=T_2^*T_1^*$。 **引理**：设 $T\in\text{End}(V)$ 正规，$f\in\C[X]$，则 $f(T)\in\text{End}(V)$ 也正规。设 $f(X)=a_0+a_1X+\ldots+a_mX^m$，则 $(f(T))^*=\overline{a_1}+\overline{a_2}T^*+\ldots+\overline{a_m}(T^*)^m$，由于 $T$ 和 $T^*$ 可以交换，这个式子和任一 $T$ 的多项式也交换。 **引理**：设 $T\in\text{End}(V)$ 正规，若 $\lambda\in\C$，$v\in V$ 满足 $\lambda v=Tv$，则 $\overline{\lambda}v=T^*v$。取 $M=T-\lambda\cdot 1$，则 $M$ 正规，且 $M^*=T^*-\overline{\lambda}\cdot 1$，$M$ 的正规性使得 $\ker(M)=\ker(MM^*)=\ker(M^*M)=\ker(M^*)$，这说明 $M$ 和 $M^*$ 的核相同，亦即差一个共轭的特征子空间相同，即证。 **引理**：设 $T\in\text{End}(V)$ 正规，若存在 $k\in\mathbb Z_{\ge 1}$ 使得 $T^k=0$，则 $T=0$。若 $T$ 自伴，当 $k=2$，有 $(Tv|Tv)=(T^2v|v)=0$，这蕴含 $T=0$。当 $k\ge 3$，$k/2$ 和 $(k+1)/2$ 至少有一个是整数，据此重复此论证可知 $T=0$。显然 $TT^*$ 自伴，且 $(TT^*)^k=T^k(T^*)^k=0$，这说明 $TT^*=0$，且 $\ker(T)=\ker(TT^*)=V$，亦即 $T=0$，即证。 **引理**：设 $T\in\text{End}(V)$ 正规且有两个不同的特征值 $\lambda,\mu$，则特征子空间 $V_\lambda\perp V_\mu$。任取 $v\in V_\lambda$ 和 $w\in V_\mu$，则 $(v|Tw)=\mu(v|w)$，另一方面 $(T^*v|w)=(\overline{\lambda}v|w)=\lambda(v|w)$，这说明 $(v|w)=0$，即证。下面可以开始证明正规算子谱分解定理了，首先证反方向。考虑由 $Sv_i=\lambda_i$ 确定的线性映射，下证 $S=T^*$。显然对于任意 $v_i,v_j$，都有 $(Tv_i|v_j)=(v_i|Sv_j)$，而容易验证 $(T(\cdot)|\cdot)$ 和 $(\cdot|S(\cdot))$ 都是半双线性形式，因此确定了上述等式在基上成立可以导出对任意向量都成立，因此确实 $S=T^*$；另外，显然 $STv_i=\lambda_i\overline{\lambda_i}v_i=TSv_i$，因此 $T$ 正规。接下来证正方向。将 $\text{Char}_X(T)$ 在 $\C[X]$ 中做分解，不妨设 $\text{Char}_X(T)=\prod_{i=1}^k(x-\lambda_i)^{t_i}$，记 $M:=\prod_{i=1}^k(x-\lambda_i)$，则 $M^{\max t_i}(T)=0$。由于 $T$ 正规，所以 $M(T)$ 也正规，因而 $M(T)=0$，这说明 $T$ 的极小多项式无重根，因而可以被对角化，因此有直和分解 $V=V_{\lambda_1}\oplus\ldots\oplus V_{\lambda_k}$，引理保证了它们是正交的，在每个特征子空间里取一组正交基即满足要求，即证。谱分解有时还被写作 $T=\sum_{i=1}^k\lambda_iP_i$，其中 $P_i$ 是 $V_{\lambda_i}$ 方向的投影算子。 **推论**：设 $T\in\text{End}(V)$ 正规，则： - $T$ 自伴当且仅当 $T$ 只有实特征值 - $T$ 反自伴当且仅当 $T$ 只有纯虚数特征值 - $T$ 是酉变换（复内积空间同构）当且仅当 $T$ 的特征值模长都为 1 定理的结果可以说明任一个正规算子 $T$ 都可以写成 $$ T=C\left( \begin{matrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{matrix}\right)C^{-1} $$ 其中 $C^{-1}=C^*$ 是酉变换，因此上边的推论都是显然的。 ### 10.5 实定理的复推广 **定理**：设 $f$ 是 $n$ 元 Hermite 型，则 $f$ 正定等价于其对应的矩阵 $A\in M_{n\times n}(\C)$ 只有正特征值。 **定义**：设 $(V,(\cdot|\cdot))$ 是复内积空间，若 $T\in\text{End}(V)$ 自伴且满足 $(v_1,v_2)\mapsto (Tv_1|v_2)$ 作为二次型是正定的，则称 $T$ 正定。 **引理**：设 $T: V\to W$ 是复向量空间中的线性映射，则 $TT^*$ 和 $T^*T$ 都半正定，若 $T$ 单（或 $T^*$ 单，即 $T$ 满），则它们都正定。 **定理**：设 $T\in\text{End}(V)$ 正定（半正定），则存在唯一的线性映射 $S$ 满足 $S$ 正定（半正定）且 $T=S^2$，有时也记作 $S=\sqrt T$。 **定理（极分解）**：设 $T\in\text{End}(V)$ 可逆，则存在唯一的 $R,U\in\text{End}(V)$ 使得 $T=RU$ 且 $R$ 正定，$U$ 是酉变换。由 $R^2=TT^*$ 即可确定 $R$，其余论证和实的版本全同。 **定理（奇异值分解）**：设 $T\in\text{Hom}(V,W)$ 是复内积空间之间的线性映射，则存在 $V$ 的一组单位正交基 $v_1,\ldots,v_m$ 和 $W$ 的一组单位正交基 $w_1,\ldots,w_n$ 使得存在实数 $\sigma_1\ge \ldots\sigma_p\ge 0$ 满足 $p=\min\{n,m\}$ 且 $Tv_i=[i\le p]\sigma_iw_i$。仿照实的情形，$T^*T$ 显然是半正定的，因而自然是正规的，可以被正交对角化，选取一组单位正交基 $v_1,\ldots,v_m$ 使得 $T^*Tv_i=\sigma_i^2v_i$，由此可以确定所有 $\sigma_i\ge 0$。随后再取 $w_i=\sigma_i^{-1}Tv_i$，那么就得到了满足条件的 $v$ 和 $w$。上边这部分的良定性和存在性论证和实的版本全同，不再赘述。如果选定单位正交基后使 $T$ 表为 $n\times m$ 矩阵 $A$，那么存在 $P\in M_{m\times m}(\C)$ 和 $Q\in M_{n\times n}(\C)$ 是酉矩阵使得 $A=Q\Sigma P^\dagger$，这里 $P$ 是上述论证过程中 $(v_1|\ldots|v_m)$ 给出的酉矩阵，$Q$ 是由 $(w_1|\ldots|w_n)$ 给出的酉矩阵。 **定义（Moore-Penrose 广义逆）**：设 $T\in\text{Hom}(V,W)$ 是复内积空间之间的线性映射，则存在唯一的 $S\in\text{Hom}(W,V)$ 使得： - $TST=T

STS=S
(TS)^*=TS
(ST)^*=ST

这个东西和实的情形没有任何区别，同样可以通过奇异值分解求出。具体地，对 T 作奇异值分解，找到单位正交基 v_1,\ldots,v_m\in V，w_1,\ldots,w_n\in W 和奇异值 \sigma_1\ge\ldots\ge\sigma_p，那么令 S 映 w_j 为 \sigma_j^{-1}v_j（如果奇异值为 0 或不存在对应位置就映为 0）。表为矩阵就为 \operatorname{MP}(Q\Sigma P^\dagger)=P\Sigma' Q^\dagger。

10.6 实正交变换的标准型

这一张中主要讨论的是实内积空间 (V,(\cdot|\cdot))，实内积空间可以自然地嵌入复内积空间，将其放在复视角下可以得到一些更好的结果。

定义：设 T\in\text{End}(V)，若 TT^*=T^*T，则称 T 正规。

引理：设 T\in\text{End}(V) 正规，且存在 k\in\mathbb Z_{\ge 1} 满足 T^k=0，则 T=0。

将 T 放在复内积空间中，这则结果之前已经得到。

接下来讨论实正交变换。当 \dim V=1 时正交变换只能是 \pm 1。当 \dim V=2 时，选取正交基使问题化为标准内积的情形，设矩阵为 \left(\begin{matrix}\alpha & \beta\\ \gamma & \delta\end{matrix}\right)，那么 \alpha^2+\gamma^2=\beta^2+\delta^2=1 且 \alpha\beta+\gamma\delta=0，同时 \det T=\alpha\delta-\beta\gamma=\pm 1。另 \alpha=\cos\theta,\gamma=\sin\theta，带入可以得到 \beta\cos\theta+\delta\sin\gamma=0，\delta\cos\theta-\beta\sin\theta=\pm 1，可以解得 (\beta,\delta)=\pm(-\sin\theta,\cos\theta)。

这正是我们熟知的旋转矩阵！

定义（旋转矩阵）：对于 \theta\in\R，定义转角为 \theta 的旋转矩阵 R(\theta)=\left(\begin{matrix}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{matrix}\right)，其作用在坐标系上即将一个点逆时针旋转 \theta 度。

引理：设 A\in M_{2\times 2}(\R) 是正交变换，则 AR(\theta)A^{-1}=R(\theta\det A)。

$\det A=-1$ 时，$A$ 可以写成 $R(\gamma)\left(\begin{matrix}1 & \\ & -1\end{matrix}\right)$ 的形式，最后得到的产物是 $R(-\theta)$。 **定理**：设 $T\in\text{End}(V)$ 是正交变换，则存在 $V$ 的单位正交基使得 $T$ 在此基上可以表为 $$ \left( \begin{matrix} 1_{a\times a} & & & &\\ & -1_{b\times b} & & &\\ & & R(\theta_1) & &\\ & & & \ddots &\\ & & & & R(\theta_m) \end{matrix} \right) $$ 其中 $a+b+2m=\dim V$。 $T$ 存在大小至多为 2 的不变子空间 $W$，由于 $T$ 是正交变换，$W^\perp$ 也是 $T-$不变子空间，因此只需要讨论 $W$ 的情形即可。如果 $W$ 有两个实特征值，则两个实特征值必然 $\in\{\pm 1\}$；否则将要么是旋转矩阵，要么是镜射合成旋转矩阵，后一种情况容易计算得到有两个实特征值 $\pm 1$，因此只能是旋转矩阵，即证。这则结果在 $\R^3$ 上的情形可以得到三维正交变换必然性如 $$ \left(\begin{matrix} \pm 1 & &\\ & \cos\theta & -\sin\theta\\ & \sin\theta & \cos\theta \end{matrix}\right) $$ 即绕一个轴旋转或镜射 + 绕一个轴旋转。 ### 10.7 三维空间中的旋转和 Euler 角上一章已经知道了三维空间的实正交变换总可以写成旋转或镜射 + 旋转，这一章将关注 $\det=1$ 的情形（即绕轴旋转），意欲确定以下两条变换的性质： - 绕轴旋转的轴（正交变换中 “1” 的部分） - 绕轴（逆时针）旋转的角度（正交变换中 $\theta$ 的部分） **约定**：如果 $\R^3$ 中的正交框架 $(u_1,u_2,u_3)$ 和标准基 $(e_1,e_2,e_3)$ 同定向，则称这是一个正向正交框架，反之称之为负向正交框架。这样可以确定一个双射：旋转正交变换 $T\to $ 正向正交框架 $(u_1,u_2,u_3)$，它映 $T$ 为 $(Te_1,Te_2,Te_3)$，这无非是在标准基下矩阵的表达。 **约记**：对于所有单位向量 $u\in\R^3$，记以 $u$ 为转轴、$\theta$ 为转角的旋转正交变换为 $R_u(\theta)$。我们的目标是从 $(e_1,e_2,e_3)$ 出发，每次以某一个向量为轴，旋转一个角度，以此来进行过渡并最终得到 $(u_1,u_2,u_3)$。具体地，进行如下操作：$(e_1,e_2,e_3)\overset{R_{e_3}(\psi)}{\to}(f_1,f_2,e_3)\overset{R_{f_2}(\theta)}\to (g_1,f_2,u_3)\overset{R_{u_3}(\varphi)}\to(u_1,u_2,u_3)$，这需要合理地确定 $f_2$ 以确保确实有这样的操作，其余的地方都可以被确定。那么一定要有 $f_2\perp e_3$，$f_2\perp u_3$，如果 $e_3$ 和 $u_3$ 线性无关，取 $f_2=e_3\times u_3$ 即可，否则取 $f_2=e_2$，如此可以以此用叉乘确定 $f_1,g_1$，需要注意确保每一步确实都是正定向正交框架，由于旋转只要保持一个轴不变，另外两个轴可以任意变成正定向的正交框架，因此操作总是可以进行的。这说明任一个旋转正交变换 $T$ 都可以写成 $R_{u_3}(\varphi)R_{f_2}(\theta)R_{e_3}(\psi)$ 的形式，接下来我们将证明它还可以被写成 $R_{e_3}(\psi)R_{e_2}(\theta)R_{e_3}(\varphi)$。 **引理**：设 $P:\R^3\to\R^3$ 是正交变换，$\epsilon=\det P$，$R_u(\theta)$ 是旋转正交变换，则 $R_{Pu}(\epsilon\theta)=PR_u(\theta)P^{-1}$，这个不难验证。 **待补** ### 10.8 四元数和旋转 **定义（四元数和其乘法）**：定义四元数集 $\H:=\{a+bi+cj+dk:a,b,c,d\in\R\}$，为带有基 $1,i,j,k$ 的 4 维 $\R-$向量空间。在基础上，定义其上的乘法为双线性映射 $\cdot:\H\times \H\to\H$，它满足 $1\cdot x= x$，$i^2=j^2=k^2=-1$，$ij=k=-ji$，$jk=i=-kj$，$ki=j=-ik$，容易验证这使得 $(\H,0,1,+,\cdot)$ 构成一个非交换环。容易验证 $\R$ 和 $\C$ 都可以直接嵌入四元数环中，且环 $\H$ 的中心是 $\R$。 **定义-命题**：对 $q=a+bi+cj+dk\in\H$，定义其 - 共轭 $\overline q:=a-bi-cj-dk

迹 \text{tr}(q)=q+\overline q
范数 \text{N}(q):=q\overline q

这些操作具有如下性质：

\overline{\overline q}=q
\overline{q_1+q_2}=\overline{q_1}+\overline{q_2}$，$\overline{q_1q_2}=\overline{q_2}\cdot\overline{q_1}
\text{tr}(q)=2a
\text{N}(q)=a^2+b^2+c^2+d^2$，$\text{N}(1)=1$ 且 $\text{N}(q_1q_2)=\text{N}(q_1)\text{N}(q_2)

只需要操演定义即可说明 (a)(b)(c)。

对于 (d)，容易发现 \text{N}(q_1q_2)=q_1q_2\overline{q_2q_1}，由于 q_2\overline{q_2}=\text{N}(q_2)\in\R，其可以和任意四元数交换，因此有 \text{N}(q_1q_2)=q_1\overline{q_1}q_2\overline{q_2}=\text{N}(q_1)\text{N}(q_2)，即证。

上面几条性质说明四元数取共轭、取范数都是环同态，取迹是线性映射。

这一条的 (d) 告诉我们对于任意 q\neq 0，\text{N}(q)=\overline qq\in\R 非零，因此其有逆元 q^{-1}=\dfrac{\overline{q}}{\text{N}(q)}，这使得四元数环 \H 成为除环。

四元数的主要价值在于三维空间 \R^3 可以嵌入它的一个子环 \H_0:=\R i\oplus \R j\oplus\R k，称为纯四元数，嵌入映射映 (a,b,c) 为 ai+bj+ck。

三维空间的很多操作都可以化归到四元数上进行，最主要的性质在于这个嵌入是保距的，将 \H_0 配备 \text{N}(\cdot) 导出的半双线性映射作为内积，同时容易验证 \|(a,b,c)\|=\text{N}(ai+bj+ck)，因此可以在纯四元数上研究 \R^3 的问题。

引理：设 x\in\H^\times，则：

对于所有 q\in\H，有 \text{N}(xqx^{-1})=\text{N}(q)
q\mapsto xqx^{-1}$ 给出 $\H_0$ 的自同构，记作 $R_x
\det R_x=1

(a) 是显然的。

(b) 确实给出了 \H_0\to \H 的同态，首先验证映射的像落在 \H_0 当中：利用 x^{-1}=\overline{x}\cdot \text{N}(x)^{-1}，可以得到 xqx^{-1}=\text{N}(x)^{-1}xq\overline{x}，取共轭可以得到 \overline{xqx^{-1}}=\text{N}(x)^{-1}x\overline{q}\cdot \overline{x}=-xqx^{-1}，可见 xqx^{-1} 是纯四元数，因此它确实是 \H_0 的自同态；另一方面，q\mapsto x^{-1}qx 给出它的逆，依照同样的论证可以证明这也是 \H_0 的自同态，因此 R_x 是自同构。

(c) 将 \H_0 同构到 \R^3 上，显然 R_x 给出了 \H_0 上的保距映射，自然也就给出了实内积空间 \R^3 上的一个同构，这表明 \det R_x\in\{\pm 1\}，同时显然 \det R_x 关于 x\in\H_0 是连续的，因此只需要验证一个 \det R_x，直接取 x=1 可以发现 R_x=\text{id}，因此 \det R_x=1。

这说明每个 R_x 都描述了一个三维旋转正交变换，同时 R_{xy}=R_x\circ R_y，因此旋转的合成可以划归到纯四元数的乘法上，那么整个论证就只剩下任何一个旋转都可以被表为某个 R_x 的形式。根据上一章关于欧拉角的讨论我们知道只需要实现绕 e_1 旋转和绕 e_2 旋转即可合成出所有旋转。

定理：设 T 为三维空间 \H_0 中的旋转映射，那么精确到 \pm x 存在唯一的 x\in\H_0 使得 T=R_x。

问题化归到绕轴旋转的问题，考虑取 x=\cos\theta+i\sin\theta，那么 x^{-1}=\cos\theta-i\sin\theta，此时容易验证：

xjx^{-1}=(\cos\theta+i\sin\theta)j(\cos\theta-i\sin\theta)=j\cos^2\theta+k\cos\theta\sin\theta+k\sin\theta\cos\theta-j\sin^2\theta=j\cos2\theta+k\sin 2\theta
xkx^{-1}=(\cos\theta+i\sin\theta)k(\cos\theta-i\sin\theta)=k(\cos^2\theta-\sin^2\theta)+j(-2\sin\theta\cos\theta)=k\cos 2\theta-j\sin 2\theta

这就相当于固定 i，旋转了 2\theta，相同的论证还给出了固定另外两轴的旋转变换，因此确实存在 R_x=T。

另一方面，R_x=R_y 蕴含 R_{xy^{-1}}=\text{id}，这归结于若 R_x=\text{id} 则 x=\pm 1，此时 ix=xi，jx=xj，kx=xk，这说明 x\in Z(\H)=\R，又因为 \det R_x=1，于是 x=\pm 1，即证。

推论：设 u\in\H_0 满足 \text{N}(u)=1，则以 u 为转轴旋转 \theta 的变换可以写作 R_x，其中 x=\cos(\theta/2)+\sin(\theta/2)u

这可以直接验证，也可以先作旋转变换 R_y 使得 R_y(i)=u，根据上一章的讨论得到 R_u(\theta)=PR_i(\theta)P^{-1}，再带入 R_i(\theta)=R_{\cos(\theta/2)+i\sin(\theta/2)}，将 P 等同于 R_y，R_u(\theta) 等同于 R_x，那么 x=y(\cos(\theta/2)+i\sin(\theta/2))y^{-1}=\cos(\theta/2)+yiy^{-1}\sin(\theta/2)，由于 R_y(i)=u，依据定义这导致 yiy^{-1}=u，于是 x=\cos(\theta/2)+u\sin(\theta/2)，即证！

间奏：对称多项式

这一章是之前在第六章当中跳过的内容，和后边的群论以及 Lagrange 预解式

6.7 对称多项式

定义：设 F 是域，f\in F[X_1,\ldots,X_n]，对 \sigma\in\mathfrak S_n，定义 (\sigma f)(X_1,\ldots,X_n):=f(X_{\sigma(1)},\ldots,X_{\sigma(n)})。

操演定义，可以得到 (\sigma\tau)f=\sigma(\tau f)，同时 \text{id}f=f，因此这个操作可以看做群 \mathfrak S_n 在 F[X_1,\ldots,X_n] 上的左作用。

定义：若对于任意 \sigma\in\mathfrak S_n 都有 \sigma f=f，则称 f 为对称多项式。所有对称多项式构成 F[X_1,\ldots,X_n] 的子环和子空间，记作 F[X_1,\ldots,X_n]^{\mathfrak S_n}。

作为一些例子，p_k:=\sum_{i=1}^n X_i^k（幂和）、e_k:=\sum_{1\le i_i<\ldots< i_k\le n}X_{i_1}\ldots X_{i_k}（初等对称多项式）都是对称的。

定理（Vieta）：\displaystyle\prod_{i=1}^n(Y-X_i)=Y^n-e_1Y^{n-1}+\ldots+(-1)^n e_n，因此对称多项式和多项式方程的根有很大联系。

定理（对称多项式基本定理）：设 f\in F[X_1,\ldots,X_n]^{\mathfrak S_n}，则存在 g\in F[X_1,\ldots,X_n] 使得 f=g(e_1,\ldots,e_n)，其中 e_k 为第 k 个初等对称多项式。

显然一个多项式可以分解成若干齐次的部分，故可以将 f 分解为 f=f_0+\ldots+f_d，其中 f_k 表示齐 k 次的多项式，同时 \deg f:=\{\max\{d\ge 0:f_d\neq 0\}，待补。

引理：设 f\in F[X_1,\ldots,X_n]^{\mathfrak S_n}，则 f(X_1,\ldots,X_{n-1},0)=0\iff e_n|f

右推左：f=qe_n 导致 f(X_1,\ldots,X_{n-1},0)=q(\ldots)X_1\ldots X_n\cdot 0=0。

左推右：带入得 0 蕴含每一个单项式都是 0，因而每个单项式都包含 X_n，有对称多项式的性质可知每个单项式都包含 e_n，即证。

例（判别式）：设多项式 f\in F[X] 在 F 上分裂为 \prod_{i=1}^n (X-\alpha_i)，那么考察 \prod_{i<j}(\alpha_i-\alpha_j)，在这个式子里对 \alpha_i 进行轮换，得到的结果 \prod_{i<j}^n(\alpha_{\sigma(i)}-\alpha_{\sigma(j)}) 最多差一个负号，因而 \prod_{i<j}^n(\alpha_i-\alpha_j)^2 是对称多项式（平方之后负号被消去），记作 \text{disc}(f)。

根据上文的定理，\text{disc}(f) 可以被写成关于 \alpha_1,\ldots,\alpha_n 的初等多项式的多项式（这个系数甚至是在整数上的），从而 \text{disc}(f) 是关于 f 系数的一个多项式，因而是多项式的内涵量。

这一则结果有如下意义：假设 f\in R[X]，如果 \text{disc}(f)=0，则说明 f 在某个足够大的扩域上有重根，反之则没有。

作为例子，考虑二次的情形，f=X^2-bX+c=(X-\alpha_1)(X-\alpha_2)，那么 \text{disc}(f)=(\alpha_1-\alpha_2)^2=(\alpha_1+\alpha_2)^2-4\alpha_1\alpha_2=b^2-4c，这就得到了一元二次方程的判别式（这里只能用于判别是否有重根，别的性质需要一些分析的内容才能够得到）。

引理（牛顿公式）：在域 F 上考察 p_k:=\sum_{i=1}^n X_i^k，称为幂和多项式，那么存在对称多项式 e_0=1,\ldots,e_k\in F[X_1,\ldots,X_n] 使得 p_k-e_1p_{k-1}+\ldots+(-1)^ne_np_{k-n}=0，超出下标的部分补 0。

考察形式幂级数，等式左边相当于 [y^k](\sum_{l=0}^ne_l(-Y)^l)(\sum_{l\ge 0}p_lY^l)，就只需要证明这个生成函数是一个常数 n 就可以了。

倒闭了。

6.8 结式

引入结式的动机是判断 f,g\in F[X] 是否有公因式，这个当然可以辗转相除（这归功于 F[X] 是欧几里得整环），但是并不适用于很多的理论研究，因此引入了一个判别的式子来判定，这就是结式。

定义（结式）：设 f=v_0X^n+\ldots+v_n\in F[X]，g=w_0X^m+\ldots+w_m\in F[X]，定义 f 和 g 的结式 \text{Res}(f,g) 为如下矩阵的行列式：

\left| \begin{matrix} v_0 & \ldots & \ldots & v_n & &\\ & \ddots & & & \ddots\\ & & v_0 & \ldots & \ldots & v_n & \\ w_0 & \ldots & \ldots & w_m & &\\ & \ddots & & & \ddots\\ & & w_0 & \ldots & \ldots & w_m & \\ \end{matrix} \right|

上半部分是 v_0,\ldots,v_n 重复 m 次，每次右移一个位置；下半部分是 w_0,\ldots,w_m 重复 n 次，每次右移一个位置，因此这确实是一个 n+m 阶方阵。

结式有一些显然的性质：

若将 \text{Res}(f,g) 看做 v_0,\ldots,v_n,w_0,\ldots,w_m 的多项式，那么这个系数是整的（嵌入 F），和 F 无关。
\text{Res}(g,f)=(-1)^{nm}\text{Res}(f,g)
对任意 t\in F，\text{Res}(tf,g)=t^m\text{Res}(f,g)

引理：给定上述的 n,m,f,g，则 \text{Res}(f,g)=0 当且仅当存在 f_1,g_1\in F[X] 不都为零使得 \deg f_1<n，\deg g_1<m 且 fg_1+gf_1=0。

将 f_1=a_1X^{n-1}+\ldots+a_n 和 g_1=b_1X^{n-1}+\ldots+b_n 带入 fg_1+gf_1=0，系数矩阵就是结式中矩阵的转置，因而有解等价于结式为 0。

定理：给定上述的 n,m,f,g，则 \text{Res}(f,g)=0 当且仅当 w_0=v_0=0 或 f,g 存在公因式 d 使得 \deg d>0。

必要性是显然的，w_0=v_0=0 导致矩阵第一列为 0，自然行列式为 0；若存在公因式 d 则可命 f_1=f/d，g_1=-f/d，那么 gf_1+fg_1=0 且 \deg f_1<\deg f\le n，\deg g_1<\deg g\le m，由引理可得此时 \text{Res}(f,g)=0。

再证明充分性。

当 $w_0,v_0$ 不全为零时，不妨设 $w_0\neq 0$。此时若 $(f,g)=1$ 时，由引理可知存在 $f_1,g_1$ 满足 $gf_1+fg_1=0$，这导致 $\frac{f}{g}=-\frac{f_1}{g_1}$，由于 $f,g$ 互质，$g|g_1$，从而 $\deg g_1\ge \deg g=m$，这和引理矛盾，即证。这一则结果可以联系到上一节的 $\text{disc}$，它们首先有一些相似之处，例如首项非零的 $\text{Res}(f,g)=0$ 就导出 $f,g$ 在足够大的扩域下有相同的根，更深入的讨论归结为如下定理： **定理**：设 $n,m\in\Z_{\ge 1}$，$f=a\prod_{i=1}^n(X-\alpha_i)\in F[X]$，$g=b\prod_{i=1}^m(X-\beta_i)\in F[X]$，则 $\text{Res}(f,g)=a^m\prod_{i=1}^mg(\alpha_i)=(-1)^{nm}b^n\prod_{i=1}^ng(\beta_i)=a^mb^n\prod_{i,j}(\alpha_i-\beta_i)

只需要证明第一个等式，并且问题可以归结为 a=b=1 的情形。

假设 g(\alpha_1),\ldots,g(\alpha_n) 互不相同，那么考虑 \text{Res}(f,g-Y)\in F[Y]，他是关于变元 Y 不超过 n 次的多项式，降幂可以写出它等于 (-1)^nY^n+\ldots+\text{Res}(f,g)，首项为 (-1)^n 归结为必须取在主对角线上。

对于任意 i，\alpha_i 是 f 和 g-g(\alpha_i) 的公根，从而 \text{Res}(f,g-g(\alpha_i))=0，从而 \prod_{i=1}^n(g(\alpha_i)-Y)|\text{Res}(f,g-Y)，比较最高次项可知它们确实相等，因而确实 \text{Res}(f,g)=\prod_{i=1}^ng(\alpha_i)。

上述论述用到了 g(\alpha_1),\ldots,g(\alpha_n) 互不相同的限制，但事实上并没有用到它们数值上性质，一个经典技巧是用变元 Z_1,\ldots,Z_n 来代替 \alpha_1,\ldots,\alpha_n，并以多项式环 F[Z_1,\ldots,Z_n] 代替域 F 进行论述，不难发现这并不影响上述论证，因而可以得到相同的结果，即 \prod_{i=1}^n(g(Z_i)-Y)=\text{Res}(\prod_{i=1}^n(X-Z_i),g-Y) 仍然成立，将 \alpha_1,\ldots,\alpha_n 代入即可，即证。

推论：设 f 如上，则 a\operatorname{disc}(f)=(-1)^{n(n-1)/2}\text{Res}(f,f')，其中 f' 表示对 f 求形式导数，并减少一次。

运用 Leibniz 求导法则和上一则定理，可以得到 \text{Res}(f,f')=a^{n-1}\prod_{i=1}^nf'(\alpha_i)=a^{2n-1}\prod_{i=1}^n\prod_{j\neq i}(\alpha_i-\alpha_j)。

6.9 不可约多项式初探

这部分的笔记是从去年的笔记上抄过来的。

定义：若多项式环 F[X] 上的所有不可约元都是一次或零次多项式，那么称 F 是代数闭域。

由于代数基本定理的存在，复数域 \mathbb C 是代数闭域。

接下来考虑 \mathbb R，将 \mathbb R[X] 嵌入 \mathbb C[X]，其根是两两共轭配对的，因此可以将其分解为一次和二次多项式。

定义：设 f=a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X]，记 c(f)=\gcd(a_0,\ldots,a_n)；若 c(f)=1，则称 f 为本原多项式。

定理：若 f,g\in\mathbb Z[X] 都是本原多项式，则 fg 也是本原多项式。

证明：如若不然，则存在素数 p 使得 fg 的每一项系数都是 p 的倍数。考察 f 和 g 最低次系数不是 p 的倍数的项，不妨设其为 a_kx^k 和 b_qx^q，那么考察 fg 的 x^{k+q} 项系数，易知其不是 p 的倍数，即证。

定理：设 f\in\mathbb Z[X] 是本原多项式，下列命题等价：

(a) 推 (b)：显然。

(b) 推 (a)：如若不然，设 f=gh，其中 gh\in\mathbb Q[X]，取适当的系数 c_1,c_2 使得 c_1g,c_2h 都是本原多项式，那么有 c(c_1g\cdot c_2h)=c_1c_2 c(f)，由于 c(c_1g)c(c_2h)=1=c(f)，于是有 c_1c_2=1，因此此时必然存在 c_1g,c_2h\in\mathbb Z[X] 使得 f=(c_1gc_2h)，即证。

定理：\mathbb Z[X] 上的不可约多项式可以分为两类：

上文中的不可约本原多项式

定理：设 f=a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X]，若存在素数 p 满足：

p\nmid a_n
p\mid a_0,a_1,\ldots,a_{n-1}
p^2\nmid a_0

那么 f 在 \mathbb Z[X] 上不可约。

证明：如果存在 g,h\in\mathbb Z[X] 使得 f=gh，且 g=b_0+b_1x\ldots+b_mx^m，h=c_0+c_1x+\ldots+c_kx^k，那么 m+k=n 且 p\nmid b_0 或 p\nmid c_0，不妨设 p\nmid b_0，考察 h 中次数最小的系数不为 p 的倍数的项 c_qx^q，那么 p\nmid a_q，这说明 q=n，即 g 只有常数项，矛盾，即证。

推论：设 p 是质数，那么多项式 f=\dfrac{x^p-1}{x-1}=1+x+\ldots+x^{p-1} 不可约。

证明：作换元 y+1=x，那么

f=\dfrac{(y+1)^p-1}{y}=\sum_{i=1}^p\binom{p}{i}y^{i-1}

根据上文定理可得 f\in \mathbb Z[Y] 是不可约的，自然对于 \mathbb Z[X] 也是不可约的。

这是分圆多项式的一个结果，在初等数论和代数中有所涉及。

命题（猜根法）：设 x_0=u/v 是多项式 a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X] 的根，那么有 v|a_n，u|a_0。

证明：其有因式 (vx-u)，因此 v|a_n,u|a_0。

推论：首一整系数多项式的根必然是整数（v|1 说明 v=\pm 1）

上面这套东西在一般的唯一分解整环上应该也是成立的，论证不需要改变，需要注意一些等号精确到同构。