高代笔记 3
KellyFrog
·
2025-05-27 11:39:01
·
个人记录
高等代数 2 笔记
第九章 实内积空间(剩余内容)
9.9 奇异值分解
定理 :设 V,W 是实内积空间,T:V\to W 是线性映射,则存在 V,W 的单位正交基 v_1,\ldots,v_n ,w_1,\ldots,w_m 和唯一确定的 \sigma_1\ge\sigma_2\ge\ldots\ge\sigma_p\ge 0 使得 Tv_i=[i\le p]\sigma_iw_i ,其中 p=\min\{n,m\} 。
首先证明奇异值 \sigma_1,\ldots,\sigma_p 的唯一性。注意到 (T(v_i+v_j)|w_i)_W=((v_i+v_j)|Tw_i)=\sigma_i ,T^*w_j=[j\le p]\sigma_jv_j ,因此 \sigma_i^2 都是 T^*T 的特征值,由此唯一确定。
同样地,由于 T^*T 是半正定的,可以正交对角化并重排得到 \sigma_1\ge\ldots\ge\sigma_p\ge 0 并确定 v_1,\ldots,v_n ,由此确定 w_i=\sigma_i^{-1}Tv_i ,容易验证 (w_i|w_i)_W=(v_i|\sigma_i^{-2}T^*Tv_i)_V=1 ,同时 (w_i|w_j)_W=(v_i|\sigma^{-2}T^*Tv_j)_V=0 ,然后将 w_1,\ldots,w_p 扩充成一组基,即证。
如此可以得到奇异值分解的矩阵形式,记 P=(v_1|\ldots|v_n) ,Q=(w_1|\ldots|w_m) ,\Sigma\in M_{m\times m} 是由 \sigma_1,\ldots,\sigma_p,0,\ldots,0 排列而成的对角矩阵,那么有 AP=Q\Sigma ,或者等价地写成 A=Q\Sigma P{^\text{t}} 。
9.10 Moore-Penrose 广义逆
定义 :设 V,W 是实内积空间,T:V\to W 是线性映射,若 S:W\to V 满足以下条件,则称 S 是 T 的 Moore-Penrose 广义逆:
TST=T
STS=S
(ST)^*=ST
(TS)^*=TS
接下来将说明 Moore-Penrose 广义逆存在且唯一,并根据奇异值分解给出一个构造。
定理 :上述 S 存在且唯一,并有如下的构造给出:对于任意的 v\in V,w\in W ,将其分解为 v=v'+v'' ,w=w'+w'' ,其中 v'\in\ker T ,v''\in(\ker T)^\perp ,w'\in\operatorname{im} T ,w''\in(\operatorname{im}T)^\perp 。对于 w\in W ,任取一个 v\in T^{-1}w' ,令 Sw=v'' 。
这确实是良定的,因为所有 T^{-1} 中的元素差一个 \ker T ,同时容易验证 TSTv=TSTv''=Tv''=Tv ,STSw=STv''=Sw'=Sw ,这同样说明了 TS 和 ST 分别是 \operatorname{im}T 和 \ker T 的正交投影,正交投影自动是自伴的,因此 S 确实存在。
如果存在两个 Moore-Penrose 广义逆 S 和 R ,那么可以得到 S=STS=S(TS)^*=SS^*T^*=SS^*(TRT)^*=S(TS)^*(TR)^*=STR ,类似的论证也给出 R=STR ,因此有 S=R ,即证。
关于 Moore-Penrose 广义逆的构造,从矩阵角度来说,一种方便的方法是先作奇异值分解 T=Q\Sigma P^\text{t} ,随后取 S=P\Sigma'Q^\text{t} ,其中 \Sigma' 表示将 \Sigma 非零部分取逆得到的对角矩阵(两维大小交换),上述各条性质都容易验证。
9.11 极小化极大原理
设 V 是实内积空间,B 是对称双线性形式,那么可知存在 S\in\text{End}(V) 使得 B(v_1,v_2)=(v_1|Sv_2) ,由于 B 和内积都是对称的,交换两个变量可以得到 B(v_1,v_2)=B(v_2,v_1)=(v_2|Sv_1) ,因此 S 自伴。
选取适当的单位正交基使 S 对角化,那么 S 的最大、最小特征值由 \displaystyle\max_{|v|=1}B(v,v) 和 \displaystyle\min_{|v|=1}B(v,v) 给出,下面这则定理给出了从大到小每个特征值的刻画:
\lambda_k=\min_{U\subseteq V,\dim U=n-k+1}\max_{v\in U,|v|=1}B(v,v)
\lambda_k=\max_{U\subseteq V,\dim U=k}\min_{v\in U,|v|=1}B(v,v)
这则定理的直观理解在于选取维数为 n-k+1 的子空间必然会包含 \left<v_1,\ldots,v_k\right> 中的一个元素,其中 v 是单位正交基,这导致右边的最大值 \ge\lambda_k ,而取到 \lambda_k 有显然的构造,类似的论证对于后一个式子也成立。
9.12 Perron–Frobenius 定理
这一章主要关心正矩阵(所有元素都为正)和正向量(所有元素都为正)的一些性质。
约记 :设 A,B\in M_{n\times n}(\R) ,称 A>B (或 A\ge B )当且仅当 A_{i,j}>B_{i,j} (A_{i,j}\ge B_{i,j} )对所有 1\le i,j\le n 都成立,特别地,当 B=0_{n\times n} 时也记作 A>0 或 A\ge 0 。
引理 :设 A>0 ,v\ge 0 是列向量且不为 0,则 Av>0 。
这是显然的,在 v 中找一项不为 0 的即可。
定义 :设 A\in M_{n\times n}(\C) ,定义 A 的谱半径为 \rho(A):=\max\{|\lambda|\} ,其中 \lambda\in\C 是 A 的特征值。
引理 :设 A\in M_{n\times n}(\R) ,且 A>0 ,则:
存在 \rho>0 和 v\in\R^n 满足 v>0 使得 Av=\rho v 。
上述 \rho 可以取到谱半径 \rho(A) 。
证明:考察 S:=\{x\in\R^n:|x|=1,x\ge 0\} ,这是紧集,因此在其上的连续映射有最大值和极值,考察映射 \mathcal L:S\to\R_{>0} 映 x\mapsto\min\{(Ax)_i/x_i:x_i\neq 0\} ,这确实是连续的,命 \rho 为 \mathcal L 的一个极大值且在 v 处取到,下面证明确实有 Av=\rho v 能被取到。
首先有 Av\ge\rho v ,如果不等号取不到,则 A(Av-\rho v)>0 ,取足够小的 \epsilon 使得 A(Av-\rho v)>\epsilon Av ,于是有 A(Av)\ge (\rho+\epsilon)Av ,命 w=Av ,则 Aw\ge (\rho+\epsilon)w ,这和 \rho 最大矛盾,因此当 \rho 最大时等号确实可以取到。
对于后一半,考虑 \mu\in\C 和 w\in\C^n 非零使得 \mu w=Aw ,那么有 |\mu|\cdot |w_i|=|(\mu w)_i|=|\sum_{j} A_{i,j}w_j|\le \sum_j A_{i,j}|w_j| ,命 w'=(|w_1|,\ldots,|w_n|) ,上述不等式说明 |\mu w'|\le |Aw'| ,适当伸缩使得 |w'|=1 ,得到 \mathcal L(w')\ge\mu ,这说明 \rho\ge\rho(A) ,而由于 \rho 确实是特征值,因此 \rho\le\rho(A) ,因此此时确有 \rho=\rho(A) 。
定理 :设 A\in M_{n\times n}(\R) ,A>0 ,则下属性质成立:
\rho(A)>0$,且存在 $v\in\R^n$ 使得 $Av=\rho(A)v
若 \mu\in\C 是 A 的特征值,且 \mu\neq \rho(A) ,则 |\mu|<\rho(A)
对应 \rho(A) 的特征子空间是 1 维的
(i) 是引理的内容。
(ii) 考虑 (i) 引理的内容,论证过程中的不等式等号必须成立,即 \sum_jA_{i,j}|w_j|=|\sum_jA_{i,j}w_j| 成立,由于 A_{i,j} 都是实的,w_j 必然处在一条复平面的直线上,设此时 w=cv ,其中 v\ge 0 ,那么 w 和 v 有相同的特征值,而 v 是实的,因此特征值也正实数,此时特征值必然是 \rho(A) ,即证。
(iii) 如若不然,则存在 v,v' 不线性相关使得 \rho(A)v=Av ,\rho(A)v'=Av' ,引理保证了存在一个 v>0 ,因此对于充分小的 \epsilon ,有 v-\epsilon v'\ge 0 ,其中至少一个分量为 0,但是 \rho(A)(v-\epsilon v')=A(v-\epsilon v')>0 ,这是显然的矛盾。
(iv) 显然 \rho(A) 转置不变,取 u\in\R^n 使得 \rho(A)u=A^\text tu ,那么 \left<u\right>^\perp=\{x\in\R^n:u^\text tx=0\} 是 A- 不变子空间,这是由于此时 u^\text t Ax=(A^\text tu)^\text tx=\rho(A)u^\text tx=0 ,且由于 u,v>0 ,总有 u^\text tv>0 ,因此可以作 A- 不变直和分解 A=\Rv\oplus\left<u\right>^\perp ,如果 \rho(A) 不是单根,那么其在 \left<u\right>^\perp 中也会有特征子空间,运用 (iii) 中的论证可知矛盾。
定理 :若将上一条定理的条件减弱为 A\ge 0 ,在存在 m\in\mathbb Z_{\ge 1} 使得 A^m>0 时,四条性质仍然成立。
由于 A^m 的特征值是 A 的特征值取 m 次幂,取 A^m>0 ,此时后三条性质自动成立。对于第一条,考虑最大特征值 \rho(A)=|\lambda_1| ,A^m 中显然会有 \rho(A^m)=|\lambda_1^m| ,取 v\in\C^n 满足 Av=\lambda_1v ,这满足 A^mv=\lambda_1^mv ,通过之前的论证得知必然存在 v>0 满足这个条件,于是 \lambda_1 v=Av\ge 0 ,这说明 \lambda_1\ge 0 ,同时显然 \lambda_1\neq 0 ,这证明了 (i)。
定理 :将正权强联通有向图视作邻接矩阵 A\in M_{n\times n}(\R) ,则:
\rho(A)>0
存在 v\in\R^n 使得 v>0 且 Av=\rho(A)v
第十章 复内积结构
对于复数 z ,其模长为 \overline z\cdot z 。如果我们想表达一个复向量的长度的话,其模长的平方就应该对应每一维模长的平方相加,也即 ^\dagger v\cdot v ,其中 ^\dagger 表示共轭转置。从这个角度来看,仿照实内积空间引入实二次型,复内积空间上也可以引入复二次型 B(v,w) ,随后让 B(v,v) 充当内积的角色,但这个结构并不能是双线性映射,这是由于第一个变量的纯量乘法会差一个共轭,因此就延伸出了复空间上的半双线性映射。
10.1 半双线性形式
定义(半线性映射) :若复向量空间之间的映射 T:V\to W 满足 T(v_1+v_2)=T(v_1)+T(v_2) 且 T(tv)=\overline tT(v) (其中 t\in\C ),则称 T 是半线性映射。
半线性映射自然是 \R 线性的(将 \C 看作 \R 向量空间)。
定义(复共轭空间) :设 V 是 \C 向量空间,定义其复共轭 \overline V ,其中 \overline V 的加法和 V 相同,纯量乘法差一个共轭(即 t\odot v=\overline t\cdot v )。
由此可知 \overline{\overline V}=V 。
以下是一些例子:
映射 z\mapsto \overline z 给出 \C- 向量空间的同构 \overline{\C} \overset{\sim}\to C
设 V_1,V_2 是 \C- 向量空间,则 \overline{V_1}\oplus \overline{V_2}=\overline{V_1\oplus V_2} (这里理解为存在元素映到自身的同构)
设 W 是 \C- 向量空间,有同构 \overline{W}^\lor\to \overline{W^\lor} 。它映 \lambda\in \overline W 为 \overline{\lambda}:v\mapsto \overline{\lambda v}
在一些时候,复空间的某些自同构也满足上述性质,只是同构应映射有所改变,如对于 $\C^n$,这样的一个同构是逐维取共轭,因此在讨论 $\C^n$ 的时候,取复共轭空间就可以看作一般的数值共轭。
**定义(半双线性映射和半双线性形式)**:设 $V,W,X$ 是 $\C-$向量空间,半双线性映射是指 $B:V\times W\to X$ 的映射,其中 $B$ 对第一个变元是半线性的、对第二个变元是线性的。限制 $V,W,X$,则所有半双线性映射构成一个空间,记作 $\text{Sesq}_{\mathbb{C|R}}(V,W;X)$;当 $X=\C$ 时,称双线性映射为双线性形式,构成的向量空间记作 $\text{Sesq}_{\mathbb{C|R}}(V,W)$。
操演定义,得到 $\text{Sesq}_{\mathbb{C|R}}(V,W;X)=\text{Bil}(\overline V,W;X)$。
**定义(左右根和非退化)**:设 $V,W$ 是有限维 $\C-$ 向量空间,其左根、右根、非退化的定义同一般双线性形式相同。
其余性质也适用,即非退化的必要条件是 $\dim V=\dim W$,此时左右根非空等价。
类似双线性形式,半双线性形式也可以由矩阵表示。对于列向量的情形,有同构 $M_{m\times n}(\C)\simeq \text{Sesq}_{\mathbb{C|R}}(\C^m,\C^n)$,同构映射映 $A\mapsto [B(v,w):={^\dagger}vAw]$。对于一般的向量空间,选定基后也有矩阵到半双线性形式的同构。
列向量 $\C^n$ 和我们需要的 $(\overline{\C^n})^\lor$ 之间过渡,用到的就是共轭转置(类似双线性形式中的转置)。
设 $B$ 依 curry 化对应到 $\varphi\in\text{Hom}(\C^n,(\overline{\C^m})^\lor)$,问题的关键在于确定同构 $\C^m\simeq (\overline{\C^m})^\lor$,这样可以使半双线性映射映到矩阵上,这个同构可以采取映 $v$ 为半线性映射 $v_1\mapsto {^\text t}v\,\overline{v_1}$,据此让 $\varphi$ 对应到 $\text{Hom}(\C^n,\C^m)$ 亦即 $M_{m\times n}(\C)$,那么有 $B(v,w)=\left<\varphi(w),v\right>={^{\text t}}(Aw)\overline v$,继续转置即得结果。
**定义(Hermite 形式)**:设 $V$ 是 $\C-$向量空间,$\epsilon\in\{\pm 1\}$,若半双线性形式 $B:V\times V\to\C$ 满足 $B(u,v)=\epsilon\overline{B(v,u)}$,则称 $B$ 是 $\epsilon-$Hermite 形式,$\epsilon$ 取正负 1 时称为 Hermite 形式和反 Hermite 形式。
**定义(Hermite 矩阵)**:设 $\epsilon\in\{-1,1\}$,若 $A\in M_{n\times n}(\C)$ 满足 $^\dagger A=\epsilon A$,则称 $A$ 为 $\epsilon-$Hermite 矩阵,当 $\epsilon$ 取正负 1 时称为 Hermite 矩阵和反 Hermite 矩阵。
正 Hermite 矩阵对应位置实部相等,虚部相反;反 Hermite 矩阵对应位置虚部相等、实部相反。
**定义(伴随映射)**:给定两个半双线性形式 $B_1:V_1\times W_1\to \C$ 和 $B_2:V_2\times W_2\to\C$,其中 $B_1$ 非退化,定义 $T\in\text{Hom}(V_1,V_2)$ 的右伴随映射 $T^*$ 为满足 $B_2(Tv_1,w_2)=B_1(v_1,T^*w_2)$ 的 $T^*$;类似地,定义 $T\in\text{Hom}(W_1,W_2)$ 的左伴随映射 $^*T$ 为满足 $B_2(v_2,Tw_1)=B_1(^*Tv_2,w_1)$ 的 $^*T$。
事实上左右伴随必然唯一,刻画也类似双线性形式,以右伴随为例,有 $^\dagger v_1{^\dagger}TA_2w_2={^\dagger}(Tv_1)A_2w_2={^\dagger}v_1A_1T^*w_2$,可以得到 $T^*=A_1^{-1}{^\dagger}TA_2$,类似地,有 $^* T={^\dagger}A_1^{-1}{^\dagger}T{^\dagger}A_2$。
从这个刻画可以看出,当 $B_1,B_2$ 都是 $\epsilon-$Hermite 形式时,左右伴随总相同,此时无歧义地将 $T$ 的伴随映射写成 $T^*$,$T^*$ 的性质和双线性映射版本的伴随矩阵完全相同。
**定义(自伴和反自伴)**:对于一个半双线性形式 $B:V\times V\to\C$,设 $T\in\text{End}(V)$,若 $T=T^*$,则称 $T$ 自伴;若 $T^*=-T$,则称 $T$ 反自伴。
$T$ 自伴等价于 $cT$ 反自伴,其中 $c$ 是纯虚数。
**定义(正规映射)**:给定非退化 $\epsilon-$Hermite 形式 $B:V\times V\to\C$,称满足 $TT^*=T^*T$ 的线性映射 $T:V\to V$ 是正规的。
自伴和反自伴映射自然是正规的,一般的映射可以写成两类的和。
**定理**:给定非退化 $\epsilon-$Hermite 形式 $B:V\times V\to\C$,则对于任意 $T\in\text{End}(V)$,存在唯一的 $T',T''$ 满足 $T'$ 自伴,$T''$ 反自伴使得 $T=T'+T''$,若 $T$ 正规,则 $T'T''=T''T'$。
命题的前一半是容易证明的,取伴随得到 $T^*=T'-T''$,解得 $T'=(T+T^*)/2$,$T''=(T-T^*)/2$。
当 $T$ 正规,操演定义得到 $TT^*=(T'+T'')(T'-T'')=T'^2-T''^2=(T'-T'')(T'+T'')=T^*T$,即证。
### 10.2 Hermite 形式的分类
仿照实二次型,二次型的半双线性映射版本由
$$
f(x_1,\ldots,x_n)=\sum_{1\le i,j\le n}\overline{x_i}A_{i,j}x_j
$$
给出,当 $A$ 是 Hermite 矩阵时,这个二次型的取值总是实的;当 $A$ 是反 Hermite 矩阵时,这个二次型的取值总是纯虚数。
这是显然的,对整个式子取共轭,可以得到
$$
\overline{f(x_1,\ldots,x_n)}=\sum_{1\le i,j\le n}x_i\overline{A_{i,j}x_j}=\sum_{1\le i,j\le n}\overline{x_iA_{j,i}}x_j
$$
即证。
仿照实二次型和双线性形式,容易定义半双线性形式上的同构。
**定义(半双线性形式的同构)**:设 $B_1:V_1\times V_1\to\C$,$B_2:V_2\times V_2\to\C$ 都是半双线性形式,且存在同构 $\varphi:V_1\to V_2$,且 $B_1(v,w)=B_2(\varphi(v),\varphi(w))$,则称 $\varphi$ 是一个 $(V_1,B_1)$ 到 $(V_2,B_2)$ 的同构,无歧义地也可以成为 $B_1$ 到 $B_2$ 的同构。
同构映射自然是可逆的和可合成的,因此自动是等价关系。
这一同构可以在诸多半双线性形式的表现下描述:
- $A,A'\in M_{n\times n}(\C)$ 是 $\epsilon-$Hermite 矩阵,$A'={^\dagger}CAC$,其中 $C$ 可逆(作保距变换 $B_1(v,w)=B_2(Tv,Tw)$,这相当于给 $B_1$ 对应的矩阵做一个 $^\dagger CAC$ 的变换)
- $f,f':\C^n\to \C$ 是 $n$ 元 $\epsilon-$Hermite 型,$f'=f\circ \varphi$,其中 $\varphi:\C^n\to\C^n$ 是可逆线性变换(看作变量的变换)
**命题($\epsilon-$Hermite 型的对角化)**:任意 $n$ 元 $\epsilon-$Hermite 型 $f$ 都同构于形如 $(x_1,\ldots,x_n)\mapsto a_1|x_1|^2+\ldots+a_n|x_n|^2$ 的 $n$ 元 $\epsilon-$Hermite 型。当 $\epsilon=+1$ 时,$a_i\in\R$;当 $\epsilon=-1$ 时,$a_i\in \text i\R$。
这一命题可以用配方法说明,在此之后,实二次型的惯性定理仍然适用。
**定理(Hermite 型的惯性定理)**:任意 $n$ 元 $\epsilon-$Hermite 型 $f$ 都同构于恰好一个形如 $(x_1,\ldots,x_n)\mapsto |x_1|^2+\ldots+|x_p|^2-|x_{p+1}|^2-\ldots-|x_{p+q}|^2$,称 $p,q$ 为 $f$ 的正/负惯性系数,$p-q$ 为 $f$ 的符号差。
这一则结果是实二次型论证的同意反复。
**定义(Hermite 形式的正定)**:设 $B:V\times V\to\C$ 是 Hermite 形式,且对于所有 $v\in V$ 有 $B(v,v)\ge 0$,则称 $B$ 正定;如果等号只在 $v=0$ 时取到,则称 $B$ 正定。
ps:这个内容似乎不太重要。
### 10.3 复内积空间和酉变换
**定义(复内积)**:复向量空间 $V$ 上的 Hermite 内积(复内积)指满足以下条件的映射 $(\cdot|\cdot):V\times V\to\C$ 满足 $(\cdot|\cdot)$ 是 $V$ 上的 Hermite 形式,且 $(\cdot|\cdot)$ 正定。
成这样的资料 $(V,(\cdot|\cdot))$ 为复内积空间、Hermite 空间或酉空间。
仿照实内积空间的论证,可以得知复内积空间的正交向量族线性无关,且维度有限或可数的向量空间总存在单位正交基。
**定义(保距和同构)**:设 $(V,(\cdot|\cdot)_V)$ 和 $(W,(\cdot|\cdot)_W)$ 是复内积空间。
- 若 $\varphi:V\to W$ 满足 $(v_1|v_2)_V=(\varphi(v_1)|\varphi(v_2))_W$,则称 $\varphi$ 保距。
- 若 $\varphi:V\to W$ 是同构,且 $\varphi$ 保距,则称 $\varphi$ 是复内积空间的同构。
和实内积空间一样,自同构是一个重要的课题。
**定义(酉变换)**:设 $T\in\text{End}(V)$ 是 $(V,(\cdot|\cdot))$ 的自同构,则称 $\varphi$ 是一个酉变换。
**定理**:设 $(V,(\cdot|\cdot))$ 是复内积空间,则 $T\in\text{End}(V)$ 是酉变换等价于 $T^*=T^{-1}$。
这个论证和之前无异,$(Tv|w)=(v|T^{-1}w)$ 表明 $T^{-1}$ 是 $T$ 的伴随;相同的论证说明 $T^*=T^{-1}$ 导出 $T$ 保距,因此自然是同构。
**定义(标准复内积)**:在 $\C^n$ 上的内积 $(\cdot|\cdot):(v,w)\mapsto {^\dagger}vw$ 称为标准内积。
在配备了标准内积的复内积空间中,$T^*={^\dagger}T$。
和实内积空间类似,复内积空间上的线性映射 $T:V\to W$ 总有 $rk(TT^*)=rk(T^*)$,$rk(T^*T)=rk(TT^*)$,$\ker(TT^*)=\ker(T)$,$\ker(T^*T)=\ker(T^*)$,$\text{im}(TT^*)=\text{im}(T)$,$\text{im}(T^*T)=\text{im}(T^*)$。
### 10.4 正规算子的酉对角化
回忆正规算子的定义:给定复内积空间 $(V,(\cdot|\cdot))$,正规算子是指 $TT^*=T^*T$ 的线性映射。
**定理(正规算子的谱分解)**:设 $T\in\text{End}(V)$,则 $T$ 是正规算子等价于存在单位正交基 $v_1,\ldots,v_n\in V$ 和 $\lambda_1,\ldots,\lambda_n\in\C$ 使得 $Tv_i=\lambda_iv_i$。
对于标准复内积的情形,正规算子是指 $^\dagger AA=A\,{^\dagger}A$ 的矩阵 $A$,证明这个需要觉用伴随的性质 $(t_1T_1+t_2T_2)^*=\overline{t_1}T_1^*+\overline{t_2}T_2^*$ 和 $(T_1T_2)^*=T_2^*T_1^*$。
**引理**:设 $T\in\text{End}(V)$ 正规,$f\in\C[X]$,则 $f(T)\in\text{End}(V)$ 也正规。
设 $f(X)=a_0+a_1X+\ldots+a_mX^m$,则 $(f(T))^*=\overline{a_1}+\overline{a_2}T^*+\ldots+\overline{a_m}(T^*)^m$,由于 $T$ 和 $T^*$ 可以交换,这个式子和任一 $T$ 的多项式也交换。
**引理**:设 $T\in\text{End}(V)$ 正规,若 $\lambda\in\C$,$v\in V$ 满足 $\lambda v=Tv$,则 $\overline{\lambda}v=T^*v$。
取 $M=T-\lambda\cdot 1$,则 $M$ 正规,且 $M^*=T^*-\overline{\lambda}\cdot 1$,$M$ 的正规性使得 $\ker(M)=\ker(MM^*)=\ker(M^*M)=\ker(M^*)$,这说明 $M$ 和 $M^*$ 的核相同,亦即差一个共轭的特征子空间相同,即证。
**引理**:设 $T\in\text{End}(V)$ 正规,若存在 $k\in\mathbb Z_{\ge 1}$ 使得 $T^k=0$,则 $T=0$。
若 $T$ 自伴,当 $k=2$,有 $(Tv|Tv)=(T^2v|v)=0$,这蕴含 $T=0$。当 $k\ge 3$,$k/2$ 和 $(k+1)/2$ 至少有一个是整数,据此重复此论证可知 $T=0$。
显然 $TT^*$ 自伴,且 $(TT^*)^k=T^k(T^*)^k=0$,这说明 $TT^*=0$,且 $\ker(T)=\ker(TT^*)=V$,亦即 $T=0$,即证。
**引理**:设 $T\in\text{End}(V)$ 正规且有两个不同的特征值 $\lambda,\mu$,则特征子空间 $V_\lambda\perp V_\mu$。
任取 $v\in V_\lambda$ 和 $w\in V_\mu$,则 $(v|Tw)=\mu(v|w)$,另一方面 $(T^*v|w)=(\overline{\lambda}v|w)=\lambda(v|w)$,这说明 $(v|w)=0$,即证。
下面可以开始证明正规算子谱分解定理了,首先证反方向。
考虑由 $Sv_i=\lambda_i$ 确定的线性映射,下证 $S=T^*$。显然对于任意 $v_i,v_j$,都有 $(Tv_i|v_j)=(v_i|Sv_j)$,而容易验证 $(T(\cdot)|\cdot)$ 和 $(\cdot|S(\cdot))$ 都是半双线性形式,因此确定了上述等式在基上成立可以导出对任意向量都成立,因此确实 $S=T^*$;另外,显然 $STv_i=\lambda_i\overline{\lambda_i}v_i=TSv_i$,因此 $T$ 正规。
接下来证正方向。
将 $\text{Char}_X(T)$ 在 $\C[X]$ 中做分解,不妨设 $\text{Char}_X(T)=\prod_{i=1}^k(x-\lambda_i)^{t_i}$,记 $M:=\prod_{i=1}^k(x-\lambda_i)$,则 $M^{\max t_i}(T)=0$。
由于 $T$ 正规,所以 $M(T)$ 也正规,因而 $M(T)=0$,这说明 $T$ 的极小多项式无重根,因而可以被对角化,因此有直和分解 $V=V_{\lambda_1}\oplus\ldots\oplus V_{\lambda_k}$,引理保证了它们是正交的,在每个特征子空间里取一组正交基即满足要求,即证。
谱分解有时还被写作 $T=\sum_{i=1}^k\lambda_iP_i$,其中 $P_i$ 是 $V_{\lambda_i}$ 方向的投影算子。
**推论**:设 $T\in\text{End}(V)$ 正规,则:
- $T$ 自伴当且仅当 $T$ 只有实特征值
- $T$ 反自伴当且仅当 $T$ 只有纯虚数特征值
- $T$ 是酉变换(复内积空间同构)当且仅当 $T$ 的特征值模长都为 1
定理的结果可以说明任一个正规算子 $T$ 都可以写成
$$
T=C\left(
\begin{matrix}
\lambda_1 & & & \\
& \lambda_2 & & \\
& & \ddots & \\
& & & \lambda_n
\end{matrix}\right)C^{-1}
$$
其中 $C^{-1}=C^*$ 是酉变换,因此上边的推论都是显然的。
### 10.5 实定理的复推广
**定理**:设 $f$ 是 $n$ 元 Hermite 型,则 $f$ 正定等价于其对应的矩阵 $A\in M_{n\times n}(\C)$ 只有正特征值。
**定义**:设 $(V,(\cdot|\cdot))$ 是复内积空间,若 $T\in\text{End}(V)$ 自伴且满足 $(v_1,v_2)\mapsto (Tv_1|v_2)$ 作为二次型是正定的,则称 $T$ 正定。
**引理**:设 $T: V\to W$ 是复向量空间中的线性映射,则 $TT^*$ 和 $T^*T$ 都半正定,若 $T$ 单(或 $T^*$ 单,即 $T$ 满),则它们都正定。
**定理**:设 $T\in\text{End}(V)$ 正定(半正定),则存在唯一的线性映射 $S$ 满足 $S$ 正定(半正定)且 $T=S^2$,有时也记作 $S=\sqrt T$。
**定理(极分解)**:设 $T\in\text{End}(V)$ 可逆,则存在唯一的 $R,U\in\text{End}(V)$ 使得 $T=RU$ 且 $R$ 正定,$U$ 是酉变换。
由 $R^2=TT^*$ 即可确定 $R$,其余论证和实的版本全同。
**定理(奇异值分解)**:设 $T\in\text{Hom}(V,W)$ 是复内积空间之间的线性映射,则存在 $V$ 的一组单位正交基 $v_1,\ldots,v_m$ 和 $W$ 的一组单位正交基 $w_1,\ldots,w_n$ 使得存在实数 $\sigma_1\ge \ldots\sigma_p\ge 0$ 满足 $p=\min\{n,m\}$ 且 $Tv_i=[i\le p]\sigma_iw_i$。
仿照实的情形,$T^*T$ 显然是半正定的,因而自然是正规的,可以被正交对角化,选取一组单位正交基 $v_1,\ldots,v_m$ 使得 $T^*Tv_i=\sigma_i^2v_i$,由此可以确定所有 $\sigma_i\ge 0$。随后再取 $w_i=\sigma_i^{-1}Tv_i$,那么就得到了满足条件的 $v$ 和 $w$。
上边这部分的良定性和存在性论证和实的版本全同,不再赘述。
如果选定单位正交基后使 $T$ 表为 $n\times m$ 矩阵 $A$,那么存在 $P\in M_{m\times m}(\C)$ 和 $Q\in M_{n\times n}(\C)$ 是酉矩阵使得 $A=Q\Sigma P^\dagger$,这里 $P$ 是上述论证过程中 $(v_1|\ldots|v_m)$ 给出的酉矩阵,$Q$ 是由 $(w_1|\ldots|w_n)$ 给出的酉矩阵。
**定义(Moore-Penrose 广义逆)**:设 $T\in\text{Hom}(V,W)$ 是复内积空间之间的线性映射,则存在唯一的 $S\in\text{Hom}(W,V)$ 使得:
- $TST=T
STS=S
(TS)^*=TS
(ST)^*=ST
这个东西和实的情形没有任何区别,同样可以通过奇异值分解求出。具体地,对 T 作奇异值分解,找到单位正交基 v_1,\ldots,v_m\in V ,w_1,\ldots,w_n\in W 和奇异值 \sigma_1\ge\ldots\ge\sigma_p ,那么令 S 映 w_j 为 \sigma_j^{-1}v_j (如果奇异值为 0 或不存在对应位置就映为 0)。表为矩阵就为 \operatorname{MP}(Q\Sigma P^\dagger)=P\Sigma' Q^\dagger 。
10.6 实正交变换的标准型
这一张中主要讨论的是实内积空间 (V,(\cdot|\cdot)) ,实内积空间可以自然地嵌入复内积空间,将其放在复视角下可以得到一些更好的结果。
定义 :设 T\in\text{End}(V) ,若 TT^*=T^*T ,则称 T 正规。
引理 :设 T\in\text{End}(V) 正规,且存在 k\in\mathbb Z_{\ge 1} 满足 T^k=0 ,则 T=0 。
将 T 放在复内积空间中,这则结果之前已经得到。
接下来讨论实正交变换。当 \dim V=1 时正交变换只能是 \pm 1 。当 \dim V=2 时,选取正交基使问题化为标准内积的情形,设矩阵为 \left(\begin{matrix}\alpha & \beta\\ \gamma & \delta\end{matrix}\right) ,那么 \alpha^2+\gamma^2=\beta^2+\delta^2=1 且 \alpha\beta+\gamma\delta=0 ,同时 \det T=\alpha\delta-\beta\gamma=\pm 1 。另 \alpha=\cos\theta,\gamma=\sin\theta ,带入可以得到 \beta\cos\theta+\delta\sin\gamma=0 ,\delta\cos\theta-\beta\sin\theta=\pm 1 ,可以解得 (\beta,\delta)=\pm(-\sin\theta,\cos\theta) 。
这正是我们熟知的旋转矩阵!
定义(旋转矩阵) :对于 \theta\in\R ,定义转角为 \theta 的旋转矩阵 R(\theta)=\left(\begin{matrix}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{matrix}\right) ,其作用在坐标系上即将一个点逆时针旋转 \theta 度。
引理 :设 A\in M_{2\times 2}(\R) 是正交变换,则 AR(\theta)A^{-1}=R(\theta\det A) 。
$\det A=-1$ 时,$A$ 可以写成 $R(\gamma)\left(\begin{matrix}1 & \\ & -1\end{matrix}\right)$ 的形式,最后得到的产物是 $R(-\theta)$。
**定理**:设 $T\in\text{End}(V)$ 是正交变换,则存在 $V$ 的单位正交基使得 $T$ 在此基上可以表为
$$
\left(
\begin{matrix}
1_{a\times a} & & & &\\
& -1_{b\times b} & & &\\
& & R(\theta_1) & &\\
& & & \ddots &\\
& & & & R(\theta_m)
\end{matrix}
\right)
$$
其中 $a+b+2m=\dim V$。
$T$ 存在大小至多为 2 的不变子空间 $W$,由于 $T$ 是正交变换,$W^\perp$ 也是 $T-$不变子空间,因此只需要讨论 $W$ 的情形即可。
如果 $W$ 有两个实特征值,则两个实特征值必然 $\in\{\pm 1\}$;否则将要么是旋转矩阵,要么是镜射合成旋转矩阵,后一种情况容易计算得到有两个实特征值 $\pm 1$,因此只能是旋转矩阵,即证。
这则结果在 $\R^3$ 上的情形可以得到三维正交变换必然性如
$$
\left(\begin{matrix}
\pm 1 & &\\
& \cos\theta & -\sin\theta\\
& \sin\theta & \cos\theta
\end{matrix}\right)
$$
即绕一个轴旋转或镜射 + 绕一个轴旋转。
### 10.7 三维空间中的旋转和 Euler 角
上一章已经知道了三维空间的实正交变换总可以写成旋转或镜射 + 旋转,这一章将关注 $\det=1$ 的情形(即绕轴旋转),意欲确定以下两条变换的性质:
- 绕轴旋转的轴(正交变换中 “1” 的部分)
- 绕轴(逆时针)旋转的角度(正交变换中 $\theta$ 的部分)
**约定**:如果 $\R^3$ 中的正交框架 $(u_1,u_2,u_3)$ 和标准基 $(e_1,e_2,e_3)$ 同定向,则称这是一个正向正交框架,反之称之为负向正交框架。
这样可以确定一个双射:旋转正交变换 $T\to $ 正向正交框架 $(u_1,u_2,u_3)$,它映 $T$ 为 $(Te_1,Te_2,Te_3)$,这无非是在标准基下矩阵的表达。
**约记**:对于所有单位向量 $u\in\R^3$,记以 $u$ 为转轴、$\theta$ 为转角的旋转正交变换为 $R_u(\theta)$。
我们的目标是从 $(e_1,e_2,e_3)$ 出发,每次以某一个向量为轴,旋转一个角度,以此来进行过渡并最终得到 $(u_1,u_2,u_3)$。
具体地,进行如下操作:$(e_1,e_2,e_3)\overset{R_{e_3}(\psi)}{\to}(f_1,f_2,e_3)\overset{R_{f_2}(\theta)}\to (g_1,f_2,u_3)\overset{R_{u_3}(\varphi)}\to(u_1,u_2,u_3)$,这需要合理地确定 $f_2$ 以确保确实有这样的操作,其余的地方都可以被确定。那么一定要有 $f_2\perp e_3$,$f_2\perp u_3$,如果 $e_3$ 和 $u_3$ 线性无关,取 $f_2=e_3\times u_3$ 即可,否则取 $f_2=e_2$,如此可以以此用叉乘确定 $f_1,g_1$,需要注意确保每一步确实都是正定向正交框架,由于旋转只要保持一个轴不变,另外两个轴可以任意变成正定向的正交框架,因此操作总是可以进行的。
这说明任一个旋转正交变换 $T$ 都可以写成 $R_{u_3}(\varphi)R_{f_2}(\theta)R_{e_3}(\psi)$ 的形式,接下来我们将证明它还可以被写成 $R_{e_3}(\psi)R_{e_2}(\theta)R_{e_3}(\varphi)$。
**引理**:设 $P:\R^3\to\R^3$ 是正交变换,$\epsilon=\det P$,$R_u(\theta)$ 是旋转正交变换,则 $R_{Pu}(\epsilon\theta)=PR_u(\theta)P^{-1}$,这个不难验证。
**待补**
### 10.8 四元数和旋转
**定义(四元数和其乘法)**:定义四元数集 $\H:=\{a+bi+cj+dk:a,b,c,d\in\R\}$,为带有基 $1,i,j,k$ 的 4 维 $\R-$向量空间。在基础上,定义其上的乘法为双线性映射 $\cdot:\H\times \H\to\H$,它满足 $1\cdot x= x$,$i^2=j^2=k^2=-1$,$ij=k=-ji$,$jk=i=-kj$,$ki=j=-ik$,容易验证这使得 $(\H,0,1,+,\cdot)$ 构成一个非交换环。
容易验证 $\R$ 和 $\C$ 都可以直接嵌入四元数环中,且环 $\H$ 的中心是 $\R$。
**定义-命题**:对 $q=a+bi+cj+dk\in\H$,定义其
- 共轭 $\overline q:=a-bi-cj-dk
迹 \text{tr}(q)=q+\overline q
范数 \text{N}(q):=q\overline q
这些操作具有如下性质:
\overline{\overline q}=q
\overline{q_1+q_2}=\overline{q_1}+\overline{q_2}$,$\overline{q_1q_2}=\overline{q_2}\cdot\overline{q_1}
\text{tr}(q)=2a
\text{N}(q)=a^2+b^2+c^2+d^2$,$\text{N}(1)=1$ 且 $\text{N}(q_1q_2)=\text{N}(q_1)\text{N}(q_2)
只需要操演定义即可说明 (a)(b)(c)。
对于 (d),容易发现 \text{N}(q_1q_2)=q_1q_2\overline{q_2q_1} ,由于 q_2\overline{q_2}=\text{N}(q_2)\in\R ,其可以和任意四元数交换,因此有 \text{N}(q_1q_2)=q_1\overline{q_1}q_2\overline{q_2}=\text{N}(q_1)\text{N}(q_2) ,即证。
上面几条性质说明四元数取共轭、取范数都是环同态,取迹是线性映射。
这一条的 (d) 告诉我们对于任意 q\neq 0 ,\text{N}(q)=\overline qq\in\R 非零,因此其有逆元 q^{-1}=\dfrac{\overline{q}}{\text{N}(q)} ,这使得四元数环 \H 成为除环。
四元数的主要价值在于三维空间 \R^3 可以嵌入它的一个子环 \H_0:=\R i\oplus \R j\oplus\R k ,称为纯四元数,嵌入映射映 (a,b,c) 为 ai+bj+ck 。
三维空间的很多操作都可以化归到四元数上进行,最主要的性质在于这个嵌入是保距的,将 \H_0 配备 \text{N}(\cdot) 导出的半双线性映射作为内积,同时容易验证 \|(a,b,c)\|=\text{N}(ai+bj+ck) ,因此可以在纯四元数上研究 \R^3 的问题。
引理 :设 x\in\H^\times ,则:
对于所有 q\in\H ,有 \text{N}(xqx^{-1})=\text{N}(q)
q\mapsto xqx^{-1}$ 给出 $\H_0$ 的自同构,记作 $R_x
\det R_x=1
(a) 是显然的。
(b) 确实给出了 \H_0\to \H 的同态,首先验证映射的像落在 \H_0 当中:利用 x^{-1}=\overline{x}\cdot \text{N}(x)^{-1} ,可以得到 xqx^{-1}=\text{N}(x)^{-1}xq\overline{x} ,取共轭可以得到 \overline{xqx^{-1}}=\text{N}(x)^{-1}x\overline{q}\cdot \overline{x}=-xqx^{-1} ,可见 xqx^{-1} 是纯四元数,因此它确实是 \H_0 的自同态;另一方面,q\mapsto x^{-1}qx 给出它的逆,依照同样的论证可以证明这也是 \H_0 的自同态,因此 R_x 是自同构。
(c) 将 \H_0 同构到 \R^3 上,显然 R_x 给出了 \H_0 上的保距映射,自然也就给出了实内积空间 \R^3 上的一个同构,这表明 \det R_x\in\{\pm 1\} ,同时显然 \det R_x 关于 x\in\H_0 是连续的,因此只需要验证一个 \det R_x ,直接取 x=1 可以发现 R_x=\text{id} ,因此 \det R_x=1 。
这说明每个 R_x 都描述了一个三维旋转正交变换,同时 R_{xy}=R_x\circ R_y ,因此旋转的合成可以划归到纯四元数的乘法上,那么整个论证就只剩下任何一个旋转都可以被表为某个 R_x 的形式。根据上一章关于欧拉角的讨论我们知道只需要实现绕 e_1 旋转和绕 e_2 旋转即可合成出所有旋转。
定理 :设 T 为三维空间 \H_0 中的旋转映射,那么精确到 \pm x 存在唯一的 x\in\H_0 使得 T=R_x 。
问题化归到绕轴旋转的问题,考虑取 x=\cos\theta+i\sin\theta ,那么 x^{-1}=\cos\theta-i\sin\theta ,此时容易验证:
xjx^{-1}=(\cos\theta+i\sin\theta)j(\cos\theta-i\sin\theta)=j\cos^2\theta+k\cos\theta\sin\theta+k\sin\theta\cos\theta-j\sin^2\theta=j\cos2\theta+k\sin 2\theta
xkx^{-1}=(\cos\theta+i\sin\theta)k(\cos\theta-i\sin\theta)=k(\cos^2\theta-\sin^2\theta)+j(-2\sin\theta\cos\theta)=k\cos 2\theta-j\sin 2\theta
这就相当于固定 i ,旋转了 2\theta ,相同的论证还给出了固定另外两轴的旋转变换,因此确实存在 R_x=T 。
另一方面,R_x=R_y 蕴含 R_{xy^{-1}}=\text{id} ,这归结于若 R_x=\text{id} 则 x=\pm 1 ,此时 ix=xi ,jx=xj ,kx=xk ,这说明 x\in Z(\H)=\R ,又因为 \det R_x=1 ,于是 x=\pm 1 ,即证。
推论 :设 u\in\H_0 满足 \text{N}(u)=1 ,则以 u 为转轴旋转 \theta 的变换可以写作 R_x ,其中 x=\cos(\theta/2)+\sin(\theta/2)u
这可以直接验证,也可以先作旋转变换 R_y 使得 R_y(i)=u ,根据上一章的讨论得到 R_u(\theta)=PR_i(\theta)P^{-1} ,再带入 R_i(\theta)=R_{\cos(\theta/2)+i\sin(\theta/2)} ,将 P 等同于 R_y ,R_u(\theta) 等同于 R_x ,那么 x=y(\cos(\theta/2)+i\sin(\theta/2))y^{-1}=\cos(\theta/2)+yiy^{-1}\sin(\theta/2) ,由于 R_y(i)=u ,依据定义这导致 yiy^{-1}=u ,于是 x=\cos(\theta/2)+u\sin(\theta/2) ,即证!
间奏:对称多项式
这一章是之前在第六章当中跳过的内容,和后边的群论以及 Lagrange 预解式
6.7 对称多项式
定义 :设 F 是域,f\in F[X_1,\ldots,X_n] ,对 \sigma\in\mathfrak S_n ,定义 (\sigma f)(X_1,\ldots,X_n):=f(X_{\sigma(1)},\ldots,X_{\sigma(n)}) 。
操演定义,可以得到 (\sigma\tau)f=\sigma(\tau f) ,同时 \text{id}f=f ,因此这个操作可以看做群 \mathfrak S_n 在 F[X_1,\ldots,X_n] 上的左作用。
定义 :若对于任意 \sigma\in\mathfrak S_n 都有 \sigma f=f ,则称 f 为对称多项式。所有对称多项式构成 F[X_1,\ldots,X_n] 的子环和子空间,记作 F[X_1,\ldots,X_n]^{\mathfrak S_n} 。
作为一些例子,p_k:=\sum_{i=1}^n X_i^k (幂和)、e_k:=\sum_{1\le i_i<\ldots< i_k\le n}X_{i_1}\ldots X_{i_k} (初等对称多项式)都是对称的。
定理(Vieta) :\displaystyle\prod_{i=1}^n(Y-X_i)=Y^n-e_1Y^{n-1}+\ldots+(-1)^n e_n ,因此对称多项式和多项式方程的根有很大联系。
定理(对称多项式基本定理) :设 f\in F[X_1,\ldots,X_n]^{\mathfrak S_n} ,则存在 g\in F[X_1,\ldots,X_n] 使得 f=g(e_1,\ldots,e_n) ,其中 e_k 为第 k 个初等对称多项式。
显然一个多项式可以分解成若干齐次的部分,故可以将 f 分解为 f=f_0+\ldots+f_d ,其中 f_k 表示齐 k 次的多项式,同时 \deg f:=\{\max\{d\ge 0:f_d\neq 0\} ,待补 。
引理 :设 f\in F[X_1,\ldots,X_n]^{\mathfrak S_n} ,则 f(X_1,\ldots,X_{n-1},0)=0\iff e_n|f
右推左:f=qe_n 导致 f(X_1,\ldots,X_{n-1},0)=q(\ldots)X_1\ldots X_n\cdot 0=0 。
左推右:带入得 0 蕴含每一个单项式都是 0,因而每个单项式都包含 X_n ,有对称多项式的性质可知每个单项式都包含 e_n ,即证。
例(判别式) :设多项式 f\in F[X] 在 F 上分裂为 \prod_{i=1}^n (X-\alpha_i) ,那么考察 \prod_{i<j}(\alpha_i-\alpha_j) ,在这个式子里对 \alpha_i 进行轮换,得到的结果 \prod_{i<j}^n(\alpha_{\sigma(i)}-\alpha_{\sigma(j)}) 最多差一个负号,因而 \prod_{i<j}^n(\alpha_i-\alpha_j)^2 是对称多项式(平方之后负号被消去),记作 \text{disc}(f) 。
根据上文的定理,\text{disc}(f) 可以被写成关于 \alpha_1,\ldots,\alpha_n 的初等多项式的多项式(这个系数甚至是在整数上的),从而 \text{disc}(f) 是关于 f 系数的一个多项式,因而是多项式的内涵量。
这一则结果有如下意义:假设 f\in R[X] ,如果 \text{disc}(f)=0 ,则说明 f 在某个足够大的扩域上有重根,反之则没有。
作为例子,考虑二次的情形,f=X^2-bX+c=(X-\alpha_1)(X-\alpha_2) ,那么 \text{disc}(f)=(\alpha_1-\alpha_2)^2=(\alpha_1+\alpha_2)^2-4\alpha_1\alpha_2=b^2-4c ,这就得到了一元二次方程的判别式(这里只能用于判别是否有重根,别的性质需要一些分析的内容才能够得到)。
引理(牛顿公式) :在域 F 上考察 p_k:=\sum_{i=1}^n X_i^k ,称为幂和多项式,那么存在对称多项式 e_0=1,\ldots,e_k\in F[X_1,\ldots,X_n] 使得 p_k-e_1p_{k-1}+\ldots+(-1)^ne_np_{k-n}=0 ,超出下标的部分补 0。
考察形式幂级数,等式左边相当于 [y^k](\sum_{l=0}^ne_l(-Y)^l)(\sum_{l\ge 0}p_lY^l) ,就只需要证明这个生成函数是一个常数 n 就可以了。
倒闭了。
6.8 结式
引入结式的动机是判断 f,g\in F[X] 是否有公因式,这个当然可以辗转相除(这归功于 F[X] 是欧几里得整环),但是并不适用于很多的理论研究,因此引入了一个判别的式子来判定,这就是结式。
定义(结式) :设 f=v_0X^n+\ldots+v_n\in F[X] ,g=w_0X^m+\ldots+w_m\in F[X] ,定义 f 和 g 的结式 \text{Res}(f,g) 为如下矩阵的行列式:
\left|
\begin{matrix}
v_0 & \ldots & \ldots & v_n & &\\
& \ddots & & & \ddots\\
& & v_0 & \ldots & \ldots & v_n & \\
w_0 & \ldots & \ldots & w_m & &\\
& \ddots & & & \ddots\\
& & w_0 & \ldots & \ldots & w_m & \\
\end{matrix}
\right|
上半部分是 v_0,\ldots,v_n 重复 m 次,每次右移一个位置;下半部分是 w_0,\ldots,w_m 重复 n 次,每次右移一个位置,因此这确实是一个 n+m 阶方阵。
结式有一些显然的性质:
若将 \text{Res}(f,g) 看做 v_0,\ldots,v_n,w_0,\ldots,w_m 的多项式,那么这个系数是整的(嵌入 F ),和 F 无关。
\text{Res}(g,f)=(-1)^{nm}\text{Res}(f,g)
对任意 t\in F ,\text{Res}(tf,g)=t^m\text{Res}(f,g)
引理 :给定上述的 n,m,f,g ,则 \text{Res}(f,g)=0 当且仅当存在 f_1,g_1\in F[X] 不都为零使得 \deg f_1<n ,\deg g_1<m 且 fg_1+gf_1=0 。
将 f_1=a_1X^{n-1}+\ldots+a_n 和 g_1=b_1X^{n-1}+\ldots+b_n 带入 fg_1+gf_1=0 ,系数矩阵就是结式中矩阵的转置,因而有解等价于结式为 0。
定理 :给定上述的 n,m,f,g ,则 \text{Res}(f,g)=0 当且仅当 w_0=v_0=0 或 f,g 存在公因式 d 使得 \deg d>0 。
必要性是显然的,w_0=v_0=0 导致矩阵第一列为 0,自然行列式为 0;若存在公因式 d 则可命 f_1=f/d ,g_1=-f/d ,那么 gf_1+fg_1=0 且 \deg f_1<\deg f\le n ,\deg g_1<\deg g\le m ,由引理可得此时 \text{Res}(f,g)=0 。
再证明充分性。
当 $w_0,v_0$ 不全为零时,不妨设 $w_0\neq 0$。此时若 $(f,g)=1$ 时,由引理可知存在 $f_1,g_1$ 满足 $gf_1+fg_1=0$,这导致 $\frac{f}{g}=-\frac{f_1}{g_1}$,由于 $f,g$ 互质,$g|g_1$,从而 $\deg g_1\ge \deg g=m$,这和引理矛盾,即证。
这一则结果可以联系到上一节的 $\text{disc}$,它们首先有一些相似之处,例如首项非零的 $\text{Res}(f,g)=0$ 就导出 $f,g$ 在足够大的扩域下有相同的根,更深入的讨论归结为如下定理:
**定理**:设 $n,m\in\Z_{\ge 1}$,$f=a\prod_{i=1}^n(X-\alpha_i)\in F[X]$,$g=b\prod_{i=1}^m(X-\beta_i)\in F[X]$,则 $\text{Res}(f,g)=a^m\prod_{i=1}^mg(\alpha_i)=(-1)^{nm}b^n\prod_{i=1}^ng(\beta_i)=a^mb^n\prod_{i,j}(\alpha_i-\beta_i)
只需要证明第一个等式,并且问题可以归结为 a=b=1 的情形。
假设 g(\alpha_1),\ldots,g(\alpha_n) 互不相同,那么考虑 \text{Res}(f,g-Y)\in F[Y] ,他是关于变元 Y 不超过 n 次的多项式,降幂可以写出它等于 (-1)^nY^n+\ldots+\text{Res}(f,g) ,首项为 (-1)^n 归结为必须取在主对角线上。
对于任意 i ,\alpha_i 是 f 和 g-g(\alpha_i) 的公根,从而 \text{Res}(f,g-g(\alpha_i))=0 ,从而 \prod_{i=1}^n(g(\alpha_i)-Y)|\text{Res}(f,g-Y) ,比较最高次项可知它们确实相等,因而确实 \text{Res}(f,g)=\prod_{i=1}^ng(\alpha_i) 。
上述论述用到了 g(\alpha_1),\ldots,g(\alpha_n) 互不相同的限制,但事实上并没有用到它们数值上性质,一个经典技巧是用变元 Z_1,\ldots,Z_n 来代替 \alpha_1,\ldots,\alpha_n ,并以多项式环 F[Z_1,\ldots,Z_n] 代替域 F 进行论述,不难发现这并不影响上述论证,因而可以得到相同的结果,即 \prod_{i=1}^n(g(Z_i)-Y)=\text{Res}(\prod_{i=1}^n(X-Z_i),g-Y) 仍然成立,将 \alpha_1,\ldots,\alpha_n 代入即可,即证。
推论 :设 f 如上,则 a\operatorname{disc}(f)=(-1)^{n(n-1)/2}\text{Res}(f,f') ,其中 f' 表示对 f 求形式导数,并减少一次。
运用 Leibniz 求导法则和上一则定理,可以得到 \text{Res}(f,f')=a^{n-1}\prod_{i=1}^nf'(\alpha_i)=a^{2n-1}\prod_{i=1}^n\prod_{j\neq i}(\alpha_i-\alpha_j) 。
6.9 不可约多项式初探
这部分的笔记是从去年的笔记上抄过来的。
定义:若多项式环 F[X] 上的所有不可约元都是一次或零次多项式,那么称 F 是代数闭域。
由于代数基本定理的存在,复数域 \mathbb C 是代数闭域。
接下来考虑 \mathbb R ,将 \mathbb R[X] 嵌入 \mathbb C[X] ,其根是两两共轭配对的,因此可以将其分解为一次和二次多项式。
定义:设 f=a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X] ,记 c(f)=\gcd(a_0,\ldots,a_n) ;若 c(f)=1 ,则称 f 为本原多项式。
定理:若 f,g\in\mathbb Z[X] 都是本原多项式,则 fg 也是本原多项式。
证明:如若不然,则存在素数 p 使得 fg 的每一项系数都是 p 的倍数。考察 f 和 g 最低次系数不是 p 的倍数的项,不妨设其为 a_kx^k 和 b_qx^q ,那么考察 fg 的 x^{k+q} 项系数,易知其不是 p 的倍数,即证。
定理:设 f\in\mathbb Z[X] 是本原多项式,下列命题等价:
(a) 推 (b):显然。
(b) 推 (a):如若不然,设 f=gh ,其中 gh\in\mathbb Q[X] ,取适当的系数 c_1,c_2 使得 c_1g,c_2h 都是本原多项式,那么有 c(c_1g\cdot c_2h)=c_1c_2 c(f) ,由于 c(c_1g)c(c_2h)=1=c(f) ,于是有 c_1c_2=1 ,因此此时必然存在 c_1g,c_2h\in\mathbb Z[X] 使得 f=(c_1gc_2h) ,即证。
定理:\mathbb Z[X] 上的不可约多项式可以分为两类:
定理:设 f=a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X] ,若存在素数 p 满足:
p\nmid a_n
p\mid a_0,a_1,\ldots,a_{n-1}
p^2\nmid a_0
那么 f 在 \mathbb Z[X] 上不可约。
证明:如果存在 g,h\in\mathbb Z[X] 使得 f=gh ,且 g=b_0+b_1x\ldots+b_mx^m ,h=c_0+c_1x+\ldots+c_kx^k ,那么 m+k=n 且 p\nmid b_0 或 p\nmid c_0 ,不妨设 p\nmid b_0 ,考察 h 中次数最小的系数不为 p 的倍数的项 c_qx^q ,那么 p\nmid a_q ,这说明 q=n ,即 g 只有常数项,矛盾,即证。
推论:设 p 是质数,那么多项式 f=\dfrac{x^p-1}{x-1}=1+x+\ldots+x^{p-1} 不可约。
证明:作换元 y+1=x ,那么
f=\dfrac{(y+1)^p-1}{y}=\sum_{i=1}^p\binom{p}{i}y^{i-1}
根据上文定理可得 f\in \mathbb Z[Y] 是不可约的,自然对于 \mathbb Z[X] 也是不可约的。
这是分圆多项式的一个结果,在初等数论和代数中有所涉及。
命题(猜根法):设 x_0=u/v 是多项式 a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X] 的根,那么有 v|a_n ,u|a_0 。
证明:其有因式 (vx-u) ,因此 v|a_n,u|a_0 。
推论:首一整系数多项式的根必然是整数(v|1 说明 v=\pm 1 )
上面这套东西在一般的唯一分解整环上应该也是成立的,论证不需要改变,需要注意一些等号精确到同构。