高代笔记 3

· · 个人记录

高等代数 2 笔记

第九章 实内积空间(剩余内容)

9.9 奇异值分解

定理:设 V,W 是实内积空间,T:V\to W 是线性映射,则存在 V,W 的单位正交基 v_1,\ldots,v_nw_1,\ldots,w_m 和唯一确定的 \sigma_1\ge\sigma_2\ge\ldots\ge\sigma_p\ge 0 使得 Tv_i=[i\le p]\sigma_iw_i,其中 p=\min\{n,m\}

首先证明奇异值 \sigma_1,\ldots,\sigma_p 的唯一性。注意到 (T(v_i+v_j)|w_i)_W=((v_i+v_j)|Tw_i)=\sigma_iT^*w_j=[j\le p]\sigma_jv_j,因此 \sigma_i^2 都是 T^*T 的特征值,由此唯一确定。

同样地,由于 T^*T 是半正定的,可以正交对角化并重排得到 \sigma_1\ge\ldots\ge\sigma_p\ge 0 并确定 v_1,\ldots,v_n,由此确定 w_i=\sigma_i^{-1}Tv_i,容易验证 (w_i|w_i)_W=(v_i|\sigma_i^{-2}T^*Tv_i)_V=1,同时 (w_i|w_j)_W=(v_i|\sigma^{-2}T^*Tv_j)_V=0,然后将 w_1,\ldots,w_p 扩充成一组基,即证。

如此可以得到奇异值分解的矩阵形式,记 P=(v_1|\ldots|v_n)Q=(w_1|\ldots|w_m)\Sigma\in M_{m\times m} 是由 \sigma_1,\ldots,\sigma_p,0,\ldots,0 排列而成的对角矩阵,那么有 AP=Q\Sigma,或者等价地写成 A=Q\Sigma P{^\text{t}}

9.10 Moore-Penrose 广义逆

定义:设 V,W 是实内积空间,T:V\to W 是线性映射,若 S:W\to V 满足以下条件,则称 ST 的 Moore-Penrose 广义逆:

接下来将说明 Moore-Penrose 广义逆存在且唯一,并根据奇异值分解给出一个构造。

定理:上述 S 存在且唯一,并有如下的构造给出:对于任意的 v\in V,w\in W,将其分解为 v=v'+v''w=w'+w'',其中 v'\in\ker Tv''\in(\ker T)^\perpw'\in\operatorname{im} Tw''\in(\operatorname{im}T)^\perp。对于 w\in W,任取一个 v\in T^{-1}w',令 Sw=v''

这确实是良定的,因为所有 T^{-1} 中的元素差一个 \ker T,同时容易验证 TSTv=TSTv''=Tv''=TvSTSw=STv''=Sw'=Sw,这同样说明了 TSST 分别是 \operatorname{im}T\ker T 的正交投影,正交投影自动是自伴的,因此 S 确实存在。

如果存在两个 Moore-Penrose 广义逆 SR,那么可以得到 S=STS=S(TS)^*=SS^*T^*=SS^*(TRT)^*=S(TS)^*(TR)^*=STR,类似的论证也给出 R=STR,因此有 S=R,即证。

关于 Moore-Penrose 广义逆的构造,从矩阵角度来说,一种方便的方法是先作奇异值分解 T=Q\Sigma P^\text{t},随后取 S=P\Sigma'Q^\text{t},其中 \Sigma' 表示将 \Sigma 非零部分取逆得到的对角矩阵(两维大小交换),上述各条性质都容易验证。

9.11 极小化极大原理

V 是实内积空间,B 是对称双线性形式,那么可知存在 S\in\text{End}(V) 使得 B(v_1,v_2)=(v_1|Sv_2),由于 B 和内积都是对称的,交换两个变量可以得到 B(v_1,v_2)=B(v_2,v_1)=(v_2|Sv_1),因此 S 自伴。

选取适当的单位正交基使 S 对角化,那么 S 的最大、最小特征值由 \displaystyle\max_{|v|=1}B(v,v)\displaystyle\min_{|v|=1}B(v,v) 给出,下面这则定理给出了从大到小每个特征值的刻画:

\lambda_k=\min_{U\subseteq V,\dim U=n-k+1}\max_{v\in U,|v|=1}B(v,v) \lambda_k=\max_{U\subseteq V,\dim U=k}\min_{v\in U,|v|=1}B(v,v)

这则定理的直观理解在于选取维数为 n-k+1 的子空间必然会包含 \left<v_1,\ldots,v_k\right> 中的一个元素,其中 v 是单位正交基,这导致右边的最大值 \ge\lambda_k,而取到 \lambda_k 有显然的构造,类似的论证对于后一个式子也成立。

9.12 Perron–Frobenius 定理

这一章主要关心正矩阵(所有元素都为正)和正向量(所有元素都为正)的一些性质。

约记:设 A,B\in M_{n\times n}(\R),称 A>B(或 A\ge B)当且仅当 A_{i,j}>B_{i,j}A_{i,j}\ge B_{i,j})对所有 1\le i,j\le n 都成立,特别地,当 B=0_{n\times n} 时也记作 A>0A\ge 0

引理:设 A>0v\ge 0 是列向量且不为 0,则 Av>0

这是显然的,在 v 中找一项不为 0 的即可。

定义:设 A\in M_{n\times n}(\C),定义 A 的谱半径为 \rho(A):=\max\{|\lambda|\},其中 \lambda\in\CA 的特征值。

引理:设 A\in M_{n\times n}(\R),且 A>0,则:

证明:考察 S:=\{x\in\R^n:|x|=1,x\ge 0\},这是紧集,因此在其上的连续映射有最大值和极值,考察映射 \mathcal L:S\to\R_{>0}x\mapsto\min\{(Ax)_i/x_i:x_i\neq 0\},这确实是连续的,命 \rho\mathcal L 的一个极大值且在 v 处取到,下面证明确实有 Av=\rho v 能被取到。

首先有 Av\ge\rho v,如果不等号取不到,则 A(Av-\rho v)>0,取足够小的 \epsilon 使得 A(Av-\rho v)>\epsilon Av,于是有 A(Av)\ge (\rho+\epsilon)Av,命 w=Av,则 Aw\ge (\rho+\epsilon)w,这和 \rho 最大矛盾,因此当 \rho 最大时等号确实可以取到。

对于后一半,考虑 \mu\in\Cw\in\C^n 非零使得 \mu w=Aw,那么有 |\mu|\cdot |w_i|=|(\mu w)_i|=|\sum_{j} A_{i,j}w_j|\le \sum_j A_{i,j}|w_j|,命 w'=(|w_1|,\ldots,|w_n|),上述不等式说明 |\mu w'|\le |Aw'|,适当伸缩使得 |w'|=1,得到 \mathcal L(w')\ge\mu,这说明 \rho\ge\rho(A),而由于 \rho 确实是特征值,因此 \rho\le\rho(A),因此此时确有 \rho=\rho(A)

定理:设 A\in M_{n\times n}(\R)A>0,则下属性质成立:

(i) 是引理的内容。

(ii) 考虑 (i) 引理的内容,论证过程中的不等式等号必须成立,即 \sum_jA_{i,j}|w_j|=|\sum_jA_{i,j}w_j| 成立,由于 A_{i,j} 都是实的,w_j 必然处在一条复平面的直线上,设此时 w=cv,其中 v\ge 0,那么 wv 有相同的特征值,而 v 是实的,因此特征值也正实数,此时特征值必然是 \rho(A),即证。

(iii) 如若不然,则存在 v,v' 不线性相关使得 \rho(A)v=Av\rho(A)v'=Av',引理保证了存在一个 v>0,因此对于充分小的 \epsilon,有 v-\epsilon v'\ge 0,其中至少一个分量为 0,但是 \rho(A)(v-\epsilon v')=A(v-\epsilon v')>0,这是显然的矛盾。

(iv) 显然 \rho(A) 转置不变,取 u\in\R^n 使得 \rho(A)u=A^\text tu,那么 \left<u\right>^\perp=\{x\in\R^n:u^\text tx=0\}A-不变子空间,这是由于此时 u^\text t Ax=(A^\text tu)^\text tx=\rho(A)u^\text tx=0,且由于 u,v>0,总有 u^\text tv>0,因此可以作 A-不变直和分解 A=\Rv\oplus\left<u\right>^\perp,如果 \rho(A) 不是单根,那么其在 \left<u\right>^\perp 中也会有特征子空间,运用 (iii) 中的论证可知矛盾。

定理:若将上一条定理的条件减弱为 A\ge 0,在存在 m\in\mathbb Z_{\ge 1} 使得 A^m>0 时,四条性质仍然成立。

由于 A^m 的特征值是 A 的特征值取 m 次幂,取 A^m>0,此时后三条性质自动成立。对于第一条,考虑最大特征值 \rho(A)=|\lambda_1|A^m 中显然会有 \rho(A^m)=|\lambda_1^m|,取 v\in\C^n 满足 Av=\lambda_1v,这满足 A^mv=\lambda_1^mv,通过之前的论证得知必然存在 v>0 满足这个条件,于是 \lambda_1 v=Av\ge 0,这说明 \lambda_1\ge 0,同时显然 \lambda_1\neq 0,这证明了 (i)。

定理:将正权强联通有向图视作邻接矩阵 A\in M_{n\times n}(\R),则:

第十章 复内积结构

对于复数 z,其模长为 \overline z\cdot z。如果我们想表达一个复向量的长度的话,其模长的平方就应该对应每一维模长的平方相加,也即 ^\dagger v\cdot v,其中 ^\dagger 表示共轭转置。从这个角度来看,仿照实内积空间引入实二次型,复内积空间上也可以引入复二次型 B(v,w),随后让 B(v,v) 充当内积的角色,但这个结构并不能是双线性映射,这是由于第一个变量的纯量乘法会差一个共轭,因此就延伸出了复空间上的半双线性映射。

10.1 半双线性形式

定义(半线性映射):若复向量空间之间的映射 T:V\to W 满足 T(v_1+v_2)=T(v_1)+T(v_2)T(tv)=\overline tT(v)(其中 t\in\C),则称 T 是半线性映射。

半线性映射自然是 \R 线性的(将 \C 看作 \R 向量空间)。

定义(复共轭空间):设 V\C 向量空间,定义其复共轭 \overline V,其中 \overline V 的加法和 V 相同,纯量乘法差一个共轭(即 t\odot v=\overline t\cdot v)。

由此可知 \overline{\overline V}=V

以下是一些例子:

在一些时候,复空间的某些自同构也满足上述性质,只是同构应映射有所改变,如对于 $\C^n$,这样的一个同构是逐维取共轭,因此在讨论 $\C^n$ 的时候,取复共轭空间就可以看作一般的数值共轭。 **定义(半双线性映射和半双线性形式)**:设 $V,W,X$ 是 $\C-$向量空间,半双线性映射是指 $B:V\times W\to X$ 的映射,其中 $B$ 对第一个变元是半线性的、对第二个变元是线性的。限制 $V,W,X$,则所有半双线性映射构成一个空间,记作 $\text{Sesq}_{\mathbb{C|R}}(V,W;X)$;当 $X=\C$ 时,称双线性映射为双线性形式,构成的向量空间记作 $\text{Sesq}_{\mathbb{C|R}}(V,W)$。 操演定义,得到 $\text{Sesq}_{\mathbb{C|R}}(V,W;X)=\text{Bil}(\overline V,W;X)$。 **定义(左右根和非退化)**:设 $V,W$ 是有限维 $\C-$ 向量空间,其左根、右根、非退化的定义同一般双线性形式相同。 其余性质也适用,即非退化的必要条件是 $\dim V=\dim W$,此时左右根非空等价。 类似双线性形式,半双线性形式也可以由矩阵表示。对于列向量的情形,有同构 $M_{m\times n}(\C)\simeq \text{Sesq}_{\mathbb{C|R}}(\C^m,\C^n)$,同构映射映 $A\mapsto [B(v,w):={^\dagger}vAw]$。对于一般的向量空间,选定基后也有矩阵到半双线性形式的同构。 列向量 $\C^n$ 和我们需要的 $(\overline{\C^n})^\lor$ 之间过渡,用到的就是共轭转置(类似双线性形式中的转置)。 设 $B$ 依 curry 化对应到 $\varphi\in\text{Hom}(\C^n,(\overline{\C^m})^\lor)$,问题的关键在于确定同构 $\C^m\simeq (\overline{\C^m})^\lor$,这样可以使半双线性映射映到矩阵上,这个同构可以采取映 $v$ 为半线性映射 $v_1\mapsto {^\text t}v\,\overline{v_1}$,据此让 $\varphi$ 对应到 $\text{Hom}(\C^n,\C^m)$ 亦即 $M_{m\times n}(\C)$,那么有 $B(v,w)=\left<\varphi(w),v\right>={^{\text t}}(Aw)\overline v$,继续转置即得结果。 **定义(Hermite 形式)**:设 $V$ 是 $\C-$向量空间,$\epsilon\in\{\pm 1\}$,若半双线性形式 $B:V\times V\to\C$ 满足 $B(u,v)=\epsilon\overline{B(v,u)}$,则称 $B$ 是 $\epsilon-$Hermite 形式,$\epsilon$ 取正负 1 时称为 Hermite 形式和反 Hermite 形式。 **定义(Hermite 矩阵)**:设 $\epsilon\in\{-1,1\}$,若 $A\in M_{n\times n}(\C)$ 满足 $^\dagger A=\epsilon A$,则称 $A$ 为 $\epsilon-$Hermite 矩阵,当 $\epsilon$ 取正负 1 时称为 Hermite 矩阵和反 Hermite 矩阵。 正 Hermite 矩阵对应位置实部相等,虚部相反;反 Hermite 矩阵对应位置虚部相等、实部相反。 **定义(伴随映射)**:给定两个半双线性形式 $B_1:V_1\times W_1\to \C$ 和 $B_2:V_2\times W_2\to\C$,其中 $B_1$ 非退化,定义 $T\in\text{Hom}(V_1,V_2)$ 的右伴随映射 $T^*$ 为满足 $B_2(Tv_1,w_2)=B_1(v_1,T^*w_2)$ 的 $T^*$;类似地,定义 $T\in\text{Hom}(W_1,W_2)$ 的左伴随映射 $^*T$ 为满足 $B_2(v_2,Tw_1)=B_1(^*Tv_2,w_1)$ 的 $^*T$。 事实上左右伴随必然唯一,刻画也类似双线性形式,以右伴随为例,有 $^\dagger v_1{^\dagger}TA_2w_2={^\dagger}(Tv_1)A_2w_2={^\dagger}v_1A_1T^*w_2$,可以得到 $T^*=A_1^{-1}{^\dagger}TA_2$,类似地,有 $^* T={^\dagger}A_1^{-1}{^\dagger}T{^\dagger}A_2$。 从这个刻画可以看出,当 $B_1,B_2$ 都是 $\epsilon-$Hermite 形式时,左右伴随总相同,此时无歧义地将 $T$ 的伴随映射写成 $T^*$,$T^*$ 的性质和双线性映射版本的伴随矩阵完全相同。 **定义(自伴和反自伴)**:对于一个半双线性形式 $B:V\times V\to\C$,设 $T\in\text{End}(V)$,若 $T=T^*$,则称 $T$ 自伴;若 $T^*=-T$,则称 $T$ 反自伴。 $T$ 自伴等价于 $cT$ 反自伴,其中 $c$ 是纯虚数。 **定义(正规映射)**:给定非退化 $\epsilon-$Hermite 形式 $B:V\times V\to\C$,称满足 $TT^*=T^*T$ 的线性映射 $T:V\to V$ 是正规的。 自伴和反自伴映射自然是正规的,一般的映射可以写成两类的和。 **定理**:给定非退化 $\epsilon-$Hermite 形式 $B:V\times V\to\C$,则对于任意 $T\in\text{End}(V)$,存在唯一的 $T',T''$ 满足 $T'$ 自伴,$T''$ 反自伴使得 $T=T'+T''$,若 $T$ 正规,则 $T'T''=T''T'$。 命题的前一半是容易证明的,取伴随得到 $T^*=T'-T''$,解得 $T'=(T+T^*)/2$,$T''=(T-T^*)/2$。 当 $T$ 正规,操演定义得到 $TT^*=(T'+T'')(T'-T'')=T'^2-T''^2=(T'-T'')(T'+T'')=T^*T$,即证。 ### 10.2 Hermite 形式的分类 仿照实二次型,二次型的半双线性映射版本由 $$ f(x_1,\ldots,x_n)=\sum_{1\le i,j\le n}\overline{x_i}A_{i,j}x_j $$ 给出,当 $A$ 是 Hermite 矩阵时,这个二次型的取值总是实的;当 $A$ 是反 Hermite 矩阵时,这个二次型的取值总是纯虚数。 这是显然的,对整个式子取共轭,可以得到 $$ \overline{f(x_1,\ldots,x_n)}=\sum_{1\le i,j\le n}x_i\overline{A_{i,j}x_j}=\sum_{1\le i,j\le n}\overline{x_iA_{j,i}}x_j $$ 即证。 仿照实二次型和双线性形式,容易定义半双线性形式上的同构。 **定义(半双线性形式的同构)**:设 $B_1:V_1\times V_1\to\C$,$B_2:V_2\times V_2\to\C$ 都是半双线性形式,且存在同构 $\varphi:V_1\to V_2$,且 $B_1(v,w)=B_2(\varphi(v),\varphi(w))$,则称 $\varphi$ 是一个 $(V_1,B_1)$ 到 $(V_2,B_2)$ 的同构,无歧义地也可以成为 $B_1$ 到 $B_2$ 的同构。 同构映射自然是可逆的和可合成的,因此自动是等价关系。 这一同构可以在诸多半双线性形式的表现下描述: - $A,A'\in M_{n\times n}(\C)$ 是 $\epsilon-$Hermite 矩阵,$A'={^\dagger}CAC$,其中 $C$ 可逆(作保距变换 $B_1(v,w)=B_2(Tv,Tw)$,这相当于给 $B_1$ 对应的矩阵做一个 $^\dagger CAC$ 的变换) - $f,f':\C^n\to \C$ 是 $n$ 元 $\epsilon-$Hermite 型,$f'=f\circ \varphi$,其中 $\varphi:\C^n\to\C^n$ 是可逆线性变换(看作变量的变换) **命题($\epsilon-$Hermite 型的对角化)**:任意 $n$ 元 $\epsilon-$Hermite 型 $f$ 都同构于形如 $(x_1,\ldots,x_n)\mapsto a_1|x_1|^2+\ldots+a_n|x_n|^2$ 的 $n$ 元 $\epsilon-$Hermite 型。当 $\epsilon=+1$ 时,$a_i\in\R$;当 $\epsilon=-1$ 时,$a_i\in \text i\R$。 这一命题可以用配方法说明,在此之后,实二次型的惯性定理仍然适用。 **定理(Hermite 型的惯性定理)**:任意 $n$ 元 $\epsilon-$Hermite 型 $f$ 都同构于恰好一个形如 $(x_1,\ldots,x_n)\mapsto |x_1|^2+\ldots+|x_p|^2-|x_{p+1}|^2-\ldots-|x_{p+q}|^2$,称 $p,q$ 为 $f$ 的正/负惯性系数,$p-q$ 为 $f$ 的符号差。 这一则结果是实二次型论证的同意反复。 **定义(Hermite 形式的正定)**:设 $B:V\times V\to\C$ 是 Hermite 形式,且对于所有 $v\in V$ 有 $B(v,v)\ge 0$,则称 $B$ 正定;如果等号只在 $v=0$ 时取到,则称 $B$ 正定。 ps:这个内容似乎不太重要。 ### 10.3 复内积空间和酉变换 **定义(复内积)**:复向量空间 $V$ 上的 Hermite 内积(复内积)指满足以下条件的映射 $(\cdot|\cdot):V\times V\to\C$ 满足 $(\cdot|\cdot)$ 是 $V$ 上的 Hermite 形式,且 $(\cdot|\cdot)$ 正定。 成这样的资料 $(V,(\cdot|\cdot))$ 为复内积空间、Hermite 空间或酉空间。 仿照实内积空间的论证,可以得知复内积空间的正交向量族线性无关,且维度有限或可数的向量空间总存在单位正交基。 **定义(保距和同构)**:设 $(V,(\cdot|\cdot)_V)$ 和 $(W,(\cdot|\cdot)_W)$ 是复内积空间。 - 若 $\varphi:V\to W$ 满足 $(v_1|v_2)_V=(\varphi(v_1)|\varphi(v_2))_W$,则称 $\varphi$ 保距。 - 若 $\varphi:V\to W$ 是同构,且 $\varphi$ 保距,则称 $\varphi$ 是复内积空间的同构。 和实内积空间一样,自同构是一个重要的课题。 **定义(酉变换)**:设 $T\in\text{End}(V)$ 是 $(V,(\cdot|\cdot))$ 的自同构,则称 $\varphi$ 是一个酉变换。 **定理**:设 $(V,(\cdot|\cdot))$ 是复内积空间,则 $T\in\text{End}(V)$ 是酉变换等价于 $T^*=T^{-1}$。 这个论证和之前无异,$(Tv|w)=(v|T^{-1}w)$ 表明 $T^{-1}$ 是 $T$ 的伴随;相同的论证说明 $T^*=T^{-1}$ 导出 $T$ 保距,因此自然是同构。 **定义(标准复内积)**:在 $\C^n$ 上的内积 $(\cdot|\cdot):(v,w)\mapsto {^\dagger}vw$ 称为标准内积。 在配备了标准内积的复内积空间中,$T^*={^\dagger}T$。 和实内积空间类似,复内积空间上的线性映射 $T:V\to W$ 总有 $rk(TT^*)=rk(T^*)$,$rk(T^*T)=rk(TT^*)$,$\ker(TT^*)=\ker(T)$,$\ker(T^*T)=\ker(T^*)$,$\text{im}(TT^*)=\text{im}(T)$,$\text{im}(T^*T)=\text{im}(T^*)$。 ### 10.4 正规算子的酉对角化 回忆正规算子的定义:给定复内积空间 $(V,(\cdot|\cdot))$,正规算子是指 $TT^*=T^*T$ 的线性映射。 **定理(正规算子的谱分解)**:设 $T\in\text{End}(V)$,则 $T$ 是正规算子等价于存在单位正交基 $v_1,\ldots,v_n\in V$ 和 $\lambda_1,\ldots,\lambda_n\in\C$ 使得 $Tv_i=\lambda_iv_i$。 对于标准复内积的情形,正规算子是指 $^\dagger AA=A\,{^\dagger}A$ 的矩阵 $A$,证明这个需要觉用伴随的性质 $(t_1T_1+t_2T_2)^*=\overline{t_1}T_1^*+\overline{t_2}T_2^*$ 和 $(T_1T_2)^*=T_2^*T_1^*$。 **引理**:设 $T\in\text{End}(V)$ 正规,$f\in\C[X]$,则 $f(T)\in\text{End}(V)$ 也正规。 设 $f(X)=a_0+a_1X+\ldots+a_mX^m$,则 $(f(T))^*=\overline{a_1}+\overline{a_2}T^*+\ldots+\overline{a_m}(T^*)^m$,由于 $T$ 和 $T^*$ 可以交换,这个式子和任一 $T$ 的多项式也交换。 **引理**:设 $T\in\text{End}(V)$ 正规,若 $\lambda\in\C$,$v\in V$ 满足 $\lambda v=Tv$,则 $\overline{\lambda}v=T^*v$。 取 $M=T-\lambda\cdot 1$,则 $M$ 正规,且 $M^*=T^*-\overline{\lambda}\cdot 1$,$M$ 的正规性使得 $\ker(M)=\ker(MM^*)=\ker(M^*M)=\ker(M^*)$,这说明 $M$ 和 $M^*$ 的核相同,亦即差一个共轭的特征子空间相同,即证。 **引理**:设 $T\in\text{End}(V)$ 正规,若存在 $k\in\mathbb Z_{\ge 1}$ 使得 $T^k=0$,则 $T=0$。 若 $T$ 自伴,当 $k=2$,有 $(Tv|Tv)=(T^2v|v)=0$,这蕴含 $T=0$。当 $k\ge 3$,$k/2$ 和 $(k+1)/2$ 至少有一个是整数,据此重复此论证可知 $T=0$。 显然 $TT^*$ 自伴,且 $(TT^*)^k=T^k(T^*)^k=0$,这说明 $TT^*=0$,且 $\ker(T)=\ker(TT^*)=V$,亦即 $T=0$,即证。 **引理**:设 $T\in\text{End}(V)$ 正规且有两个不同的特征值 $\lambda,\mu$,则特征子空间 $V_\lambda\perp V_\mu$。 任取 $v\in V_\lambda$ 和 $w\in V_\mu$,则 $(v|Tw)=\mu(v|w)$,另一方面 $(T^*v|w)=(\overline{\lambda}v|w)=\lambda(v|w)$,这说明 $(v|w)=0$,即证。 下面可以开始证明正规算子谱分解定理了,首先证反方向。 考虑由 $Sv_i=\lambda_i$ 确定的线性映射,下证 $S=T^*$。显然对于任意 $v_i,v_j$,都有 $(Tv_i|v_j)=(v_i|Sv_j)$,而容易验证 $(T(\cdot)|\cdot)$ 和 $(\cdot|S(\cdot))$ 都是半双线性形式,因此确定了上述等式在基上成立可以导出对任意向量都成立,因此确实 $S=T^*$;另外,显然 $STv_i=\lambda_i\overline{\lambda_i}v_i=TSv_i$,因此 $T$ 正规。 接下来证正方向。 将 $\text{Char}_X(T)$ 在 $\C[X]$ 中做分解,不妨设 $\text{Char}_X(T)=\prod_{i=1}^k(x-\lambda_i)^{t_i}$,记 $M:=\prod_{i=1}^k(x-\lambda_i)$,则 $M^{\max t_i}(T)=0$。 由于 $T$ 正规,所以 $M(T)$ 也正规,因而 $M(T)=0$,这说明 $T$ 的极小多项式无重根,因而可以被对角化,因此有直和分解 $V=V_{\lambda_1}\oplus\ldots\oplus V_{\lambda_k}$,引理保证了它们是正交的,在每个特征子空间里取一组正交基即满足要求,即证。 谱分解有时还被写作 $T=\sum_{i=1}^k\lambda_iP_i$,其中 $P_i$ 是 $V_{\lambda_i}$ 方向的投影算子。 **推论**:设 $T\in\text{End}(V)$ 正规,则: - $T$ 自伴当且仅当 $T$ 只有实特征值 - $T$ 反自伴当且仅当 $T$ 只有纯虚数特征值 - $T$ 是酉变换(复内积空间同构)当且仅当 $T$ 的特征值模长都为 1 定理的结果可以说明任一个正规算子 $T$ 都可以写成 $$ T=C\left( \begin{matrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{matrix}\right)C^{-1} $$ 其中 $C^{-1}=C^*$ 是酉变换,因此上边的推论都是显然的。 ### 10.5 实定理的复推广 **定理**:设 $f$ 是 $n$ 元 Hermite 型,则 $f$ 正定等价于其对应的矩阵 $A\in M_{n\times n}(\C)$ 只有正特征值。 **定义**:设 $(V,(\cdot|\cdot))$ 是复内积空间,若 $T\in\text{End}(V)$ 自伴且满足 $(v_1,v_2)\mapsto (Tv_1|v_2)$ 作为二次型是正定的,则称 $T$ 正定。 **引理**:设 $T: V\to W$ 是复向量空间中的线性映射,则 $TT^*$ 和 $T^*T$ 都半正定,若 $T$ 单(或 $T^*$ 单,即 $T$ 满),则它们都正定。 **定理**:设 $T\in\text{End}(V)$ 正定(半正定),则存在唯一的线性映射 $S$ 满足 $S$ 正定(半正定)且 $T=S^2$,有时也记作 $S=\sqrt T$。 **定理(极分解)**:设 $T\in\text{End}(V)$ 可逆,则存在唯一的 $R,U\in\text{End}(V)$ 使得 $T=RU$ 且 $R$ 正定,$U$ 是酉变换。 由 $R^2=TT^*$ 即可确定 $R$,其余论证和实的版本全同。 **定理(奇异值分解)**:设 $T\in\text{Hom}(V,W)$ 是复内积空间之间的线性映射,则存在 $V$ 的一组单位正交基 $v_1,\ldots,v_m$ 和 $W$ 的一组单位正交基 $w_1,\ldots,w_n$ 使得存在实数 $\sigma_1\ge \ldots\sigma_p\ge 0$ 满足 $p=\min\{n,m\}$ 且 $Tv_i=[i\le p]\sigma_iw_i$。 仿照实的情形,$T^*T$ 显然是半正定的,因而自然是正规的,可以被正交对角化,选取一组单位正交基 $v_1,\ldots,v_m$ 使得 $T^*Tv_i=\sigma_i^2v_i$,由此可以确定所有 $\sigma_i\ge 0$。随后再取 $w_i=\sigma_i^{-1}Tv_i$,那么就得到了满足条件的 $v$ 和 $w$。 上边这部分的良定性和存在性论证和实的版本全同,不再赘述。 如果选定单位正交基后使 $T$ 表为 $n\times m$ 矩阵 $A$,那么存在 $P\in M_{m\times m}(\C)$ 和 $Q\in M_{n\times n}(\C)$ 是酉矩阵使得 $A=Q\Sigma P^\dagger$,这里 $P$ 是上述论证过程中 $(v_1|\ldots|v_m)$ 给出的酉矩阵,$Q$ 是由 $(w_1|\ldots|w_n)$ 给出的酉矩阵。 **定义(Moore-Penrose 广义逆)**:设 $T\in\text{Hom}(V,W)$ 是复内积空间之间的线性映射,则存在唯一的 $S\in\text{Hom}(W,V)$ 使得: - $TST=T

这个东西和实的情形没有任何区别,同样可以通过奇异值分解求出。具体地,对 T 作奇异值分解,找到单位正交基 v_1,\ldots,v_m\in Vw_1,\ldots,w_n\in W 和奇异值 \sigma_1\ge\ldots\ge\sigma_p,那么令 Sw_j\sigma_j^{-1}v_j(如果奇异值为 0 或不存在对应位置就映为 0)。表为矩阵就为 \operatorname{MP}(Q\Sigma P^\dagger)=P\Sigma' Q^\dagger

10.6 实正交变换的标准型

这一张中主要讨论的是实内积空间 (V,(\cdot|\cdot)),实内积空间可以自然地嵌入复内积空间,将其放在复视角下可以得到一些更好的结果。

定义:设 T\in\text{End}(V),若 TT^*=T^*T,则称 T 正规。

引理:设 T\in\text{End}(V) 正规,且存在 k\in\mathbb Z_{\ge 1} 满足 T^k=0,则 T=0

T 放在复内积空间中,这则结果之前已经得到。

接下来讨论实正交变换。当 \dim V=1 时正交变换只能是 \pm 1。当 \dim V=2 时,选取正交基使问题化为标准内积的情形,设矩阵为 \left(\begin{matrix}\alpha & \beta\\ \gamma & \delta\end{matrix}\right),那么 \alpha^2+\gamma^2=\beta^2+\delta^2=1\alpha\beta+\gamma\delta=0,同时 \det T=\alpha\delta-\beta\gamma=\pm 1。另 \alpha=\cos\theta,\gamma=\sin\theta,带入可以得到 \beta\cos\theta+\delta\sin\gamma=0\delta\cos\theta-\beta\sin\theta=\pm 1,可以解得 (\beta,\delta)=\pm(-\sin\theta,\cos\theta)

这正是我们熟知的旋转矩阵!

定义(旋转矩阵):对于 \theta\in\R,定义转角为 \theta 的旋转矩阵 R(\theta)=\left(\begin{matrix}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{matrix}\right),其作用在坐标系上即将一个点逆时针旋转 \theta 度。

引理:设 A\in M_{2\times 2}(\R) 是正交变换,则 AR(\theta)A^{-1}=R(\theta\det A)

$\det A=-1$ 时,$A$ 可以写成 $R(\gamma)\left(\begin{matrix}1 & \\ & -1\end{matrix}\right)$ 的形式,最后得到的产物是 $R(-\theta)$。 **定理**:设 $T\in\text{End}(V)$ 是正交变换,则存在 $V$ 的单位正交基使得 $T$ 在此基上可以表为 $$ \left( \begin{matrix} 1_{a\times a} & & & &\\ & -1_{b\times b} & & &\\ & & R(\theta_1) & &\\ & & & \ddots &\\ & & & & R(\theta_m) \end{matrix} \right) $$ 其中 $a+b+2m=\dim V$。 $T$ 存在大小至多为 2 的不变子空间 $W$,由于 $T$ 是正交变换,$W^\perp$ 也是 $T-$不变子空间,因此只需要讨论 $W$ 的情形即可。 如果 $W$ 有两个实特征值,则两个实特征值必然 $\in\{\pm 1\}$;否则将要么是旋转矩阵,要么是镜射合成旋转矩阵,后一种情况容易计算得到有两个实特征值 $\pm 1$,因此只能是旋转矩阵,即证。 这则结果在 $\R^3$ 上的情形可以得到三维正交变换必然性如 $$ \left(\begin{matrix} \pm 1 & &\\ & \cos\theta & -\sin\theta\\ & \sin\theta & \cos\theta \end{matrix}\right) $$ 即绕一个轴旋转或镜射 + 绕一个轴旋转。 ### 10.7 三维空间中的旋转和 Euler 角 上一章已经知道了三维空间的实正交变换总可以写成旋转或镜射 + 旋转,这一章将关注 $\det=1$ 的情形(即绕轴旋转),意欲确定以下两条变换的性质: - 绕轴旋转的轴(正交变换中 “1” 的部分) - 绕轴(逆时针)旋转的角度(正交变换中 $\theta$ 的部分) **约定**:如果 $\R^3$ 中的正交框架 $(u_1,u_2,u_3)$ 和标准基 $(e_1,e_2,e_3)$ 同定向,则称这是一个正向正交框架,反之称之为负向正交框架。 这样可以确定一个双射:旋转正交变换 $T\to $ 正向正交框架 $(u_1,u_2,u_3)$,它映 $T$ 为 $(Te_1,Te_2,Te_3)$,这无非是在标准基下矩阵的表达。 **约记**:对于所有单位向量 $u\in\R^3$,记以 $u$ 为转轴、$\theta$ 为转角的旋转正交变换为 $R_u(\theta)$。 我们的目标是从 $(e_1,e_2,e_3)$ 出发,每次以某一个向量为轴,旋转一个角度,以此来进行过渡并最终得到 $(u_1,u_2,u_3)$。 具体地,进行如下操作:$(e_1,e_2,e_3)\overset{R_{e_3}(\psi)}{\to}(f_1,f_2,e_3)\overset{R_{f_2}(\theta)}\to (g_1,f_2,u_3)\overset{R_{u_3}(\varphi)}\to(u_1,u_2,u_3)$,这需要合理地确定 $f_2$ 以确保确实有这样的操作,其余的地方都可以被确定。那么一定要有 $f_2\perp e_3$,$f_2\perp u_3$,如果 $e_3$ 和 $u_3$ 线性无关,取 $f_2=e_3\times u_3$ 即可,否则取 $f_2=e_2$,如此可以以此用叉乘确定 $f_1,g_1$,需要注意确保每一步确实都是正定向正交框架,由于旋转只要保持一个轴不变,另外两个轴可以任意变成正定向的正交框架,因此操作总是可以进行的。 这说明任一个旋转正交变换 $T$ 都可以写成 $R_{u_3}(\varphi)R_{f_2}(\theta)R_{e_3}(\psi)$ 的形式,接下来我们将证明它还可以被写成 $R_{e_3}(\psi)R_{e_2}(\theta)R_{e_3}(\varphi)$。 **引理**:设 $P:\R^3\to\R^3$ 是正交变换,$\epsilon=\det P$,$R_u(\theta)$ 是旋转正交变换,则 $R_{Pu}(\epsilon\theta)=PR_u(\theta)P^{-1}$,这个不难验证。 **待补** ### 10.8 四元数和旋转 **定义(四元数和其乘法)**:定义四元数集 $\H:=\{a+bi+cj+dk:a,b,c,d\in\R\}$,为带有基 $1,i,j,k$ 的 4 维 $\R-$向量空间。在基础上,定义其上的乘法为双线性映射 $\cdot:\H\times \H\to\H$,它满足 $1\cdot x= x$,$i^2=j^2=k^2=-1$,$ij=k=-ji$,$jk=i=-kj$,$ki=j=-ik$,容易验证这使得 $(\H,0,1,+,\cdot)$ 构成一个非交换环。 容易验证 $\R$ 和 $\C$ 都可以直接嵌入四元数环中,且环 $\H$ 的中心是 $\R$。 **定义-命题**:对 $q=a+bi+cj+dk\in\H$,定义其 - 共轭 $\overline q:=a-bi-cj-dk

这些操作具有如下性质:

只需要操演定义即可说明 (a)(b)(c)。

对于 (d),容易发现 \text{N}(q_1q_2)=q_1q_2\overline{q_2q_1},由于 q_2\overline{q_2}=\text{N}(q_2)\in\R,其可以和任意四元数交换,因此有 \text{N}(q_1q_2)=q_1\overline{q_1}q_2\overline{q_2}=\text{N}(q_1)\text{N}(q_2),即证。

上面几条性质说明四元数取共轭、取范数都是环同态,取迹是线性映射。

这一条的 (d) 告诉我们对于任意 q\neq 0\text{N}(q)=\overline qq\in\R 非零,因此其有逆元 q^{-1}=\dfrac{\overline{q}}{\text{N}(q)},这使得四元数环 \H 成为除环。

四元数的主要价值在于三维空间 \R^3 可以嵌入它的一个子环 \H_0:=\R i\oplus \R j\oplus\R k,称为纯四元数,嵌入映射映 (a,b,c)ai+bj+ck

三维空间的很多操作都可以化归到四元数上进行,最主要的性质在于这个嵌入是保距的,将 \H_0 配备 \text{N}(\cdot) 导出的半双线性映射作为内积,同时容易验证 \|(a,b,c)\|=\text{N}(ai+bj+ck),因此可以在纯四元数上研究 \R^3 的问题。

引理:设 x\in\H^\times,则:

(a) 是显然的。

(b) 确实给出了 \H_0\to \H 的同态,首先验证映射的像落在 \H_0 当中:利用 x^{-1}=\overline{x}\cdot \text{N}(x)^{-1},可以得到 xqx^{-1}=\text{N}(x)^{-1}xq\overline{x},取共轭可以得到 \overline{xqx^{-1}}=\text{N}(x)^{-1}x\overline{q}\cdot \overline{x}=-xqx^{-1},可见 xqx^{-1} 是纯四元数,因此它确实是 \H_0 的自同态;另一方面,q\mapsto x^{-1}qx 给出它的逆,依照同样的论证可以证明这也是 \H_0 的自同态,因此 R_x 是自同构。

(c) 将 \H_0 同构到 \R^3 上,显然 R_x 给出了 \H_0 上的保距映射,自然也就给出了实内积空间 \R^3 上的一个同构,这表明 \det R_x\in\{\pm 1\},同时显然 \det R_x 关于 x\in\H_0 是连续的,因此只需要验证一个 \det R_x,直接取 x=1 可以发现 R_x=\text{id},因此 \det R_x=1

这说明每个 R_x 都描述了一个三维旋转正交变换,同时 R_{xy}=R_x\circ R_y,因此旋转的合成可以划归到纯四元数的乘法上,那么整个论证就只剩下任何一个旋转都可以被表为某个 R_x 的形式。根据上一章关于欧拉角的讨论我们知道只需要实现绕 e_1 旋转和绕 e_2 旋转即可合成出所有旋转。

定理:设 T 为三维空间 \H_0 中的旋转映射,那么精确到 \pm x 存在唯一的 x\in\H_0 使得 T=R_x

问题化归到绕轴旋转的问题,考虑取 x=\cos\theta+i\sin\theta,那么 x^{-1}=\cos\theta-i\sin\theta,此时容易验证:

这就相当于固定 i,旋转了 2\theta,相同的论证还给出了固定另外两轴的旋转变换,因此确实存在 R_x=T

另一方面,R_x=R_y 蕴含 R_{xy^{-1}}=\text{id},这归结于若 R_x=\text{id}x=\pm 1,此时 ix=xijx=xjkx=xk,这说明 x\in Z(\H)=\R,又因为 \det R_x=1,于是 x=\pm 1,即证。

推论:设 u\in\H_0 满足 \text{N}(u)=1,则以 u 为转轴旋转 \theta 的变换可以写作 R_x,其中 x=\cos(\theta/2)+\sin(\theta/2)u

这可以直接验证,也可以先作旋转变换 R_y 使得 R_y(i)=u,根据上一章的讨论得到 R_u(\theta)=PR_i(\theta)P^{-1},再带入 R_i(\theta)=R_{\cos(\theta/2)+i\sin(\theta/2)},将 P 等同于 R_yR_u(\theta) 等同于 R_x,那么 x=y(\cos(\theta/2)+i\sin(\theta/2))y^{-1}=\cos(\theta/2)+yiy^{-1}\sin(\theta/2),由于 R_y(i)=u,依据定义这导致 yiy^{-1}=u,于是 x=\cos(\theta/2)+u\sin(\theta/2),即证!

间奏:对称多项式

这一章是之前在第六章当中跳过的内容,和后边的群论以及 Lagrange 预解式

6.7 对称多项式

定义:设 F 是域,f\in F[X_1,\ldots,X_n],对 \sigma\in\mathfrak S_n,定义 (\sigma f)(X_1,\ldots,X_n):=f(X_{\sigma(1)},\ldots,X_{\sigma(n)})

操演定义,可以得到 (\sigma\tau)f=\sigma(\tau f),同时 \text{id}f=f,因此这个操作可以看做群 \mathfrak S_nF[X_1,\ldots,X_n] 上的左作用。

定义:若对于任意 \sigma\in\mathfrak S_n 都有 \sigma f=f,则称 f 为对称多项式。所有对称多项式构成 F[X_1,\ldots,X_n] 的子环和子空间,记作 F[X_1,\ldots,X_n]^{\mathfrak S_n}

作为一些例子,p_k:=\sum_{i=1}^n X_i^k(幂和)、e_k:=\sum_{1\le i_i<\ldots< i_k\le n}X_{i_1}\ldots X_{i_k}(初等对称多项式)都是对称的。

定理(Vieta)\displaystyle\prod_{i=1}^n(Y-X_i)=Y^n-e_1Y^{n-1}+\ldots+(-1)^n e_n,因此对称多项式和多项式方程的根有很大联系。

定理(对称多项式基本定理):设 f\in F[X_1,\ldots,X_n]^{\mathfrak S_n},则存在 g\in F[X_1,\ldots,X_n] 使得 f=g(e_1,\ldots,e_n),其中 e_k 为第 k 个初等对称多项式。

显然一个多项式可以分解成若干齐次的部分,故可以将 f 分解为 f=f_0+\ldots+f_d,其中 f_k 表示齐 k 次的多项式,同时 \deg f:=\{\max\{d\ge 0:f_d\neq 0\}待补

引理:设 f\in F[X_1,\ldots,X_n]^{\mathfrak S_n},则 f(X_1,\ldots,X_{n-1},0)=0\iff e_n|f

右推左:f=qe_n 导致 f(X_1,\ldots,X_{n-1},0)=q(\ldots)X_1\ldots X_n\cdot 0=0

左推右:带入得 0 蕴含每一个单项式都是 0,因而每个单项式都包含 X_n,有对称多项式的性质可知每个单项式都包含 e_n,即证。

例(判别式):设多项式 f\in F[X]F 上分裂为 \prod_{i=1}^n (X-\alpha_i),那么考察 \prod_{i<j}(\alpha_i-\alpha_j),在这个式子里对 \alpha_i 进行轮换,得到的结果 \prod_{i<j}^n(\alpha_{\sigma(i)}-\alpha_{\sigma(j)}) 最多差一个负号,因而 \prod_{i<j}^n(\alpha_i-\alpha_j)^2 是对称多项式(平方之后负号被消去),记作 \text{disc}(f)

根据上文的定理,\text{disc}(f) 可以被写成关于 \alpha_1,\ldots,\alpha_n 的初等多项式的多项式(这个系数甚至是在整数上的),从而 \text{disc}(f) 是关于 f 系数的一个多项式,因而是多项式的内涵量。

这一则结果有如下意义:假设 f\in R[X],如果 \text{disc}(f)=0,则说明 f 在某个足够大的扩域上有重根,反之则没有。

作为例子,考虑二次的情形,f=X^2-bX+c=(X-\alpha_1)(X-\alpha_2),那么 \text{disc}(f)=(\alpha_1-\alpha_2)^2=(\alpha_1+\alpha_2)^2-4\alpha_1\alpha_2=b^2-4c,这就得到了一元二次方程的判别式(这里只能用于判别是否有重根,别的性质需要一些分析的内容才能够得到)。

引理(牛顿公式):在域 F 上考察 p_k:=\sum_{i=1}^n X_i^k,称为幂和多项式,那么存在对称多项式 e_0=1,\ldots,e_k\in F[X_1,\ldots,X_n] 使得 p_k-e_1p_{k-1}+\ldots+(-1)^ne_np_{k-n}=0,超出下标的部分补 0。

考察形式幂级数,等式左边相当于 [y^k](\sum_{l=0}^ne_l(-Y)^l)(\sum_{l\ge 0}p_lY^l),就只需要证明这个生成函数是一个常数 n 就可以了。

倒闭了。

6.8 结式

引入结式的动机是判断 f,g\in F[X] 是否有公因式,这个当然可以辗转相除(这归功于 F[X] 是欧几里得整环),但是并不适用于很多的理论研究,因此引入了一个判别的式子来判定,这就是结式。

定义(结式):设 f=v_0X^n+\ldots+v_n\in F[X]g=w_0X^m+\ldots+w_m\in F[X],定义 fg 的结式 \text{Res}(f,g) 为如下矩阵的行列式:

\left| \begin{matrix} v_0 & \ldots & \ldots & v_n & &\\ & \ddots & & & \ddots\\ & & v_0 & \ldots & \ldots & v_n & \\ w_0 & \ldots & \ldots & w_m & &\\ & \ddots & & & \ddots\\ & & w_0 & \ldots & \ldots & w_m & \\ \end{matrix} \right|

上半部分是 v_0,\ldots,v_n 重复 m 次,每次右移一个位置;下半部分是 w_0,\ldots,w_m 重复 n 次,每次右移一个位置,因此这确实是一个 n+m 阶方阵。

结式有一些显然的性质:

引理:给定上述的 n,m,f,g,则 \text{Res}(f,g)=0 当且仅当存在 f_1,g_1\in F[X] 不都为零使得 \deg f_1<n\deg g_1<mfg_1+gf_1=0

f_1=a_1X^{n-1}+\ldots+a_ng_1=b_1X^{n-1}+\ldots+b_n 带入 fg_1+gf_1=0,系数矩阵就是结式中矩阵的转置,因而有解等价于结式为 0。

定理:给定上述的 n,m,f,g,则 \text{Res}(f,g)=0 当且仅当 w_0=v_0=0f,g 存在公因式 d 使得 \deg d>0

必要性是显然的,w_0=v_0=0 导致矩阵第一列为 0,自然行列式为 0;若存在公因式 d 则可命 f_1=f/dg_1=-f/d,那么 gf_1+fg_1=0\deg f_1<\deg f\le n\deg g_1<\deg g\le m,由引理可得此时 \text{Res}(f,g)=0

再证明充分性。

当 $w_0,v_0$ 不全为零时,不妨设 $w_0\neq 0$。此时若 $(f,g)=1$ 时,由引理可知存在 $f_1,g_1$ 满足 $gf_1+fg_1=0$,这导致 $\frac{f}{g}=-\frac{f_1}{g_1}$,由于 $f,g$ 互质,$g|g_1$,从而 $\deg g_1\ge \deg g=m$,这和引理矛盾,即证。 这一则结果可以联系到上一节的 $\text{disc}$,它们首先有一些相似之处,例如首项非零的 $\text{Res}(f,g)=0$ 就导出 $f,g$ 在足够大的扩域下有相同的根,更深入的讨论归结为如下定理: **定理**:设 $n,m\in\Z_{\ge 1}$,$f=a\prod_{i=1}^n(X-\alpha_i)\in F[X]$,$g=b\prod_{i=1}^m(X-\beta_i)\in F[X]$,则 $\text{Res}(f,g)=a^m\prod_{i=1}^mg(\alpha_i)=(-1)^{nm}b^n\prod_{i=1}^ng(\beta_i)=a^mb^n\prod_{i,j}(\alpha_i-\beta_i)

只需要证明第一个等式,并且问题可以归结为 a=b=1 的情形。

假设 g(\alpha_1),\ldots,g(\alpha_n) 互不相同,那么考虑 \text{Res}(f,g-Y)\in F[Y],他是关于变元 Y 不超过 n 次的多项式,降幂可以写出它等于 (-1)^nY^n+\ldots+\text{Res}(f,g),首项为 (-1)^n 归结为必须取在主对角线上。

对于任意 i\alpha_ifg-g(\alpha_i) 的公根,从而 \text{Res}(f,g-g(\alpha_i))=0,从而 \prod_{i=1}^n(g(\alpha_i)-Y)|\text{Res}(f,g-Y),比较最高次项可知它们确实相等,因而确实 \text{Res}(f,g)=\prod_{i=1}^ng(\alpha_i)

上述论述用到了 g(\alpha_1),\ldots,g(\alpha_n) 互不相同的限制,但事实上并没有用到它们数值上性质,一个经典技巧是用变元 Z_1,\ldots,Z_n 来代替 \alpha_1,\ldots,\alpha_n,并以多项式环 F[Z_1,\ldots,Z_n] 代替域 F 进行论述,不难发现这并不影响上述论证,因而可以得到相同的结果,即 \prod_{i=1}^n(g(Z_i)-Y)=\text{Res}(\prod_{i=1}^n(X-Z_i),g-Y) 仍然成立,将 \alpha_1,\ldots,\alpha_n 代入即可,即证。

推论:设 f 如上,则 a\operatorname{disc}(f)=(-1)^{n(n-1)/2}\text{Res}(f,f'),其中 f' 表示对 f 求形式导数,并减少一次。

运用 Leibniz 求导法则和上一则定理,可以得到 \text{Res}(f,f')=a^{n-1}\prod_{i=1}^nf'(\alpha_i)=a^{2n-1}\prod_{i=1}^n\prod_{j\neq i}(\alpha_i-\alpha_j)

6.9 不可约多项式初探

这部分的笔记是从去年的笔记上抄过来的。

定义:若多项式环 F[X] 上的所有不可约元都是一次或零次多项式,那么称 F 是代数闭域。

由于代数基本定理的存在,复数域 \mathbb C 是代数闭域。

接下来考虑 \mathbb R,将 \mathbb R[X] 嵌入 \mathbb C[X],其根是两两共轭配对的,因此可以将其分解为一次和二次多项式。

定义:设 f=a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X],记 c(f)=\gcd(a_0,\ldots,a_n);若 c(f)=1,则称 f 为本原多项式。

定理:若 f,g\in\mathbb Z[X] 都是本原多项式,则 fg 也是本原多项式。

证明:如若不然,则存在素数 p 使得 fg 的每一项系数都是 p 的倍数。考察 fg 最低次系数不是 p 的倍数的项,不妨设其为 a_kx^kb_qx^q,那么考察 fgx^{k+q} 项系数,易知其不是 p 的倍数,即证。

定理:设 f\in\mathbb Z[X] 是本原多项式,下列命题等价:

(a) 推 (b):显然。

(b) 推 (a):如若不然,设 f=gh,其中 gh\in\mathbb Q[X],取适当的系数 c_1,c_2 使得 c_1g,c_2h 都是本原多项式,那么有 c(c_1g\cdot c_2h)=c_1c_2 c(f),由于 c(c_1g)c(c_2h)=1=c(f),于是有 c_1c_2=1,因此此时必然存在 c_1g,c_2h\in\mathbb Z[X] 使得 f=(c_1gc_2h),即证。

定理:\mathbb Z[X] 上的不可约多项式可以分为两类:

定理:设 f=a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X],若存在素数 p 满足:

那么 f\mathbb Z[X] 上不可约。

证明:如果存在 g,h\in\mathbb Z[X] 使得 f=gh,且 g=b_0+b_1x\ldots+b_mx^mh=c_0+c_1x+\ldots+c_kx^k,那么 m+k=np\nmid b_0p\nmid c_0,不妨设 p\nmid b_0,考察 h 中次数最小的系数不为 p 的倍数的项 c_qx^q,那么 p\nmid a_q,这说明 q=n,即 g 只有常数项,矛盾,即证。

推论:设 p 是质数,那么多项式 f=\dfrac{x^p-1}{x-1}=1+x+\ldots+x^{p-1} 不可约。

证明:作换元 y+1=x,那么

f=\dfrac{(y+1)^p-1}{y}=\sum_{i=1}^p\binom{p}{i}y^{i-1}

根据上文定理可得 f\in \mathbb Z[Y] 是不可约的,自然对于 \mathbb Z[X] 也是不可约的。

这是分圆多项式的一个结果,在初等数论和代数中有所涉及。

命题(猜根法):设 x_0=u/v 是多项式 a_0+a_1x+\ldots+a_nx^n\in\mathbb Z[X] 的根,那么有 v|a_nu|a_0

证明:其有因式 (vx-u),因此 v|a_n,u|a_0

推论:首一整系数多项式的根必然是整数(v|1 说明 v=\pm 1

上面这套东西在一般的唯一分解整环上应该也是成立的,论证不需要改变,需要注意一些等号精确到同构。