数学
ql12345
·
2024-07-26 15:18:22
·
个人记录
Day0 数学基础(集合 & 几何 & 群论)
集合和映射 & 等价关系和商集
集合
在公理化数学中,一切对象都是集合,一切关系(包括运算)都是映射。(但关系又何尝不是对象,对象又何尝不能成为关系)
一群元素称为集合 ,集合中的元素有确定性 、唯一性 、无序性 。集合中的一部分元素组成的集合称为子集 ,显然每个集合有 2^n 个子集。元素和集合之间有从属关系:a\in A (a\notin A );集合和集合之间有包含关系:A\subset B,A\subsetneqq B,A=B ;没有任何元素的集合规定是一个特殊的集合——空集 \varnothing 。集合构成的集合也称为集族 或集类 。
集合的记法:\{0,1,2,3,4\},\{0,1,2,\cdots\},\{x_{\alpha}:\alpha\in I\},\{x\in S:P(x)\} ,特别地,\mathbb{N},\mathbb{Z},\mathbb{Q},\mathbb{R},\mathbb{C},\mathbb{N^*},\mathbb{N_+} .
集合的“加、乘、减”:A\cup B,A\cap B,A\backslash B ,分别称为集合的并、交、差 ,显然并和交是满足交换律和结合律的。有些时候我们讨论的集合都属于同一个大集合,这时称这个大集合为全集 。假设此时全集为 X ,则对于集合 A 其补集 定义如下: A^c:=X\backslash A .
集合的笛卡尔积 :A\times B:=\{(a,b):a\in A,b\in B\} ,显然满足结合律但不满足交换律。
集合的“正确性”:罗素悖论(A:=\{x:x\notin x\} ,则 A\in A\Leftrightarrow A\notin A )和第三次世界危机、ZFC公理体系(欢迎入土集合论).
映射
映射:f 是一个从集合 A 到集合 B 的对应法则,f 称为一个从 A 到 B 的映射,如果 \forall a\in A,\exist! b\in B,s.t.f(a)=b ,记作
f:A\to B \\
a\mapsto b
其中,A 称为定义域 ,B 称为陪域 ,\forall a\in A,f(a) 称为 a (关于 f )的像 ,a 称为 f(a) (关于 f )的一个原像 。方便起见,常用这样的约定:\forall S\subset A,f(S):=\{b\in B:f(a)=b,a\in S\} 称为 S (关于 f )的像,f(A) 称为 f 的像(或值域) 。
映射和映射之间有**复合运算**:$f:A\to B,g:B\to C$,则 $g\circ f:=A\to C,g\circ f(a)=g(f(a))$。
$f$ 称为一个**单射**,如果 $\forall a_1,a_2\in A,f(a_1)=f(a_2)\Rightarrow a_1=a_2$. $f$ 称为一个**满射**,如果 $f(A)=B$. $f$ 称为一个**双射**,如果 $f$ 既是单射又是满射.
$f$ 的 **(广义)逆映射** $f^{-1}$ 定义为 $f^{-1}:f(A)\to 2^A,f^{-1}(b)=\{a\in A:f(a)=b\}$。$f^{-1}(b)$ 称为 $b$(关于 $f$)的**原像**。同样方便起见,有 $f^{-1}(S),S\in f(A)$ 这样的记号。如果 $f$ 是一个双射,则可将 $f^{-1}$ 看作从 $B$ 到 $A$ 的双射,这样的 $f^{-1}$ 是狭义的逆映射,此时(狭义的逆映射存在)称 $f$ 是**可逆的**。
如果 $f$ 是一个单射,显然有 $f^{-1} \circ f=id_A, f\circ f^{-1}=id_{f(A)}$。
对于以上所有映射的基本定义,特别地,若 $B\subset\mathbb{R}$,称 $f$ 为一个**函数**。
_事实上,上面对集合定义的那些交并差补笛卡尔积运算和映射的复合运算数学形式的定义都要用映射来表示,不过方便起见暂略。也可以利用集合的**特征函数**来方便地表示集合、元素之间的关系,这里也不多阐述了。_
#### 等价关系和商集
一个集合 $S$ 上的**二元关系** $R$ 定义如下:$R\subset S\times S,\forall a,b\in S$ 有关系 $R$,记作 $aRb$,如果 $(a,b)\in R$。一个关系如果满足**反身性、对称性、传递性**,则称为一个**等价关系**。例如在 $\mathbb{Z}$ 上,$\{(a,b):a\equiv b(\mathrm{mod}~P)\}$ 是一个等价关系,$\{(a,b):a>b\}$ 是一个关系,但不是一个等价关系。
$\{S_{\alpha}:\alpha\in I\}$ 称为集合 $S$ 的一个**划分**,如果 $S=\displaystyle\bigsqcup_{\alpha\in I}S_{\alpha}$。设 $\sim$ 是 $S$ 上的一个等价关系,$\forall a\in S, \bar{a}:=\{b:a\sim b\}$,易知 $\forall a,b\in S,\bar{a}\ne\bar{b}\Rightarrow\bar{a}\cap\bar{b}=\varnothing$ 且 $a\in\bar{a}$。故互不相同的 $\bar{a}$ 构成了 $S$ 的一个划分,该划分称为 $S$ 关于等价关系 $\sim$ 的**商集**,记作 $S\backslash\sim$。称商集中的元素 $\bar{a}$ 为一个**等价类**,易知等价关系、等价类、划分是两两唯一确定的。
## 解析几何
默认你们会高中平面向量和立体几何基础知识
## 群 & 环 & 域
### 群的概念
从群开始,我们正式学习一些代数系统,所谓代数系统就是定义了某种运算的集合,这种运算揭示了集合中元素的某些关系,也就是结构。代数系统之间保持运算的映射称为态射。现代代数学的主线就是研究各种代数系统的结构及其之间的态射。(你可以暂时感性地将集合理解为没有任何结构的系统,映射理解为集合之间的态射。)
$S$ 上的一个**二元运算**指的是定义域为 $S\times S$ 值域为 $S$ 的映射。我们以下提到的“运算”均指二元运算。对于一个运算,它的名称是不重要的,方便起见叫作乘法或者加法,并且在不发生歧义的情况下,将 $a*b$ 简写为 $ab$,而加法则不简写。
结合律:集合 $S$ 上的运算具有**结合律**指的是 $\forall a,b,c\in S,(ab)c=a(bc)$。容易证明,运算具有结合律 $\Longleftrightarrow$ 其具有**广义结合律** $\forall a_1,\cdots,a_n\in S$,在 $a_1a_2\cdots a_n$ 中任意加括号,值不变。具有结合律的运算可以有幂的记号 $a^n:=\underbrace{aa\cdots a}_{n个a}$,容易证明,$a^na^m=a^{n+m},(a^n)^m=a^{nm}$。(我们熟知的运算都满足结合律,这里给出一个不满足结合律的运算的例子:定义在 $\mathbb{R}$ 上的运算 $a*b=\frac{a+b}{2}$)。
以下所有讨论中,代数系统均不为空集。
称 $(S,*)$ 是一个**半群**,如果 $*$ 是 $S$ 上的一个满足结合律的运算。
称 $(S,*)$ 是一个**幺半群**,如果 $(S,*)$ 是一个半群且存在单位元 $e$,$\forall a\in S,ea=a$。(“幺”就是单位元的意思)
称 $(S,*)$ 是一个**群**,如果 $(S,*)$ 是一个幺半群且 $\forall a\in S$ 存在 $b$,$ba=e$。
称 $(S,*)$ 是一个**交换半群/交换幺半群/交换群**,如果 $(S,*)$ 是一个半群/幺半群/群,且 $*$ 满足交换律。交换群也叫做 **Abel 群**。(对于交换半群显然成立 $(ab)^n=a^nb^n$。)
群的性质:
1. $\forall a\in S$,若 $ba=e$ 则 $ab=e$。其中 $\forall a\in S,ea=a
\forall a\in S,ae=a$。其中 $\forall a\in S,ea=a
\forall a\in S,e_1a=e_2a=a\Rightarrow e_1=e_2
\forall a\in S$,$b_1a=b_2a=e\Rightarrow b_1=b_2
一个小推论:ax=b,ya=b 均有唯一解。
上面的性质直观上非常简单且简洁,由性质1可以定义 ab=e 时,a,b 互为逆元 且互逆的元素相乘时不必考虑顺序问题,而定义和性质4说明逆元存在且唯一;性质2说明和单位元相乘时也不用考虑顺序问题,性质3说明单位元唯一。(注意性质1对于幺半群是不存在的 )
将 a 的逆元记作 a^{-1} ,a^0:=e,a^{-n}:=(a^{-1})^n ,其中 e 为单位元,显然 a^na^m=a^{n+m},(a^n)^m=a^{nm} 仍然适用。
定义中的 (S,*) 严谨上讲并不表示一个集合,而是一个集合和一个该集合上的运算的集合,但方便起见,我们就认为它表示的就是 S 这个集合,在不引起歧义的情况下群 (G,*) 一般用 G 来表示。
子群中的单位元和逆元均与原单位元和逆元相同。(显然)
命题1:$H\subset G$ 是子群 $\Longleftrightarrow\forall a,b\in H,a^{-1}b\in H
命题2:任意多个子群之交是子群,即 H_\alpha<G,\alpha\in I\Longrightarrow\displaystyle\bigcap_{\alpha\in I} H_\alpha<G
群的元素个数 $|G|$ 称为群的**阶**。阶为有限数则称为**有限群**。
下面我们定义群这个代数系统上的态射。群 $(G_1,*_1),(G_2,*_2)$ 之间的映射 $f:G_1\to G_2$ 称为群 $(G_1,*_1)$ 到群 $(G_2,*_2)$ 的**群同态**,如果 $\forall a,b\in G_1,f(ab)=f(a)f(b)$。如果 $f$ 是单射/满射,则称为**单同态/满同态**。如果 $f$ 是双射,并且 $f^{-1}$ 是从 $(G_2,*_2)$ 到 $(G_1,*_1)$ 的群同态,则称为**群同构**,群 $(G_1,*_1)$ 和 $(G_1,*_1)$ 称为是**同构的**,如果他们之间存在一个群同构。
由于我们关心的是群的结构而非群中的元素是谁,所以同构的群我们视作是完全相同的。
### 几个群的例子
#### 变换群
集合 $M$ 到自身的全体双射关于映射的复合运算成为一个群,称为 $M$ 的**全变换群**,记作 $S(M)$ 或 $Perm(M)$。特别地,$|M|=n$ 时,称 $M$ 到自身的双射为一个 **$n$ 元置换**,$S(M)$ 称为 **$n$ 元对称群**,记作 $S_n$。(我们在定义时将所有具有 $n$ 个元素的有限集上的全变换群视为相同的,这是因为他们显然同构。)我们下面只研究 $S_n$。
将 $M$ 中的元素用 $1,2,\cdots,n$ 编号之后,$S_n$ 中的元素可表示为:$f=\begin{pmatrix} 1 & 2 & \cdots & n \\ f(1) & f(2) & \cdots & f(n) \end{pmatrix}$。由于 $f$ 是双射,所以第二行恰好是 $1,2,\cdots,n$ 的一个排列,$|S_n|=n!$。
如果置换 $f$ 在 $a_1,\cdots,a_m$ 上的作用为 $f(a_1)=a_2,f(a_2)=a_3,\cdots,f(a_m)=a_1$,在其他点上为恒等映射,则称 $f$ 为一个**轮换**,记作 $f=(a_1a_2\cdots a_m)$。显然相交的轮换是不能交换顺序的,不相交的轮换是可以交换顺序的。**任何一个置换都可以唯一地表示成若干不相交的轮换的乘积。**(考虑证明)
全变换群的子群称为**变换群**。显然变换群不一定是交换群。
#### 交错群
逆序对数为偶数的置换称为**偶置换**,全体 $n$ 元偶置换组成的集合 $A_n$ 关于映射的复合运算成为一个群,$A_n<S_n$ 称为 **$n$ 元交错群**,且 $|A_n|=\frac{1}{2}n!$。
#### 群上的平移构成的群
$\forall a\in G$ 由 $a$ 引起的**左平移** $\sigma_a$ 定义为 $\sigma_a:G\to G,\sigma_a(x)=ax$。记所有左平移构成的集合为 $G_l$,$G_l$ 显然是 $Perm(G)$ 的一个子群(左平移是双射并且容易证明关于映射的复合运算构成群),并且 $f:G\to G_l,f(a)=\sigma_a$ 是一个群同构(这个群同构的定义是很自然的)。
于是我们证明了**任何群都同构于某个集合上的变换群**($Cayley$),这个定理说明了变换群的重要意义。
类似地可定义**右平移**,它和左平移的性质一样,所有右平移构成的群记为 $G_r$,$G$ 同构于 $G_l,G_r$,称 $G_l,G_r$ 为 $G$ 的**左正则表示/右正则表示**。
#### 数集的群结构
$(\mathbb{R},+),(\mathbb{R^*},*),(\mathbb{Q^*},*),(\mathbb{Z},+)$ 均是群,且均是交换群,$(\mathbb{R},*),(\mathbb{Z},*),(\mathbb{N},+)$ 均不是群。
#### 循环群
考虑 $G$ 的由 $\{a\}$ 生成的子群 $\left<\{a\}\right>$,也叫作 **$a$ 生成的子群**,记作 $\left<a\right>$,$a$ 称为该群的**生成元**,$|\left<a\right>|$ 称为 $a$ 的**阶**,记作 $|a|$。
容易发现,当 $|\left<a\right>|=n$ 时,$\left<a\right>=\{a^0,a^1,\cdots,a^{n-1}\}$,且 $a^n=a^0=e$;而 $\left<a\right>$ 为无限群时,一定形如 $\{a^0,a^{\pm 1},a^{\pm 2},\cdots,a^{\pm n}\cdots\}$。即由单个元素生成的群的结构只和群的阶有关,故称阶为 $n$ 的可以由单个元素生成的群为 **$n$ 阶循环群**,称可以由单个元素生成的无限群为**无限循环群**。可以看出,$a$ 的阶的另一个定义是成立 $a^n=e$ 的最小的 $n$。
循环群的结构是很简单的,显然所有 $n$ 阶循环群都同构,所有无限循环群都同构,因此我们只需考虑一个循环群的例子即可。$(\mathbb{Z},+)$ 为无限循环群,容易看出无限循环群有且仅有 $\pm 1$ 两个生成元;$(\mathbb{Z_m},+)$ 为 $m$ 阶循环群,容易看出 $m$ 阶循环群中 $k\in\mathbb{Z_m},|k|=\frac{m}{gcd(k,m)}$,所以 $m$ 阶循环群有 $\varphi(m)$ 个生成元。
### 陪集、正规子群、商群、群的同态定理
作为记号,以后用 $aS,~S_1S_2,~S^{-1}$ 分别表示 $\{as:s\in S\},~\{s_1s_2:s_1\in S_1,s_2\in S_2\},~\{s^{-1}:s\in S\}$,其中 $a\in G,~S\subset G$。容易证明,这个记号可以让我们像操作元素一样地操作一个集合,如:$a(bS)=(ab)S,~S_1(S_2S_3)=(S_1S_2)S_3,~aS=bS\Rightarrow S=a^{-1}bS$。
若 $H<G$,$\forall a\in G,~aH$ 称为 $H$ 的一个**左陪集**,$Ha$ 称为 $H$ 的一个**右陪集**。
命题1:$\forall a,b\in G,aH\cap bH\ne\varnothing\Longleftrightarrow a^{-1}b\in H\Longleftrightarrow aH= bH
命题1说明 G 的任何一个子群可以引出 G 上的一个等价关系,并且 G 关于该等价关系的商集中每个等价类元素个数相同,记这个商集为 G/H 。
推论(Lagrange ):H<G\Longrightarrow |H|\big||G| 。
直观上,群是表示“对称”的结构,其表示的对称并不是简单的轴对称、中心对称,而是更抽象更一般的对称。而子群就是包含了群的一部分对称性的子结构,可以将群想象成一个圆,一个子群想象成一条直径,它包含了一部分对称性,但还存在着其他的对称性,即圆关于该直径形成的商集——一条与它垂直的直径。该子群所引出的等价关系就是“两点间的连线平行于该直径”。陪集可以理解为子集这条直径沿着商集那条直径平移所产生的一个线段。
但是,子群的性质并不够好,因为 G/H 不一定是一个群,甚至 G/H 上都无法定义运算,即 a_1H=a_2H,b_1H=b_2H\nRightarrow a_1b_1H=a_2b_2H 。如 S_3 的子群 \{e,(1,2)\} 就不满足这个性质。
命题2:H<G ,以下两个命题等价:
\forall a_1,a_2,b_1,b_2\in G,a_1H=a_2H,b_1H=b_2H\Rightarrow a_1b_1H=a_2b_2H
\forall a\in G,aH=Ha
命题3:H<G,\forall a\in G,aH=Ha ,则 \forall a,b\in G,aHbH=abH
这两个命题说明,满足 \forall a\in G,aH=Ha 的子群所产生的商集上可以沿用原群上的运算 aHbH=abH ,进一步容易验证,G/H 是一个群,称 G/H 关于陪集的乘法所成的群为 G 对 H 的商群 。
就像集合有商集一样,群也有商群,商结构可以视为原结构舍弃掉一部分结构之后留下的一部分结构。通过这样的思想我们可以让一个复杂的结构逐步变得简单,所以它是很重要的。自然地,满足上面命题条件的子群也是很重要的一类子群,称为正规子群 ,记作 H\vartriangleleft G 。
上面说到了,群的子群表示原群的一部分对称性,群模这个子群的商集是剩下的结构,一般地,剩下的结构不一定仍为一个群,但是当子群正规的时候剩下的结构为一个群,即商群。考虑群模一个正规子群变成商群的过程,可以自然地用一个映射来表示。
对于 H\vartriangleleft G ,定义 \sigma:G\to G/H,\sigma(a)=aH ,显然 \sigma 是一个群同态,将群 G 中的每个元素映成它所在的陪集。这个群同态太自然了,所以称为群 G 到它的商群 G/H 的自然同态 。
自然同态的作用可以理解为把群中“平行于”正规子群的元素粘合在一起。被“粘合”在一起的元素有什么特征呢?它们都“平行于”正规子群,即映射之后的像相同。我们把这个性质抽象出来,对于任意一个群同态,考虑映射之后像相同的元素在原群中形成的划分。
正如自然同态是由 H 引出的,而 H 刚好为 G/H 的单位元的原像,为研究任意一个同态的结构,我们先将这个概念抽象出来:对于任意一个群同态 \varphi:G\to G' ,定义 Ker~\varphi:=\varphi^{-1}(e') 称为 \varphi 的核 。
命题4:Ker~\varphi\vartriangleleft G
命题5:\varphi:G\to G' 是群同态,\varphi(a)=\varphi(b)\Leftrightarrow a^{-1}b\in Ker~\varphi
命题4和命题5说明对于任何一个群同态,Ker~\varphi 将 G 划分为若干陪集,且每个陪集中的元素的像相同,不同陪集的元素的像不相同,并且 G/Ker~\varphi 还是一个群。于是令 \~{\varphi}:G/Ker~\varphi\to G',\~{\varphi}(aKer~\varphi)=\varphi(a) ,容易验证 \~{\varphi} 是从 G/Ker~{\varphi} 到 G' 的单同态。
这个结论其实是很直观的,一个群同态是保持了运算的映射,也就是保持了原群的某些对称性的映射,但是群同态有可能损失了原群的某些对称性(如一个极端的例子:\varphi:G\to{e} 中群 G 就损失了全部的对称性)。群同态为什么会损失某些对称性呢,就是因为群同态不一定是单射(如果群同态是单射,则 G 同构于 \varphi(G) ,没有损失任何对称性,称为一个嵌入 )。将这个损失对称性的过程看作是将 Ker~\varphi 粘合在了一起,粘合在一起之后再向 G' 映射就不损失对称性了,所以就是单射了,此时也就产生了一个群同构 G/Ker~\varphi\to\varphi(G) 。
这就是群同态基本定理 ,用交换图来表示就是:
其中 \varphi 是任意满同态,\sigma 是自然同态,\~\varphi 定义如上,是一个群同构。
环和域的概念
称 (S,+,*) 是一个环 ,如果 (S,+) 是一个交换群,(S,*) 是一个半群,且乘法对加法满足分配律 \forall a,b,c\in S,a(b+c)=ab+ac,(b+c)a=ba+ca 。
称 (S,+,*) 是一个幺环/交换环/交换幺环 ,如果 (S,+,*) 是一个环且 (S,*) 是一个幺半群/交换半群/交换幺半群。
如果 L\subset R ,(L,+,*) 是一个环,则称 L 是 R 的子环 。
环的性质:
记加法群 (S,+) 的单位元为 0 并称为零元 ,\forall a\in S 记其关于加法的逆元为 -a 并称为负元 ,na:=\underbrace{a+\cdots+a}_{n个a},0a=0,-na=n(-a),n>0 。对于乘法也类似地记 a^n,n>0
\forall a,b\in S,(-a)b=a(-b)=-ab,(-a)(-b)=ab
如果环是幺环,那么乘法单位元显然唯一,记作 1 并称为 1 元 。在幺环中若 ab=1 (并不能推出 ba=1 ),则称 a 是 b 的左逆 、b 是 a 的右逆 。如果 a 的左右逆均存在且相等,则记为 a^{-1} 并称为 a 的逆 ,如果逆元存在,则称为一个单位 。显然所有单位 对于乘法构成一个群,称为 S 的单位群 。
只有一个元素的环称为零环 ,它是一个交换幺环。R 是一个幺环,则 0=1\Leftrightarrow R 是零环。除去零环的情况外,0 显然不是单位。
环的例子:
全体模 $m$ 剩余类记作 $\mathbb{Z_m}$,$(\mathbb{Z_m},+,*)$ 是一个环,且是一个交换幺环。
称 $(S,+,*)$ 是一个**域**,如果 $(S,+,*)$ 是一个**环**且 $(S\backslash\{0\},*)$ 是一个交换群。
如果 $L\subset S$,$(L,+,*)$ 是一个域,则称 $L$ 是 $S$ 的**子域**。$\mathbb{C}$ 是一个域,$\mathbb{C}$ 的子域称为**数域**,显然 $\mathbb{Q}$ 是一个数域,且 $\mathbb{Q}$ 是任何数域的子域。
环/域和环/域之间保持两种运算的映射叫作**环同态/域同态**,特别地,当其为双射且逆映射为环同态/域同态时,称为**环同构/域同构**。
例:$p$ 是质数时 $(\mathbb{Z_p},+,*)$ 是一个域。
特别地,考虑域 $(\mathbb{Z_2},+,*)$ 它只有两个元素 $0,1$ 且
$$
0+0=1+1=0,~~~1+0=0+1=1 \\
0*0=1*0=0*1=0,~~~1*1=1
$$
这让你想到了什么?没错,加法就是 $|$,乘法就是 $\&$,所以 $(\mathbb{Z_2},+,*)=(\{0,1\},|,\&)$. 我们在线性代数里会用到这个域,把它记作 $\mathbb{Z_2}$。
域有加、乘两种运算,并且加法逆元和非零元素的乘法逆元都存在,所以我们可以将域视为具备了加减乘除运算,且有0和1的概念。这就是对我们比较熟悉的数域的推广,在理解上仍可以用数域来类比。
多项式严谨的定义为一种形式 $P(x)=a_1x_1^{b_1}+a_2x_2^{b_2}\cdots+a_nx_n^{b_n}+\cdots$,它的含义为用 $a_i$ 作为系数、$b_i$ 作为次数对 $x_i$ 进行加法和乘法的组合,其中 $x$ 称为**不定元**。既然只是一种形式,那应当对任何具备了满足条件的加法和乘法运算的 $x$ 均适用,所以 $x$ 不一定为数或某一确定的对象,故称为不定元。(比如将 $x_1=x_2+x_3$ 代入,此时就是将另一个多项式作为不定元代入了。)而为了方便,我们要求 $a_i\in F$,其中 $F$ 是一个域,此时将多项式 $P(x)$ 称为一个**域 $F$ 上的多项式**。
多项式的加法和乘法你们应该学过,不难验证,域 $F$ 上的多项式全体构成一个交换环。如果补充定义分式,那就有了**域 $F$ 上的分式域**。
### 群在计数中的应用
本节我们介绍一个用群在计数上的应用。可以应用群解决的计数问题有个显著的特征就是**计算(在某种变换意义下)本质不同的方案数**。
考虑这样一个问题:
用三种颜色给一个正方体的六个面染色,如果两种染色方案可以通过空间中的各种旋转变成所有面完全相同的颜色则认为是本质上相同的,求本质上不同的染色方案有几种。
我们先不急着解决问题,先来研究这个问题的关键点:在空间旋转下本质不同。容易发现,空间旋转具有很明显的对称性,它显然存在群结构,所以“用所有空间旋转在所有静态染色方案上作用”可以视为将一个群作用在一个集合上,问“求有多少本质不同的方案”即将集合中可以通过该群作用相互到达的那些元素视为同一个“状态”,问这样的“状态”的个数。
一般地,本质不同的计数问题中,有一些静态状态和这些静态状态之间的一些变换,一些静态状态可以通过这些变换相互到达,将可以相互到达的静态状态视为同一个状态,求这样的状态有多少个。
从上面的分析中可以看出,引入群并用数学语言描述“群在一个集合上的作用”、“状态”等概念,研究在群作用下这样的“状态”的性质和结构,对于我们找到计数的方法是有意义的。
*前排提示:本节中群作用的定义和严谨的数学定义形式上稍有差别,不过是含义上等价的。
#### 群作用和轨道-稳定化子定理
$\phi:G\to Perm(S)$ 的一个群同态称为**群 $G$ 在集 $S$ 上的一个作用**。以下简记 $\phi(a)(s)$ 为 $as$。
$\forall s\in S$,定义 $s$ 的 **$G$-轨道**为 $Orb(s):=\{as:a\in G\}$。显然轨道之间要么相等要么不相交。容易看出,轨道的定义就是我们上面所说的“状态”,一个轨道即对应着一个(关于该变换群)本质不同的方案。
$\forall s\in S$,定义 $s$ 的**稳定化子**为 $Stab(s):=\{a\in G:as=s\}$。显然 $Stab(s)<G$,但 $Stab(s)$ 不一定是正规子群,如 $S_3$ 中 $Stab(3)=\{e,(12)\}$ 不正规。
命题:$s\in S,x,y\in G$,则 $xs=ys\Longleftrightarrow x^{-1}y\in Stab(s)
该命题的直接作用就是可以自然地引出从 G/Stab(s) 到 Orb(s) 的双射,这就是轨道-稳定化子定理 。特别地,G 为有限群时,|G|=|Stab(s)|\cdot|Orb(s)| 。
轨道-稳定化子定理的一个直接应用是找到变换群中的所有变换。如上面提到的问题,考虑正方体的空间旋转群有哪些元素。首先容易找到三种旋转,分别以面心对角线、棱中点对角线、顶点对角线为轴,共24种互不相同的变换。但是,这些变换中任意多个组合是否一定不会产生新的变换呢?这个问题不容易直接解决。
考虑运用轨道-稳定化子定理,任取一个顶点,易见其轨道为8个顶点,而稳定化子为3个(从它相邻的三个点的位置可以算出),所以 |G|=8\cdot 3=24 ,故刚刚找到的24种不同的变换就是正方体空间旋转群的全部元素了。
Burnside 定理和 Polya 定理
轨道-稳定化子定理在OI里更重要的作用是证明 Burnside 定理,从而彻底解决本质不同的计数问题,Polya 定理是 Burnside 定理在一个特殊情况下的显然的小改进。
证明:设 $S=\displaystyle\bigsqcup_{i=1}^rOrb_i$,
$$
\begin{equation} \begin{split}
\displaystyle\sum_{a\in G}|F(a)| &= \displaystyle\sum_{a\in G}\displaystyle\sum_{s\in S}[as=s] = \displaystyle\sum_{s\in S}\displaystyle\sum_{a\in G}[as=s] \\
&= \displaystyle\sum_{s\in S}|Stab(s)| \\
&= \displaystyle\sum_{s\in S}\dfrac{|G|}{|Orb(s)|} = |G|\displaystyle\sum_{s\in S}\dfrac{1}{|Orb(s)|} \\
&= |G|\displaystyle\sum_{i=1}^r\displaystyle\sum_{s\in Orb_i}\dfrac{1}{|Orb_i|} \\
&= |G|\displaystyle\sum_{i=1}^r|Orb_i|\cdot\dfrac{1}{|Orb_i|} \\
&= |G|\cdot r
\end{split} \end{equation}\\
$$
$\square
在本质不同的计数问题中,将所有静态状态视为 S ,所有合法的变换视为群 G 在 S 上作用的像,要求的是轨道个数。可以利用 Burnside 定理,先找出所有合法的变换,对于每一个变换求出在这个变换下保持不变的状态个数,即得到答案。
在上面的问题中,所有变化及其不动点数量如下:
不变:1种情况,在该变换下保持不变的状态数为 3^6
绕面心对角线旋转 90^{\circ} :6种情况,在该变换下保持不变的状态数为 3^3
绕面心对角线旋转 180^{\circ} :3种情况,在该变换下保持不变的状态数为 3^4
绕棱中点对角线旋转 180^{\circ} :6种情况,在该变换下保持不变的状态数为 3^3
绕顶点对角线旋转 120^{\circ} :8种情况,在该变换下保持不变的状态数为 3^2
故本质不同的状态数为 \dfrac{1}{24}(3^6+3^3\times 6+3^4\times 3+3^3\times 6+3^2\times 8)=57
现在考虑另一个问题,用 k 种颜色给 n 个点 m 条边的简单无向图中的每个点染色,求本质不同的方案数,其中 n\le 10 ,结果取模。(无向图仅由它的拓扑结构决定,所以不同染色下的无向图可能通过连续形变变成相同的方案。连续形变即不影响图的拓扑结构的变换,可借助这个来理解。)
按照用 Burnside 定理计数的套路,首先要找出所有合法的变换,合法的变换一定可以视为将点重新标号之后得到一张和原图一样的图,所以这一步可以暴力枚举所有的置换(将点重新标号),然后暴力判断置换前后的两个图是否相同,复杂度 O(n!\cdot n^2) 。接下来要对每一个找到的合法的变换求出其不动点的个数。容易发现,将置换表示成若干不相交的轮换(包含长度为1的轮换)之后,想要在该置换下保持图中各点的颜色不变,同一个轮换之中的点的颜色必须相同,而不同轮换之中的点的颜色可以不同,所以不动点的个数为 k^{c(a)} ,其中 k 为可以用来染色的颜色个数,c(a) 为置换 a 分解为不相交轮换的个数。求出 c(a) 的时间复杂度为 O(n) ,故总时间复杂度 O(n!\cdot (n^2+n)) 。
上述过程就是 Polya 定理:用 k 个颜色染色给一个集合染色,群 G 的作用下本质不同的染色方案数 r=\dfrac{1}{|G|}\displaystyle\sum_{a\in G}k^{c(a)} ,其中 c(a) 为 a 分解为不相交轮换的个数。
例题
P4980 【模板】Polya 定理:板子
P8633 [蓝桥杯 2015 国 B] 模型染色:真 · 板子
Cubes:模拟就行了
P2561 [AHOI2002] 黑白瓷砖
TRANSP - Transposing is Fun
P4727 [HNOI2009] 图的同构计数
P4128 [SHOI2006] 有色图
Day1 简单线性代数(理论篇)
群是有对称结构的集合,线性空间就是有线性结构的集合。所谓“对称结构”就是元素之间具有对称关系(对称关系是多种多样的,由子群来表现),所谓“线性结构”就是元素之间具有线性关系。
线性空间
线性、线性空间和向量组
什么是“线性关系”呢?先来考虑什么是“线性”。一次函数 y=ax+b 的图像是一条线,我们认为是线性的;一次多项式 a_1x_1+a_2x_2+\cdots+a_nx_n 形式和一次函数类似,其关于每一个变量 x_i 都是线性的,所以我们也认为这是线性的。
我们可以从上述对“线性”的感性认识中抽象出两个运算:x_i 之间的加、x_i 和 a_i,b 之间的数乘。这里为什么要区分 x_i 和 a_i,b 的地位呢?因为我们认为一次多项式是线性的,而在多项式中,不定元 x_i 和参数 a_i 具有不同的地位。我们将这个用数学语言来描述出来就是:
集合 L 上具备一个加法 + 和一个关于域 F 的纯量乘法 \cdot:F\times L\to L,a\cdot x=ax ,满足:
\forall k,l\in F,\forall x\in L,~k(lx)=(kl)x
\forall k,l\in F,\forall x\in L,~(k+l)x=kx+lx
\forall k\in F,\forall x,y\in L,~k(x+y)=kx+ky
则称 (L,+,\cdot) 为域F 上的一个线性空间 。沿用几何中的名字,抽象的线性空间中的元素也称为向量 ,线性空间也称为向量空间 ,但这样叫不意味着线性空间中的元素真的形式上是几何中向量的形式,几何中的形式上的向量构成的线性空间仅仅是一种特殊的比较容易理解的线性空间而已。
例:域 F 上的一元多项式全体 F[x] 对于多项式加法和纯量乘法构成域 F 上的线性空间。
可以证明线性空间有如下简单性质:
\forall a\in L,~0a=0
\forall k\in F,~k0=0
ka=0\Rightarrow k=0$ 或 $a=0
\forall a\in L,~(-1)a=-a
注:以下我们只考虑线性空间是一个可数集且只考虑有限维的线性空间(后面会定义维数),我们定义的向量组是有限的,但这并不是本质的。
有了“线性”的运算,我们就可以定义“线性关系”了。a_1,a_2,\cdots,a_s 是线性空间中的一些向量,则称为一个向量组 ,\displaystyle\sum_{i=1}^sk_ia_i,~k_i\in F 称为 a_1,a_2,\cdots,a_s 的一个线性组合 。如果一个向量 b=\displaystyle\sum_{i=1}^sk_ia_i,~k_i\in F 则称 b 可以由 a_1,a_2,\cdots,a_s 线性表出 。如果向量组 \{a_1,a_2,\cdots,a_s\} 中存在某一个元素 a_i 可以由其他向量线性表出,则称向量组线性相关 ,否则称向量组线性无关 。线性相关和线性无关有如下显然的命题,这也是线性相关和线性无关的等价定义:
命题1:向量组 a_1,a_2,\cdots,a_s 线性相关 \Longleftrightarrow\exist k_1,\cdots,k_s\in F,k_1a_1+\cdots+k_sa_s=0 ,其中 k_i 不全为 0 。
命题2:向量组 a_1,a_2,\cdots,a_s 线性无关 \Longleftrightarrow k_1a_1+\cdots+k_sa_s=0\Rightarrow k_1=\cdots=k_s=0
显然包含零向量的任何向量组线性相关。
如同集有子集、群有子群,线性空间也有子空间,其定义如出一辙:L 是一个线性空间 W\subset L ,称 W 为 L 的线性子空间 (简称为子空间 ),记作 W\subseteq L ,如果 W 关于 L 的运算是一个线性空间。容易验证,这个定义等价于 W 对加法和纯量乘法封闭。
如同群有子集生成的子群,线性空间也有子集张成的子空间:S\subset L ,S 张成的子空间 \left<S\right>:=\displaystyle\bigcap\{W:S\subset W,W\subseteq L\} 。容易发现,向量组张成的子空间刚好是其能线性表出的所有向量。
秩
命题1:b 可由 a_1,a_2,\cdots,a_s 线性表出,则 表出方式唯一 \Longleftrightarrow a_1,a_2,\cdots,a_s 线性无关。
命题2:a_1,a_2,\cdots,a_s 线性无关,则 a_1,a_2,\cdots,a_s,b 线性相关 \Longleftrightarrow b 可由 a_1,a_2,\cdots,a_s 线性表出。
如果 S\subset L 是一个向量集,向量组 a_1,a_2,\cdots,a_s\in S 线性无关,且加入 S 中的任何一个向量之后向量组线性相关,则称 a_1,a_2,\cdots,a_s 为 S 的一个极大线性无关组 。一个集合可以有不止一个极大线性无关组,并且任何一个线性无关的向量组都可以扩充成为一个极大线性无关组。
命题3:若 a_1,a_2,\cdots,a_s 可以线性表出 b_1,b_2,\cdots,b_r ,b_1,b_2,\cdots,b_r 线性无关,则 s\ge r 。(证明!)
命题3说明 S 的任意两个极大线性无关组的大小相同 !S 的极大线性无关组的大小称为 S 的秩 ,记作 rank~S 。线性空间 L 的极大线性无关组的大小称为线性空间的维数 ,记作 dim~L 。注:存在无限维的线性空间,但我们只考虑有限维的线性空间,所以考虑向量组时也只需要考虑有限大小的即可。
由于 L 的一个极大线性无关组 a_1,\cdots,a_n 可以唯一地表出 L 中的任何向量,且其所有线性组合刚好为 L 中的所有元素,故可以将 L 表示为 \{k_1a_1+k_2a_2+\cdots+k_na_n:k_i\in F\} 。a_1,\cdots,a_n 之于 L 就像 x,y 轴之于平面直角坐标系,它们确定了所有不同的维度(不同的方向),用它们可以组合出空间中的所有元素。所以线性空间的一个极大线性无关组称为线性空间的基 。可以证明任意线性空间都存在一组基。
两个向量组如果可以相互表出,则称这两个向量组等价 ,记作 a_1,\cdots,a_s\cong b_1,\cdots,b_r 不难验证这是一个等价关系。向量组和自身的极大线性无关组等价。在考虑向量组之间是否能够相互线性表出的问题时,可任取其一个极大线性无关组来代替原向量组。尝试证明以下命题:
U\subseteq W$,则 $dim~U\le dim~W
U\subseteq W$,$dim~U=dim~W$,则 $U=W
rank\{a_1,\cdots,a_r\}=dim\left<a_1,\cdots,a_r\right>
线性空间的子空间
正如群可用正规子群和商群来拆解为小的群的“和”、群同态基本定理给出了同态和子空间的关系,我们也可以从子空间的角度来研究线性空间,这也为后面研究线性映射和子空间的关系以及拆解线性变换做铺垫。
命题1:任意个子空间的交是子空间。
但是两个子空间的并不一定是子空间,如:x,y 轴并起来仅仅是两条相交直线,而它们张成的线性空间是一个平面。不过假如我们找到了 x,y 轴上的某些性质并且由线性运算可以推广到它们的所有线性组合,那么就可以发现,定义 x,y 轴张成的子空间是有意义的。
自己思考证明如下命题,并举例说明反方向不成立:
1. $V_1\cap(V_2+V_3)\supseteq(V_1\cap V_2)+(V_1\cap V_3)
V_1+(V_2\cap V_3)\subseteq(V_1+V_2)\cap(V_1+V_3)
命题2:\left<a_1,\cdots,a_s\right>+\left<b_1,\cdots,b_r\right>=\left<a_1\cdots,a_s,b_1,\cdots,b_r\right>
命题3:dim~V_1+dim~V_2=dim(V_1+V_2)+dim(V_1\cap V_2)
当 V_1\cap V_2=\varnothing 时,V_1+V_2 称为直和 ,记作 V_1\oplus V_2 。类似地可以定义任意多个子空间的直和。
命题4:L 为有限维线性空间时,下列命题相互等价:
dim~V_1+dim~V_2=dim(V_1+V_2)
上述直和的定义和等价命题均可直接推广到有限多个子空间相加的情况。
如果 V_1\oplus V_2=L 则称 V_1 是 V_2 的补空间 ,也称 V_2 是 V_1 的补空间。
命题5:任一空间都有补空间。
在群上一个正规子群可以将群划分为若干等价类,形式上这些等价类为正规子群左/右平移得到的陪集,含义上这些等价类代表着等价关系 a^{-1}b\in H (即“a,b 连线平行于 H ”),将群上的运算延伸定义到这些等价类上就得到了商群。
线性空间中有同样的概念,并且它们的含义是相似的,可以将二者的含义相互类比理解。
命题6:两个陪集要么相同要么无交。(从而一个子空间引起线性空间上的一个划分)
命题7:$a+V=b+V\Longleftrightarrow a-b\in V$(这个从直观上比群的情形更容易理解,一个平面平移 $a$ 和平移 $b$ 到达相同的地方,当且仅当 $a-b$ 平行于这个平面)
将线性空间中的运算直接推广到陪集上容易验证是良定义的 $(a+V)+(b+V):=(a+b)+V,~k(a+V):=ka+V,~\forall a,b\in L,\forall k\in F$,并且容易验证 $L/V$ 关于该运算是一个域 $F$ 上的线性空间。称 $L/V$ 为 **$V$ 对于 $W$ 的商空间**。
$V\subseteq L,~\pi:L\to L/V,\pi(a)=a+V$ 称为**标准映射**(类比自然同态)。
利用自然同态是原空间、子空间和商空间之间的桥梁,利用商空间可以(对维数)使用数学归纳法证明一些线性空间的性质成立。
## 线性映射
类比群同态,线性空间之间保持线性运算的映射称为线性映射。因为线性关系基于线性运算,所以线性映射保持线性关系(线性相关、线性无关)不变。
同时很多时候线性映射是有实际含义的,我们想要直观上知道它究竟是一个怎样的作用(拉伸、旋转、仿射,还是别的什么?),直观上知道它是怎样的作用显然还有助于更快地计算一个线性映射的各种结果、性质,这个时候就需要考虑线性映射的表示和最简表示。
### 线性映射
$V,W$ 是域 $F$ 上的线性空间,$\mathcal{A}:V\to W$ 称为**从 $V$ 到 $W$ 的线性映射**,如果 $\forall a,b\in V,\forall k\in F~\mathcal{A}(a+b)=\mathcal{A}(a)+\mathcal{A}(b),\mathcal{A}(ka)=k\mathcal{A}(a)$。$V=W$ 时称为 **$V$ 上的线性变换**,恒等变换记为 $\mathcal{I}$。$W=F$ 时称为 **$V$ 上的线性函数**。
例:
1. 上面定义的 $\pi:L\to L/V$ 就是一个线性映射
1. $\mathbb{R^3}$ 中沿一条直线向一个与直线相交的平面的投影是一个线性变换
1. $\mathbb{R^3}$ 中的旋转、仿射变换都是线性变换,但平移不是线性映射
1. $\mathcal{A}:\mathbb{R^3}\to\mathbb{R^3},\mathcal{A}(x,y,z)=(2x,2y,2z)$ 是一个线性变换
1. 数域 $K$ 上的 $n$ 次多项式记为 $K[x]_n$,求导 $\mathcal{D}:K[x]_n\to K[x]_{n-1}$ 是一个线性映射
1. $\mathcal{J}:C[a,b]\to\mathbb{R},\mathcal{J}(f)=\displaystyle\int_a^bf(x)~\mathrm{d}x$ 是一个线性函数
1. 设 $V=U\oplus W,\forall a\in V,a=a_1+a_2,a_1\in U,a_2\in W$,$P_U:V\to U,P_U(a)=a_1$ 称为**平行于 $W$ 在 $U$ 上的投影**,$P_W:V\to W,P_W(a)=a_2$ 称为**平行于 $U$ 在 $W$ 上的投影**
*投影的性质:
1. 正交:$P_UP_W=P_WP_U=0
幂等:P_UP_U=P_U,P_WP_W=P_W
和为恒等变换:P_U+P_W=\mathcal{I}
*命题:满足以上三条性质的两个映射是两个投影
简单性质:
\mathcal{A}(0_V)=0_W
线性映射不改变线性组合的系数(从而不改变线性相关性)
对于有限维线性空间 V 到一个线性空间的线性映射,只要确定 V 的任意一组基的像 \mathcal{A}(e_1),\cdots,\mathcal{A}(e_n) 就确定了整个线性映射
线性映射如果是双射,则其逆映射也是线性映射
线性映射如果是双射且其逆映射也是线性映射,则称为一个线性同构 。(不过其实一般的定义都只需要线性映射是双射,因为后一句话是废话,就像群同构的定义一样。)同构的空间在绝大多数情况下都被视为完全一样的。
命题1:域 F 上的所有维数相同的有限维线性空间都同构。(所以所有 n 维线性空间的结构和 \mathbb{F^n} 都是一样的)
命题1说明线性空间的结构没什么可研究的,所以线性代数主要研究的是线性映射的最简表示(相似标准形)。
线性映射的整体结构
从 V 到 W 的所有线性映射记为 Hom(V,W) ,像普通函数一样地定义 Hom(V,W) 上的加法和纯量乘法,不难验证 (Hom(V,W),+,\cdot) 是一个线性空间,V,W 均为有限维时维数为 dim~V\cdot dim~W 。
如果一个集合上具有加法 + 、乘法 \circ 、域 F 上的纯量乘法 \cdot ,且该集合 (A,+,\cdot) 是一个域 F 上的线性空间,(A,+,\circ) 是一个幺环,则称为一个代数 。
#### 线性映射的核与象
$\mathcal{A}\in Hom(V,V)$,可以定义 $\mathcal{A}$ 的幂($\mathcal{A^0}=\mathcal{I}$;如果变换可逆,还可以定义负指数幂)。记 $F[A]$ 为 $A$ 的所有域 $F$ 上的多项式(是一个线性变换,如:$\mathcal{A^2}-2\mathcal{A}+3\mathcal{I}$),$F[A]$ 是 $Hom(V,V)$ 的一个子环,并且是一个交换环。
$\mathcal{A}:V\to W$,$\mathcal{A}$ 的像记作 $Im~\mathcal{A}$,$\mathcal{A}$ 的**核** $Ker~\mathcal{A}:=f^{-1}(0_W)$。
命题2:线性映射是单射 $\Longleftrightarrow Ker~\mathcal{A}=0
命题3:线性映射是满射 \Longleftrightarrow Im~\mathcal{A}=W
和群同态基本定理一样,有定理:V/Ker~\mathcal{A}\cong Im~\mathcal{A} 。证明方法也是相同的。由这个定理可以得到维数公式:dim~V=dim(Im~\mathcal{A})+dim(Ker~\mathcal{A}) 。
命题4:线性变换单射当且仅当满射。
直观上容易简单地将线性变换理解为先做沿 Ker~\mathcal{A} 到 Im~\mathcal{A} 上的投影再做 Im~\mathcal{A} 上的线性变换。但事实上并不是如此,我们有如下反例和结论:
例:\mathcal{A}:\mathbb{R^2}\to\mathbb{R^2},\mathcal{A}(x,y)=(0,x) 的核和象都是 y 轴
命题5:\mathcal{A} 幂等,则 V=Im~\mathcal{A}\oplus Ker~\mathcal{A} 。(即幂等变换只可能是投影。)
线性映射的表示
矩阵语言
形如 A_{n\times m}=\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
a_{21} & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nm}
\end{pmatrix},a_{ij}\in F 称为域 F 上的 n\times m 矩阵 ,全体域 F 上的 n\times m 矩阵 记为 M_{n\times m}(F) 。A_{n\times n} 称为 n 级矩阵 。
矩阵的加法:M_{n\times m}(F)\times M_{n\times m}(F)\to M_{n\times m}(F) ,
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
a_{21} & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nm}
\end{pmatrix}+\begin{pmatrix}
b_{11} & b_{12} & \cdots & b_{1m} \\
b_{21} & b_{22} & \cdots & b_{2m} \\
\vdots & \vdots & & \vdots \\
b_{n1} & b_{n2} & \cdots & b_{nm}
\end{pmatrix}=\begin{pmatrix}
c_{11} & c_{12} & \cdots & c_{1m} \\
c_{21} & c_{22} & \cdots & c_{2m} \\
\vdots & \vdots & & \vdots \\
c_{n1} & c_{n2} & \cdots & c_{nm}
\end{pmatrix}\\
c_{ij}=a_{ij}+b_{ij}
矩阵的乘法:M_{n\times m}(F)\times M_{m\times s}(F)\to M_{n\times s}(F) ,
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
a_{21} & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nm}
\end{pmatrix}
\begin{pmatrix}
b_{11} & b_{12} & \cdots & b_{1s} \\
b_{21} & b_{22} & \cdots & b_{2s} \\
\vdots & \vdots & & \vdots \\
b_{m1} & b_{m2} & \cdots & b_{ms}
\end{pmatrix}
=
\begin{pmatrix}
c_{11} & c_{12} & \cdots & c_{1s} \\
c_{21} & c_{22} & \cdots & c_{2s} \\
\vdots & \vdots & & \vdots \\
c_{n1} & c_{n2} & \cdots & c_{ns}
\end{pmatrix}\\
c_{ij}=\displaystyle\sum_{k=1}^ma_{ik}b_{kj}
矩阵的纯量乘法:F\times M_{n\times m}(F)\to M_{n\times m}(F)
k\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
a_{21} & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nm}
\end{pmatrix}
=
\begin{pmatrix}
ka_{11} & ka_{12} & \cdots & ka_{1m} \\
ka_{21} & ka_{22} & \cdots & ka_{2m} \\
\vdots & \vdots & & \vdots \\
ka_{n1} & ka_{n2} & \cdots & ka_{nm}
\end{pmatrix}
矩阵的转置:$\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
a_{21} & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nm}
\end{pmatrix}$ 变成 $\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}$,记为 $A'$ 或 $A^T
特殊的矩阵:
零矩阵(全 0 ),单位矩阵 I=\begin{pmatrix}
1 & 0 & \cdots & 0 \\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 1
\end{pmatrix} ,a_{ij}=\delta_{ij} ,数量矩阵 kI
任何矩阵乘单位矩阵不变,任何矩阵乘 kI 等于数乘 k
对角矩阵 D=\begin{pmatrix}
a_{11} & 0 & \cdots & 0 \\
0 & a_{22} & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & a_{nn}
\end{pmatrix} ,记作 D=Diag\{a_{11},a_{22},\cdots,a_{nn}\}
上三角矩阵 \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
0 & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & a_{nn}
\end{pmatrix} ,下三角矩阵 \begin{pmatrix}
a_{11} & 0 & \cdots & 0 \\
a_{21} & a_{22} & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix}
对称矩阵 \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix},~\forall i,j,~a_{ij}=a_{ji}
矩阵的分块:在矩阵上画 r-1 条横线和 t-1 条竖线,矩阵就会被分成 r\times t 块,每块都是矩阵,将每块视为一个元素,分块之后就成为一个 r\times s 矩阵。如果两个矩阵对应元素可以相乘,则分块矩阵可以像普通矩阵一样正常地算。
如下面的矩阵,r-1 条横线将矩阵分为的 r 块的行数分别为 n_1,\cdots,n_r ,t-1 条竖线将矩阵分为的 t 块的列数分别为 m_1,\cdots,m_t :
\begin{pmatrix}
\begin{pmatrix}
a_{11} & \cdots & a_{1m_1} \\
\vdots & & \vdots \\
a_{n_11} & \cdots & a_{n_1m_1}
\end{pmatrix}
&
\begin{pmatrix}
a_{11} & \cdots & a_{1m_2} \\
\vdots & & \vdots \\
a_{n_11} & \cdots & a_{n_1m_2}
\end{pmatrix}
& \cdots &
\begin{pmatrix}
a_{11} & \cdots & a_{1m_t} \\
\vdots & & \vdots \\
a_{n_11} & \cdots & a_{n_1m_t}
\end{pmatrix} \\
\begin{pmatrix}
a_{11} & \cdots & a_{1m_1} \\
\vdots & & \vdots \\
a_{n_21} & \cdots & a_{n_2m_1}
\end{pmatrix}
&
\begin{pmatrix}
a_{11} & \cdots & a_{1m_2} \\
\vdots & & \vdots \\
a_{n_21} & \cdots & a_{n_2m_2}
\end{pmatrix}
& \cdots &
\begin{pmatrix}
a_{11} & \cdots & a_{1m_t} \\
\vdots & & \vdots \\
a_{n_21} & \cdots & a_{n_2m_t}
\end{pmatrix} \\
\vdots & \vdots & & \vdots \\
\begin{pmatrix}
a_{11} & \cdots & a_{1m_1} \\
\vdots & & \vdots \\
a_{n_s1} & \cdots & a_{n_sm_1}
\end{pmatrix}
&
\begin{pmatrix}
a_{11} & \cdots & a_{1m_2} \\
\vdots & & \vdots \\
a_{n_s1} & \cdots & a_{n_sm_2}
\end{pmatrix}
& \cdots &
\begin{pmatrix}
a_{11} & \cdots & a_{1m_t} \\
\vdots & & \vdots \\
a_{n_s1} & \cdots & a_{n_sm_t}
\end{pmatrix}
\end{pmatrix}
整个矩阵为 r\times t ,第 i,j 块为 n_i\times m_j 矩阵,方便起见,我们可以将矩阵记为下述形式:
\begin{pmatrix}
M_{n_1\times m_1} & M_{n_1\times m_2} & \cdots & M_{n_1\times m_t} \\
M_{n_2\times m_1} & M_{n_2\times m_2} & \cdots & M_{n_2\times m_t} \\
\vdots & \vdots & & \vdots \\
M_{n_s\times m_1} & M_{n_s\times m_2} & \cdots & M_{n_s\times m_t} \\
\end{pmatrix}
其中,每个位置上的元素为矩阵。
分块矩阵的乘法定义如下:
\begin{pmatrix}
A_{n_1\times m_1} & A_{n_1\times m_2} & \cdots & A_{n_1\times m_t} \\
A_{n_2\times m_1} & A_{n_2\times m_2} & \cdots & A_{n_2\times m_t} \\
\vdots & \vdots & & \vdots \\
A_{n_s\times m_1} & A_{n_s\times m_2} & \cdots & A_{n_s\times m_t} \\
\end{pmatrix}_{s\times t}
\begin{pmatrix}
B_{m_1\times o_1} & B_{m_1\times o_2} & \cdots & B_{m_1\times o_p} \\
B_{m_2\times o_1} & B_{m_2\times o_2} & \cdots & B_{m_2\times o_p} \\
\vdots & \vdots & & \vdots \\
B_{m_t\times o_1} & B_{m_t\times o_2} & \cdots & B_{m_t\times o_p} \\
\end{pmatrix}_{t\times p}
=
\begin{pmatrix}
M_{n_1\times m_1} & M_{n_1\times m_2} & \cdots & M_{n_1\times m_t} \\
M_{n_2\times m_1} & M_{n_2\times m_2} & \cdots & M_{n_2\times m_t} \\
\vdots & \vdots & & \vdots \\
M_{n_s\times m_1} & M_{n_s\times m_2} & \cdots & M_{n_s\times m_t} \\
\end{pmatrix}_{s\times p}
\\
C_{ij}=\displaystyle\sum_{k=1}^tA_{ik}B_{kj}
其中大矩阵下标表示大矩阵中对应位置的小矩阵:~A_{ik}=A_{n_i\times m_k},~B_{kj}=B_{m_k\times o_j} ,A,B,C 下标仅为分块矩阵形式上的下标,实际上的下标为 A_{\sum n\times\sum m},~B_{\sum m\times\sum o},~C_{\sum n\times\sum o}
矩阵的初等变换
矩阵有三种行(列)初等变换:
第 i 行(列)乘 k,~k\in F
第 i 行(第 j 列)加上 k 倍的第 j 行(第 i 列)
交换 i,j 行(列)
初等矩阵(了解):
1 & 0 & \cdots & 0 & \cdots & 0 \\
0 & 1 & \cdots & 0 & \cdots & 0 \\
\vdots & \vdots & & \vdots & & \vdots \\
0 & 0 & \cdots & k(a_{ii}) & \cdots & 0 \\
\vdots & \vdots & & \vdots & & \vdots \\
0 & 0 & \cdots & 0 & \cdots & 1
\end{pmatrix}
1 & \cdots & 0 & \cdots & 0 & \cdots & 0 \\
\vdots & & \vdots & & \vdots & & \vdots \\
0 & \cdots & 1 & \cdots & k(a_{ij}) & \cdots & 0 \\
\vdots & & \vdots & & \vdots & & \vdots \\
0 & \cdots & 0 & \cdots & 1 & \cdots & 0 \\
\vdots & & \vdots & & \vdots & & \vdots \\
0 & \cdots & 0 & \cdots & 0 & \cdots & 1
\end{pmatrix}
1 & \cdots & 0 & \cdots & 0 & \cdots & 0 \\
\vdots & & \vdots & & \vdots & & \vdots \\
0 & \cdots & 0 & \cdots & 1(a_{ij}) & \cdots & 0 \\
\vdots & & \vdots & & \vdots & & \vdots \\
0 & \cdots & 1(a_{ji}) & \cdots & 0 & \cdots & 0 \\
\vdots & & \vdots & & \vdots & & \vdots \\
0 & \cdots & 0 & \cdots & 0 & \cdots & 1
\end{pmatrix}
左乘初等矩阵等于做相应的初等行变换,右乘初等矩阵等于做相应的初等列变换。
通过初等变换可以将矩阵化为较简单的形式,这有利于矩阵的计算、解线性方程组和对线性映射的研究。
线性映射的表示
对于线性映射 \mathcal{A}:V\to W ,确定在了 V 的一组基下的取值,就确定了线性映射,所以可以用 (\mathcal{A}e_1,\mathcal{A}e_2,\cdots,Ae_n) 来表示线性映射。但是一个向量组显然不够直观,所以可以确定 W 的一组基,用该向量组在该基下的坐标来表示:
(\mathcal{A}e_1,\mathcal{A}e_2,\cdots,Ae_n)=(e_1',e_2',\cdots,e_m')\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{m1} & a_{n2} & \cdots & a_{mn}
\end{pmatrix}
,其中 a_{ij} 为 \mathcal{A}e_j 的第 i 个分量坐标。
于是,在分别确定了 V 和 W 的一组基之后,从 V 到 W 的线性映射就可以用一个矩阵来描述。
命题1:用上面的方式诱导出的映射 \sigma:Hom(V,W)\to M_{m\times n} 是一个同构。
学过线性代数的人应该把矩阵理解为线性映射。
确定了一组基后,一个元素可用如下方式表示:a=(e_1,\cdots,e_n)x^T ,列向量 x 称为 a 的坐标 。在基已知的情况下,也可以直接用坐标列向量来表示坐标。在这个意义下,上述线性映射的矩阵表示法中矩阵的 n 列(记为 a_1,\cdots,a_n )就是 V 中 n 个基向量的像,所以 \left<a_1,\cdots,a_n\right>=Im~\mathcal{A}
矩阵的秩和高斯消元
高斯消元
命题2:矩阵的秩等于阶数最小的行列式不为 $0$ 的子阵的阶数。
命题3:矩阵的行向量组的秩和列向量组的秩相同。
### 线性变换的相似标准形概论