线性代数学习笔记4——矩阵的逆

walk_alone · 2021-01-23 11:21:54 · 个人记录

在进行矩阵的运算的时候，我们会发现我们没有定义矩阵的除法，但是经常又需要做类似的操作，因而我们引入矩阵的逆的概念，用以填补这个空白。

矩阵的逆

由于我们在定义矩阵运算的时候只定义了数乘和矩阵乘法，而没有除法运算。和逆元的产生一样，我们为了定义出除法，我们采用乘一个数/矩阵得到单位1/单位矩阵的方法，并定义这个数/矩阵为原数/原矩阵的乘法。

注：单位矩阵是一个除了主对角线为1，其他全为0的方阵。由于阶数不固定，因而有无穷多种单位矩阵。

\begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1\\\end{bmatrix}

定义：设A为n阶方阵，若存在n阶方阵B，使得AB=BA=I，则称B为A的逆，并称A为可逆矩阵。 记A^{-1}为A的逆。

若A可逆，则逆唯一。

证明：若B与C都是A的逆，由定义AB=BA=I，AC=CA=I，则有：

B=IB=(CA)B=C(AB)=CI=C

即B=C

有一种用行列式来判定和计算矩阵是否可逆的方法，过于繁琐，不适用于计算，只在此介绍。

定义：设n阶方阵

\begin{bmatrix} a_{11} & a_{12} & a_{13} & \cdots & a_{1n} \\ a_{12} & a_{22} & a_{23} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & a_{n3} & \cdots & a_{nn} \\ \end{bmatrix}

由A的行列式|A|中元素a_{ij}的代数余子式A_{ij}构成的如下n阶方阵：

A^*=\begin{bmatrix} A_{11} & A_{21} & A_{31} & \cdots & A_{n1} \\ A_{12} & A_{22} & A_{32} & \cdots & A_{n2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ A_{n1} & A_{n2} & A_{3n} & \cdots & A_{nn} \\ \end{bmatrix}

称A^*为A的伴随矩阵，而A可逆的充要条件为|A| \neq 0，且

A^{-1}=\frac{A^*}{|A|}

此处证明需要用到行列式的性质，在此略去。

下文有更简单的判定和计算方法。

逆变换有一重要性质：若A,B均可逆，则AB也可逆，且(AB)^{-1}=B^{-1}A^{-1}。该性质可以反复利用，因此可以拓展到k个可逆行列式相乘：

(A_1A_2……A_k)^{-1}=A_k^{-1}A_{k-1}^{-1}……A_1^{-1}

初等矩阵

把单位矩阵进行一次初等行变换，就得到了初等矩阵。复习一下，初等行变换有以下三种：

1.交换矩阵的任意两行。

2.用一个非零整数k乘矩阵的任意一行。

3.将矩阵中某一行乘以k倍加到另外一行。

因此对于三阶单位矩阵I_3

\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0\\ -4 & 0 & 1 \\ \end{bmatrix} \begin{bmatrix} 0 & 1 & 0 \\ 1 & 0 & 0\\ 0 & 0 & 1 \\ \end{bmatrix} \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0\\ 0 & 0 & 5 \\ \end{bmatrix}

均为初等矩阵。

由于初等行变换可逆（可以改过去又可以改回来），因此初等矩阵可逆。

证明：设E为一初等矩阵，由于EI=E，因此任意一个初等矩阵可以视为对I矩阵的一种变换，使其变为E矩阵。由于初等行变换可逆，则存在E变换的逆变换F，将E矩阵变回I，因此EF=I，即E可逆，且其逆为E的逆变换。

到此可以引出本题的证明了：

方阵A可逆，当且仅当A行等价于I_n ，即A经过若干次行变换可以变成I_n

充分性：由于A可逆，则方程Ax=b必有解，其中x,b均为向量（求解只需要在等式两边左乘以A^{-1}即可）。那么，对于解x：

x=\begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_n\\ \end{bmatrix}

必可写出与A等价的增广矩阵A'（因为解一样）：

A'=\left[ \begin{array}{cccc|c} 1&&&&x_1\\ &1&&&x_2\\ &&\ddots\ && \vdots\\ &&&1&x_n \end{array} \right]

那么原矩阵必与I_n等价，否则无法化简成A'

必要性：如果A等价于I_n，则A是由若干次初等行变换得到。对于每次初等行变换都有一个对应的初等矩阵，那么这些操作可以被记作：

E_pE_{p-1}……E_1A=I_n

由矩阵逆的另一种定义，若A可逆，则必存在一种能让A回到I_n的方法。考虑对上式两边左乘(E_pE_{p-1}……E_1)^{-1}

((E_pE_{p-1}……E_1)^{-1}E_pE_{p-1}……E_1)A=(E_pE_{p-1}……E_1)^{-1}I_n

即A=(E_pE_{p-1}……E_1)^{-1}，为可逆矩阵的乘积，因此A可逆，且A^{-1}=E_pE_{p-1}……E_1。因此，A^{-1}可以由E_1,E_2,……,E_p依次作用于I_n得到。

得证。

接下来就是解法时间

我们把A和I_n置于同一矩阵中：

\begin{bmatrix} A & I_n \end{bmatrix}

对其进行高斯-若尔当消元操作将A变换为I_n。由于是在同一矩阵中，因此A和I_n得到的操作都是一样的。我们只需要让前面的A变换为I_n，那么对于同一过程，I_n就会变成矩阵的逆。

用一张图来表示这个互相转化关系：

A\stackrel{P}{\underset{P'}{\Leftrightarrow}}I_n\stackrel{P}{\underset{P'}{\Leftrightarrow}}A^{-1}

下面是洛谷P4783的代码，内含逆元，但是大体思路一样，因而还是放上代码。

#include <cstdio>
#include <algorithm>
using namespace std;
const long long mod = 1000000007;
long long power(long long a,int x)//快速幂板子
{
    long long ans = 1;
    while(x)
    {
        if(x&1)
        {
            ans *= a;
            ans %= mod;
        }
        a *= a;
        a %= mod;
        x >>= 1;
    }
    return ans % mod;
}
long long a[405][805];
int main()
{
    int n, m;
    scanf("%d", &n);
    m = 2 * n;//矩阵的宽
    for (int i = 1; i <= n;i++)
    {
        for (int j = 1; j <= n;j++)
            scanf("%lld", &a[i][j]);
        a[i][i + n] = 1;//后面要跟上一个n阶单位矩阵
    }
    for (int i = 1; i <= n; i++)//高斯-若尔当消元的板子
    {
        int place = i;
        for (int j = i + 1; j <= n; j++)//找到绝对值最大的元素开始消元
            if(abs(a[j][i])>abs(a[place][i]))
                place = j;
        if (i != place)
            swap(a[i], a[place]);
        if(!a[i][i])//如果某行没有主元则A无法化为单位矩阵，无解
        {
            printf("No Solution");
            return 0;
        }
        long long inv = power(a[i][i], mod - 2);//本题加入的逆元特色
        for (int j = 1; j <= n; j++)
            if(j!=i)
            {
                long long multiple = a[j][i] * inv % mod;//等价于除以a[i][i]，消去其他行在第i列上的数，使之变成简化阶梯形矩阵
                for (int k = i; k <= m; k++)
                    a[j][k] = ((a[j][k] - a[i][k] * multiple) % mod + mod) % mod;
            }
        for (int j = 1; j <= m; j++)//由于此处需要简化阶梯型矩阵，要把原矩阵化为简化矩阵的必须操作。
        //“在使用高斯-若尔当消元的时候，计算机计算的时候通常采用回带法，而人操作的时候建议采用此法。”——《线性代数及其应用》
            a[i][j] = (a[i][j] * inv % mod);
    }
    for (int i = 1; i <= n;i++)
    {
        for (int j = n + 1; j <= m; j++)//只打印后面，前面的单位矩阵不要打出来了
            printf("%lld ", a[i][j]);
        printf("\n");
    }
    return 0;
}