Logo

矩阵的逆

1. 矩阵的逆

逆的概念:矩阵的逆类似于实数的倒数。对于实数 5 ~5~,它的倒数为 51=15 ~5^{-1}=\frac{1}{5}~,满足 5×15=1 ~5\times \frac{1}{5}=1~。在矩阵代数中,逆矩阵的定义要求两个条件同时成立:对于一个 n×n ~n\times n~矩阵A\mathbf{A},如果存在一个同样大小的矩阵 C ~\mathbf{C}~使得 CA=I ~\mathbf{C}\mathbf{A}=\mathbf{I}~ AC=I ~\mathbf{A}\mathbf{C}=\mathbf{I}~,其中 I ~\mathbf{I}~是单位矩阵,那么矩阵 A ~\mathbf{A}~就是可逆的,矩阵 C ~\mathbf{C}~被称为 A ~\mathbf{A}~的逆矩阵。从定义便可知,只有方阵才可能有逆矩阵

唯一性:逆矩阵是唯一的,如果 A ~\mathbf{A}~的逆存在,那么它只有一个,通常记作 A1 ~\mathbf{A}^{-1}~。这个结论利用矩阵乘法结合律很容易证明:假设 A ~\mathbf{A}~可逆,存在两个逆矩阵 B ~\mathbf{B}~ C ~\mathbf{C}~,那么B=BI=B(AC)=(BA)C=IC=C\mathbf{B}=\mathbf{B}\mathbf{I}=\mathbf{B}(\mathbf{A}\mathbf{C})=(\mathbf{B}\mathbf{A})\mathbf{C}=\mathbf{I}\mathbf{C}=\mathbf{C}可得,B=C \mathbf{B}=\mathbf{C}~,结论得证。

非奇异矩阵与奇异矩阵:如果一个矩阵是可逆的,它被称为非奇异矩阵(Nonsingular Matrix\text{Nonsingular Matrix});如果不可逆,则称为奇异矩阵 ( Singular Matrix ) ~(~\text{Singular Matrix}~)~

几何上的解释:矩阵的逆表示将通过矩阵施加的几何变换进行逆向操作,以恢复到变换前的状态。请看下面的示例,其中 A ~\mathbf{A}~为复合变换矩阵(旋转、垂直拉伸、水平剪切), A1 ~\mathbf{A}^{-1}~为复合变换的逆矩阵,观察两种变换效果:

2. 二阶矩阵的可逆性判定

根据前面对矩阵逆的定义,我们很容易推断出求解矩阵逆的方法。以二阶矩阵为例,有如下定理:

  1. 逆矩阵定义:设矩阵 A ~\mathbf{A}~的逆矩阵 A1 ~\mathbf{A}^{-1}~存在,则必须满足: AA1=I ~\mathbf{A}\mathbf{A}^{-1}=\mathbf{I}~。其中, I ~\mathbf{I}~ 2×2 ~2\times 2~的单位矩阵,表示为: I=[1001] ~\mathbf{I}=\begin{bmatrix}1&0\\0&1\end{bmatrix}~

  2. 设定逆矩阵的形式:假设  A1=[wxyz] ~\mathbf{A}^{-1}=\begin{bmatrix}w&x\\y&z\end{bmatrix}~,其中, w,x,y,z ~w,x,y,z~是待求的元素。

  3. 进行矩阵乘法:计算 AA1 ~\mathbf{A}\mathbf{A}^{-1}~
    AA1=[abcd][wxyz]=[aw+byax+bzcw+dycx+dz]\mathbf{A}\mathbf{A}^{-1}=\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}w&x\\y&z\end{bmatrix}=\begin{bmatrix}aw+by&ax+bz\\cw+dy&cx+dz\end{bmatrix}
  4. 与单位矩阵比较:由于 AA1=I ~\mathbf{A}\mathbf{A}^{-1}=\mathbf{I}~,因此有:
    [aw+byax+bzcw+dycx+dz]=[1001]\begin{bmatrix}aw+by&ax+bz\\cw+dy&cx+dz\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix}
    这给出了以下四个方程:
    aw+by=1ax+bz=0cw+dy=0cx+dz=1\begin{align} aw + by &= 1 \\ ax + bz &= 0 \\ cw + dy &= 0 \\ cx + dz &= 1 \end{align}
  5. 解方程组:求解过程就是用 a,b,c,d ~a,b,c,d~来表示 w,x,y,z ~w,x,y,z~。这里省略求解过程,求解的结果如下:
    w=dadbc,x=badbc,y=cadbc,z=aadbcw=\frac{d}{ad-bc},x=\frac{-b}{ad-bc},y=\frac{-c}{ad-bc},z=\frac{a}{ad-bc}
  6. 结论:因此,逆矩阵 A1 ~\mathbf{A}^{-1}~可以表示为:
    A1=1adbc[dbca]\mathbf{A}^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d&-b\\-c&a\end{bmatrix}

这个定理提供了一种简洁的方法来计算二阶矩阵的逆矩阵(不适合计算更高维的矩阵),请观察下面示例的求解逆矩阵的过程:

判断矩阵 A ~\mathbf{A}~是否可逆的关键量是 adbc ~ad-bc~,它被称为 A ~\mathbf{A}~行列式 ( determinant ) ~(~\text{determinant}~)~,记为:
detA=adbc\text{det}\mathbf{A}=ad-bc
引入行列式的概念,我们可以将二阶矩阵逆矩阵定理推广到更高阶的矩阵中。具体来说,矩阵 A ~\mathbf{A}~可逆,当且仅当 detA0 ~\text{det}\mathbf{A}\neq0~,这一结论适用于任意阶的方阵(即n×nn \times n矩阵)。
几何角度去观察,不可逆矩阵对应的线性变换会将二维平面压缩到一条直线上,导致‘降维’。也就是说,变换后的所有点将共线,不再占据二维空间。请观察下面的复合变换:

上面的案例中,由于 detA=1×42×2=0~det\mathbf{A}=1\times 4 - 2\times 2 =0,所以 A ~\mathbf{A}~不可逆。具体来说,导致复合变换矩阵 A ~\mathbf{A}~不可逆的原因在于矩阵 B ~\mathbf{B}~,它在 ey ~\mathbf{e}_{y}~方向上丢失了信息,导致了二维空间被“塌陷”成一条直线。

3. 线性方程组的唯一解

逆矩阵与线性方程组的求解密切相关。通过判断矩阵(方阵)是否可逆,我们可以确定线性方程组解的存在性和唯一性。有如下定理:

  • 存在性:考虑 b ~\mathbf{b}~ Rn ~\mathbb{R^n}~中的任意一个向量。我们首先证明方程 Ax=b ~\mathbf{A}\mathbf{x}=\mathbf{b}~至少有一个解。假设 x=A1b ~\mathbf{x}=\mathbf{A}^{-1}\mathbf{b}~,将它代入方程 Ax ~\mathbf{A}\mathbf{x}~中:
    A(A1b)=(AA1)b=Ib=b\mathbf{A}(\mathbf{A}^{-1}\mathbf{b})=(\mathbf{A}\mathbf{A}^{-1})\mathbf{b}=\mathbf{I}\mathbf{b}=\mathbf{b}
    由此可见, A1b ~\mathbf{A}^{-1}\mathbf{b}~就是方程 Ax=b ~\mathbf{A}\mathbf{x}=\mathbf{b}~的一个解。

  • 唯一性:设 u ~\mathbf{u}~是方程 Ax=b ~\mathbf{A}\mathbf{x}=\mathbf{b}~的任意解,即 Au=b~\mathbf{A}\mathbf{u}=\mathbf{b}。我们在等式两边同时乘以 A1 ~\mathbf{A}^{-1}~
    A1Au=A1b\mathbf{A}^{-1}\mathbf{A}\mathbf{u}=\mathbf{A}^{-1}\mathbf{b}
    根据矩阵乘法结合律可得:
    Iu=A1b\mathbf{I}\mathbf{u}=\mathbf{A}^{-1}\mathbf{b}
    因此,u=A1b \mathbf{u}=\mathbf{A}^{-1}\mathbf{b}~,说明方程的解是唯一的。

在求解线性方程组时,对于 2×2 ~2\times2~矩阵来说,用逆矩阵的公式手工计算可能会更简单和直观。例如求解下面的方程组:

在实际计算中,特别是在大规模矩阵中,逆矩阵的计算可能会放大数值误差。因此,直接用逆矩阵求解线性方程组在数值计算中可能导致不必要的精度损失。通常情况下,通过行简化(也就是高斯消元法)来求解线性方程组要比使用逆矩阵 A1 ~\mathbf{A}^{-1}~更快。

4. 逆矩阵的性质

逆矩阵具有几个重要的性质,这些性质使得我们在矩阵之间进行转换和操作时更加灵活,有助于简化计算过程,提高运算效率。

这些性质的证明过程比较简单,下面我们主要从几何角度来分析逆矩阵的性质:

如果 A ~\mathbf{A}~是一个二维平面的旋转矩阵,施加一次 A ~\mathbf{A}~变换相当于一次正向变换(旋转 θ ~\theta~),它的逆矩阵相当于在第一次变换的基础上再施加一次反向变换(旋转 θ ~-\theta~)。逆矩阵的逆矩阵执行与前一次相反的变换(旋转 θ ~\theta~),以此类推。 (A1)1 ~(\mathbf{A}^{-1})^{-1}~变换的结果等价于 A ~\mathbf{A}~变换的结果。观察下面的示例:

 AB ~\mathbf{A}\mathbf{B}~看做复合线性变换,它相当于先进行 B ~\mathbf{B}~变换,再进行 A ~\mathbf{A}~变换。 (AB)1 ~(\mathbf{A}\mathbf{B})^{-1}~表示复合变化的逆变换,也就是把之前的复合变换还原到最初状态。我们需要从最后一个变换动作开始倒序执行每一个变换的逆变换。那么,逆变换的执行顺序就是 先执行 A1 ~\mathbf{A}^{-1}~,再执行 B1 ~\mathbf{B}^{-1}~,对应的复合逆变换矩阵就是 B1A1 ~\mathbf{B}^{-1}\mathbf{A}^{-1}~。请观察下面的示例:

这个结论可以进一步推广:多个 n×n ~n\times n~的矩阵的乘积也是可逆的,并且其逆矩阵是这些矩阵的逆矩阵按相反顺序的乘积。

在几何上,矩阵的转置操作可以理解为对线性变换中的作用方向进行交换。例如,对于一个水平剪切矩阵,转置后的矩阵会产生垂直剪切的效果。同样地,对于一个逆时针旋转矩阵,转置后的矩阵则会产生相同角度的顺时针旋转效果。而逆矩阵 A1 ~\mathbf{A}^{-1}~代表了使变换 A ~\mathbf{A}~逆转的操作,A1 \mathbf{A}^{-1}~ 使得变换后的空间重新恢复到初始状态。在几何上,先进行逆变换再对结果进行转置,和先对矩阵进行转置再进行逆变换,从最终效果上是等价的。请观察下面两个示例:

观察示例 2 可以发现,旋转矩阵的逆矩阵与它的转置矩阵是相同的。具有这种性质的矩阵被称为正交矩阵

5. 初等矩阵与逆矩阵

对单位矩阵进行一次初等行变换,得到的是初等矩阵 ( Elementary Matrix ) ~(~\text{Elementary Matrix}~)~。初等矩阵与一个 n×n ~n\times n~矩阵 A ~\mathbf{A}~的乘积就相当于对 A ~\mathbf{A}~进行一次初等行变换。请观察下面的过程:

通过对矩阵 A ~\mathbf{A}~进行行化简操作将其转换为单位矩阵 I ~\mathbf{I}~,我们不仅能确认 A ~\mathbf{A}~是可逆的,还可以通过跟踪这些行操作来求得 A ~\mathbf{A}~的逆矩阵 A1 ~\mathbf{A}^{-1}~。有如下定理:

  1. 必要条件:如果 A ~\mathbf{A}~是可逆的,那么 A ~\mathbf{A}~行等价于 In ~\mathbf{I}_{n}~

    • 假设:矩阵 A ~\mathbf{A}~可逆。

    • 根据定理 5 ,对于向量 b ~\mathbf{b}~,方程 Ax=b ~\mathbf{A}\mathbf{x}=\mathbf{b}~都有解,这意味着矩阵 A ~\mathbf{A}~的每一行都有一个主元(即行主元位置)。

    • 因为 A ~\mathbf{A}~是方阵,所有的主元都必须在对角线上,这意味着 A ~\mathbf{A}~的行化简阶梯形是单位矩阵 In ~\mathbf{I}_{n}~,即 AIn ~\mathbf{A}\sim\mathbf{I}_{n}~

  2. 充分条件:如果 A ~\mathbf{A}~行等价于 In ~\mathbf{I}_{n}~,那么 A ~\mathbf{A}~是可逆的。

    • 假设:AIn \mathbf{A}\sim \mathbf{I}_{n}~,即矩阵 A ~\mathbf{A}~通过一系列初等行变换可以变为单位矩阵 In ~\mathbf{I}_{n}~

    • 这些初等行变换可以用对应的初等矩阵 E1,E2,,Ep ~\mathbf{E}_1,\mathbf{E}_2,\dots,\mathbf{E}_p~表示,满足:
      AE1AE2(E1A)Ep(Ep1E1A)=In\mathbf{A} \sim \mathbf{E}_1\mathbf{A} \sim \mathbf{E}_2(\mathbf{E}_1\mathbf{A}) \sim \dots \sim \mathbf{E}_p(\mathbf{E}_{p-1}\dots \mathbf{E}_1\mathbf{A}) = \mathbf{I}_n
      即:
      EpE1A=In(1)\mathbf{E}_p \dots \mathbf{E}_1 \mathbf{A} = \mathbf{I}_n \quad \text{(1)}
    • 因为初等矩阵都是可逆的,它们的乘积 EpEp1E1 ~\mathbf{E}_p\mathbf{E}_{p-1}\dots\mathbf{E}_1~也是可逆的,因此我们可以在等式(1)的两边同时左乘 (EpE1)1 ~(\mathbf{E}_p\dots\mathbf{E}_1)^{-1}~
      (EpE1)1(EpE1)A=(EpE1)1In(\mathbf{E}_p \dots \mathbf{E}_1)^{-1} (\mathbf{E}_p \dots \mathbf{E}_1) A = (\mathbf{E}_p \dots \mathbf{E}_1)^{-1} \mathbf{I}_n
      简化得:
      A=(EpE1)1\mathbf{A} = (\mathbf{E}_p \dots \mathbf{E}_1)^{-1}
      那么:
      A1=[(EpE1)1]1=EpE1\mathbf{A}^{-1}=[(\mathbf{E}_p \dots \mathbf{E}_1)^{-1}]^{-1}=\mathbf{E}_p\dots\mathbf{E}_1
      因此 A ~\mathbf{A}~是可逆的,其逆矩阵 A1 ~\mathbf{A}^{-1}~ EpE1 ~\mathbf{E}_p\dots \mathbf{E}_1~

6. 求解逆矩阵的方法

根据定理 7 ,我们可以得到一个利用矩阵的行化简发来求解矩阵逆的方法。先将一个可逆矩阵 A ~\mathbf{A}~与单位矩阵 I ~\mathbf{I}~拼接在一起,然后对这个拼接矩阵 [AI] ~\begin{bmatrix}\mathbf{A}&\mathbf{I}\end{bmatrix}~进行行变换。当把 A ~\mathbf{A}~转换为单位矩阵 I ~\mathbf{I}~时,原本拼接在右边的单位矩阵 I ~\mathbf{I}~经过相同的行变换会变成 A ~\mathbf{A}~的逆矩阵 A1 ~\mathbf{A}^{-1}~。请观察下面的示例:

我们可以从求解线性方程组的角度来理解通过行化简求解矩阵逆的过程。在上面求解逆矩阵的过程中,每一步的行变换都可以看作是在同时解 n ~n~个线性方程组,每个方程组对应一个单位向量 ei ~\mathbf{e}_i~作为结果向量。因此,求解 A1 ~\mathbf{A}^{-1}~实际上等价于求解 n ~n~个方程组:
Ax=e1,Ax=e2,,Ax=en\mathbf{Ax} = \mathbf{e}_1, \quad \mathbf{Ax} = \mathbf{e}_2, \quad \ldots, \quad \mathbf{Ax} = \mathbf{e}_n
其中,每个方程组的解构成了逆矩阵 A1 ~\mathbf{A}^{-1}~的对应列。请观察下面的求解过程:
这一视角的好处在于,当我们不需要求出整个逆矩阵,而只需要求逆矩阵的某一列或几列时,那我们只需求解相应的线性方程组即可。