Logo

克拉默法则、体积和线性变换

1. 克拉默法则

行列式不仅可以用于判断矩阵的可逆性,还可用于直接求解线性方程组的解。下面要介绍的克拉默法则 (Cramers Rule) ~\mathbf{(Cramer’s~Rule)}~就是一种基于行列式求解线性方程组的方法,它可通过计算不同行列式的比值来确定方程组中的每个未知数。具体法则如下:

其中,符号 Ai(b) ~\mathbf{A}_i(\mathbf{b})~表示一个通过替换矩阵 A ~\mathbf{A}~的某一列而得到的新矩阵。若 n ~n~阶矩阵 A=[a1,,ai,,an] ~\mathbf{A}=\begin{bmatrix}\mathbf{a}_1,\dots,\textcolor{#2196f3}{\mathbf{a}_i},\dots, \mathbf{a}_n\end{bmatrix}~,那么 Ai(b)=[a1,,b,,an] ~\mathbf{A}_i(\textcolor{#2196f3}{\mathbf{b}})=\begin{bmatrix}\mathbf{a}_1,\dots, \textcolor{#2196f3}{\mathbf{b}}, \dots , \mathbf{a}_n\end{bmatrix}~

  1. 符号定义
    • 矩阵 A ~\mathbf{A}~的列记为(a1,a2,,an)(\mathbf{a}_1, \mathbf{a}_2, \dots, \mathbf{a}_n)
    • 单位矩阵 I ~\mathbf{I}~的列记为(e1,e2,,en)(\mathbf{e}_1, \mathbf{e}_2, \dots, \mathbf{e}_n)
    • 向量 x ~\mathbf{x}~是矩阵方程方程 Ax=b ~\mathbf{Ax}=\mathbf{b}~的解
  2. 矩阵乘法的展开
    •  A ~\mathbf{A}~乘以一个替换列后的矩阵 Ii(x) ~\mathbf{I}_i(\mathbf{x})~,这个矩阵是单位矩阵 I ~\mathbf{I}~的第 i ~i~列替换为向量 x ~\mathbf{x}~
      A(Ii(x))=A[e1xen]=[Ae1AxAen]=[a1ban]=Ai(b)\begin{align*} \mathbf{A}(\mathbf{I}_i(\mathbf{x})) &= \mathbf{A} \begin{bmatrix} \mathbf{e}_1 & \cdots & \mathbf{x} & \cdots & \mathbf{e}_n \end{bmatrix}\\[2ex] &= \begin{bmatrix}\mathbf{Ae}_1 & \dots & \textcolor{#2196f3}{\mathbf{Ax}} & \dots & \mathbf{Ae}_n\end{bmatrix}\\[2ex] &= \begin{bmatrix}\mathbf{a}_1 & \dots & \textcolor{#2196f3}{\mathbf{b}} & \dots & \mathbf{a}_n\end{bmatrix}\\[2ex] &= \mathbf{A}_i(\mathbf{b}) \end{align*}
  3. 行列式的乘法性质
    根据行列式的乘法性质,有:
    det(A)det(Ii(x))=det(Ai(b))\det(\mathbf{A}) \cdot \textcolor{#2196f3}{\det(\mathbf{I}_i(\mathbf{x}))} = \det(\mathbf{A}_i(\mathbf{b}))
    由于 Ii(x) ~\mathbf{I}_i(\mathbf{x})~是一个替换列后的单位矩阵,其行列式值为向量 xi ~\textcolor{#2196f3}{\mathbf{x}_i}~,上式可以进一步化简:
    det(A)xi=det(Ai(b))xi=det(Ai(b))det(A)\det(\mathbf{A})\mathbf{x}_i=\det(\mathbf{A}_i(\mathbf{b})) \\[4ex] \Rightarrow \mathbf{x}_i=\frac{\det(\mathbf{A}_i(\mathbf{b}))}{\det(\mathbf{A})}
    定理证毕!

使用克拉默法则来解线性方程组,请看下面示例:

开通会员解锁全部动画

2. 克拉默法则求矩阵的逆

克拉默法则可以用于直接求解逆矩阵的 (i,j) ~(i,j)~元素,其推导过程如下: 给定一个 n×n ~n\times n~的方阵 A ~\mathbf{A}~,其逆矩阵 A1 ~\mathbf{A}^{-1}~的第 j ~j~列可以看做是一个向量 x ~\mathbf{x}~,满足:
 Ax=ej~\mathbf{Ax}=\mathbf{e}_j
其中 ej ~\mathbf{e}_j~是单位矩阵的第 j ~j~列, x ~\mathbf{x}~的第 i ~i~个元素是 A1 ~\mathbf{A}^{-1}~中的 (i,j) ~(i,j)~元素。从求解线性方程组的角度出发,根据克拉默法则可得:
(A1)ij=xi=detAi(ej)detA(2)\left( \mathbf{A}^{-1} \right)_{ij} = x_i = \frac{\det \mathbf{A}_i(\mathbf{e}_j)}{\det \mathbf{A}} \tag{2}
 Ai(ej) ~\mathbf{A}_i(\mathbf{e}_j)~是用单位矩阵 In ~\mathbf{I}_n~的第 j ~j~列替换矩阵 A ~\mathbf{A}~的第 i ~i~行得到的,它的行列式 detAi(ej) ~\det \mathbf{A}_i(\mathbf{e}_j)~是矩阵 A ~\mathbf{A}~按第 j ~j~行第 i ~i~列的余子展开式,有如下表达式:
detAi(ej)=(1)i+jdetAji=Cji(3)\det \mathbf{A}_i(\mathbf{e}_j) = (-1)^{i+j} \det A_{ji} = C_{ji} \tag{3}
这个推导过程可以结合下面的动画演示来辅助理解:

开通会员解锁全部动画

 (2),(3) ~(2),(3)~可得 A1 ~\mathbf{A}^{-1}~
A1=1detA[C11C21Cn1C12C22Cn2C1nC2nCnn](4)\mathbf{A}^{-1} = \frac{1}{\det \mathbf{A}} \begin{bmatrix} C_{11} & C_{21} & \cdots & C_{n1} \\ C_{12} & C_{22} & \cdots & C_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ C_{1n} & C_{2n} & \cdots & C_{nn} \end{bmatrix} \tag{4}
公式 (4) ~(4)~右边的代数余子式的矩阵又被称为 A ~\mathbf{A}~伴随矩阵 (adjugate) ~(\mathbf{adjugate})~经典伴随矩阵 (classical adjoint) ~(\mathbf{classical~adjoint})~,记作 adjA ~\operatorname{adj}\mathbf{A}~。对于 (4) ~(4)~式,有如下定理:
 (5) ~(5)~式两边同时乘以矩阵 A ~\mathbf{A}~,再做简单推导,可得如下结论:
adj(A)A=det(A)In(6)\operatorname{adj}(\mathbf{A}) \cdot \mathbf{A} = \det(\mathbf{A}) \cdot \mathbf{I}_n \tag{6}
公式 (6) ~(6)~可以在已知矩阵 A ~\mathbf{A}~和伴随矩阵 adjA ~\operatorname{adj}\mathbf{A}~的情况计算行列式 detA ~\det \mathbf{A}~。 不过,如果使用定理 8 ~8~来求解矩阵的逆,计算复杂度较高,它只适合处理小规模矩阵。例如,对于 3×3 ~3\times 3~的矩阵,使用该方法所需的计算量远高于行化简算法。请观察下面的计算过程:

开通会员解锁全部动画

3. 行列式的几何意义

将行列式与几何意义联系起来,能为我们提供更直观的理解:它不仅是一个代数工具,还能用于描述由矩阵列向量围成的区域面积或体积。有如下定理:

3.1 二维空间中的行列式与面积

二阶矩阵如果是三角矩阵,我们可以很容易看出由其列向量围成的平行四边形的面积就是矩阵对应的行列式,如下所示:

开通会员解锁全部动画

要证明定理 9(1) ~9(1)~,我们可以先把任意矩阵通过行变换(或列变换)化简为三角矩阵,只要能证明原矩阵的列向量和三角矩阵的列向量围成的平行四边形面积相同即可。对任意可逆的二阶矩阵 A=[a1a2] ~\mathbf{A}=\begin{bmatrix}\mathbf{a}_1 & \mathbf{a}_2\end{bmatrix}~经过列倍加变换后,总能得到三角矩阵 A=[a1a2+ca1] ~\mathbf{A'}=\begin{bmatrix}\mathbf{a}_1 & \mathbf{a}_2 + c\mathbf{a}_1\end{bmatrix}~。下面只需要证明 A ~\mathbf{A}~ A ~\mathbf{A'}~的列向量围成的平行四边形面积是相同的即可,下面的动画过程展示了我们总能找到一个合适的标量 c ~c~,可以使得 a2+ca1 ~\mathbf{a}_2+c\mathbf{a}_1~垂直于 a1 ~\mathbf{a}_1~,从而很容易观察到两个平行四边形的面积相等:

开通会员解锁全部动画

  1. 证明命题
    • 给定两个非零向量 a1,a2 ~\mathbf{a}_1,\mathbf{a}_2~证明对于任意标量 c ~c~,由 a1 ~\mathbf{a}_1~ a2+ca1 ~\mathbf{a}_2+c\mathbf{a}_1~围成的平行四边形的面积与由 a1 ~\mathbf{a}_1~ a2 ~\mathbf{a}_2~围成的平行四边形面积相等。
  2.  a1,a2 ~\mathbf{a}_1,\mathbf{a}_2~共线的情况
    •  a1,a2 ~\mathbf{a}_1,\mathbf{a}_2~共线,平行四边形退化为一条直线,面积为 0 ~0~
  3. 几何解释
    • 定义平行线 L: ~L:~假设 L ~L~是过原点 0 ~\mathbf{0}~和向量 a1 ~\mathbf{a}_1~的直线。
    • 向量 a2+ca1 ~\mathbf{a}_2+c\mathbf{a}_1~是在 a2 ~\mathbf{a}_2~的基础上沿 a1 ~\mathbf{a}_1~方向平移。即, a2+ca1 ~\mathbf{a}_2+c\mathbf{a}_1~在平行与 L ~L~的直线上。
  4.  L ~L~的垂直距离

    •  a2 ~\mathbf{a}_2~ a2+ca1 ~\mathbf{a}_2+c\mathbf{a}_1~相对直线 L ~L~的垂直距离相等。观察动画不难发现从 a2+ca1 ~\mathbf{a}_2+c\mathbf{a}_1~到直线 L ~L~的垂直距离不会因为沿 a1 ~\mathbf{a}_1~方向的滑动而改变。
  5. 结论:两个平行四边形面积相等
    • 两个平行四边形的底边相同(即 a1 ~\mathbf{a}_1~),并且它们垂直高度相同。因此这两个平行四边形的面积相等。

3.2 三维空间中的行列式与体积

三阶三角矩阵的列向量围成的平行六面体的体积等于对角线元素的乘积(取绝对值)。只要三角矩阵的对角线元素保持不变,该平行六面体的体积就不会发生变化。请观察下面的动画过程:

在上面的示例中,向量的数值发生变化时,由向量 x,y ~\mathbf{x},\mathbf{y}~确定的平行四边形的面积(底)以及向量 z ~\mathbf{z}~ xy ~\mathbf{xy}~平面的垂直距离(高)始终不变,所以动画过程中平行六面体的体积并没有发生变化。证明定理 9(2) ~9(2)~和证明定理 9(1) ~9(1)~的思路是一样的,下面我们用动画来演示证明的过程:

任何 3×3 ~3\times 3~矩阵都可以通过不改变 detA ~|\det \mathbf{A}|~的列倍加变换转化为对角矩阵。在变换过程中由矩阵列向量构成的六面体的体积始终保持不变,上面的动画展示了一次列倍加变换的过程:[a1a2a3][a1a2+ca1a3]\begin{bmatrix} \mathbf{a}_1 & \mathbf{a}_2 & \mathbf{a}_3 \end{bmatrix} \rightarrow \begin{bmatrix} \mathbf{a}_1 & \mathbf{a}_2 + c \mathbf{a}_1 & \mathbf{a}_3 \end{bmatrix}。当把矩阵化简为对角矩阵时,列向量构成的会是一个轴对齐的长方体

4. 行列式与矩阵变换的几何意义

行列式还可以用来揭示了线性变换如何影响空间的面积、体积以及方向。我们在 1.8 线性变换的矩阵一节介绍过一些常见的变换矩阵( R2 ~\mathbb{R^2}~空间)。我们可以观察到旋转矩阵、剪切矩阵的行列式都为 1 ~1~,变换后图形的面积不会发生变化;缩放矩阵的行列式为 k (kR2) ~k~(k\in \mathbb{R^2})~,变换后图形的面积会缩放 k ~\lvert k \rvert~倍(如果是投影矩阵, k=0 ~k=0~)。行列式的绝对值描述了线性变换对区域面积 (R2) ~(\mathbb{R^2})~或体积 (R3) ~(\mathbb{R^3})~的缩放比例,而符号则反映了变换的方向(如:是否翻转)。这种几何视角帮助我们从形状和大小的变化来理解矩阵变换的本质。注意观察下面变换矩阵的行列式和变换图形的面积变化:

开通会员解锁全部动画

给定一个线性变化 T ~T~,定义在集合 S ~S~上, T(S) ~T(S)~表示集合 S ~S~中所有点在变换 T ~T~下的像。我们关注的是变换后区域的面积或体积与原始区域的变化。有如下定理: