矩阵方程Ax=bA \mathbf{x} = \mathbf{b}

1. 矩阵方程定义

我们把向量方程的线性组合看成矩阵与向量的乘积,最主要的目的之一是能够利用矩阵的特性进行高效计算,对于矩阵与向量的乘积运算AxA\mathbf{x}有如下定义:

请看下面AxA \mathbf{x}的运算过程:

我们称形如Ax=bA\mathbf{x}=\mathbf{b}这样的方程为矩阵方程,其中AA对应方程组中的系数矩阵,它和上一节的向量矩阵等价。而它们又和对应的线性方程组等价,有如下定理:

这个定理的核心思想是:尽管线性方程组可以有不同的表示形式(矩阵方程、向量方程、增广矩阵),但它们本质上是等价的,因为它们都表示同一个解集。通过这些等价性,我们可以根据实际情况选择最方便的一种形式来求解或分析线性方程组。

2. 解的存在性

既然线性方程组可以有三种不同的表示形式,那么对于每一种表示形式,它们对于解的存在性的表述也是等价的,有如下定理:

下面我们通过两个示例来理解上面关于线性方程组解存在的几个等价条件。其中例1满足对任意 bR3~\mathbf{b}\in\mathbb{R^3},方程 Ax=b ~A\mathbf{x}=\mathbf{b}~有解;例2中的向量 b ~\mathbf{b}~需要满足一定条件,方程 Ax=b ~A\mathbf{x}=\mathbf{b}~才有解。 我们先对分别对两个矩阵方程对应的增广矩阵进行行化简:

loading...
上面两个示例中, A ~\mathbf{A}~是一个 3×3 ~3\times 3~的系数矩阵(m=3m=3)。根据本章的定理2可知,示例 1 ~1~对于任意 bR3 ~\mathbf{b}\in\mathbb{R^3}~,方程 Ax=b ~A\mathbf{x}=\mathbf{b}~都有解;示例 2 中,对于 bR3 ~\mathbf{b}\in\mathbb{R^3}~,它要满足 b3+3b112(b2+4b1)=0~b_3+3b_1-\frac{1}{2}(b_2+4b_1)=0,方程 Ax=b ~A\mathbf{x}=\mathbf{b}~才有解。

根据矩阵-向量乘积的定义,方程 Ax=b ~A\mathbf{x}=\mathbf{b}~意味着我们在寻找一个向量 x~\mathbf{x},使得 b ~\mathbf{b}~可以表示为 A ~\mathbf{A}~的列向量的线性组合,即:b=x1a1+x2a2++xnan\mathbf{b}=x_1\mathbf{a_1}+x_2\mathbf{a_2}+\dots +x_n\mathbf{a_n}。在向量方程一节我们已经讨论过“线性方程组有解等价于向量 b ~\mathbf{b}~可表示为a1,a2,,an\mathbf{a_1},\mathbf{a_2},\dots,\mathbf{a_n}的线性组合”,请参考向量方程和线性方程组的联系

在示例 1 ~1~中,矩阵 A ~\mathbf{A}~张成的是 R3~\mathbb{R^3},三个向量不在同一个平面上。示例 2 ~2~中,矩阵 A ~\mathbf{A}~张成的是 R2~\mathbb{R^2},三个向量在同一个平面上,说明其中一个向量可以表示为另外两个向量线性组合。

观察示例 1 ~1~、示例 2 ~2~,并结合 定理2来理解。

3.  Ax ~A\mathbf{x}~的计算方式

前面对于 Ax ~A\mathbf{x}~的定义强调的是矩阵 A ~\mathbf{A}~的列向量a1,a2,,an\mathbf{a_1},\mathbf{a_2},\dots,\mathbf{a_n}和向量x\mathbf{x}的元素x1,x2,,xnx_1,x_2,\dots,x_n的线性组合,它适合从整体上去理解矩阵向量乘法的概念。不过在实际计算中我们会使用行-向量规则,它强调的是具体的计算过程,即每一行的计算是如何进行的,这对于实际的计算和编程实现非常有用(特别是在处理大规模数据或者在分布式计算时)。

请观察下面使用行-向量规则来计算 Ax ~\mathbf{A}\mathbf{x}~的过程,其中A=[234153628],x=[x1x2x3]\mathbf{A}=\begin{bmatrix}2&3&4\\-1&5&-3\\6&-2&8\end{bmatrix},\mathbf{x}=\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}

loading...
有一种比较特殊的矩阵,它的对角线上的元素为 1 ~1~,其它位置上的元素为 0 ~0~,这个矩阵称为单位矩阵,用符号 I ~\mathbf{I}~表示。对任意 Rn ~\mathbb{R^n}~中的 x ~\mathbf{x}~ Inx=x ~\mathbf{I_n}\mathbf{x}=\mathbf{x}~。比如:
[100010001][rst]=[rst]\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}\begin{bmatrix}r\\s\\t\end{bmatrix}=\begin{bmatrix}r\\s\\t\end{bmatrix}

4. 矩阵-向量积 Ax ~A\mathbf{x}~的性质

这两个性质共同构成了矩阵乘法的线性特性,使得矩阵能够描述线性变换。下面我们分别对这两个特性进行解释:

这个公式表明矩阵 A ~\mathbf{A}~对向量的加法是线性的。具体来说,当矩阵 A ~\mathbf{A}~作用在两个向量的和 u+v ~\mathbf{u}+\mathbf{v}~上时,等同于矩阵 A ~\mathbf{A}~分别作用在每个向量 u ~\mathbf{u}~ v ~\mathbf{v}~上,然后将结果相加。这个性质称为分配律,它是线性变换的基本性质之一。

这个公式表明矩阵 A ~\mathbf{A}~对向量的标量乘法是线性的。具体来说,当矩阵 A ~\mathbf{A}~作用在一个被标量 c ~c~放大的向量 cu ~c\mathbf{u}~上时,等同于先将矩阵 A ~\mathbf{A}~作用在向量 u ~\mathbf{u}~上,然后再将结果放大 c ~c~倍。这个性质称为同质性齐次性