矩阵方程Ax=b
线性代数中的一个基本思想是把向量的线性组合看做矩阵与向量的积。
1. 矩阵方程定义
我们把向量方程的线性组合看成矩阵与向量的乘积,最主要的目的之一是能够利用矩阵的特性进行高效计算,对于矩阵与向量的乘积运算Ax有如下定义:
矩阵-向量乘积 Ax
若
A是
m×n矩阵(也可以用
Am×n)表示,它的各列为
a1,a2,…,an. 若
x是
Rn中的向量,则
A与
x的积(记为
Ax)就是
A的各列以
x中对应元素为权的线性组合,即
Ax=[a1a2…an]x1x2⋮xn=x1a1+x2a2+⋯+xnan定义
请看下面Ax的运算过程:
我们称形如Ax=b这样的方程为矩阵方程,其中A对应方程组中的系数矩阵,它和上一节的向量矩阵等价。而它们又和对应的线性方程组等价,有如下定理:
线性方程组的三种等价形式
若
A 是
m×n 矩阵,它的列为
a1,a2,…,an ,而
b 属于
Rm,则矩阵方程:
Ax=b 与向量方程:
x1a1+x2a2+⋯+xnan 有相同的解集。它又与增广矩阵为:
[a1a2…anb] 的线性方程组有相同的解集。
定理 3
这个定理的核心思想是:尽管线性方程组可以有不同的表示形式(矩阵方程、向量方程、增广矩阵),但它们本质上是等价的,因为它们都表示同一个解集。通过这些等价性,我们可以根据实际情况选择最方便的一种形式来求解或分析线性方程组。
2. 解的存在性
既然线性方程组可以有三种不同的表示形式,那么对于每一种表示形式,它们对于解的存在性的表述也是等价的,有如下定理:
线性方程组解的等价条件
对于一个特定的
m×n 矩阵
A,下面陈述要么都是真的,要么都是假的:
a. 对于
Rn 中的每个
b ,方程
Ax=b 有解。
b. 对于
Rn 中的每个
b 都是矩阵
A 的列向量的线性组合。
c. 矩阵
A 的列向量张(生)成
Rm 。
d. 矩阵
A 在每一行都有一个主元位置。
定理 4
下面我们通过两个示例来理解上面关于线性方程组解存在的几个等价条件。其中例1满足对任意 b∈R3,方程 Ax=b 有解;例2中的向量 b 需要满足一定条件,方程 Ax=b 才有解。 我们先对分别对两个矩阵方程对应的增广矩阵进行行化简:
上面两个示例中,
A 是一个
3×3 的系数矩阵(
m=3)。根据本章的
定理2可知,示例
1 对于任意
b∈R3 ,方程
Ax=b 都有解;示例 2 中,对于
b∈R3 ,它要满足
b3+3b1−21(b2+4b1)=0,方程
Ax=b 才有解。
根据矩阵-向量乘积的定义,方程 Ax=b 意味着我们在寻找一个向量 x,使得 b 可以表示为 A 的列向量的线性组合,即:b=x1a1+x2a2+⋯+xnan。在向量方程一节我们已经讨论过“线性方程组有解等价于向量 b 可表示为a1,a2,…,an的线性组合”,请参考向量方程和线性方程组的联系。
在示例 1 中,矩阵 A 张成的是 R3,三个向量不在同一个平面上。示例 2 中,矩阵 A 张成的是 R2,三个向量在同一个平面上,说明其中一个向量可以表示为另外两个向量线性组合。
观察示例 1 、示例 2 ,并结合 定理2来理解。
3. Ax 的计算方式
前面对于 Ax 的定义强调的是矩阵 A 的列向量a1,a2,…,an和向量x的元素x1,x2,…,xn的线性组合,它适合从整体上去理解矩阵向量乘法的概念。不过在实际计算中我们会使用行-向量规则,它强调的是具体的计算过程,即每一行的计算是如何进行的,这对于实际的计算和编程实现非常有用(特别是在处理大规模数据或者在分布式计算时)。
计算 Ax 的行-向量规则
对于矩阵
A 和向量
x的乘积
Ax,第
i 行的结果
(Ax)i 可以表示为:
(Ax)i=ai1x1+ai2x2+⋯+ainxn 其中,
aij 表示矩阵
A 的第
i 行第
j 列的元素,
xj是向量
x的第
j 个元素。
请观察下面使用行-向量规则来计算 Ax 的过程,其中A=2−1635−24−38,x=x1x2x3。
有一种比较特殊的矩阵,它的对角线上的元素为
1 ,其它位置上的元素为
0 ,这个矩阵称为
单位矩阵,用符号
I 表示。对任意
Rn 中的
x ,
Inx=x 。比如:
100010001rst=rst 4. 矩阵-向量积 Ax 的性质
矩阵乘法的线性特性
如果
A 是一个
m×n 矩阵,
u 和
v 是
Rn 中的向量,且
c 是一个标量,则:
a. A(u+v)=Au+Avb. A(cu)=c(Au) 定理 5
这两个性质共同构成了矩阵乘法的线性特性,使得矩阵能够描述线性变换。下面我们分别对这两个特性进行解释:
这个公式表明矩阵
A 对向量的加法是线性的。具体来说,当矩阵
A 作用在两个向量的和
u+v 上时,等同于矩阵
A 分别作用在每个向量
u 和
v 上,然后将结果相加。这个性质称为
分配律,它是线性变换的基本性质之一。
这个公式表明矩阵 A 对向量的标量乘法是线性的。具体来说,当矩阵 A 作用在一个被标量 c 放大的向量 cu 上时,等同于先将矩阵 A 作用在向量 u 上,然后再将结果放大 c 倍。这个性质称为同质性或齐次性。
Ax 的几何意义
在线性代数中,矩阵
A 和向量
x 相乘不仅仅是一个代数运算,它还具有重要的几何意义,我们会在
线性变换一节展开介绍。