零空间、列空间、行空间和线性变换
这部分内容探讨零空间、列空间和行空间及其与线性变换的关系。零空间帮助识别线性方程的解,列空间反映了矩阵的映射范围,而行空间揭示了方程间的关系。
在线性代数的应用中, Rn 的子空间产生的方式通常有两种:
(1) 方程解的集合:作为齐次线性方程组的所有解的集合,这种子空间通常称为零空间。
(2) 线性组合的集合:作为一组特定向量的所有线性组合的集合,这种子空间称为列空间或行空间。
接下来我们将介绍并使用这些新的术语重新讨论之前学过的内容,以更清晰地理解子空间的性质。
1. 零空间 NulA
1.1 零空间的定义
在线性代数中,零空间是我们重新理解齐次线性方程组解的结构和性质的一个核心概念。我们来看下面这个齐次方程组:
x1−3x2−2x3−5x1+9x2+x3=0=0 它可以用矩阵方程
Ax=0 来表示,其中
A=[1−5−39−21] 我们称满足方程
Ax=0 的所有
x 的集合(解集)为矩阵
A 的零空间。严格的定义如下:
定义
零空间
一个
m×n 矩阵
A 的零空间
(null space) ,记作
NulA ,是齐次方程
Ax=0 的所有解的集合。用集合表示法,可以写作:
NulA={x∣x∈Rn 且 Ax=0} 1.2 判定向量是否属于零空间
我们判断一个向量是否属于矩阵
A 的零空间,只需要判断该向量是否为齐次方程
Ax=0 的解即可。例如,判断向量
u 是否存在于矩阵
A 的零空间,只需要判断
Au=0 是否成立即可。经计算:
Au=[1−5−39−21]53−2=[5−9+4−25+27−2]=[00] 所以,
u 存在于矩阵
A 的零空间内,即:
u∈NullA 。我们可以对矩阵
A 进行行化简并得到齐次方程组的解集
x=tv, 其中, v=[21−231]T,所以零空间是向量
v 的所有线性组合,可以用
Span{v} 表示,几何上可以表示为
R3 中一条经过原点的直线。
1.3 零空间性质
零空间是一个向量的集合,集合中的向量必要符合矩阵乘法 Ax 的定义,即: Am×nxn×1=0 。有如下定理:
定理 2
零空间的性质
一个
m×n 矩阵
A 的零空间是
Rn 的一个子空间。等价地,
m 个方程、
n 个未知数的齐次线性方程组
Ax=0 的所有解的集合是
Rn 的一个子空间。
这个定理在验证特定条件下的向量集合是否为子空间时非常有用。在实际问题中,我们通常会得到来自系统(工程、物理和计算机科学等领域)中不同变量之间的约束或平衡关系构成的条件方程,例如下面的条件方程:
a−2b+5c=d 和
c−a=b 。满足此方程的所有向量
(a,b,c,d) 构成的集合
H 是
R4 的一个子空间。这是因为上面的条件方程可以写成如下的齐次方程组:
a−2b+5c−d−a−b+c=0=0 这是一个包含
2 个方程、
4 个未知数的齐次方程组,根据定理
2 可知它的解集
H 是
R4 的子空间。
1.4 NulA 的显示表示
上面对零空间的定义并不是显而易见的,在 NulA 中的向量与矩阵 A 中的元素没有明显的直接关系,我们称 NulA 是被隐式定义的。隐式定义虽然简洁,但缺乏对集合结构的直观描述,难以直接进行计算和分析。在实际应用中通常会将隐式定义转换为显式表示。为此,我们可以通过求解矩阵方程 Ax=0 的解集来获得显式表示。请观察下面求解 Ax=0 的过程:
将通解中的自由变量提取,并表示为一组向量的线性组合,这些向量 {u,v,w} 就构成了 NulA 的一个生成集合。上面的示例展示了如何构建 NulA 的生成集合,并可以得出以下两个关键性质:
(1) 线性无关:生成集合中的向量是线性无关的,因为自由变量作为生成向量的权重,只有当所有权重(即自由变量)均为零时,整个组合结果才为零。
(2) 生成集合的维数:当 NulA 包含非零向量时,生成集合的向量个数等于自由变量的数量,即方程 Ax=0 中的自由变量的数量。
2. 列空间 ColA
列空间 (Column Space) 提供了矩阵 A 的列向量所能覆盖的所有向量集合的范围,常用于研究矩阵的映射范围、线性独立性以及其他与线性变换相关的性质。与零空间不同,列空间是通过线性组合显式定义:
定义
列空间
列空间
ColA 是一个
m×n 矩阵
A 的列向量的线性组合的集合。具体来说,如果矩阵
A 的列向量是
a1,a2,…,an ,那么列空间定义为:
ColA=Span{a1,…,an} 也就是说,列空间是由矩阵
A 的列向量所张成的所有线性组合的集合。
因为
Span{a1,…,an}是一个子空间,根据上一节的
定理 1可以得出列空间是定义在
Rm 中的子空间,因为
A 的列向量位于
Rm 中。
有如下定理:
定理 3
矩阵的列空间
一个
m×n 矩阵
A 的列空间是
Rm 的一个子空间。
由于 Ax 表示矩阵 A 的列向量的线性组合,所以在列空间 ColA 中的向量可以表示为 Ax 的形式,其中 x 是某个来自 Rn 的向量。
那么,列空间有如下等价定义:
ColA={b:b=Ax , x∈Rn} 在实际应用中,构造一个矩阵使其列空间等于给定的向量空间的情况是很常见的需求。例如我们前面介绍过的
透视投影矩阵 P ,它的列空间被定义为所有能够通过矩阵
P 作用后生成的向量集合,也就是在透视投影下所有可以投影到二维平面上的点。从这个角度来看,矩阵
A 的列空间
ColA 也是线性变换
x↦Ax 的
值域 (Range) 。
3. 行空间 RowA
对于一个 m×n 的矩阵 A ,每一行都可以视为 Rn 中的一个向量。矩阵 A 的所有行向量的线性组合的集合被称为 A 的行空间 (Row Space) ,记作 RowA 。因为每一行都有 n 个元素,行空间 RowA 是 Rn 的一个子空间。此外,矩阵 A 的行向量与转置矩阵 AT 的列向量相同,因此行空间 RowA 可以表示为 ColAT 。
4. 对比 NulA 和 ColA
零空间和列空间代表了矩阵的不同几何属性。列空间 ColA 包含矩阵 A 的所有列向量的线性组合,描述了 A 能够映射到的输出空间;而零空间 NulA 包含了被 A 映射到零向量的所有输入向量,即 Ax=0 的所有解。例如下面的矩阵 A 它的列空间 ColA 是 R3 的一个子空间,而零空间是 R4 的子空间:
接下来,我们可以从零空间和列空间的结构入手,进一步探讨它们在实际应用中的不同处理方法。在线性代数中,寻找 NulA 或 ColA 中的非零向量和判断一个向量是否属于 NulA 或 ColA 是线性代数中非常常见的两个问题。下面我们分别针对零空间和列空间来讨论这两个问题。
4.1 寻找 NulA 和 ColA 中的非零向量
寻找
NulA 中的向量,就是求解齐次方程
Ax=0中的
x ,这需要对
[A0]做行变换,以上面的矩阵
A 为例,
行变换过程如下:
上面的示例,零空间 NulA 中有非零向量,这意味着矩阵 A 存在线性依赖关系,即方程组有无穷多解。寻找列空间 ColA 中的向量比较容易,它就是由矩阵 A 的列向量线性组合得到的,即 ColA 中的向量可以由b=x1a1+x2a2+⋯+xnan表示。
4.2 判断 v 是否存在于 NulA 和 ColA 中
判断 v∈NulA 很简单。根据对 NulA 的定义,若 Au=0 成立,那么 v∈NulA 。判断 v∈ColA 是否成立,就要尝试能否找到 A 中列向量的一种组合方式,使得 v=x1a1+x2a2+⋯+xnan 成立,这其实是在判断矩阵方程 Ax=v 中是否有解,这个过程也可以通过对[Av]进行行化简确定。
上面的增广矩阵的最右列不是主元列,所以根据
线性方程组的存在性定理可知,方程组
Ax=v 有解,那么
v∈ColA 成立。
4.3 整体对比 NulA 和 ColA
表 4-1 m×n 矩阵 A 的NulA 和ColA 的对比
| NulA | ColA |
|---|
1 | NulA 是 Rn 的子空间。 | ColA 是 Rm 的子空间。 |
2 | NulA 是 隐式定义的。 | ColA 是 显式定义的。 |
3 | 求NulA 中的向量,需要对[A0]做行变换。 | ColA 中的向量可由 A 的列组合出来。 |
4 | NulA 与 A 中元素之间没有明显关系。 | A 中的列是ColA 中的向量。 |
5 | NulA 中的任意向量 v ,满足 Av=0 。 | ColA 中的向量 v 满足方程 Ax=v 相容。 |
6 | 判断 v∈NulA 是否成立,只需计算 Av 。 | 判断 v∈ColA 是否成立,需对[Av]做行变换。 |
7 | NulA={0}当且仅当 Ax=0 仅有一个 平凡解。 | ColA=Rm当且仅当Ax=b对任意b∈Rm有解。 |
8 | NulA=Rn当且仅当x↦Ax是一对一的。 | ColA=Rm当且仅当x↦Ax将 Rn 映射到 Rm 上。 |
前面我们学习了零空间和列空间,它们都是通过矩阵定义的子空间。 现在我们将视角从矩阵提升到更一般的线性变换, 这是一个能够统一描述各种"保持线性结构"的映射的核心概念。
线性变换 T 有两个重要的关联子空间:核 ( kernel ) ,也称为零空间,是 V 中所有满足 T(u)=0 的向量集合;值域 ( range ) ,是 W 中所有形如 T(x) 的向量集合。当线性变换是矩阵变换 T(x)=Ax 时, 核就是矩阵 A 的零空间 NulA ,值域就是列空间 ColA 。
线性变换的概念不仅适用于矩阵,还能推广到函数空间。在微积分中,求导运算本身就是一个线性变换。这个视角将微分方程的求解问题 纳入了线性代数的统一框架。
例9(需要微积分基础):设
V 是区间
[a,b] 上所有可微函数的集合,
W 是
[a,b] 上所有连续函数的集合。 定义变换
D:V→W 为求导运算,即
D(f)=f′ 。 证明
D 是线性变换,并确定其核与值域。
明确向量空间设
V 是区间
[a,b] 上所有可微函数的集合(且导数连续),
W 是
[a,b] 上所有连续函数的集合
C[a,b] 。 定义变换
D:V→W 为求导运算:
D(f)=f′ 。
验证加法保持性对于
V 中任意两个函数
f 和
g ,根据求导的和法则:
D(f+g)=(f+g)′=f′+g′=D(f)+D(g) 这说明
D 保持向量加法运算。
验证标量乘法保持性对于
V 中任意函数
f 和任意标量
c ,根据求导的常数倍法则:
D(cf)=(cf)′=c⋅f′=cD(f) 这说明
D 保持标量乘法运算。
确定核(零空间) D 的核是所有满足
D(f)=0 的函数,即
f′=0 。 根据微积分基本定理,导数恒为零的函数必为常数函数。因此:
ker(D)={f∈V∣f(x)=c,c∈R} 核是
[a,b] 上所有常数函数的集合。
确定值域 D 的值域是所有形如
D(f)=f′ 的函数集合。 由于
V 中的函数可微且导数连续,其导数
f′ 是
[a,b] 上的连续函数。 反过来,对于
W 中任意连续函数
g ,根据微积分基本定理,
F(x)=∫axg(t)dt 是
g 的一个原函数,且
F′=g 。 因此:
range(D)=W=C[a,b] 值域是
[a,b] 上所有连续函数的集合。
例10(需要微积分基础):微分方程
y′′+ω2y=0 描述了弹簧振动、钟摆运动等物理系统。证明该微分方程的解集是某个线性变换的核。
理解微分方程的物理背景微分方程
y′′+ω2y=0 描述了多种物理系统的振动行为: 弹簧的简谐振动、钟摆的小角度摆动、LC电路中的电压振荡等。 其中
ω 是角频率常数。
定义线性变换设
V 是所有二阶可微函数的集合,
W 是所有连续函数的集合。 定义变换
T:V→W 为:
T(f)=f′′+ω2f 这个变换将函数
f 映射到
f′′+ω2f 。
验证 T 是线性变换对于任意函数
f,g∈V 和标量
c :
T(f+g)=(f+g)′′+ω2(f+g)=f′′+g′′+ω2f+ω2g=(f′′+ω2f)+(g′′+ω2g)=T(f)+T(g) T(cf)=(cf)′′+ω2(cf)=cf′′+cω2f=c(f′′+ω2f)=cT(f) 因此
T 满足线性变换的两个条件。
微分方程的解是 T 的核微分方程
y′′+ω2y=0 的解集正是
T 的核:
ker(T)={f∈V∣T(f)=0}={f∣f′′+ω2f=0} 这意味着
求解微分方程等价于找出线性变换的核。
求解核(微分方程的通解)该微分方程的特征方程为
r2+ω2=0 ,解得
r=±iω 。 因此通解为:
y=c1cos(ωt)+c2sin(ωt) 其中
c1,c2 是任意常数。这说明
T 的核是由
cos(ωt) 和
sin(ωt) 张成的二维向量空间。
线性变换在金融领域也有重要应用。在股票技术分析中,移动平均 ( moving average ) 是一种常用的指标, 它通过平滑价格波动来揭示整体趋势。移动平均本质上也是一个线性变换。
例11:设
{pk} 表示某只股票在第
k 天的价格序列。 定义两日移动平均变换
M2 为:
M2({pk})={2pk+pk−1} 证明
M2 是线性变换,并求其核。
理解信号空间设
S 是所有离散信号
{pk} 的集合, 其中
pk 表示第
k 天的股票价格。 假设在研究时间段之外
pk=0 。 两日移动平均变换
M2:S→S 定义为:
M2({pk})={2pk+pk−1} 验证加法保持性对于
S 中任意两个信号
{pk} 和
{qk} :
M2({pk}+{qk})=M2({pk+qk})={2(pk+qk)+(pk−1+qk−1)}={2pk+pk−1}+{2qk+qk−1}=M2({pk})+M2({qk}) 验证标量乘法保持性对于任意信号
{pk} 和标量
c :
M2(c{pk})=M2({cpk})={2cpk+cpk−1}=c{2pk+pk−1}=cM2({pk}) 因此
M2 是线性变换。
求核的条件信号
{pk} 在
M2 的核中,当且仅当对所有
k :
2pk+pk−1=0⇒pk=−pk−1 这意味着相邻两项互为相反数。
推导核的形式由
pk=−pk−1 递推可得:
pk=−pk−1=(−1)2pk−2=(−1)3pk−3=⋯=p0⋅(−1)k 因此核中的任意信号都可以写成:
{pk}=p0⋅{(−1)k} 即
交替信号 {(−1)k}={…,1,−1,1,−1,…} 的标量倍。
核的物理意义核由所有交替信号的倍数组成。这说明两日移动平均能够完全消除日间的交替波动(如每日涨跌交替的噪声),同时保留整体趋势。 这正是移动平均在技术分析中的核心作用:平滑短期波动,揭示长期趋势。