Logo

线性无关集和基

1. 线性无关与线性相关

在第一章节中,我们介绍过向量的线性相关性的概念,但当时的范围局限于 Rn ~\mathbb{R^n}~空间。将其拓展到一般的向量空间后,可以得到更普遍的结论,具体如下定理所述:
 Rn ~\mathbb{R^n}~中,我们可以通过将向量组成矩阵的列(构建 A ~\mathbf{A}~矩阵),并利用求解齐次方程 Ax=0 ~\mathbf{A}\mathbf{x}=\mathbf{0}~来分析线性相关性。然而,在向量空间中,向量不一定是 n ~n~-元组,因此无法将这些向量构造成矩阵的列来求解 Ax=0 ~\mathbf{A}\mathbf{x}=\mathbf{0}~的线性方程组。例如在多项式空间 P ~\mathbb{P}~中,设:
p1(t)=1,p2(t)=t,p3(t)=4tp_1(t)=1,\quad p_2(t)=t,\quad p_3(t)=4-t
这里的每一个多项式也是一个向量,我们也可以用几何上的直线来表示它们:

开通会员解锁全部动画

这些由多项式构成的向量不再是 n ~n~-元组,我们也不能通过几何上的平行四边形图形来展示多项式加法,但这些多项式之间存在如下的代数关系:
p3=4p1p2p_3=4p_1-p_2
根据定理 4 可知,在多项式空间 P ~\mathbb{P}~中,向量集合{p1, p2, p3}\{p_1,~p_2,~p_3\}也是线性相关的。函数空间 C[0,2π] ~C[\,0, 2\pi\,]~中,三角函数 sint ~\sin\,t~ cost ~\cos\,t~也可以视为向量。由它们构成的向量集合{sint, cost}\{\sin\,t,~\cos\,t\}是线性无关的,因为不存在一组非零常数 a ~a~ b ~b~使得 asint+bcost=0 ~a\cdot\sin\,t+b\cdot \cos\,t=0~对所有 t[0,2π] ~t\in [0, 2\pi]~成立。这表明在该函数空间中, sint ~\sin\,t~ cost ~\cos\,t~不能通过任何常数倍的关系来互相表示。

开通会员解锁全部动画

对于向量集合{sint, costsint}\{\sin\, t,~\cos\,t\sin\,t\}是线性相关的,因为这两个向量满足sin2t2sintcost=0\sin\,2t - 2\sin\,t\cos\,t=0

开通会员解锁全部动画

2. 基的定义与性质

在描述向量空间的结构时,我们会选择一组适当的向量,使得这些向量的线性组合可以表示向量空间中的所有向量。这样的向量组被称为向量空间的“基”。基的存在为向量空间赋予了结构,使得我们可以通过基向量的线性组合来唯一表示空间内的任何向量。下面是基的完整定义:

基的定义既适用于整个向量空间 V ~V~,也适用于 V ~V~的子空间 H ~H~。如果 H=V ~H=V~,则 V ~V~的基是一个线性无关且能够生成 V ~V~的集合。而当 HV ~H\neq V~ HV ~H\subsetneq V~)时,作为 H ~H~的基的集合中的向量必须全部属于 H ~H~(条件 ii ~ii~),从而确保 SpanB=H ~\text{Span}\,\mathcal{B}=H~

开通会员解锁全部动画

对于 n×n ~n\times n~的可逆矩阵 A ~\mathbf{A}~,根据可逆矩阵定理,它的列向量是线性无关的,并且这些列向量能够张成整个 Rn ~\mathbb{R^n}~空间。那么,矩阵 A ~\mathbf{A}~的列向量集合满足构成 Rn ~\mathbb{R^n}~的基的连个条件:线性无关性和生成整个空间。因此,矩阵 A ~\mathbf{A}~的列向量构成了 Rn ~\mathbb{R^n}~的一组基。

3. 标准基

3.1  Rn ~\mathbb{R^n}~中的标准基

标准基 (standard basis) ~(\mathbf{standard~basis})~是向量空间中有一组特别简单且常用的基。在基础线性代数中,我们主要在 Rn ~\mathbb{R^n}~空间中进行讨论,下面对标准基在 Rn ~\mathbb{R^n}~空间中的定义:
标准基的特性在于,它能够在 Rn ~\mathbb{R^n}~中唯一表示任何向量。例如,任意向量[a1,a2,,an]T\begin{bmatrix} a_1, a_2, \dots, a_n \end{bmatrix}^T可以写成标准基的线性组合形式
a1e1+a2e2++anena_1 \mathbf{e}_1 + a_2 \mathbf{e}_2 + \cdots + a_n \mathbf{e}_n
其中 ei ~\mathbf{e}_i~是标准基向量, ai ~a_i~是对应的分量系数。这种表示方式不仅简洁,还使得运算更加直观。通过标准基,向量空间中的每个向量都可以直接分解为各个分量的线性组合,从而提供了一个自然的坐标系。

3.2 多项式空间 Pn ~\mathbb{P}_n~中的标准基

在多项式空间 Pn ~\mathbb{P}_n~中,标准基通常是不同次幂的多项式。例如,在次数不超过 n ~n~的多项式空间 Pn ~\mathbb{P}_n~中,标准基为{1,x,x2,,xn}\{ 1, x, x^2, \dots, x^n \}。任何多项式 p(x) ~p(x)~都可以表示为这些基的线性组合:
p(x)=a01+a1x+a2x2++anxnp(x) = a_0 \cdot 1 + a_1 \cdot x + a_2 \cdot x^2 + \dots + a_n \cdot x^n
下面演示由多项式空间 P3 ~\mathbb{P}_3~的标准基线性组合其它多项式的过程:

开通会员解锁全部动画

4. 生成集定理

在实际应用中,我们经常会遇到高维向量空间,其中可能包含大量冗余向量(特征)。这些冗余不仅浪费计算资源,还可能影响最终结果的准确性。通过去除冗余信息,可以优化向量空间,从而得到一个最小生成集(基)。下面的生成集定理为我们提供了一个可以用来识别和去除这些冗余向量的理论工具。
这个定理主要用来去除向量空间中的冗余,得到最小生成集。例如,下面三个向量:
v1=[021],v2=[220],v3=[6165]\mathbf{v}_1 = \begin{bmatrix} 0 \\ 2 \\ -1 \end{bmatrix}, \quad \mathbf{v}_2 = \begin{bmatrix} 2 \\ 2 \\ 0 \end{bmatrix}, \quad \mathbf{v}_3 = \begin{bmatrix} 6 \\ 16 \\ -5 \end{bmatrix}
这三个向量张成的空间为H=Span{v1,v2,v3}H=\text{Span}\,\{\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3\}。由于向量 v3 ~\mathbf{v}_3~可以由向量空间中的另两个向量 v1,v2 ~\mathbf{v}_1,\mathbf{v}_2~来表示,即:v3=5v1+3v2\mathbf{v}_3=5\mathbf{v}_1+3\mathbf{v}_2。因此 v3 ~\mathbf{v}_3~是冗余的,那么Span{v1,v2,v3}=Span{v1,v2}\text{Span}\,\{\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3\} = \text{Span}\,\{\mathbf{v}_1,\mathbf{v}_2\}。从几何角度来看,这三个向量处在 R3 ~\mathbb{R^3}~空间中的一个平面(子空间 H ~H~)上,这三个向量中的任意两个就可以确定这个平面。下面是 v1,v2,v3 ~\mathbf{v}_1,\mathbf{v}_2,\mathbf{v}_3~ R3 ~\mathbb{R^3}~空间中的位置关系:

5.  Nul A,Col A ~\text{Nul}~\mathbf{A},\text{Col}~\mathbf{A}~ Row A ~\text{Row}~\mathbf{A}~的基

确定向量空间中的基的思路是从给定的生成集出发,逐步移除不必要的向量,直到只剩下一个最小的生成集,即基。在这一过程中,要确保得到的基是线性无关的,且生成了向量空间 H ~H~

5.1  Null A ~\text{Null}~\mathbf{A}~的基

零空间 NulA ~\text{Nul}\,\mathbf{A}~是由满足 Ax=0 ~\mathbf{A}\mathbf{x}=\mathbf{0}~的所有向量 x ~\mathbf{x}~组成的。寻找 NulA ~\text{Nul}\,\mathbf{A}~的基的思路就是:(1) (1)~先通过将矩阵 A ~\mathbf{A}~化为行简化阶梯形 (RREF) ~(\mathbf{RREF})~来确定自由变量; (2) ~(2)~利用自由变量构造出零空间 NulA ~\text{Nul}\,\mathbf{A}~中线性无关的非零向量; (3) ~(3)~这些非零向量就构成了零空间 NulA ~\text{Nul}\,\mathbf{A}~的基,并生成整个 NulA ~\text{Nul}\,\mathbf{A}~

开通会员解锁全部动画

上面示例中,齐次方程 Ax=0 ~\mathbf{A}\mathbf{x}=\mathbf{0}~的解可表示为自由变量 x2,x4,x5 ~x_2,x_4,x_5~的线性组合x=x2u+x4v+x5w\mathbf{x}=x_2\mathbf{u}+x_4\mathbf{v}+x_5\mathbf{w}。通过分别设定每个自由变量为 1 ~1~,就可以得到零空间 NulA ~\text{Nul}\,\mathbf{A}~的三个特解向量 u,v,w ~\mathbf{u},\mathbf{v},\mathbf{w}~,这些向量构成了零空间 NulA ~\text{Nul}\,\mathbf{A}~的基:{u,v,w}\{\mathbf{u},\mathbf{v},\mathbf{w}\}

5.2  Col A ~\text{Col}~\mathbf{A}~的基

对于一个简化阶梯形矩阵 B ~\mathbf{B}~来说,每个非主元列是主元列的线性组合,请看下面的示例:

开通会员解锁全部动画

根据生成集定理,我们可以去掉非主元列 b2,b4 ~\mathbf{b}_2,\mathbf{b}_4~,得到 ColB ~\text{Col}\,\mathbf{B}~的基 {b1,b3,b5} ~\{\mathbf{b}_1,\mathbf{b}_3,\mathbf{b}_5\}~。对于一个非简化阶梯型矩阵 A ~\mathbf{A}~,它的列与对应的简化阶梯型矩阵的列具有相同的线性相关关系,请看下面示例( A ~\mathbf{A}~跟前面的矩阵 B ~\mathbf{B}~是行等价的):

开通会员解锁全部动画

对于确定列空间 ColA ~\text{Col}\,\mathbf{A}~的基有如下定理:

这里有一点需要注意,虽然行变换不会改变列之间的线性关系,但是行化简会改变一个矩阵的列空间。因此不能使用行化简后的阶梯型矩阵的列来表示原矩阵的列空间。拿上面两个示例来说,矩阵 A ~\mathbf{A}~的列空间的基是 {a1,a3,a5} ~\{\mathbf{a}_1,\mathbf{a}_3,\mathbf{a}_5\}~,而不是化简为最简阶梯型矩阵 B ~\mathbf{B}~之后的主元列 {b1,b3,b5} ~\{\mathbf{b}_1,\mathbf{b}_3,\mathbf{b}_5\}~,它们各自张成的列空间是不相同的,即:Span{a1,a3,a5}Span{b1,b3,b5}\text{Span}\{\mathbf{a}_1,\mathbf{a}_3,\mathbf{a}_5\} \neq \text{Span}\{\mathbf{b}_1,\mathbf{b}_3,\mathbf{b}_5\}

5.3  Row A ~\text{Row}~\mathbf{A}~的基

行化简不会改变一个矩阵的行空间,有如下定理:

  1. 行等价与线性组合
    • 如果 B ~\mathbf{B}~ A ~\mathbf{A}~通过行变换得到,则 B ~\mathbf{B}~的每一行都是 A ~\mathbf{A}~的行的线性组合。

    • 因此, B ~\mathbf{B}~的行空间是 A ~\mathbf{A}~的行空间的子集。

  2. 行变换的可逆性

    • 行变换是可逆的,因此 A ~\mathbf{A}~的每一行也可以表示为 B ~\mathbf{B}~的行的线性组合。

    • 这说明 A ~\mathbf{A}~的行空间是 B ~\mathbf{B}~的行空间的子集。

  3. 行空间相等
    • 根据上述两点, A ~\mathbf{A}~ B ~\mathbf{B}~的行空间互为子集,因此它们的行空间相同。

  4. 阶梯形矩阵 B ~\mathbf{B}~的性质
    • 如果 B ~\mathbf{B}~是阶梯形矩阵,其非零行是线性无关的(因为没有非零行是位于其下方非零行的线性组合)。

    • 因此, B ~\mathbf{B}~的非零行是 B ~\mathbf{B}~行空间的一个基。

  5. 非零行构成基
    •  A ~\mathbf{A}~ B ~\mathbf{B}~的行空间相同,而 B ~\mathbf{B}~的非零行是 B ~\mathbf{B}~的行空间的基。

    • 所以, B ~\mathbf{B}~的非零行也是 A ~\mathbf{A}~的行空间的基。

请看下面的示例,求矩阵 A ~\mathbf{A}~和矩阵 B ~\mathbf{B}~行空间的基, 其中矩阵 A ~\mathbf{A}~行等价于矩阵 B ~\mathbf{B}~

开通会员解锁全部动画

根据定理 7 ~7~ RowB ~\text{Row}\,\mathbf{B}~的基为 B ~\mathbf{B}~的前三行 {rb1,rb2,rb3} ~\{\mathbf{rb}_1,\mathbf{rb}_2,\mathbf{rb}_3\}~ RowA ~\text{Row}\,\mathbf{A}~的基为 A ~\mathbf{A}~的前三行 {ra1,ra2,ra3} ~\{\mathbf{ra}_1,\mathbf{ra}_2,\mathbf{ra}_3\}~,它们张成的空间是相同的,即:Span{ra1,ra2,ra3}=Span{rb1,rb2,rb3}\text{Span}\{\mathbf{ra}_1,\mathbf{ra}_2,\mathbf{ra}_3\}=\text{Span}\{\mathbf{rb}_1,\mathbf{rb}_2,\mathbf{rb}_3\}