正交集
正交集在线性代数中的作用在于简化计算。正交集天然线性无关,可作为基,使坐标计算更简单。
1. 正交集的定义与性质
如果一个向量集合
{u1,u2,…,up}在欧几里得空间
Rn 中满足:任意两个不同的向量
ui,uj 都是正交的,即:
ui⋅uj=0,∀i=j 那么,这个向量集合称为
正交集 (Orthogonal Set)。请观察下面三维场景中的向量:
这个三维场景中的三个向量如下:
u1=311,u2=−121,u3=−1/2−27/2(1) 它们中任意两个向量的点积都为
0 (相互垂直),因此
{u1,u2,u3}是一个
正交集。正交集有一个良好的性质,那就是它其中的向量之间线性无关,这一特性使得正交集在构造基
(basis) 时极具优势。下面的定理正式描述了这一性质:
定理 4
正交集的线性无关性
如果
S={u1,⋯,up} 是
Rn 中一个由非零向量组成的正交集,那么
S 是线性无关的,因此它可以作为其张成子空间的一组基。
假设:存在一组标量
c1,c2,…,cp,使得:
0=c1u1+c2u2+⋯+cpup 两边同时与
u1 取内积
0⋅u1=(c1u1+c2u2+⋯+cpup)⋅u1 利用内积的线性性展开 对上式展开得:
(c1u1)⋅u1+(c2u2)⋅u1+⋯+(cpup)⋅u1=0 利用正交集的性质,由于
S 是正交集,
ui⋅u1=0当
i=1,因此上式中所有非零项都消失,只剩下:
c1(u1⋅u1)=0 由于
u1=0,则
u1⋅u1>0,因此
对
u2,u3,…,up 依次重复相同操作 类似地,对
u2,u3,…,up进行相同的计算,我们可以得到:
c2=c3=⋯=cp=0
结论:所有系数
ci=0 说明集合
S 线性无关。
2. 正交基
在证明了正交集的线性无关性后,我们可以利用这一性质来构造子空间的基。如果一个向量集合既是某个子空间的基,又是正交集,那这组向量集合可被称作正交基 (Orthogonal Basis) ,有如下定义:
定义
正交基
正交基指的是
Rn 的某个子空间
W 的一组基,并且这组基同时是一个正交集。
正交基不仅能够简化线性组合的计算,还可以直接计算向量在该基下的坐标,而不需要解方程组。下面的定理给出了正交基下的坐标计算公式:
定理 5
正交基下的坐标计算
设
{u1,…,up}是
Rn中某个子空间
W的正交基,对于
W中的任意向量
y,它可以表示为:
y=c1u1+c2u2+⋯+cpup 其中,每个权重
cj的计算公式为:
cj=uj⋅ujy⋅uj,j=1,…,p 假设:存在一组标量
c1,c2,…,cp,使得:
0=c1u1+c2u2+⋯+cpup 由
y的线性组合:
y=c1u1+c2u2+⋯+cpup 两边与
u1取点积:
y⋅u1=(c1u1+c2u2+⋯+cpup)⋅u1 利用正交性质,根据内积的线性性:
y⋅u1=c1(u1⋅u1)+c2(u2⋅u1)+⋯+cp(up⋅u1) 由于
{u1,…,up}是正交集,当
i=j时
ui⋅uj=0,所以上式简化为:
y⋅u1=c1(u1⋅u1) 求解
c1:
c1=u1⋅u1y⋅u1 推广到所有
j对
j=2,…,p 进行相同运算,可得:
cj=uj⋅ujy⋅uj,j=1,…,p
现在,我们可以十分方便地利用正交基表示子空间
W 内的任意向量。
(1) 式中的向量集合
{u1,u2,u3} 组成了
R3 的一组正交基。我们可以利用定理
5 来计算向量
y=[61−8]T 在这组正交基下的坐标,即找到系数
c1,c2,c3 ,使得
y 能够表示为正交基向量的线性组合:
y=c1u1+c2u2+c3u3 计算内积。根据定理
5 ,系数
cj 由以下公式给出:
cj=uj⋅ujy⋅uj 分别计算点积:
y⋅u1u1⋅u1=11,=11,y⋅u2u2⋅u2=−12,=6,y⋅u3u3⋅u3=−33=33/2 计算权重系数:
c1=1111=1,c2=6−12=−2,c3=33/2−33=−2 组合得到向量:
y=u1−2u2−2u3
这说明 y 在正交基 U={u1,u2,u3} 下的坐标为:yu=[1−2−2]T。下面的三维场景可视化地展示了这一线性组合关系:
3. 正交投影
定理
5 还可以从几何角度来做出解释,这需要借助
正交投影 (orthogonal projection) 的概念。对
Rn 空间中的任意向量
y 以及
Rn 中的一个非零向量
u ,我们尝试对向量
y 进行分解:一个向量指向
u 的方向,另一个与
u 正交的向量:
y=y^+z(1) 如图所示,
y^ 就是
y 在
u 方向上的
正交投影,所以我们可以设
y^=αu 。接下来我们只要求出这个系数
α 的表达式,就可以很方便的求出
y^ 。因为
z=y−y^ 与
u 正交,所以它们的点积为
0 :
⇒⇒(y−y^)⋅u(y−αu)⋅uα=u⋅uy⋅u=0=0 现在,我们就得到了计算投影向量
y^ 的表达式:
y^=projLy=u⋅uy⋅uu(2) 不难发现,投影向量
y^ 跟
u 的长度(范数)没有关系,它只跟
u 的方向有关。下面是一个根据公式
(2) 计算向量
y 在向量
u 方向的投影的示例:
观察上图可以发现,在向量
u 的方向上,
y^点是离向量 y 最近的点,它们之间的距离为
∥y−y^∥=(−1)2+22=5 。
4. 定理 5 的几何解释
现在,我们就可以利用正交投影的概念来解释定理
5 的几何意义了。在定理
5 中,向量
y 在正交基下分解出的分量的系数
cj=uj⋅ujy⋅u和
y 投影到
u 方向的向量
y^ 的表达式系数
α 是相同的。在
R2 中,根据定理
5 ,向量
y 可分解为:
y=u1⋅u1y⋅u1u1+u2⋅u2y⋅u2u2 从几何角度来解释,向量
y 可(正交)分解为沿正交向量
u1 的投影向量
y1^ 与沿正交向量
u2 的投影向量
y1^ 之和:
y=y1^+y2^。
4. 在物理学中的应用
在物理学和工程力学中,力是一个矢量,可表示为向量 F ,目标方向用另一个向量 u 来表示。在许多实际问题中,施加的力 F 并不完全沿着目标方向 u ,例如在拖车牵引汽车的过程中,牵引力的方向( F 的方向)可能与汽车的实际运动方向( u 的方向)不完全一致。这时,我们可以利用正交投影的概念,将力 F 分解为两个分量:一个沿着拖车方向的分量 F^ 和一个垂直(正交)于拖车方向的分量 F−F^ 。
假设拖车施加的牵引力
F 以及拖车方向
u 如下:
F=[1.00.8] kN,u=[41] 计算力在拖车方向上的正交投影:
F^=u⋅uF⋅uu=[1.1290.282] kN 投影方向上的力的大小(即
F^ 的模长)为:
∥F^∥=1.1292+0.2822≈1.164 kN。这个力便是拖车施加于小汽车在运动方向上的力。
5. 标准正交集与标准正交基
如果一组向量 {u1,u2,⋯,up} 既两两正交,又都是单位向量(长度为 1 ),那么这组向量被称标准正交集 (Orthonormal Sets) 。如果该集合的向量数量等于空间 W 的维度,则它构成空间 W 的标准正交基 (Orthonormal Basis) 。标准正交基通常被用作最优基,它可以进一步以提升运算效率和精度。
上面三维场景中的三个向量如下:
v1=3/111/111/11,v2=−1/62/61/6,v3=−1/66−4/667/66 其中任意两个向量正交,验证其中一组点积
v1⋅v2 :
v1⋅v2=(3/11⋅−1/6)+(1/11⋅2/6)+(1/11⋅1/6)=0 每个向量的长度(范数)也为
1 ,验证
v1 :
∥v1∥2=(3/11)2+(1/11)2+(1/11)2=1 v1,v2,v3 互相正交且长度为
1 ,因此它们是标准正交集。由于它们是线性无关的,并且有
3 个向量张成
R3 ,因此它们可作为
R3 的标准正交基。
6. 列正交矩阵及其性质
标准正交集可以作为向量空间的理想基底,简化计算并优化投影操作。在实际计算中,我们通常将这些基向量组织成矩阵形式,由标准正交集的向量作为列向量构成的矩阵,被称为列正交矩阵(或具有标准正交列向量的矩阵)。它有一个关键的性质,可由以下定理给出:
定理 6
标准正交列矩阵的性质
一个
m×n 矩阵
U 的列向量是标准正交的充要条件是:
UTU=I,其中
I 是
n×n 单位矩阵。
为了简化记号,我们假设
U 只有三列,每列都是
Rm 中的向量,即:
U=[u1u2u3] 计算
UTU:
UTU=u1Tu1u2Tu1u3Tu1u1Tu2u2Tu2u3Tu2u1Tu3u2Tu3u3Tu3 由于
U 的列向量是标准正交的,因此:
若 i=j ,则 uiTuj=0 (正交性)。
若 i=j ,则 uiTui=1 (单位长度)。
因此,矩阵
UTU 具有单位矩阵的形式,证明成立。
利用定理 6 的结论,我们能够简化正交性验证、优化线性方程求解、提高数值计算的稳定性,因此它广泛应用于最小二乘法、数据降维、计算机图形学和机器学习等场景。进一步地,下面的定理 7 详细揭示了列正交矩阵在变换过程中如何保持向量的几何特性,包括长度、内积和正交性,这些性质在各种变换和数据处理过程中至关重要。
下面通过一个例题来直观展示定理
7 的应用。给定一个列正交矩阵
U 和一个向量
x :
U=1/21/202/3−2/31/3,x=[23] 验证矩阵变换
x↦Ux 不会改变向量
x 的长度。
Ux=1/21/202/3−2/31/3[23]=3−11 ∥Ux∥∥x∥=32+(−1)2+12=9+1+1=11=(2)2+32=2+9=11 如果列正交矩阵是一个
方阵 (n×n) ,那么它就是一个
正交矩阵 (Orthogonal Matrix) 。它不仅满足所有列正交矩阵的性质,还具有两个独特的性质:
行、列向量都是正交、归一的;
其逆矩阵等于其转置矩阵,即:
Q−1=QT 。例如,我们常用的旋转矩阵就是一个典型的正交矩阵:
Q=[cosθsinθ−sinθcosθ] 从几何角度来看,正交矩阵描述的是保持物体形状和尺寸不变的几何变换,通常对应于旋转或反射(镜像变换),它们属于
刚体变换的一部分。