内积、长度和正交性
本节定义了内积、范数、距离、正交性,并探讨了行空间、列空间与零空间的正交关系,奠定了正交投影、最小二乘法、
QR 分解等重要方法的基础。
1. 内积的定义与性质
提出
内积 (Inner Product) 这个概念,主要是为了
在向量空间中推广欧几里得几何的概念。它包括:定义向量的长度(范数)、定义向量间的角度与正交性、计算投影。这些基础概念是继续研究正交矩阵、最小二乘法、特征值分解
(Eigen Decomposition) 、奇异值分解
(SVD) 等核心内容的基础。
1.1 内积的定义
在欧几里得空间
Rn 中,内积是两个向量之间的一种运算,它将两个向量映射为一个标量
(scalar) ,用来度量它们之间的相似性或投影关系。对于两个
n 维向量:
u=u1u2⋮un,v=v1v2⋮vn 它们的
内积(或称
点积,
dot product) 定义为:
u⋅v=u1v1+u2v2+⋯+unvn 也可写作矩阵乘法的形式:
uTv=[u1u2…un]v1v2⋮vn 内积的结果是一个标量(
1×1 矩阵)。向量的内积结果具有明确的几何意义:
当两个向量的内积为正时,它们的方向相近,夹角小于 90∘ ;当内积为零时,两个向量正交(垂直),夹角为 90∘ ;当内积为负时,它们的方向相反,夹角大于 90∘ 。
1.2 内积的性质
设 u,v,w 是 Rn 中的向量, c 是标量,内积具有以下性质:
定理 1
内积的性质
u⋅v=v⋅u
(u+v)⋅w=u⋅w+v⋅w
(cu)⋅v=c(u⋅v)=u⋅(cv)
u⋅u≥0, 且u⋅u=0⟺u=0
u⋅v=v⋅u 内积是数值相乘后求和的过程,乘法本身满足交换律,因此交换顺序不会影响结果。请看下面示例:
123⋅456=1×4+2×5+3×6=32 交换顺序:
456⋅123=4×1+5×2+6×3=32 结果相同。
(u+v)⋅w=u⋅w+v⋅w 如果我们把向量加法看作向量的坐标逐项相加,例如:
[12]+[34]=[46] 那么内积的计算可以拆分成分配计算,对内积计算:
[46]⋅[57]=4×5+6×7=62 等价于:
([12]⋅[57])+([34]⋅[57])=(1×5+2×7)+(3×5+4×7)=19+43=62 (cu)⋅vu⋅(cv)=c(u⋅v)=c(u⋅v) 数乘会单独作用于每个分量,因此可以提到整体外部。请看示例: 设标量
c=2,向量
u 和
v 分别为:
u=[12],v=[35] 首先,先对
u 进行数乘:
cu=2×[12]=[24] 然后计算内积:
[24]⋅[35]=2×3+4×5=26 另一种计算方式: 先计算
u与
v的内积:
u⋅v=[12]⋅[35]=1×3+2×5=13 再乘以标量
c:
c×13=2×13=26 由于平方和始终非负,所以内积不可能小于
0 ,只有当所有分量都为
0 时,内积才为
0 。请看下面两个例子:
[3−4]⋅[3−4]=32+(−4)2=25 当且仅当:
[00]⋅[00]=0 这说明只有零向量才会让内积为 0。
2. 向量的长度(范数)
向量的长度用于度量向量的大小,帮助定义距离、方向、归一化及相似性,是计算几何、数据分析和机器学习等领域的重要工具。
2.1 向量的长度(范数)的定义
在欧几里得空间
Rn中,向量的
长度(或称
范数,
Norm)是衡量向量大小的重要概念,表示从原点到该向量终点的
欧几里得距离。 对于一个
n 维向量:
v=v1v2⋮vn 它的
长度(或称
二范数,
ℓ2−norm)定义为:
∥v∥=v12+v22+⋯+vn2 换一种表达方式:
∥v∥=v⋅v 其中,
v⋅v表示向量自身的
内积(点积)。
2.2 向量长度的几何意义
在二维空间
R2 中,向量长度等同于直角三角形中的斜边长度,符合勾股定理:
∥v∥=x2+y2 其中
x,y 为向量的横纵坐标。在三维空间
R3 中,向量的长度为:
∥v∥=x2+y2+z2 在更高维的空间,仍然保持相同形式,它度量了向量到原点的直线距离。
2.3 归一化(单位向量)
若一个向量的长度为
1 ,则称其为单位向量
(Unit Vectoer) 给定任意非零向量
v ,我们可以通过
归一化 (Normalization) 得到与其方向相同的单位向量:
u=∥v∥v 即用向量自身除以它的长度,使其长度变为
1 。若向量
v=[34] 其单位向量计算如下:
u=51[34]=[3/54/5] 验证其长度:
∥u∥=(53)2+(54)2=259+2516=2525=1 2.4 向量长度的性质
设 u,v 是 Rn 中的向量, c 是标量,向量的范数满足以下性质:
∥v∥≥0 只有当
v=0时,
∥v∥=0。
∥cv∥=∣c∣∥v∥ 说明乘以标量只会影响向量的长度,而不会改变其方向。
∥u+v∥≤∥u∥+∥v∥ 说明两个向量相加的长度不超过各自长度之和。
∥u+v∥2+∥u−v∥2=2(∥u∥2+∥v∥2) 该公式广泛用于内积空间的研究。
3. 向量间的距离
向量间的距离衡量它们在空间中的接近程度,即直线距离,从而反映相似性或差异性。它广泛应用于机器学习、信号处理、计算机视觉、推荐系统等领域,助力数据分析、分类、聚类等任务。
3.1 向量间的距离的定义
在
欧几里得空间 Rn 中,向量之间的距离衡量的是两个向量在空间中的“接近程度”。对于
两个向量u,v,它们之间的欧几里得距离
(Euclidean Distance) 定义为:
dist(u,v)=∥u−v∥ 即两个向量的
差向量 (Euclidean Distance) 的长度(范数)。展开计算:
dist(u,v)=(u1−v1)2+(u2−v2)2+⋯+(un−vn)2 换句话说,
向量间的距离即对应元素之差的平方和的平方根。
3.2 向量距离的几何意义
在
二维空间 R2 ,距离公式等同于
两点间的直线距离,即:
dist(u,v)=(x2−x1)2+(y2−y1)2 在
三维空间 R3 ,距离扩展为:
dist(u,v)=(x2−x1)2+(y2−y1)2+(z2−z1)2 该公式描述的是两点间的
欧几里得直线距离。在高维空间
Rn ,向量间的距离依然保持相同的计算方式,它表示的是从
u 到
v 的最短路径,即直线距离。
3.3 向量距离的性质
设 u,v,w 是 Rn 中的向量,向量间的欧几里得距离具有以下重要性质:
dist(u,v)≥0 说明距离不会为负。只有当
u=v 时,距离才为
0 ,即:
dist(u,v)=0⟺u=v dist(u,v)=dist(v,u) 说明向量
u 到
v 的距离与
v 到
u 的距离是相等的。
dist(u,w)≤dist(u,v)+dist(v,w) 说明从
u 到
w 的直线距离
不会超过先到
v 再到
w 的距离之和。等式成立的前提是
u,v,w 三个向量共线。
4. 正交向量的定义
正交向量表示相互独立、不相关的方向,在线性代数、数据分析、信号处理、最小二乘法等领域用于构建正交基、计算投影和优化计算。
4.1 正交向量的定义
在
欧几里得空间 Rn 中,两个向量
u 和
v 被称为
正交(orthogonal),当且仅当它们的内积为
0 ,即:
u⋅v=0 或者用矩阵形式表示:
uTv=0 内积等于
0 意味着两个向量之间的夹角
θ 为
90∘ ,即:
cosθ=∥u∥∥v∥u⋅v=0 4.2 正交向量的几何意义
在二维空间
R2 中,向量
u=[10]T 和
v=[01]T 是正交的,因为:
u⋅v=1×0+0×1=0 向量
u,v 对应于直角坐标系中的标准基向量,它们互相垂直。
在三维空间
R3 中,向量
u=[12−1]T 和
u=[2−10]T 是正交的,因为:
u⋅v=1×2+2×(−1)+(−1)×0=2−2+0=0 在高维空间中,正交向量的概念依然适用。例如,高维数据分析中通常会使用正交向量来构建正交基 (orthonormal basis) ,以便简化计算和数据变换。
4.3 正交向量的性质
由于0⋅v=0对任意向量 v 都成立,因此零向量与所有向量正交。
若 u 和 v 正交,且它们的范数均为 1 (即单位向量),则称它们构成标准正交基。
此外,正交向量还具有一个重要性质,它是勾股定理在向量空间中的推广。勾股定理描述了直角三角形的斜边平方等于两直角边平方之和,而在向量空间中,这一定理可以推广如下:
定理 2
毕达哥拉斯定理(
Pythagorean Theorem)
向量
u 和
v 正交的充分必要条是
∥u+v∥2=∥u∥2+∥v∥2。
5. 正交补空间
正交补空间由与给定子空间正交的所有向量组成,在最小二乘法、数据降维(PCA)等领域用于分析向量的独立性和空间分解。
5.1 正交补空间的定义
在向量空间
Rn 中,给定一个子空间
W ,其
正交补(Orthogonal Complement)记作
W⊥,定义如下:
W⊥={v∈Rn∣v 与 W 中的所有向量正交} 即,
正交补W⊥ 是所有与
W 中向量正交的向量组成的集合。
5.2 正交补空间的几何意义
在几何上,正交补W⊥代表的是所有垂直于 W 的方向,在 R2 中,如果 W 是一条直线(通过原点),那么W⊥是与该直线垂直的另一条直线。在 R3 中,如果 W 是一个平面(过原点),那么W⊥是垂直于该平面的直线;如果 W 是一条直线(过原点),那么W⊥是垂直于该直线的平面。
5.3 如何求正交补空间
要求一个子空间 W 的正交补W⊥,通常按照以下步骤:
设
W 由
k 个线性无关的向量
w1,w2,⋯,wk 张成。
找出所有与
W 中所有基向量正交的向量
v=[x1,x2,⋯,xn]T ,即解方程组:
w1⋅v=0,w2⋅v=0,…,wk⋅v=0 这是一组齐次线性方程。
5.4 正交补空间的性质
这个性质
直接定义了正交补空间,即
W⊥由所有与 W 内向量正交的向量组成。
这个性质确保了
W⊥仍然是一个向量空间,所以它也满足:
零空间 0 必定属于 W⊥。
封闭性:若v,w∈W⊥,则它们的线性组合 c1v+c2w仍然在 W⊥内。
加法封闭性: W⊥中两个向量相加仍在 W⊥内。
正交补揭示了矩阵空间的结构,特别是行空间、列空间与零空间的正交补关系,它在分析矩阵的解空间、线性系统的自由度以及最小二乘逼近等问题中具有重要作用。下面的定理描述了这些关系:
定理 3
行空间与零空间的正交补关系
设
A 是一个
m×n 矩阵,则:
行空间的正交补是矩阵的零空间:
(Row A)⊥=Nul A 即,矩阵
A 的零空间包含了所有
与其行向量正交的向量。
列空间的正交补是转置矩阵的零空间:
(Col A)⊥=Nul AT 即,矩阵
AT 的零空间包含了所有
与 A 的列向量正交的向量。
下面是定理 3 的证明过程:
设x∈Nul A,
即Ax=0设矩阵
A 由行向量组成:
A=r1r2⋮rm 其中
ri是
A 的第
i 行向量。
计算矩阵乘法:
Ax=r1r2⋮rmx=r1⋅xr2⋅x⋮rm⋅x=00⋮0 这说明
x 与所有行向量正交,因此
x∈(Row A)⊥。
反向证明:若x∈RowAT,
则x∈NulA若
x 与
A 的所有行向量正交,则
ri⋅x=0,∀i=1,2,…,m 这意味着:
Ax=0 即
x 属于零空间
Nul A。因此,
(Row A)⊥=Nul A。
由于
Row AT=Col A,将
AT代入上面的结论:
(Row AT)⊥=Nul AT 再由
Row AT=Col A,可得:
(Col A)⊥=Nul AT
在欧几里得空间
Rn 中,两个向量
u 和
v 之间的夹角
θ 是度量它们方向关系的重要概念。角度可以通过
内积来计算,定义如下:
cosθ=∥u∥∥v∥u⋅v 这一公式可以通过
余弦定理推导得出。设
u 和
v 是从原点出发的两个向量,它们的端点与
u−v 形成一个三角形。根据余弦定理,有:
∣u−v∣2=∣u∣2+∣v∣2−2∣u∣∣v∣cosθ 另一方面,考虑向量模长的平方展开:
∣u−v∣2=(u−v)⋅(u−v) 展开后得到:
∣u−v∣2=u⋅u+v⋅v−2u⋅v 将此等式与余弦定理的表达式对比,得:
−2u⋅v=−2∣u∣∣v∣cosθ 整理后:
cosθ=∣u∣∣v∣u⋅v