正交投影
1. 正交投影和正交分解
开通会员解锁全部动画
这一节,我们将正交投影推广到中来讨论。在中,给定向量和子空间,可以找到唯一的向量,使得正交于,同时也是中最接近的向量。因此,我们可以将唯一地分解为
其中在内,在(正交补空间)内。例如在一个五维空间的正交基下,对中任意给定向量用同样的方式进行分解:
我们可以对按照式进行拆分:
如果在子空间内,那么一定在内。我们可以进一步推广到更一般的情况,即不需要整个空间的正交基,只需要自己的正交基即可计算正交投影,有如下定理:
- 令按照公式定义:其中是的正交基,因此。
- 定义:我们需要验证是否在中,即是否与中的每个基向量正交。
- 计算内积:由于,因此对上式展开后,仅保留的项:
对于所有都可以用相同的方法证明,因此。
- 假设也可以写成另一种分解形式:其中。
- 由两种分解形式相等:整理得到:
- 由于,且,因此既属于,又属于。但中的元素必须正交于内的所有向量。因此:说明:即正交分解是唯一的。
2. 正交分解示例
给定中向量以及由正交基生成是空间:
下面利用正交分解定理对的向量进行分解:,其中。
由正交投影公式:
计算内积:
计算投影:
最终分解结果:
3. 正交投影的几何解释
当是一维子空间时,正交投影公式仅包含一项,表示在该基向量上的正交投影。对于更高维的子空间,向量在上的正交投影可以分解为投影到每个基向量的正交投影之和。在空间中,假设是由两个正交向量和张成的子空间,向量的正交投影可以分解为在和上的投影之和。
下面动画演示了这个分解过程:
开通会员解锁全部动画
4. 最佳逼近定理
开通会员解锁全部动画
正交投影的核心作用之一是最小化误差,常用于高维空间向量的低维近似。在数据分析、机器学习和信号处理等领域,我们常需用低维表示替代高维数据,以简化计算并减少信息损失。在这样的背景下,正交投影提供了一种最优的方法来确定低维近似向量,使得误差最小。它不仅保证了投影后的向量在目标子空间内,同时确保了该向量与原向量之间的距离最小。下面的定理表达了这种”最近似“的概念:
- 设定条件
设是的一个子空间。
设是任意向量,是在上的正交投影。
取任意不同于的,即。
- 利用正交分解
- 根据正交分解定理,可以将分解为:其中:。
- 利用勾股定理
- 由于于正交,故可以应用勾股定理:
- 推导不等式
- 由于,所以。
- 由此可得:取平方根,得到:这证明了是在中的最优逼近点。
- 结论
- 由于任意都满足该不等式,说明正交投影是中离最近的点。
我们可以把正交投影看作把高纬度向量降到低维度空间上的过程,例如我们现在有一个高维数据点和一个二维子空间,这个子空间由两个基向量和张成。具体数据如下:
我们希望通过将投影到上来找到最接近的低维表示,和前面正交分解示例的计算过程是一样的。根据正交投影公式,可将分解如下:
其中为投影的二维空间上的近似向量;是误差向量,误差值(模长):。
5. 正交投影的矩阵表示
定理通过逐项计算每个基向量上的投影来实现正交投影,而在实际应用中,矩阵运算提供了一种更高效、更通用的方法来完成投影计算,特别适用于大规模数据处理和高维空间的投影问题。在定理的基础上,我们进一步推导并在标准正交基的条件下,可得下面的定理:
由正交投影公式:
由于是标准正交基,那么,投影公式可化简为:
所以成立。
可以等价表示为:
其中,投影系数可以写成矩阵运算:
可得:
可改写为:
记,则上述表达式为:
所以成立。
6. 正交投影的应用
在 2.1 节我们讨论过一种用矩阵运算来识别特定图像模型的方法。当时只是给出了模式识别矩阵,下面我们利用正交补空间和矩阵投影来介绍如何构造出矩阵。我们定义一个模式向量,用来识别的目标图案。例如下面这个图形 ““:
开通会员解锁全部动画
我们的目标是构造一个矩阵,使得:如果输入向量符合模式,则;否则。构造的思路是通过求解方程找到所有与模式向量正交的向量组成的正交补空间,构造其基矩阵,然后计算以得到模式检测矩阵。下面是具体过程:
定义模式向量生成的空间:
其中。
是一个维子空间(原空间维度方程个数)。因此我们需要找到个线性无关的基向量。我们可以用自由变量来表示:
这样,是自由变量。然后,我们让每个自由变量依次取,其余取,以构造基向量。
将这些基向量组合成矩阵:
那么若,则,否则。
用上一步得到的矩阵来识别不太方便运算,得到的是一个的向量,我们构造可以进一步把这个向量转化为一个标量:
这样我们就可以直接通过一个数值判断:若,则,否则。此例中矩阵如下: