特征向量与线性变换
1. 特征值和特征向量的概念推广
这一节我们探讨特征值和特征向量在更广泛的线性变换(不仅仅限于矩阵)中的应用。首先,我们从定义上对特征值和特征向量的概念进行扩展:
将特征值和特征向量的概念推广到一般的线性变换后,我们不仅可以在任何向量空间(包括函数空间、信号空间和多项式空间等)中应用这一概念,还能更深入地研究变换的核心几何特性,即:特征向量的方向不变性和特征值反应变化后的缩放程度)。下面我们来讨论一个在离散信号空间中的问题,通过研究余弦信号在特定线性变换下的特征值和特征向量,揭示信号的频率特性和变换的核心行为。给定信号:
定义变换为左移位:
有如下结论:
此时信号为:
变换定义为,则:
利用三角函数公式:
结论:当时,信号经变换后,不能表示为原信号的数值倍数,因此不是变换的特征向量。
此时信号为:
变换定义为,则:
结论:当时,信号满足变换的定义:
其中。因此,是变换的特征向量,对应的特征值为。
下面的动画过程演示了这两种变换:
开通会员解锁全部动画
更一般地,当为偶数时,对应的信号都是变换的特征向量。即,当时:
特征值为。
2. 线性变换的矩阵
开通会员解锁全部动画
在坐标系一节中我们介绍过:任何向量空间中的向量都可以通过选定一组基一一映射到空间中的坐标向量,从而我们可以将线性变换表示为一个矩阵。具体来说,假设是一个维向量空间,选取基。任意向量可以表示为基向量的线性组合:
在基下,的坐标向量为:
线性变换的作用是将向量映射到,即:
由于从到的坐标映射是线性的,可以写成:
我们可以用矩阵表示这个线性变换。定义矩阵:
其中,矩阵的每一列对应基向量经过变换后的坐标向量。于是,线性变换可以表示为:
这表明,在基下,线性变换的作用等价于用矩阵左乘坐标向量。 矩阵被称为线性变换在基下的矩阵表示,记为。这种表示方法不仅让我们能够通过矩阵运算研究线性变换的性质,还能更清晰地理解特征向量与线性变换之间的关系。
开通会员解锁全部动画
3. 矩阵表示的计算示例
以下两个示例分别展示了如何构造线性变换的矩阵表示,以及如何验证矩阵表示与线性变换的等价性。第一个示例关注基向量在变换下的映射,第二个示例则以多项式求导为例,进一步展示线性变换在特定基下的矩阵表示方法。
3.1 基向量变换的矩阵表示
给定一个二维向量空间,基为。定义了线性变换,满足:
下面动画演示计算在基下的矩阵表示:
开通会员解锁全部动画
3.2 多项式求导的矩阵表示
给定一个线性变换(求导运算):
给定标准基,需要求:
根据公式,矩阵为:
我们只需要分别计算基向量的变换后的坐标向量即可:
由此可得矩阵,即变换在基下的矩阵:
这其实是验证它和公式是等价的。首先,任意的坐标向量为:
变换,对应的坐标向量为:
根据第一步中求的的矩阵计算:
结果与一致,验证成立。
这个示例说明,多项式求导问题可以通过矩阵运算来完成。
开通会员解锁全部动画
4. 上的线性变换
线性变换可以用矩阵来表示,其中。出于简化运算的考虑,我们自然会去尝试对矩阵进行对角化处理。如果矩阵可对角化,那么可以找到一组由特征向量构成的基,使得在基下的矩阵是对角矩阵。有如下定理:
定义基与变换矩阵
- 假设的列向量为,它们组成基。
- ,是基的坐标变换矩阵。
基变换的关系
- 对任意向量有:
计算在基下的表示:
- 线性变换。在基下的矩阵表示为:
- 因为,得:
- 应用基变换
- 利用基变换关系:
- 将所有基向量组合:
- 结合对角化条件
- 因为,所以:
定理的作用是将一个复杂的线性变换简化为对角矩阵的形式。下面我们从几何角度来观察这个过程:
开通会员解锁全部动画
上述示例展示了在不同基下对同一线性变换的表示形式。通过选择矩阵的特征向量作为新基,原来的矩阵被转化为对角矩阵。这种变换的好处是,在基中,矩阵的线性变换等价于对每个基向量按特征值进行伸缩,而不涉及基向量间的混合操作。
5. 矩阵相似性与变换表示
定理中的矩阵和是一对相似矩阵,它们在几何上表现为在不同基下的同一个变换(相似矩阵的几何意义)。只不过定理为了对实现对角化处理,要求新基是由矩阵的特征向量构成,如果不考虑这个条件,我们可以找到其他相似矩阵,满足, 它们也能表示同一个线性变换。
开通会员解锁全部动画
当矩阵无法对角化时,我们需要寻找其它相似矩阵(例如矩阵)来简化计算。例如下面的矩阵:
它的特征多项式为,因此它的特征值是,代数重数为。求解特征方程,写成增广矩阵并化简得:
解得特征向量为:。这说明的几何重数少于代数重数,因此矩阵无法进行对角化处理。我们可以将矩阵转化为形式,那么就需要继续寻找广义特征向量,满足:
广义特征向量和普通特征向量之间存在递归关系:
求解:
得到广义特征向量。由获取到的特征向量和广义特征向量构成的基:
最后将基变换矩阵应用与得:
矩阵是的相似矩阵,它又称为的形式(若尔当标准型)。