对称矩阵的对角化
1. 对称矩阵的定义
对称矩阵()是指满足的方阵,即主对角线两侧元素相等(如),其对称性反映了系统或数据的对称结构。由于实对称矩阵具有所有特征值为实数,且不同特征值的特征向量正交等独特性质,这便于通过正交矩阵实现正交对角化()、简化矩阵计算和分解,因此它在物理学(如描述系统动态和振动分析)、统计学(如主成分分析中的协方差矩阵建模)和工程(如优化与控制问题)中得到广泛应用。
2. 对称矩阵的正交对角化
我们在对角化一节讨论过如何对复杂矩阵进行对角化来简化矩阵运算。对称矩阵的对角化过程和普通矩阵类似,下面通过一个示例来演示这个过程:
- 计算特征值
- 特征方程:特征值满足。构造矩阵:
- 行列式计算:
- 计算特征向量
- 对于每个特征值,求解的非零解,得到特征向量。
- 解: 设则取,得:
- 得:
- 得:
- 标准化:将特征向量归一化为单位向量,这一步是为了构建正交矩阵。
- 构造和
- 正交矩阵:
- 对角矩阵:
- 结论:
- 对角化的结果:
- 由于正交矩阵的逆矩阵等于其转置矩阵,即,所以对角化结果满足:
- 由于是正交矩阵,的形式消除了显式计算逆矩阵的需要,因为可以直接通过转置得到。
在上面的步骤中,我们注意到对称矩阵的特征向量是正交的,这一性质并非偶然,而是实对称矩阵的一个重要的固有特性。有如下定理:
设是矩阵的特征向量,分别对应不同的特征值和。
- 计算内积:
- 整理得到:
上面对矩阵进行的对角化过程又称为正交对角化(),它将一个矩阵,分解为一个正交矩阵和一个对角矩阵:
这里的等于是正交矩阵的特性,因此和在正交矩阵的情况下是等价的。
3. 正交对角化对称矩阵的条件
在对角化对角化一节中,我们在讨论过判断任意矩阵是否可对角化通常很困难。但如何矩阵是实对称矩阵(即),则总是可以正交对角化。其正交矩阵的列向量是的个标准正交特征向量,且,其中是一个对角矩阵,其对角元素是对应的特征值。
3.1 正交对角化的充要条件
确定一个矩阵是否能够被正交对角化,结合前述内容有如下定理:
对于定理的充分条件(即可正交对角化是对称矩阵)的证明通过直接矩阵转置运算即可验证:如果可正交对角化,即,那么计算:
而必要条件(即矩阵为对称矩阵可对角化)的证明较为复杂,需要依赖线性代数的深层理论,如谱定理和施密特正交化过程。
3.2 重复特征值的情况
与普通矩阵类似,对称矩阵的正交对角化并不要求特征值必须唯一,即使特征值重复,依然可以通过正交基实现正交对角化。请看下面的示例,对矩阵进行正交对角化:
- 计算特征值
- 特征方程:特征值满足。
- 矩阵的特征值:( 重数),( 重数)。
- 计算特征向量
- 对于每个特征值,求解 的非零解,得到特征向量。
- 得特征向量:。
- 得特征向量:
由于出现了重数为的特征值,所以与之对应的两个特征向量来自于同一个特征子空间,定理只能保证分别与正交,并不能保证正交,所以我们需要对这两个特征向量进行正交化处理。
- 保留不变,作为第一个正交向量。
- 计算在上的投影:
- 计算正交于的向量:
- 得到正交基如下:
- 标准化:将特征向量归一化为单位向量。
- 构造和
- 正交矩阵:
- 对角矩阵:
- 结论:
- 是正交矩阵:(列向量标准正交)。
- 成立。
4. 谱定理
在线性代数中,矩阵的特征值的集合被称为“谱”()。下面的谱定理是关于对称矩阵的一个核心定理,它系统性地描述了对称矩阵的特征值和特征向量的性质。
- 证明特征值是实数
- 是一个的实对称矩阵,设是的特征向量,满足:其中是对应的特征值。
- 计算(其中是的共轭向量):由于是对称矩阵,一定是实数(由于,对取共轭后等于自身,即,因此它一定实数),而也是实数,因此只能是实数。
- 证明有个特征值
- 的特征值是其特征多项式的根,该多项式是实系数的次多项式。由代数基本定理可知,该多项式有个(包括重数)根。
- 结论
- 结合可得:对称矩阵具有个实特征值(包括重数)。
已知
是对称矩阵。
特征值的代数重数是它在特征多项式中的重数。
特征空间的维数是几何重数。
对称矩阵性质
有个实特征值(计入重数),且对应不同特征值的特征向量正交。
可以正交对角化:存在正交矩阵和对角矩阵,使得,其中的对角线是特征值。
结论:几何重数代数重数
设的代数重数为。在中,出现次。
对应的特征向量(中相关列)是正交的,因此线性无关,特征空间维数至少为。
所以,代数重数几何重数。
定理的结论。
定理的结论。
5. 谱分解
谱分解() 是对谱定理的直接应用。它是一种在线性代数中将矩阵分解为基于其特征值和特征向量的形式的方法,特别适用于对称矩阵。
5.1 什么是谱分解
具体来说,对于一个的对称矩阵,如果是正交可对角化的(即),那么可以表示为以下形式:
根据列列-行展开定理可得:
这里的是单位特征向量(正交且模为),是对应的特征值,每个是一个秩为的矩阵(列空间或行空间是一维的),表示将向量投影到由所张成的子空间上,并按进行缩放。谱分解展示了矩阵如何在不同方向(由特征向量表示)上“伸缩”或“投影”(由特征值表示)。对于对称矩阵,这种分解是唯一的,且完全由其谱(特征值)和对应的正交特征向量决定。
5.2 为什么要做谱分解
谱分解在理论和实践中具有重要意义,主要原因如下:
提升计算效率:谱分解简化了复杂的矩阵运算,如矩阵幂、指数和对数。通过将矩阵表示为特征值和特征向量的组合,可以直接对特征值进行运算,而无需直接操作原始矩阵。对于对称矩阵,谱分解避免了计算逆矩阵,进一步简化了运算过程。
直观的几何解释:谱分解中的每一项是一个投影矩阵,表示将向量投影到特征向量的方向上。这提供了矩阵作用的几何直观理解。
理论分析的基础:谱分解为研究矩阵的性质(如二次型、矩阵的秩和条件数)提供了基础。此外,它在数据分析和机器学习中的应用广泛,例如主成分分析()就是基于谱分解的。
数值稳定性:在处理大规模数据或数值计算时,谱分解通常比直接矩阵运算更稳定,可以减少误差积累的风险。
5.3 谱分解的示例
构造矩阵的谱分解,已知对称矩阵的正交对角化如下:
下面是谱分解的具体步骤:
- 从正交对角化中,我们知道矩阵的列是的特征向量,记为和。
- 对应的特征值为。
- 谱分解的形式为:。
- 因此:
- 计算:
- 计算:
- 验证: