对角化
1. 对角化的基本概念与性质
我们在介绍矩阵的幂运算时,有提到过为了简化矩阵的幂运算,我们会先尝试对矩阵进行对角化处理,将其表示为,其中矩阵为对角矩阵,矩阵为可逆矩阵。求对角矩阵的幂会十分简单,它仅涉及对角线上元素逐个求幂。请看下面对角矩阵的幂运算:
开通会员解锁全部动画
如果矩阵可对角化,那么计算会变得非常简单,因为,而的计算仅需对对角线元素求幂。请观察下面的示例:
开通会员解锁全部动画
2. 对角化定理
如果存在可逆矩阵和对角矩阵,使得,那么矩阵被称为可对角化。这意味着矩阵和矩阵是一对相似矩阵,上一节我们讨论过,相似矩阵具有相同的特征多项式和其它一些相同性质。接下来的定理将进一步说明对角化的充要条件及具体方法:
假设和
假设是一个矩阵,列向量为,的一个对角矩阵,其对角元素为。
- 矩阵和的表达式为:
假设可对角化
- 假设,右乘矩阵,得。
- 结合上面的表达式,得:
- 等式分解与线性无关性
- 逐列比较:这些等式表明是特征值,是对应的特征向量。
- 因为可逆,说明其列向量必须线性无关。
构造和并验证
如果给定个特征向量,用这些向量作为的列,特征值构造对角矩阵。
根据的推导,成立,说明可对角化。
结论
如果有个线性无关的特征向量,则可构造和,使。反之,如果,则的列向量必须是线性无关的特征向量,且数量为。
定理得证!
换句话说,矩阵可对角化的充要条件是其存在足够多的特征向量以构成的一个基。我们称这样的基为的特征向量基。需要注意的是,定理只是提供了判断矩阵是否可对角化的理论依据,在实际操作中还是无法避免复杂的特征值计算、特征空间分析和线性无关性验证等环节。
3. 对角化矩阵的步骤
根据上面的定理,对矩阵做对角化的核心是找到足够多线性无关的特征向量(其数量与矩阵的阶数相同),并以此构造特征向量矩阵和对应的对角矩阵,从而满足。我们以一个具体的例子来说明如何对角化一个矩阵,以矩阵为例:
下面是对角化的具体步骤:
构造特征矩阵
- 特征矩阵为:
计算特征方程
- 计算行列式,展开得:
- 将其因式分解为:由此解得特征值:
对特征值求解特征向量
- 特征向量满足方程:将代入:解方程,通过行化简得:化简得特征向量的通解为:
对特征值求解特征向量
- 将代入:解方程,通过行化简得:化简得特征向量的通解为:
将所有线性无关的特征向量按列排列形成矩阵:
对角矩阵的对角线元素对应特征值,顺序与的特征向量排列一致。可得矩阵:
验证和是否正确的方法是计算和,如果,则对角化关系成立,同时需确保可逆。此方法可避免直接计算,简化验证过程。 经验证可知成立。
对矩阵进行对角化的主要步骤是通过求解矩阵的特征值和特征向量,在实际应用中,这通常借助计算机利用高效数值方法(如算法)来完成求解的。
4. 不可对角化的情况
对于矩阵,当无法找到足够多的线性无关特征向量时(少于个),我们将无法对其进行对角化。请看下面的示例,以下面的矩阵为例:
我们用同样的步骤尝试对其进行对角化:
构造特征矩阵
- 特征矩阵为:
计算特征方程
- 计算行列式,展开得:
- 将其因式分解为:由此解得特征值:
对特征值求解特征向量
- 特征向量满足方程:将代入:解方程,通过行化简得:化简得特征向量的通解为:
对特征值求解特征向量
- 将代入:解方程,通过行化简得:化简得特征向量的通解为:
在第步中,我们只得到矩阵的个线性无关的特征向量,根据定理可知,矩阵不可以对角化。
5. 可对角化的充分条件
若能保证特征向量线性无关,则矩阵可对角化。满足这种情况的一个充分条件是矩阵的特征值各不相同(根据定理 2)。基于此,我们有如下定理:
根据定理,我们可以轻松判断一个矩阵是否可对角化。以下是一个具体示例,设矩阵为:
观察该矩阵的特征值为,它们互不相同。根据定理,这说明矩阵的特征向量是线性无关的,因此矩阵是可对角化的。一个矩阵即使没有个不同的特征值,也可能是可对角化的。特征值的数量只是可对角化的一个充分条件,而非必要条件。例如前面的矩阵:
它虽然只有个特征值,但依然是可对角化的。
6. 特征值与对角化的关系
前面介绍的条件多为局部性判断,难以全面判断矩阵的对角化。下面的定理总结并拓展了这些条件,通过明确几何重数与代数重数的关系,并引入特征多项式的分解性,使对角化判断更系统。
定理中的结论对于理解矩阵对角化很重要,下面我们来逐个进行解读。
这个结论等价于:矩阵某个特征值的几何重数永远小于或等于其代数重数。特征值的几何重数是矩阵的零空间的维数(也就是线性无关的特征向量数量),即:
代数重数则是特征值作为特征多项式根的重数。这个结论可表示如下:
这个结论成立是因为每个特征向量都对应一个特征值,但这些特征值不一定都是线性无关的。
这条结论为判断矩阵可对角化提供了更加具体、实用的条件(相比定理)。下面解读这两个可对角化的条件:
特征多项式完全分解为线性因子
- “完全分解为线性因子” 的意思是: 特征多项式可以表示为若干个一阶因子的乘积。例如矩阵可完全分解为线性因子:特征多项式为:
几何重数等于代数重数
- 这个条件是矩阵可对角化的核心条件,每个特征值的特征子空间维数必须等于其代数重数,否则特征向量不足以构造一个完整的基,矩阵就不可对角化。
如果矩阵可对角化,特征值对应的特征向量可以组合成整个空间的基,它也为构造对角化矩阵提供了依据。我们看一个具体示例,设矩阵:
计算特征值
特征多项式为:特征值为:(代数重数为),(代数重数为)计算特征向量和子空间基
- 对,求解:零空间的基为:
- 对,求解:零空间的基为:
检查特征向量是否构成全空间基
将和合并:该集合包含个向量,且它们是线性无关的,因此构成的一组基。构造对角化矩阵
构造矩阵(特征向量为列)和对角矩阵(特征值为对角元素):验证对角化:
总的来说,判断任意一个矩阵是否可对角化通常并没有快捷的方法,其中的难点在于我们需要计算矩阵的特征值并分析其代数重数与几何重数是否相等,这会涉及复杂的特征多项式求解和特征空间维度的确定,尤其在高维或非对称矩阵中计算复杂且易出错。不过,如果是对称矩阵,那我们就可以确定它一定可以进行对角化。