特征方程
特征方程
det(A−λI=0)是线性代数中研究矩阵的重要工具。它连接了矩阵的特征值与特征多项式,帮助揭示矩阵的核心性质,如线性变换的几何行为(缩放、旋转)和系统的稳定性。特征方程在判断矩阵可逆性、对角化、简化复杂运算等方面具有关键作用,是理解线性变换和矩阵结构的基础。
1. 特征方程的定义与基本性质
在上一节中,我们只讨论了如何判断一个特征值是否属于一个方阵
A 。下面我们来介绍如何求一个矩阵的特征值。我们还是从定义出发,对于矩阵方程
(A−λI)x=0,如果存在非零解
x=0 ,那么矩阵
(A−λI)的
解空间(即零空间)至少要包含一个非零向量
x 。根据
可逆矩阵定理,矩阵
A−λI 必须
不可逆,那么它对应的行列式一定为
0 (根据
矩阵可逆性的充要条件),即:
det(A−λI)=0 这个就是
特征方程 (characteristic equation) ,我们可以根据这个方程来求矩阵
A=[233−6]的特征值。请观察求解过程:
2. 行列式与矩阵的特征值关系
行列式在计算矩阵的特征值中起着核心作用,下面我们来讨论行列式和矩阵的特征值之间的联系。前面我们已经学习过关于
行列式的基本概念、行列式的计算方法(对矩阵按行、列展开),以及它的基本性质。为了方便后面的讨论,现把行列式的主要性质重新罗列如下:
定理 3
行列式的性质
设
A 和
B 是
n×n 方阵。
a. A 可逆的充要条件是
detA=0 .
b. detAB=(detA)(detB) .
c. detAT=detA .
d. 若
A 是三角矩阵,那么
detA 是
A 主对角线元素的乘积 .
e. 对矩阵
A 进行行倍加操作不会改变行列式;进行行交换操作会改变行列式的符号;进行行倍乘操作会使行列式按相同的标量因子进行倍乘;
结合上面行列式的性质 a 和 d ,以及上一节讨论过的三角矩阵的特征值,我们可以得到下面的结论:
定理
可逆矩阵定理(续)
r. 矩阵
A 可逆当且仅当
0 不是
A 的特征值。
3. 特征多项式与特征值重数
特征方程是关于 λ 的多项式,如果矩阵 A 是一个 n×n 的矩阵,那么特征方程(A−λI)x=0是一个 n 次多项式,它被称为 A 的特征多项式 (characteristic polynomial) 。例如下面的 4×4 矩阵 A 对应的是一个 4 次多项式。
在上面这个示例中, (5−λ) 这个因子在特征多项式中出现了 2 次,它被称为特征值 5 的代数重数 (algebraic multiplicity) 。同理,λ=3 和 λ=1 的代数重数都是 1 。代数重数表示特征值在特征多项式中作为根的重数,它是特征方程求解和矩阵性质分析的重要概念。
代数重数的作用
与代数重数相对应的概念是
几何重数 (geometric multiplicity) ,它是特征值对应的
线性无关特征向量的个数。代数重数其中一个主要作用是和几何重数一起来判断矩阵是否可
对角化。例如前面的矩阵
A=5000−23006−850−1041 特征值
λ=5 的几何重数和代数重数均为
2 ,其他特征值也满足这一关系。这是因为矩阵
A 为对角矩阵。但当特征值的代数重数大于几何重数时,矩阵将无法对角化。
4. 特征多项式和相似矩阵
4.1 相似矩阵的定义
特征多项式描述了矩阵的特征值及其代数重数,这些特征值决定了矩阵在线性变换中表现出的缩放、旋转等行为。在实际应用中,我们常常引入相似变换这一工具,它能够将矩阵转化为更简单的形式(如对角矩阵),同时保持矩阵的特征值和特征多项式不变。下面是相似矩阵的定义:
定义
相似矩阵
设
A 和
B 是两个
n×n 的方阵,如果存在一个可逆矩阵
P ,使得:
B=P−1AP 则称矩阵
A 和
B 相似,记作:
A∼B 4.2 相似矩阵的几何意义
相似矩阵反映了同一个线性变换在不同基下的表示形式。例如在非标准基下的旋转变换矩阵 RB(θ) 和标准基下的旋转矩阵 RE(θ) 就是一对相似矩阵。在非标准基 B 做旋转时,为了方便,我们通常会先把非标准基下的向量转换到非标准基下,然后在标准基下执行旋转变换 RE(θ) ,最后再从标准基下变换回非标准基下。请观察下面的动画过程:
上例中, 非标准基
B 、基
B 到标准基
E 的变换矩阵如下:
B={[02],[1−1]},E←BP=[021−1] 又知标准基下的旋转矩阵如下:
RE(θ)=[cosθsinθ−sinθcosθ] 那么,容易求得在非标准基
B 下的旋转矩阵为:
RB(θ)=E←BPRE(θ)RE(θ)B←EP=[021−1][cosθsinθ−sinθcosθ][021−1]−1=[cosθ+sinθ2cosθ−cosθ−cosθ−sinθ] 4.3 相似矩阵的性质
相似矩阵不仅能够通过不同的矩阵形式来描述相同的线性变换,它们还拥有相同的特征多项式和特征值。有如下定理:
定理 4
相似矩阵的特征值和特征多项式
如果两个
n×n 矩阵
A 和
B 是相似矩阵,那么它们具有相同的特征多项式,因此它们的特征值(包括重数)也完全相同。
假设条件设B=P−1AP,其中 A 和 B 是 n×n 矩阵, P 是可逆矩阵。
转换特征多项式
考虑矩阵
B−λI:
B−λI=P−1AP−λP−1P=P−1(A−λI)P 这说明
B−λI和
A−λI是相似矩阵。
使用行列式性质根据行列式的性质:
det(B−λI)=det[P−1(A−λI)P]=det(P−1)⋅det(A−λI)⋅det(P)=det(A−λI) 这说明矩阵
A 和
B 的特征多项式相同。
结论矩阵 A 和 B 的特征多项式相同,它们的特征值(包括重数)完全一致,定理得证。
相似矩阵可以用来简化复杂矩阵的计算,最常见的用途是通过对角化将矩阵分解为更易于分析的形式。在动力系统分析中,相似矩阵用于研究系统的长期行为,例如稳定性和振荡模式。
5. 特征值与离散动力系统
我们来讨论一种
离散动力系统,它用于研究系统在离散时间上的变化规律,分析系统的稳定性、周期性以及随时间推移的长期行为。给定一个动力系统,其演化由以下方程定义:
xk+1=Axk,x0=[0.60.4] 其中,矩阵
A 为:
A=[0.950.050.030.97] 接下来,我们来分析该动力系统的长期行为,即
k→∞ 时状态
xk 的变化趋势。下面是具体的求解步骤:
特征值通过特征方程
det(A−λI)=0计算:
det[0.95−λ0.050.030.97−λ]=(0.95−λ)(0.97−λ)−0.03⋅0.05 化简后得到:
λ2−1.92λ+0.92=0 求解特征值:
λ=21.92±(1.92)2−4⋅0.92=21.92±0.08 结果为:
λ1=1,λ2=0.92 对应的特征向量分别为:
v1=[35],v2=[1−1] 初始状态向量
x0=[0.60.4] 可以表示为特征向量的线性组合:
x0=c1v1+c2v2 求解系数
c1 和
c2 :
[0.60.4]=c1[35]+c2[1−1] 用矩阵方法求解:
[351−1][c1c2]=[0.60.4] 解得:
c1=0.125,c2=0.225 由于特征向量对应的特征值满足:
Av1=λ1v1=v1,Av2=λ2v2=0.92v2 可以得到系统在第
k 步的状态:
xk=c1λ1kv1+c2λ2kv2 代入特征值和初始系数:
xk=0.125⋅1k[35]+0.225⋅0.92k[1−1] 当
k→∞ 时,特征值
λ2=0.92≤1 ,因此
(0.92)k→0 。系统状态趋近于:
xk→0.125[35]=[0.3750.625] 这表明,系统最终稳定在一个平衡状态,该状态由特征值
λ1=1 的特征向量决定。
系统的长期行为由特征值最大的模决定。在本例中,λ1=1 是唯一的稳定特征值,主导了系统的最终状态。初始状态在特征向量的分解中,快速衰减的分量(由 λ2=0.92 决定)对长期行为没有影响。该分析方法广泛应用于 Markov 链(马尔可夫链)、人口迁移模型等动力系统中。