Logo

复特征值

1. 复特征值及其几何特性

在线性代数中,矩阵的特征值不仅只有实数,也可以是复数。如果一个矩阵的特征值是复数,通常可以写成:
λ=a+bi (a,bR,i2=1)\lambda = a + bi~(a,b \in \mathbb{R}, i^2 = -1)
这里 a ~a~是特征值的实部 (Real Part) ~(\textbf{Real Part})~ b ~b~虚部 (Imaginary Part) ~(\textbf{Imaginary Part})~。为了更方便地讨论复数的几何性质(旋转、缩放),复数还可以用极坐标来表示为:
z=r(cosθ+isinθ)z=reiθz = r (\cos \theta + i \sin \theta) \quad \text{或} \quad z = re^{i\theta}
其中,r=a2+b2r = \sqrt{a^2 + b^2}是复数的模长θ=tan1(b/a)\theta = \tan^{-1} (b/a)是复数的幅角。复数 z=r(cosθ+isinθ) ~z = r (\cos \theta + i \sin \theta)~的极坐标可由下图表示:

开通会员解锁全部动画

复数相乘的本质上对应着模长的乘积(伸缩)和幅角的相加(旋转),图中的复数 z ~z~每次做幂运算后,模长是原来的2\sqrt{2}倍,幅角会增加 45 ~45^\circ~

2. 复数的矩阵化表示

复数相乘的几何作用,本质上是二维复平面中的线性变换。 它将伸缩(由模长 r ~r~控制)和旋转(由幅角 θ ~\theta~控制)复合在一起,等价于相应的矩阵变换。我们对通过复数z=r(cosθ+isinθ)z=r(\cos\theta+i\sin\theta)和另一个复数w=x+yiw=x+yi相乘来推导对应的矩阵形式:

开通会员解锁全部动画

由上可得,复数的极坐标形式z=r(cosθ+isinθ)z = r(\cos \theta + i \sin\theta)对应矩阵:
C=[r00r][cosθsinθsinθcosθ]\mathbf{C} = \begin{bmatrix}r & 0 \\ 0 & r\end {bmatrix}\begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{bmatrix}
再由复数的实部 a=rcosθ ~a = r\cdot \cos\theta~,虚部 b=rsinθ ~b= r\cdot \sin\theta~可得矩阵的另一种形式:
C=[abba]\mathbf{C} = \begin{bmatrix} a & -b \\ b & a \end{bmatrix}
这个是复数的矩阵化形式(为了方便讨论,下文所有提及到的矩阵 C ~\mathbf{C}~都表示使用了这种结构)。很显然,这个矩阵 C ~\mathbf{C}~的结构是刻意设计出来的,进一步计算可知矩阵C\mathbf{C}的特征值λ=a±bi\lambda = a \pm bi。在二维平面内,矩阵 C ~\mathbf{C}~作用于任何向量 x ~\mathbf{x}~都会表现出伸缩 (r=1 时不伸缩) ~(r=1~时不伸缩)~和旋转的效果。请观察下面两个示例:

开通会员解锁全部动画

3. 复数对应矩阵的相似矩阵

矩阵 C ~\mathbf{C}~对二维向量 x ~\mathbf{x}~施加旋转变换,那么其相似矩阵 A ~\mathbf{A}~在几何上也会保持相同的旋转性质。我们以下面的矩阵 C ~\mathbf{C}~为例:
C=[0.80.60.60.8]\mathbf{C} = \begin{bmatrix}0.8 & -0.6 \\ 0.6 & 0.8\end{bmatrix}
此例中矩阵 C ~\mathbf{C}~的模长r=0.82+0.62=1,θ=tan1(0.6/0.8)36.87r=\sqrt{0.8 ^ 2 + 0.6 ^ 2}=1,\,\theta =\tan^{-1}(0.6/0.8) \approx 36.87^\circ,所以它作用于二维向量 v ~\mathbf{v}~仅表现出了旋转效果。我们可以找到一组非标准基 B ~\mathcal{B}~
B={[0.51.25],[10]}\mathcal{B} = \left\{\begin{bmatrix} -0.5 \\ 1.25\end{bmatrix}, \begin{bmatrix} -1 \\ 0\end{bmatrix}\right\}
从而得到基变换矩阵 BEP ~\overset{\normalsize \mathbf{P}}{\raisebox{-1ex}{\tiny \(\mathcal{B} \kern-0.5em \leftarrow \kern-0.5em \mathcal{E}\)}}~和它的逆矩阵 EBP ~\overset{\normalsize \mathbf{P}}{\raisebox{-1ex}{\tiny \(\mathcal{E} \kern-0.5em \leftarrow \kern-0.5em \mathcal{B}\)}}~
BEP=[0.511.250],EBP=[00.810.4]\overset{\normalsize \mathbf{P}}{\raisebox{-1ex}{\tiny \(\mathcal{B} \kern-0.5em \leftarrow \kern-0.5em \mathcal{E}\)}}= \begin{bmatrix}-0.5 & -1 \\ 1.25 & 0\end{bmatrix}, \quad \overset{\normalsize \mathbf{P}}{\raisebox{-1ex}{\tiny \(\mathcal{E} \kern-0.5em \leftarrow \kern-0.5em \mathcal{B}\)}}= \begin{bmatrix}0 & 0.8 \\ -1 & -0.4\end{bmatrix}
用基变换矩阵 BEP ~\overset{\normalsize \mathbf{P}}{\raisebox{-1ex}{\tiny \(\mathcal{B} \kern-0.5em \leftarrow \kern-0.5em \mathcal{E}\)}}~乘以向量[vi]E[\mathbf{v}_i]_\mathcal{E}得到向量ui\mathbf{u}_i,在标准基 E ~\mathcal{E}~下观察,向量 [ui]E ~[\mathbf{u}_i]_\mathcal{E}~会在原向量 [v]E ~[\mathbf{v}]_\mathcal{E}~的基础上顺着基向量 b1,b2 ~{\mathcal{b}_1,\mathcal{b}_2}~的方向进行“扭曲”;如果在新基 B ~\mathbf{B}~下观察, [ui]B ~[\mathbf{u}_i]_\mathcal{B}~的位置会和原向量 [vi]E ~[\mathbf{v}_i]_\mathcal{E}~的位置保持一致。下面的动画演示了这个过程:

开通会员解锁全部动画

我们可以计算 C ~\mathbf{C}~的相似矩阵 A ~\mathbf{A}~
A=BEPCCEBP=[0.511.250][0.80.60.60.8][00.810.4]=[0.50.60.751.1]\begin{align*}\mathbf{A} &= \overset{\smash{\raisebox{-0.45ex}{$\mathbf{P}$}}}{\raisebox{-1.5ex}{\tiny \(\mathcal{B} \kern-0.5em \leftarrow \kern-0.5em \mathcal{E}\)}} \vphantom{\mathbf{C}}\,\mathbf{C}\, \overset{\smash{\raisebox{-0.45ex}{$\mathbf{P}$}}}{\raisebox{-1.5ex}{\tiny \(\mathcal{E} \kern-0.5em \leftarrow \kern-0.5em \mathcal{B}\)}}\\[3ex] &= \begin{bmatrix}-0.5 & -1 \\ 1.25 & 0\end{bmatrix} \begin{bmatrix}0.8 & -0.6 \\ 0.6 & 0.8\end{bmatrix} \begin{bmatrix}0 & 0.8 \\ -1 & -0.4\end{bmatrix}\\[3ex] &= \begin{bmatrix} 0.5 & -0.6 \\ 0.75 & 1.1 \end{bmatrix} \end{align*}
根据本章的定理 4可知:相似矩阵的特征值是相同的。那么,此例中 A ~\mathbf{A}~ C ~\mathbf{C}~的特征值都是 0.8±0.6i ~0.8 \pm 0.6i~。接下来我们来讨论复特征值的共轭性质。

4. 实矩阵的复特征值共轭性质

对于实系数矩阵,其复特征值必定以共轭成对出现,这些特征值被称为共轭特征值。这种成对出现的性质可归结为 :如果矩阵的一个特征值是复数λ=a+bi( 其中 a,bR)\lambda = a + bi\,(~\text{其中}~a,b\in \mathbb{R}),那么λ=abi\overline{\lambda} = a - bi也必然是特征值

4.1 计算复特征值

为了进一步讨论复特征值的共轭特性,我们根据定义来计算矩阵 A ~\mathbf{A}~的特征值以及特征向量:
A=[0.50.60.751.1]\mathbf{A} = \begin{bmatrix} 0.5 & -0.6 \\ 0.75 & 1.1 \end{bmatrix}
由特征多项式det(AλI)=0\det(\mathbf{A}-\lambda\mathbf{I}) = 0得:
0.5λ0.60.751.1λ=(0.5λ)(1.1λ)(0.6)(0.75)=0\begin{vmatrix} 0.5 - \lambda & -0.6 \\ 0.75 & 1.1 - \lambda \end{vmatrix}=(0.5 - \lambda)(1.1 - \lambda) - (-0.6)(0.75) = 0
化简得:
λ21.6λ+1=0\lambda^2 - 1.6\lambda + 1=0
求解得特征值为: λ=0.8±0.6i ~\lambda = 0.8 \pm 0.6i~(和 C ~\mathbf{C}~的特征值相同)。

4.2 计算特征向量

接着先求解特征值λ1=0.80.6i\lambda_1=0.8 - 0.6i对应的特征向量,也即矩阵方程(AλI)x=0(\mathbf{A}-\lambda \mathbf{I})\mathbf{x} = 0的解,构造矩阵:
A(0.80.6i)I=[0.50.60.751.1][0.80.6i000.80.6i]=[0.3+0.6i0.60.750.3+0.6i](1)\begin{align*}\mathbf{A} - (0.8 - 0.6i)\mathbf{I} &= \begin{bmatrix} 0.5 & -0.6 \\ 0.75 & 1.1 \end{bmatrix} - \begin{bmatrix} 0.8 - 0.6i & 0 \\ 0 & 0.8 - 0.6i \end{bmatrix}\\[3ex] &= \begin{bmatrix} -0.3 + 0.6i & -0.6 \\ 0.75 & 0.3 + 0.6i \end{bmatrix}\end{align*}\tag{1}
矩阵对应的方程组为:
{(0.3+0.6i)x10.6x2=00.75x1+(0.3+0.6i)x2=0(2)\left\{\begin{aligned} (-0.3 + 0.6i)x_1 - 0.6x_2 &= 0 \\[1ex] 0.75x_1 + (0.3 + 0.6i)x_2 &= 0 \end{aligned}\right.\tag{2}
矩阵 (1) ~(1)~的行列式为 0 ~0~,意味着矩阵的行、列向量是线性相关的。那么方程组 (2) ~(2)~中的两个方程是等价的,我们选择第 2 ~2~个方程来求解,得到:
x1=(0.40.8i)x2(3)x_1=(-0.4-0.8i)x_2\tag{3}
为了消除小数,我们设 x2=5 ~x_2=5~代入 (3) ~(3)~得:x1=(0.40.8i)(5)=24ix_1=(-0.4-0.8i)(5)=-2-4i因此,复特征值 λ1=0.80.6i ~\lambda_1=0.8-0.6i~对应的特征向量为:
v1=t[25]ti[40],tR\mathbf{v}_1 = t \begin{bmatrix} -2 \\ 5 \end{bmatrix} - t \cdot i \begin{bmatrix} 4 \\ 0 \end{bmatrix}, \quad t \in \mathbb{R}
为了方便讨论, t=1 ~t=1~,向量 v1 ~\mathbf{v}_1~的实部可以表示为:Rev1=[25]T\operatorname{Re} \mathbf{v}_1 = \begin{bmatrix}-2 & 5\end{bmatrix}^T,向量的虚部可以表示为:Imv1=[40]T\operatorname{Im} \mathbf{v}_1 = \begin{bmatrix}-4 & 0\end{bmatrix}^T。 用同样的方法求解另一个特征值 λ2=0.8+0.6i ~\lambda_2=0.8+0.6i~对应的特征向量,得:
v2=t[25]+ti[40],tR\mathbf{v}_2 = t \begin{bmatrix} -2 \\ 5 \end{bmatrix} + t \cdot i \begin{bmatrix} 4 \\ 0 \end{bmatrix}, \quad t \in \mathbb{R}
那么,Rev2=[25]T,Imv2=[40]T\operatorname{Re} \mathbf{v}_2 = \begin{bmatrix}-2 & 5\end{bmatrix}^T,\,\operatorname{Im} \mathbf{v}_2 = \begin{bmatrix}4 & 0\end{bmatrix}^T。可以看到,特征向量v1\mathbf{v}_1v2\mathbf{v}_2也是共轭关系。

5. 有复特征值的实矩阵的相似表示

在前面讨论矩阵 C ~\mathbf{C}~的相似矩阵 A ~\mathbf{A}~时,我们给出的一组非标准基 B ~\mathcal{B}~正是矩阵 A ~\mathbf{A}~的特征向量( t=0.25 ~t=0.25~时)。这一结果对任意一个有复特征值的二阶实数矩阵都成立,有如下定理:

在定理中,复特征值 λ ~\lambda~可以选择 λ=a+bi ~\lambda = a + bi~ λ=abi ~\lambda = a - bi~中的任意一个,因为它们是共轭成对的,选择哪一个都不会影响最终的结论( A ~\mathbf{A}~会有所不同,但都是 C ~\mathbf{C}~的相似矩阵)。

开通会员解锁全部动画

此定理和本章中的定理 8都是告诉我们如何寻找合适的基通过相似变换来简化矩阵表示,只不过它们分别针对不同类型的特征值,定理 8 ~8~对应实特征值,定理 9 ~9~对应的是复特征值。

6. 高维空间中的复数特征值与不变平面

在高维空间中,含有复数特征值的矩阵依然延续了 R2 ~\mathbb{R^2}~中的几何特性。具体来说,复数特征值对应的矩阵变换通常会在某个不变平面上表现为旋转(可能伴随缩放),这一不变平面由与复数特征向量相关的几何性质所确定。而在垂直于该平面的方向上,矩阵的作用由其他特征值(通常是实数)决定,表现为扩展或压缩。例如下面的矩阵:
A=[0.80.600.60.80001.07]\mathbf{A} = \begin{bmatrix} 0.8 & -0.6 & 0 \\ 0.6 & 0.8 & 0 \\ 0 & 0 & 1.07 \end{bmatrix}
它的特征值为 λ1,2=0.8±0.6i,λ3=1.07~\lambda_{1,2} = 0.8\pm 0.6i,\,\lambda_3 = 1.07。那么,在 x1,x2 ~x_1,x_2~平面上的任何一个向量 w0 ~\mathbf{w}_0~仅会被 A ~\mathbf{A}~逆时针旋转36.8736.87^\circ,其它平面上的向量 x0 ~\mathbf{x}_0~的坐标会被拉伸 1.07 ~1.07~倍。