二次型
二次型(quadratic form)是线性代数中研究二次多项式函数的核心工具,其本质是通过对称矩阵将复杂的二次关系转化为结构化的矩阵形式。
设
Rn 为
n 维实向量空间,二次型是定义在
Rn 上的函数
Q(x) ,其形式为:
Q(x)=xTAx=i=1∑nj=1∑naijxixj 其中,
x=[x1x2⋯xn]T是列向量,
A为
n×n 实对称矩阵,称为
关于二次型的矩阵(matrix of the quadratic form)。例如,对于二维变量
x=[x1x2]T,二次型的矩阵形式为:
Q(x)=[x1x2][a11a21a12a22][x1x2] 展开后得到二次函数:
Q(x)=a11x12+(a12+a21)x1x2+a22x22 由于
A 对称
(a12=a21),最终形式为:
Q(x)=a11x12+2a12x1x2+a22x22 下面两个示例分别演示了对角矩阵和对称矩阵的二次型计算,通过矩阵乘法将二次型
Q(x)=xTAx 展开为具体的多项式形式的过程:
通过对比可以发现,对角矩阵的二次型仅包含平方项,而非对角矩阵的二次型则包含交叉项,其系数由矩阵的非对角元素决定。下面的示例展示了如何将一个给定的二次多项式表示为矩阵形式 xTAx :
通过将平方项的系数置于矩阵的对角线,并将交叉项的系数平分到对称位置,可以构造出对称矩阵 A ,从而将二次型转化为矩阵形式。
在实际应用中,为了进一步简化复杂的二次关系,通常的做法是对二次型进行标准化处理,通过变量替换将其转化为仅含平方项的标准形式。我们接下来讨论如何通过正交对角化和变量替换实现这一过程。
二次型中的交叉项会增加计算复杂度,并使得几何性质(如椭圆、双曲线的形状和方向)难以直观理解。为了简化分析和计算,可以通过
变量替换消除交叉项,将其转化为标准形式:
Q(x)=λ1y12+λ2y22+⋯+λnyn2=[y1y2⋯yn]λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λny1y2⋮yn=yTDy 其中,
D 为对角矩阵,对角元素
λ1,λ2,⋯,λn 为二次型矩阵
A 的特征值,
y 为新的变量。
2.2 变量替换的核心思想
变量替换的核心思想是通过一个可逆矩阵
P 将原始变量
x 替换为新变量
y ,即:
x=Py 通过这种替换,二次型
Q(x)=xTAx 可以转化为:
Q(x)=(Py)TA(Py)=yT(PTAP)y(1) 新的二次型矩阵变为
D=PTAP。可见,变量替换的过程本质上就是对矩阵
A 正交对角化的过程。
2.3 变量替换的示例
给定二次型:
Q(x)=x12−8x1x2−5x22 通过变量替换将其转化为标准形式,消除交叉项。
将二次型
Q(x)=x2−8x1x2−5x22 表示为矩阵形式
Q(x)=xTAx ,其中
A 是对称矩阵。根据二次型的系数,矩阵
A 为:
A=[1−4−4−5]
计算特征值:求解特征方程
det(A−λI)=0 :
det[1−λ−4−4−5−λ]=(1−λ)(−5−λ)−(−4)2=λ2+4λ−21=0 解得特征值:
λ1=3,λ2=7 计算特征向量:
对于
λ1=3 ,解方程
(A−3I)v=0 :
[−2−4−4−8][v1v2]=[00] 解得特征向量
v=[2−1]T ,归一化后得
[2/5−1/(5)]T 。
对于
λ2=7 ,解方程
(A−7I)v=0 :
[8−4−42][v1v2]=[00] 解得特征向量
v=[12]T ,归一化后得
[1/52/(5)]T 。
构造正交矩阵 P 和对角矩阵
D :将单位特征向量按列排列,得到正交矩阵
P ;对角矩阵
D 对角元素为特征值:
P=[2/5−1/51/52/5],D=[300−7]
通过变量替换
x=Py ,将二次型转化为标准形式:
Q(x)=yTDy=3y12−7y22
取 x=[2−2]T ,验证标准形式的值是否与原二次型一致。
计算
y=PTx :
y=[2/51/5−1/52/5][2−2]=[6/5−2/5] 计算标准形式的值:
3y12−7y22=3(56)2−7(5−2)2 计算原二次型的值:
Q(x)=(2)2−8(2)(−2)−5(−2)2=4+32−20=16
结论:验证结果一致。
验证标准形式的值和原二次型结果等价可由下图说明:
3. 主轴定理及其几何意义
根据 (1) 式,我们可以把变量变换过程可以推广到任意的对称矩阵,这一结论由下面的主轴定理给出。“主轴”(Principal Axes)的概念让我们可以将二次型的几何图形(如椭圆、双曲线)对齐到标准位置,从而更好地理解二次型的性质。
3.1 主轴定理
定理 4
主轴定理
设
A 是一个
n×n 的对称矩阵。则存在一个正交变量替换
x=Py ,将二次型
xTAx 转化为不含交叉项的二次型标准形式
yTDy 。
在主轴定理中,正交矩阵 P 的列向量被称为二次型 xTAx 的主轴,这些主轴实际上是矩阵 A 的特征向量,它们构成了 Rn 的一个标准正交基。
3.2 几何意义
主轴变换的几何意义在于通过坐标系的旋转,将复杂的二次型图形转化为标准形式。二次型
xTAx=c ( c 为常数)对应的几何图形可能是椭圆、双曲线、直线等,具体形态取决于矩阵
A 的特征值和常数
c 的符号。例如,当
A 为非对角矩阵时,图形处于非主轴位置,且二次型有交叉项。通过对
A 进行标准化处理,实际上是将图形旋转到由
A 的特征向量定义的主轴位置。这一过程可以通过下面的动画展示:
3.3 动画中的两个示例
二次型矩阵为:
A=[5−2−25] A 的特征值为
λ1=3, λ2=7 ,对应的单位特征向量为:
u1=[1/21/2],u2=[−1/21/2] 变量替换:
x=Py,P=[1/21/2−1/21/2] 二次型的标准形式为:
yTDy=3y12+7y22
二次型矩阵为:
A=[1−4−4−5] A 的特征值为
λ1=3, λ2=−7 ,对应的单位特征向量为:
u1=[−2/51/5],u2=[1/52/5] 变量替换:
x=Py,P=[−2/51/51/52/5] 二次型的标准形式为:
yTDy=3y12−7y22
当 A 是一个 n×n 矩阵时,二次型 Q(x)=xTAx 是一个定义域为 Rn 的实值函数。对于二维空间中的二次型 Q(x)=xTAx ,其几何图形可以通过 z=Q(x) 来表示,其中 z 是二次型在点 (x1,x2) 处的值。此时, (x1,x2,z) 表示的是三维空间中的图形。下面的三维场景展示了四个不同的二次型图形:
(1)z=3x12+7x22: 这是一个正定(Positive Definite)二次型,对于所有非零向量 x ,Q(x)>0。它对应的图形是一个开口向上的椭圆抛物面。
(2)z=3x12: 这是一个半正定(Positive Semidefinite)二次型,对于所有向量 x ,Q(x)≥0。它对应的图形是一个开口向上的抛物线。
(3)z=3x12−7x22: 这是一个不定(Indefinite)二次型,存在某些向量 x 使得Q(x)>0,另一些向量 x 使得Q(x)<0。 它对应的图形是一个双曲抛物面(形状像马鞍,又叫马鞍面)。
(4)z=−3x12−7x22:它是一个负定(Negative Definite)二次型,对应图形是一个开口向下的椭圆抛物面。
通过对二次型的定号性(如正定、负定、不定等)进行分类,我们可以更好地理解其几何性质、代数性质以及在实际问题中的应用。例如,在优化问题中,正定二次型对应于严格凸函数,具有唯一的最小值;负定二次型对应于严格凹函数,具有唯一的最大值;而不定二次型则可能具有鞍点。
二次型矩阵 A 的特征值的符号直接决定了二次型的定号性,进而决定了其几何图形的形状和方向。通过研究特征值,我们可以快速判断二次型的性质,有以下定理:
应用主轴定理
根据主轴定理,存在一个正交变换
x=Py ,其中
P 是一个正交矩阵
(PT=P−1),使得:
Q(x)=xTAx=yTDy 其中
D 是对角矩阵,其对角线元素是
A 的特征值
λ1,λ2,⋯,λn 。
将二次型转化为标准形式
通过正交变换,二次型
Q(x) 可以表示为:
Q(x)=yTDy=λ1y12+λ2y22+⋯+λnyn2
分析特征值的符号
由于 P 是可逆的, x 和 y 之间存在一一对应关系。因此, Q(x) 的值(对于 x=0 )与标准形式 yTDy 的值一致。
标准形式 yTDy=yTDy=λ1y12+λ2y22+⋯+λnyn2 的值完全由特征值 λ1,λ2,⋯,λn 的符号决定。
根据特征值的符号分类正定:如果所有特征值 λi>0 ,则对于所有非零 y ,yTDy>0,因此 Q(x)>0 对所有非零 x 成立。
负定:如果所有特征值 λi<0 ,则对于所有非零 y ,yTDy<0,因此 Q(x)<0 对所有非零 x 成立。
不定:如果特征值有正有负,则存在某些 y 使得yTDy>0,另一些 y 使得yTDy<0,因此 Q(x) 既取正值又取负值。
根据定理
5 ,我们可以通过分析矩阵的特征值来判断一个二次型属于哪一种类型。例如,判断二次型
Q(x)=3x12+2x22+x32+4x1x2+4x2x3 是否为正定的。尽管这个二次型的所有系数都是正的,看起来像是正定的,但其矩阵:
A=320222021 的特征值为
λ1=5,λ2=2,λ3=−1 。因此,
Q(x) 是一个不定二次型。它所对应的几何图形为单叶双曲面:
对二次型的分类可以应用于其对应的对称矩阵上。具体来说,如果某个对称矩阵 A 对应的二次型 xTAx 是正定的(等价于 A 的特征值均为正),那么我们称矩阵 A 为正定矩阵(positive definite matrix)。类似地,如果二次型是负定的(特征值全负),则 A 为负定矩阵(negative definite matrix),以此类推。