线性变换的矩阵 每一个从
R n ~\mathbb{R^n}~ R n 到
R m ~\mathbb{R^m}~ R m 的线性变换实际上都可以表示为矩阵变换
x ↦ A x ~\mathbf{x}\mapsto A\mathbf{x}~ x ↦ A x 。变换
T ~T~ T 的性质与矩阵
A ~\mathbf{A}~ A 的性质密切相关。
在上一节线性变换的示例中,我们都是直接给出了对应的线性变换矩阵,然后再去观察它对目标向量产生了什么样的变换。比如:矩阵 A = [ 0 − 1 1 0 ] ~A=\begin{bmatrix}0&-1\\1&0\end{bmatrix}~ A = [ 0 1 − 1 0 ] 会将二维平面中的向量逆时针旋转90°。那如果把问题反过来,比如:在二维平面中,对于一个给定向量,求出其关于 x 轴对称的向量,这个变换对应的矩阵是什么?为了回答这个问题,请观察下面两个变换中求解变换矩阵 A ~\mathbf{A}~ A 的过程:
逆时针旋转 90° 关于x 1 x_1~ x 1 轴对称
从上面的示例中不难看出,我们可以通过线性变换 T ~T~ T 对单位矩阵 I n ~I_n~ I n 的列向量的作用来确定矩阵 A ~\mathbf {A}~ A 的每一列。这就是线性变换矩阵 A ~\mathbf{A}~ A 的构造方法,即通过变换 T ~T~ T 对标准基向量 的作用来确定 A ~\mathbf{A}~ A 的每一列,从而确定矩阵 A ~\mathbf{A}~ A 的形式。
对于任何从 R n ~\mathbb{R^n}~ R n 到 R m ~\mathbb{R^m}~ R m 的线性变换 T ~T~ T ,都存在且只有一个矩阵 A ~\mathbf{A}~ A ,它可以完全描述这个变换 T ~T~ T 。换句话说,每个线性变换都可以通过矩阵乘法来表示。这个矩阵 A ~\mathbf{A}~ A 被称为线性变换 T ~T~ T 的 标准矩阵 。有如下定理:
线性变换的标准矩阵
设:
T : R n ↦ R m ~T:\mathbb{R^n}\mapsto \mathbb{R^m}~ T : R n ↦ R m 是一个线性变换。则存在唯一的矩阵
A ~\mathbf{A}~ A ,使得对于
R n ~\mathbb{R^n}~ R n 中的所有
x ~\mathbf{x}~ x ,有
T ( x ) = A x ~T(\mathbf{x})=A\mathbf{x}~ T ( x ) = A x 实际上,矩阵
A ~\mathbf{A}~ A 是一个
m × n ~m\times n~ m × n 的矩阵,它的第
j ~j~ j 列是向量
T ( e j ) ~T(\mathbf{e_j})~ T ( e j ) ,其中
e j ~\mathbf{e_j}~ e j 中单位矩阵的第
j ~j~ j 列:
A = [ T ( e 1 ) … T ( e n ) ] A=\begin{bmatrix}T(\mathbf{e_1})&\dots T(\mathbf{e_n})\end{bmatrix} A = [ T ( e 1 ) … T ( e n ) ] 定理 10
下面是对定理 10 的证明过程:
1
证明存在矩阵 A ~\mathbf{A}~ A ,使得 T ( x ) = A x ~T(\mathbf{x})=A\mathbf{x}~ T ( x ) = A x 任意向量
x ~\mathbf{x}~ x 都可以表示为标准基向量的线性组合:
x = x 1 e 1 + x 2 e 2 + ⋯ + x n e n \mathbf{x} = x_1 \mathbf{e_1} + x_2 \mathbf{e_2} + \dots + x_n \mathbf{e_n} x = x 1 e 1 + x 2 e 2 + ⋯ + x n e n 由于
T ~T~ T 是线性变换,
根据上一节推论 ,可知:
T ( x ) = T ( x 1 e 1 + x 2 e 2 + ⋯ + x n e n ) = x 1 T ( e 1 ) + x 2 T ( e 2 ) + ⋯ + x n T ( e n ) = [ T ( e 1 ) T ( e 2 ) … T ( e n ) ] [ x 1 x 2 ⋮ x n ] = A x \begin{align*}T(\mathbf{x})&= T(x_1 \mathbf{e_1} + x_2 \mathbf{e_2} + \dots + x_n \mathbf{e_n})\\[2ex] &= x_1 T(\mathbf{e_1}) + x_2 T(\mathbf{e_2}) + \dots + x_n T(\mathbf{e_n})\\[2ex] &= \begin{bmatrix}T(\mathbf{e_1})&T(\mathbf{e_2})&\dots &T(\mathbf{e_n})\end{bmatrix}\begin{bmatrix}x_1\\x_2\\ \vdots \\x_n\end{bmatrix}\\[2ex] &=A\mathbf{x} \end{align*} T ( x ) = T ( x 1 e 1 + x 2 e 2 + ⋯ + x n e n ) = x 1 T ( e 1 ) + x 2 T ( e 2 ) + ⋯ + x n T ( e n ) = [ T ( e 1 ) T ( e 2 ) … T ( e n ) ] x 1 x 2 ⋮ x n = A x 这表明
T ( x ) = A x ~T(\mathbf{x})=A\mathbf{x}~ T ( x ) = A x ,即矩阵
\MATHBF A ~\MATHBF{A}~ \MATHBF A 可以表示线性变换
T ~T~ T 。
假设存在两个矩阵
A ~\mathbf{A}~ A 和
B ~B~ B ,它们都能表示同一个线性变换
T ~T~ T ,即对所有
x ∈ R n ~\mathbf{x}\in\mathbb{R^n}~ x ∈ R n ,都有:
T ( x ) = A x = B x ~T(\mathbf{x})=A\mathbf{x}=B\mathbf{x}~ T ( x ) = A x = B x 。对于
任意 标准基向量
e j ∈ R n , ( j = 1 , 2 , … , n ) ~\mathbf{e_j}\in \mathbb{R^n},\quad (j = 1, 2, \dots, n)~ e j ∈ R n , ( j = 1 , 2 , … , n ) ,我们有:
T ( e j ) = A e j T ( e j ) = B e j \begin{align*}T(\mathbf{e_j})=A\mathbf{e_j}\\[2ex] T(\mathbf{e_j})=B\mathbf{ e_j }\end{align*} T ( e j ) = A e j T ( e j ) = B e j 因为假设
T ( x ) = A x = B x ~T(\mathbf{x})=A\mathbf{x}=B\mathbf{x}~ T ( x ) = A x = B x ,所以:
A e j = B e j \textcolor{red}{A\mathbf{e_j}=B\mathbf{e_j}} A e j = B e j 也就是说,矩阵
\MATHBF A ~\MATHBF{A}~ \MATHBF A 和矩阵
B ~B~ B 的第
j ~j~ j 列是相等的(因为
A e j ~A\mathbf{e_j}~ A e j 和
B e j ~B\mathbf{e_j}~ B e j 分别是矩阵
A ~\mathbf{A}~ A 和
B ~B~ B 的第
j ~j~ j 列),因此
\MATHBF A ~\MATHBF{A}~ \MATHBF A 和
B ~B~ B 的每一列都相等,因此
\MATHBF A ~\MATHBF{A}~ \MATHBF A 和
B ~B~ B 是完全相同的矩阵。也就是说,矩阵
\MATHBF A ~\MATHBF{A}~ \MATHBF A 是唯一的。
为什么称 A ~\mathbf{A}~ A 为“标准”矩阵
•
标准基 : 矩阵 A 之所以被称为“标准”矩阵,是因为它是基于标准基向量变换的。后续章节中,我们将看到
基于“非标准基”的变换形式 。
•
唯一性 :由于矩阵 A 是基于标准基构造的,这确保了它在标准基下的唯一性。而对于“非标准基”的变换,矩阵的形式则不再唯一,
可能因选择不同的基而有所不同 。
用矩阵表示线性变换是以矩阵乘法 A x ~A\mathbf{x}~ A x 来表示的,这种符号化的表示方式,虽然简洁有力,但也更加抽象,因为它将具体的几何图形转换成了代数表达式。以下是一些 R 2 ~\mathbb{R^2}~ R 2 中基本的几何变换,通过观察图形的变化直观感受线性变换的效果。这将帮助你建立几何直觉,为理解更复杂的变换(如:复合变换 )打下基础。
3.1 对称 3
关于 x 2 = x 1 ~x_2=x_1~ x 2 = x 1 的对称 4
关于 x 2 = − x 1 ~x_2=-x_1~ x 2 = − x 1 的对称 3.2 收缩和拉伸 3.3 剪切 3.4 投影 线性变换的一般性
线性变换的概念不仅限于特定的维度或特定的几何形状,而是适用于任何维度 的向量空间。这意味着,无论是在二维、三维还是更高维度空间中,线性变换的定义和性质都是相同的。这种广泛适用的特性使线性变换成为一个更为一般化的概念。相比之下,上面这些具体的几何变换(旋转、缩放、剪切等)更具象,更容易直观理解。
4. 线性变换的两个重要性质 通过线性变换的概念,我们可以从一个新的视角来探讨和回答之前提出的存在性和唯一性问题。相比传统的解法(比如:消元法),这种方法在理论上具有更大的普遍性(不仅仅适用于特定的线性方程组问题),并且能够提供一个更全面的理解。在这之前,我们需要先介绍线性变换的两个重要性质:满射和单射。
满射(onto)
若对于
R m ~\mathbb{R^m}~ R m 中的每一个
b ~\mathbf{b} b ,都存在至少一个
R n ~\mathbb{R^n}~ R n 中的
x ~\mathbf{x}~ x 使得
T ( x ) = b ~T(\mathbf{x}) = \mathbf{b} T ( x ) = b ,那么映射
T ~T~ T 被称为是满射到
R m ~\mathbb{R^m}~ R m 。
定义
对于满射等价的描述 :映射 T ~T~ T 满射到 R m ~\mathbb{R^m}~ R m 意味着 T ~T~ T 的值域(range)值域覆盖整个 R m ~\mathbb{R^m}~ R m )。
判断是否满射 :判断 T ~T~ T 是否满射是一个存在性的问题 。对于 R m ~\mathbb{R^m}~ R m 中的每一个 b ~\mathbf{b}~ b ,T ( x ) = b T(\mathbf{x}) = \mathbf{b} T ( x ) = b 至少有一个解,那么映射 T ~T~ T 就是满射。注意观察下图,图中左边不是满射,右边是满射:
单射(one to one)
如果
R m ~\mathbb{R^m}~ R m 中的每个
b ~\mathbf{b}~ b 至多是
R n ~\mathbb{R^n}~ R n 中某个
x ~\mathbf{x}~ x 的像(image),那么映射 T 被称为单射映射,也就是一对一映射。
定义
单射 T ~T~ T 不会把两个或多个不同的 x ~\mathbf{x}~ x 映射到相同的 b ~\mathbf{b}~ b 上。如果存在不同的 x 1 ~\mathbf{x}_1~ x 1 和 x 2 ~\mathbf{x}_2~ x 2 (其中 x 1 ≠ x 2 ~\mathbf{x}_1\neq\mathbf{x}_2~ x 1 = x 2 ),使得T ( x 1 ) = T ( x 2 ) T(\mathbf{x}_1) = T(\mathbf{x}_2) T ( x 1 ) = T ( x 2 ) ,那么这个映射 T ~T~ T 就不是单射。
满射和单射是线性变换的重要性质,它们基于数学定义,并且独立于具体的数值计算,因此本质上具有抽象性 。为了进一步探讨线性变换的这些性质,我们需要将满射和单射这两个概念与线性变换的矩阵表示联系起来,从而为方程组解的存在性和唯一性问题提供理论依据。接下来,我们将通过介绍两个重要的定理来建立它们之间的联系。
下面是对定理 11 的证明过程:
1
必要性: T ~T~ T 单射 ⇒ T ( x ) = 0 ~\Rightarrow T(\mathbf{x})=\mathbf{0}~ ⇒ T ( x ) = 0 仅有平凡解 1. 假设
T ~T~ T 是单射的,即对于
R m ~\mathbb{R^m}~ R m 中的每一个
b ~\mathbf{b}~ b ,方程
T ( x ) = b ~T(\mathbf{x})=\mathbf{b}~ T ( x ) = b 至多有一个解。
2. 再来看齐次方程
T ( x ) = 0 ~T(\mathbf{x})=\mathbf{0}~ T ( x ) = 0 的解集。假设
u ~\mathbf{u}~ u 和
v ~\mathbf{v}~ v 是该方程的两个解,即:
T ( u ) = 0 , T ( v ) = 0 T(\mathbf{u})=\mathbf{0},T(\mathbf{ v })=\mathbf{0} T ( u ) = 0 , T ( v ) = 0 3. 由于
T ~T~ T 是线性变换,因此:
T ( u − v ) = 0 ⇒ T ( u ) − T ( v ) T(\mathbf{u}-\mathbf{v})=\mathbf{0}\Rightarrow T(\mathbf{u})-T(\mathbf{v}) T ( u − v ) = 0 ⇒ T ( u ) − T ( v ) 4. 因为
T ~T~ T 是单射的,这意味着
T ( x ) = 0 ~T(\mathbf{x})=\mathbf{0}~ T ( x ) = 0 的解是唯一的(即,
x = 0 \mathbf{x}=\mathbf{0}~ x = 0 )。因此:
x = u − v = 0 ⇒ u = v \mathbf{x}=\mathbf{u}-\mathbf{v}=\mathbf{0}\Rightarrow \mathbf{u}=\mathbf{v} x = u − v = 0 ⇒ u = v 5. 可得结论:
T ( x ) = 0 ~T(\mathbf{x})=\mathbf{0}~ T ( x ) = 0 只有平凡解
x = 0 ~\mathbf{x}=\mathbf{0}~ x = 0 ,即
x = 0 ~\mathbf{x}=\mathbf{0}~ x = 0 是唯一的解。
2
充分性: T ( x ) = 0 ~T(\mathbf{x})=\mathbf{0} T ( x ) = 0 只有平凡解 ⇒ T ~\Rightarrow T~ ⇒ T 单射 1. 假设
T ( x ) = 0 ~T(\mathbf{x})=\mathbf{0}~ T ( x ) = 0 只有平凡解
x = 0 ~\mathbf{x}=\mathbf{0}~ x = 0 2. 要证明
T ~T~ T 是单射的,也就是证明:如果
T ( u ) = T ( v ) ~T(\mathbf{u})=T(\mathbf{v})~ T ( u ) = T ( v ) ,那么
u ~\mathbf{u}~ u 和
v ~\mathbf{v}~ v 一定是相同的,即证明:
已知 : T ( u ) − T ( v ) = 0 , 来证明 u = v \textcolor{red}{已知:T(\mathbf{u})-T(\mathbf{v})=\mathbf{0},~来证明~\mathbf{u}=\mathbf{v}} 已知 : T ( u ) − T ( v ) = 0 , 来证明 u = v 3. 由于
T ~T~ T 是线性变换,因此:
T ( u − v ) = T ( u ) − T ( v ) = 0 T(\mathbf{u}-\mathbf{v})=T(\mathbf{u})-T(\mathbf{v})=\mathbf{0} T ( u − v ) = T ( u ) − T ( v ) = 0 4. 根据假设,方程
T ( x ) = 0 ~T(\mathbf{x})=\mathbf{0}~ T ( x ) = 0 只有平凡解,所以:
u − v = 0 ⇒ u = v \mathbf{u}-\mathbf{v}=\mathbf{0}\Rightarrow \mathbf{u}=\mathbf{v} u − v = 0 ⇒ u = v 5. 由此可以得出结论
T ~T~ T 是单射的。
定理 11 的作用
1.
建立单射性与齐次方程唯一解之间的关系: 我们可以通过检验方程
A x = 0 ~A\mathbf{x}=\mathbf{0}~ A x = 0 的解是否唯一来判断
T ~T~ T 是否为单射。
2.
连接线性变换的抽象性质与具体的矩阵运算: 我们能够通过具体的矩阵运算(如解方程
A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 )来验证线性变换的抽象性质,从而将理论问题转化为可操作的计算问题。
请利用定理 11 解答下面的问题:设
T ~T~ T 是线性变换,它的标准矩阵
A ~\mathbf{A}~ A 为
[ 1 − 4 8 1 0 2 − 1 3 0 0 0 5 ] \begin{bmatrix}1&-4&8&1\\0&2&-1&3\\0&0&0&5\end{bmatrix} 1 0 0 − 4 2 0 8 − 1 0 1 3 5 (1)请判断 T ~T~ T 是否为 R 4 ↦ R 3 ~\mathbb{R^4}\mapsto \mathbb{R^3}~ R 4 ↦ R 3 的单射 ?解答这个问题我们只需要判断齐次方程
A x = 0 ~A\mathbf{x}=\mathbf{0}~ A x = 0 是否仅有平凡解 x = 0 ~\mathbf{x}=\mathbf{0}~ x = 0 ,很显然矩阵
A 3 × 4 ~A_{3\times 4}~ A 3 × 4 的列向量数量多于向量的元素个数(矩阵的列数多于行数),根据本章节的
定理8 可以判断
A ~\mathbf{A}~ A 的列向量线性无关,那么方程
A x = 0 ~A\mathbf{x}=\mathbf{0}~ A x = 0 一定有非平凡解,所以可以判断
T ~T~ T 并不是单射。
(2)请判断 T ~T~ T 是否为 R 4 ↦ R 3 ~\mathbb{R^4}\mapsto \mathbb{R^3}~ R 4 ↦ R 3 的满射 ?解答这个问题可以用到下面的定理 12(a) ,因为矩阵 A ~\mathbf{A}~ A 的每一行都有一个主元位置,根据本章节的定理 4 可知,矩阵 A ~\mathbf{A}~ A 的列向量张成 R 3 ~\mathbb{R^3}~ R 3 ,所以 T ~T~ T 是满射的。
下面是对定理 12 的证明过程:
必要性:
假设 T ~T~ T 是满射的,这意味着对于 R m ~\mathbb{R^m}~ R m 中的每一个 b ~\mathbf{b}~ b ,存在 x ∈ R n ~\mathbf{x}\in \mathbb{R^n}~ x ∈ R n 使得 T ( x ) = A x = b ~T(\mathbf{x})=A\mathbf{x}=\mathbf{b}~ T ( x ) = A x = b 。 这意味着,方程 A x = b ~A\mathbf{x}=\mathbf{b}~ A x = b 对于 b ∈ R m ~\mathbf{b}\in\mathbb{R^m}~ b ∈ R m 都有解。因此(根据定理 4 ), A ~\mathbf{A}~ A 的列向量必须能够组合成任何 R m ~\mathbb{R^m}~ R m 中的向量,即 A ~\mathbf{A}~ A 的列向量张成整个 R m ~\mathbb{R^m}~ R m 。 充分性:
· 假设 A ~\mathbf{A}~ A 的列向量张成 R m ~\mathbb{R^m}~ R m ,这意味着任意 b ∈ R m ~\mathbf{b}\in \mathbb{R^m}~ b ∈ R m 都可以表示为 A ~\mathbf{A}~ A 的列向量的线性组合。因此,对于每个 b ~\mathbf{b}~ b ,存在一个 x ∈ R n ~\mathbf{x}\in \mathbb{R^n}~ x ∈ R n 使得 A x = b ~A\mathbf{x}=\mathbf{b}~ A x = b 。 这表明 T ( x ) = b ~T(\mathbf{x})=\mathbf{b}~ T ( x ) = b 对于任意 x ∈ R n ~\mathbf{x}\in \mathbb{R^n}~ x ∈ R n 都有解,因此 T ~T~ T 是满射的。 必要性:
假设 T ~T~ T 是单射的,这意味着 T ( x ) = A x = 0 ~T(\mathbf{x})=A\mathbf{x}=\mathbf{0}~ T ( x ) = A x = 0 仅有平凡解 x = 0 ~\mathbf{x}=\mathbf{0}~ x = 0 。 如果 A ~\mathbf{A}~ A 的列向量线性相关,那么存在非零向量 x ~\mathbf{x}~ x 使得 A x = 0 ~A\mathbf{x}=\mathbf{0}~ A x = 0 ,这与 T ~T~ T 是单射的假设矛盾。因此, A ~\mathbf{A}~ A 的列向量一定是线性无关的。 充分性:
假设 A ~\mathbf{A}~ A 的列向量线性无关,这意味着T ( x ) = A x = 0 T(~\mathbf{x})=A\mathbf{x}=\mathbf{0}~ T ( x ) = A x = 0 。 因此, T ( x ) = b ~T(\mathbf{x})=\mathbf{b}~ T ( x ) = b 对于任意 b ∈ R m ~\mathbf{b}\in \mathbb{R^m}~ b ∈ R m 最多有一个解,这表明 T ~T~ T 是单射的。