在马尔科夫链中的应用
马尔可夫链利用随机矩阵描述系统状态的概率演化,其中特征值
1 的特征向量确定系统的稳态分布。
1. 马尔可夫链的基本概念与定义
马尔可夫链 (Markov chains) 是一种用于描述
系统状态随时间演化的数学模型,其核心特点是无记忆性,即系统下一时刻的状态仅依赖于当前状态,而与过去的状态无关。例如,城市间人口流动可以使用马尔可夫链进行建模,用以分析人口迁移的动态变化。下面的热力图展示了一个简化后的模型,其中仅包含城市
A,B,C 三地的人口流动情况:
这个热力图通过颜色深浅直观地展示了
从当前城市的人口流动到其他城市的概率。例如,城市
A 中的人口,在接下来的一年有
85% 的概率仍然是留在城市
A ,
5% 的概率流动到城市
B ,
10% 的概率动到城市
C 。这些概率值构成了一个
概率向量 (probability vector) ,即一个非负且元素之和为
1 的向量。上述例子中,城市
A 对应的概率向量是
[0.850.050.1]T。而这些概率向量则构成了一个
随机矩阵 (stochastic matrix) :
P=0.850.050.10.10.80.10.040.060.9 马尔可夫链就是一系列概率向量
x0,x1,x2,⋯ 组成的序列,它与随机矩阵
P 相关联,并满足递推关系:
x1=Px0,x2=Px1,x3=Px2,… 这和离散动力系统的迭代形式非常相似,只不过这里的状态转移是通过随机矩阵进行的。因此,我们可以用差分方程的方法来求解马尔可夫链在长期演化后的状态:
xk+1=Pxk,k=0,1,2,… 其中,
xk 的每个分量代表系统在
n 个可能状态之一的概率(通常会做归一化),因此,
xk 也被称为
状态向量 (state vector) 。
2. 应用实例:城市人口迁移模型
现有
A,B,C 三个城市,我们可以用一个随机矩阵
P 来描述不同城市之间的人口迁移情况:
P=0.850.050.100.100.800.100.040.060.90 这个矩阵的每一列表示一个城市的人口分布概率,即该城市的人口在一年后留在原地或迁移到其他城市的比例。我们可以通过差分方程计算未来几年的人口分布:
xk+1=Pxk 假设今年
(2025) ,
A,B,C 三个城市的人口分别为
x0=[503020]T(单位万人),那么明年
(2026) 三个城市的人口预计为:
x1=Px0=0.850.050.100.100.800.100.040.060.90503020=46.327.726 同样的方法,可以计算后续年份的人口分布情况。不过,随着时间的推移,即使继续模拟人口流动,各城市的人口比例会逐渐稳定,最终不会发生显著变化。请观察下面的人口变化趋势图:
上面的人口变化趋势图表明,在经过若干年后,三个城市的人口会稳定在:城市 A 约 28 万人,城市 B 约 22 万人,城市 C 约 50 万人。接下来我们会证明:无论初始人口如何分布,最终三个城市的人口占比都会稳定下来(即 28:22:50 的比例)。
3. 稳态向量与特征值理论
在人口迁移的过程中,每一年人口分布的变化都是由随机矩阵
P 决定的:
xk+1=Pxk 如果经过无限次迭代后,系统达到了稳定状态,即:
x∞=Px∞ 这意味着最终的人口分布不会再发生变化,即:
Pq=q 其中
q 就是
稳态向量 (steady-state vector) 。而
q 是矩阵
P 的一个特征向量,对应的特征值是
1 。下面给出一个关于随机矩阵
P 的重要定理:
定理 10
随机矩阵的特征值
如果
P 是一个
n×n 的随机矩阵,那么
λ=1 是它的特征值。
随机矩阵的性质:
每列的元素之和为 1 ,即:
P=p11⋮pi1⋮pn1⋯⋱⋯⋱⋯p1j⋮pij⋮pnj⋯⋱⋯⋱⋯p1n⋮pin⋮pnn,i=1∑npij=1 。
构造特征向量:令
e 是一个所有分量都为
1 的向量:
e=11⋮1 计算
PTe:
PTe=p11⋮p1j⋮p1n⋯⋱⋯⋱⋯pi1⋮pij⋮pin⋯⋱⋯⋱⋯pn1⋮pnj⋮pnn1⋮1⋮1=e 这说明
e 是
PT 的特征向量,对应特征值
1 。
对偶性:由于
P 和 PT 具有相同的特征值。因此,
P 的特征值也是
1 。
根据上一节的幂法可知,经过多次幂次运算后,系统最终趋于稳定,而这一稳定状态与矩阵的最大特征值有关。对于随机矩阵 P ,其最大特征值为 λ=1 。根据这一结论,我们通过计算随机矩阵 P 的稳态向量,就可以得到城市人口的长期分布情况。下面我们还是以上面的城市人口迁移模型中的矩阵 P 为例,来计算稳态向量:
我们要求解:
Pq=q 即:
(P−I)q=0 给定的矩阵:
P=0.850.050.100.100.800.100.040.060.90 因此:
P−I=0.850.050.100.100.800.100.040.060.90−100010001 =−0.150.050.100.10−0.200.100.040.06−0.10 下面我们加入概率向量的约束条件(这一步是为了确保稳态向量是一个唯一确定的概率分布。当然,这一步也可以在得到参数化解之后再进行概率归一化处理):
x+y+z=1 增广矩阵为:
−0.150.050.1010.10−0.200.1010.040.06−0.1010001 通过初等行变换来化简增广矩阵。省去化简步骤,直接给出最终结果:
1000010000100.280.220.500 从化简后的矩阵可以看出:
x=0.28,y=0.22,z=0.50 因此,稳态向量为:
q=0.280.220.50 计算得到的稳态向量 q=[0.280.220.50]T 说明,最终城市 A,B,C 的人口占比会稳定在 28%,22%,50% 。该结果符合稳态分布的计算逻辑。
4. 正则随机矩阵与长期收敛性
我们这节研究的随机矩阵是马尔可夫链中的一类特殊的随机矩阵,称作
正则随机矩阵(regular stochastic matrix),它满足某个幂
Pk 的
所有元素严格为正。正则随机矩阵保证了马尔可夫链无论初始状态如何,系统都会
收敛 (converges) 到一个唯一的稳态分布。这一性质可以通过以下定理来严格说明:
定理 11
正则随机矩阵的唯一稳态分布定理
如果
P 是一个
n×n 的正则随机矩阵,那么它一定存在一个
唯一的稳态向量 q ,且对任意初始状态
x0 。对于任何初始状态
x0 ,经过多次矩阵迭代
xk+1=Pxk 都会收敛到这个唯一的
q 。
由于这些工具涉及
更深入的线性代数和马尔可夫过程理论,定理
11 的完整证明并不是我们需要讨论的范围。