线性代数 Cheat Sheet 4-9:马尔可夫链中的应用
马尔可夫链习惯上用来描述用用一种方法进行多次实验或测量,实验中每次测试的结果属于几个指定的可能结果之一,每次测试结果仅依赖于最近的前一次测试。
一个具有非负元素且各元素的数值相加等于 1 的向量称为概率向量。随机矩阵是各列向量均为概率向量的方阵。马尔可夫链是一个概率向量序列 x0,x1,x2,⋯ 和一个随机矩阵 P,满足
x1=Px0,x2=Px1,x3=Px2,⋯
于是马尔可夫链可用一阶差分方程来刻画:
xk+1=Pxk,k=0,1,2,⋯
当向量在 Rn 中的一个马尔可夫链描述一个系统或实验的序列时,xk 中的元素分别列出系统在 n 个可能状态中的概率,或实验结果是 n 个可能结果之一的概率。因此,xk 通常称为状态向量。
1. 稳态向量
若 P 是一个随机矩阵,则相对于 P 的稳态向量(或平衡向量)是一个满足
Pq=q
的概率向量 q。可以证明每一个随机矩阵有一个稳态向量。
可以通过解方程 Px=P 来寻找随机矩阵 P 的稳态向量。例如令 P=[0.60.30.40.7],解方程 Px=P:
Px–x=0(P–I)x=0
由
P–I=[0.60.30.40.7]–[1001]=[−0.40.30.4−0.3]
化简增广矩阵
[−0.40.300.4−0.30]∼[1−3/40000]
得到通解为 x2[3/41]。对此解空间选一个简单的基 w=[34],将 w 除以其元素之和,得到概率向量 q=[3/74/7]。检验之,计算
Pq=[0.60.30.40.7][3/74/7]=[30/7040/70]=q
如果一个随机矩阵的某次幂 Pk 仅包含严格正的元素,则称这个随机矩阵是正则的。
对于一个向量序列 {xk:k=1,2,⋯},如果当 k 充分大时,xk 中的元素无限接近 q 中对应的元素,则称该向量序列当 k→∞ 时收敛到一个向量 q。
定理 18 若 P 是一个 n×n 的正则随机矩阵,则 P 具有唯一的稳态向量 q。进一步地,若 x0 是任一个初始状态,且 xk+1=Pxk,k=0,1,2,⋯,则当 k→∞ 时,马尔可夫链 {xk} 收敛到 q。
这个定理说明初始状态对马尔可夫链的长期行为没有影响。