Processing math: 100%

线性代数 Cheat Sheet 4-9:马尔可夫链中的应用

  马尔可夫链习惯上用来描述用用一种方法进行多次实验或测量,实验中每次测试的结果属于几个指定的可能结果之一,每次测试结果仅依赖于最近的前一次测试。

  一个具有非负元素且各元素的数值相加等于 1 的向量称为概率向量随机矩阵是各列向量均为概率向量的方阵。马尔可夫链是一个概率向量序列 x0,x1,x2, 和一个随机矩阵 P,满足

x1=Px0,x2=Px1,x3=Px2,

于是马尔可夫链可用一阶差分方程来刻画:

xk+1=Pxk,k=0,1,2,

  当向量在 Rn 中的一个马尔可夫链描述一个系统或实验的序列时,xk 中的元素分别列出系统在 n 个可能状态中的概率,或实验结果是 n 个可能结果之一的概率。因此,xk 通常称为状态向量

1. 稳态向量

  若 P 是一个随机矩阵,则相对于 P稳态向量(或平衡向量)是一个满足

Pq=q

的概率向量 q。可以证明每一个随机矩阵有一个稳态向量。

  可以通过解方程 Px=P 来寻找随机矩阵 P 的稳态向量。例如令 P=[0.60.30.40.7],解方程 Px=P

Pxx=0(PI)x=0

PI=[0.60.30.40.7][1001]=[0.40.30.40.3]

化简增广矩阵

[0.40.300.40.30][13/40000]

得到通解为 x2[3/41]。对此解空间选一个简单的基 w=[34],将 w 除以其元素之和,得到概率向量 q=[3/74/7]。检验之,计算

Pq=[0.60.30.40.7][3/74/7]=[30/7040/70]=q

  如果一个随机矩阵的某次幂 Pk 仅包含严格正的元素,则称这个随机矩阵是正则的。

  对于一个向量序列 {xk:k=1,2,},如果当 k 充分大时,xk 中的元素无限接近 q 中对应的元素,则称该向量序列当 k收敛到一个向量 q

  定理 18 若 P 是一个 n×n 的正则随机矩阵,则 P 具有唯一的稳态向量 q。进一步地,若 x0 是任一个初始状态,且 xk+1=Pxk,k=0,1,2,,则当 k 时,马尔可夫链 {xk} 收敛到 q

  这个定理说明初始状态对马尔可夫链的长期行为没有影响。