线性代数 Cheat Sheet 4-9:马尔可夫链中的应用
马尔可夫链习惯上用来描述用用一种方法进行多次实验或测量,实验中每次测试的结果属于几个指定的可能结果之一,每次测试结果仅依赖于最近的前一次测试。
一个具有非负元素且各元素的数值相加等于 1 的向量称为概率向量。随机矩阵是各列向量均为概率向量的方阵。马尔可夫链是一个概率向量序列 \boldsymbol x_0, \boldsymbol x_1, \boldsymbol x_2, \cdots 和一个随机矩阵 P,满足
\begin{equation} \boldsymbol x_1 = P \boldsymbol x_0, \; \boldsymbol x_2 = P \boldsymbol x_1, \; \boldsymbol x_3 = P \boldsymbol x_2, \cdots \end{equation}
于是马尔可夫链可用一阶差分方程来刻画:
\begin{equation} \boldsymbol x_{k+1} = P \boldsymbol x_k, \; k = 0, 1, 2, \cdots \end{equation}
当向量在 \mathbb{R}^n 中的一个马尔可夫链描述一个系统或实验的序列时,\boldsymbol x_k 中的元素分别列出系统在 n 个可能状态中的概率,或实验结果是 n 个可能结果之一的概率。因此,\boldsymbol x_k 通常称为状态向量。
1. 稳态向量
若 P 是一个随机矩阵,则相对于 P 的稳态向量(或平衡向量)是一个满足
\begin{equation} P \boldsymbol q = \boldsymbol q \end{equation}
的概率向量 \boldsymbol q。可以证明每一个随机矩阵有一个稳态向量。
可以通过解方程 P \boldsymbol x = P 来寻找随机矩阵 P 的稳态向量。例如令 P = \begin{bmatrix} 0.6 & 0.3 \\ 0.4 & 0.7\end{bmatrix},解方程 P \boldsymbol x = P:
\begin{equation} P \boldsymbol x – \boldsymbol x = \boldsymbol 0 \\ (P – I) \boldsymbol x = \boldsymbol 0 \end{equation}
由
\begin{equation} P – I = \begin{bmatrix} 0.6 & 0.3 \\ 0.4 & 0.7\end{bmatrix} – \begin{bmatrix} 1 & 0 \\ 0 & 1\end{bmatrix} = \begin{bmatrix} -0.4 & 0.3 \\ 0.4 & -0.3\end{bmatrix} \end{equation}
化简增广矩阵
\begin{equation} \begin{bmatrix} -0.4 & 0.3 & 0 \\ 0.4 & -0.3 & 0\end{bmatrix} \sim \begin{bmatrix} 1 & -3/4 & 0 \\ 0 & 0 & 0\end{bmatrix} \end{equation}
得到通解为 x_2 \begin{bmatrix}3/4 \\ 1\end{bmatrix}。对此解空间选一个简单的基 \boldsymbol w = \begin{bmatrix} 3 \\ 4\end{bmatrix},将 \boldsymbol w 除以其元素之和,得到概率向量 \boldsymbol q = \begin{bmatrix} 3/7 \\ 4/7\end{bmatrix}。检验之,计算
\begin{equation} P \boldsymbol q = \begin{bmatrix} 0.6 & 0.3 \\ 0.4 & 0.7\end{bmatrix} \begin{bmatrix} 3/7 \\ 4/7\end{bmatrix} = \begin{bmatrix} 30/70 \\ 40/70\end{bmatrix} = \boldsymbol q \end{equation}
如果一个随机矩阵的某次幂 P^k 仅包含严格正的元素,则称这个随机矩阵是正则的。
对于一个向量序列 \{\boldsymbol x_k: k = 1, 2, \cdots\},如果当 k 充分大时,\boldsymbol x_k 中的元素无限接近 \boldsymbol q 中对应的元素,则称该向量序列当 k \rightarrow \infty 时收敛到一个向量 \boldsymbol q。
定理 18 若 P 是一个 n \times n 的正则随机矩阵,则 P 具有唯一的稳态向量 \boldsymbol q。进一步地,若 x_0 是任一个初始状态,且 \boldsymbol x_{k+1} = P \boldsymbol x_k, \; k = 0,1,2,\cdots,则当 k \rightarrow \infty 时,马尔可夫链 \{\boldsymbol x_k\} 收敛到 \boldsymbol q。
这个定理说明初始状态对马尔可夫链的长期行为没有影响。