时间序列分析:Ljung-Box Q 统计量

  为了对序列的自相关系数进行推断,Box 和 Pierce 提出了 Portmanteau 统计量

\begin{equation}
Q^*(m) = T \sum_{i=1}^m r_i^2 \tag{1}
\end{equation}

其中 $T$ 为序列长度,$r_i$ 为样本自相关系数。在某些情况下,$Q^*(m)$ 趋近于自由度为 $m$ 的 $\chi^2$ 分布,即

\begin{equation}
Q^*(m) \sim \chi^2(m)
\end{equation}

通过 Portmanteau 统计量可以对序列的 $m$ 个自相关系数进行推断,零假设和备择假设分别为

\begin{align}
&H_0: \rho_1 = \rho_2 = \cdots = \rho_m = 0 \\
&H_1: \rho_i \neq 0
\end{align}

其中 $i \in \{1, 2, \cdots\}$。

  Ljung 和 Box 改进了这一统计量,提高了对有限个样本进行检验的强度,称为 Ljung-Box Q 统计量,即

\begin{equation}
Q(m) = T(T + 2) \sum_{l=1}^m \frac{r_i^2}{T-l} \tag{2}
\end{equation}

通常取 $m = \ln(T)$,在 R 中可以使用 Box.text(data, lag=log(T)) 进行检验。

  当 $Q(m) > \chi_{\alpha}^2$ 时,拒绝零假设,即认为序列中存在某些自相关,这里 $\chi_{\alpha}^2$ 为自由度为 $m$ 的 $\chi^2$ 分布的 $100(1-\alpha)$ 分位数。R 中的计算程序会直接给出 $p$ 值,此时当 $p < \alpha$ 时拒绝零假设,$\alpha$ 为显著性水平。

  在进行时间序列分析时,通常会先使用 Ljung-Box Q 统计量检查时间序列是否存在自相关。如果存在自相关,就可以考虑使用模型对序列进行拟合。我们希望模型的残差是白噪声,此时可以对拟合的残差再使用 Ljung-Box Q 统计量进行一次检验,如果残差不存在自相关,说明模型能够很好地捕获序列中的相关关系。