时间序列分析:Ljung-Box Q 统计量

  为了对序列的自相关系数进行推断,Box 和 Pierce 提出了 Portmanteau 统计量

Q(m)=Tmi=1r2i

其中 T 为序列长度,ri 为样本自相关系数。在某些情况下,Q(m) 趋近于自由度为 mχ2 分布,即

Q(m)χ2(m)

通过 Portmanteau 统计量可以对序列的 m 个自相关系数进行推断,零假设和备择假设分别为

H0:ρ1=ρ2==ρm=0H1:ρi0

其中 i{1,2,}

  Ljung 和 Box 改进了这一统计量,提高了对有限个样本进行检验的强度,称为 Ljung-Box Q 统计量,即

Q(m)=T(T+2)ml=1r2iTl

通常取 m=ln(T),在 R 中可以使用 Box.text(data, lag=log(T)) 进行检验。

  当 Q(m)>χ2α 时,拒绝零假设,即认为序列中存在某些自相关,这里 χ2α 为自由度为 mχ2 分布的 100(1α) 分位数。R 中的计算程序会直接给出 p 值,此时当 p<α 时拒绝零假设,α 为显著性水平。

  在进行时间序列分析时,通常会先使用 Ljung-Box Q 统计量检查时间序列是否存在自相关。如果存在自相关,就可以考虑使用模型对序列进行拟合。我们希望模型的残差是白噪声,此时可以对拟合的残差再使用 Ljung-Box Q 统计量进行一次检验,如果残差不存在自相关,说明模型能够很好地捕获序列中的相关关系。