时间序列分析:Ljung-Box Q 统计量
为了对序列的自相关系数进行推断,Box 和 Pierce 提出了 Portmanteau 统计量
Q∗(m)=Tm∑i=1r2i
其中 T 为序列长度,ri 为样本自相关系数。在某些情况下,Q∗(m) 趋近于自由度为 m 的 χ2 分布,即
Q∗(m)∼χ2(m)
通过 Portmanteau 统计量可以对序列的 m 个自相关系数进行推断,零假设和备择假设分别为
H0:ρ1=ρ2=⋯=ρm=0H1:ρi≠0
其中 i∈{1,2,⋯}。
Ljung 和 Box 改进了这一统计量,提高了对有限个样本进行检验的强度,称为 Ljung-Box Q 统计量,即
Q(m)=T(T+2)m∑l=1r2iT−l
通常取 m=ln(T),在 R
中可以使用 Box.text(data, lag=log(T))
进行检验。
当 Q(m)>χ2α 时,拒绝零假设,即认为序列中存在某些自相关,这里 χ2α 为自由度为 m 的 χ2 分布的 100(1−α) 分位数。R
中的计算程序会直接给出 p 值,此时当 p<α 时拒绝零假设,α 为显著性水平。
在进行时间序列分析时,通常会先使用 Ljung-Box Q 统计量检查时间序列是否存在自相关。如果存在自相关,就可以考虑使用模型对序列进行拟合。我们希望模型的残差是白噪声,此时可以对拟合的残差再使用 Ljung-Box Q 统计量进行一次检验,如果残差不存在自相关,说明模型能够很好地捕获序列中的相关关系。