应用时间序列分析(3)趋势
1. 确定趋势与随机趋势
平稳时间序列的均值函数是时域上的常数,而一般时间序列的均值函数可能是任意的时间函数。均值函数体现了时间序列的趋势,趋势可能是难以琢磨的。例如随机游动在任意时间上都有零均值,在相邻时点上具有很强的正相关,且随机过程的方差随时间的增加而增加,由此会带来表面上的趋势;而对同样的过程进行反复模拟,则可能会得到完全不同的“趋势”。这样的趋势称为随机趋势。
趋势有时也会具有某些确定的特征。例如某地各个月份的气温值 $\{Y_t\}$ 可以建模为 $Y_t = \mu_t + X_t$,其中 $\mu_t$ 是周期为 $12$ 的确定函数,满足 $\mu_t = \mu_{t-12}$(对所有 $t$);$X_t$ 是围绕 $\mu_t$ 的无法观测到的扰动,假设 $X_t$ 对所有 $t$ 都有零均值,此时 $\mu_t$ 实际上就是观测序列 $\{Y_t\}$ 的均值函数。这种模型就具有确定趋势。
2. 常数均值的估计
假设均值函数是常数,此时的模型为
\begin{equation}
Y_t = \mu_t + X_t \tag{1}
\end{equation}
其中对所有的 $t$ 有 $E(X_t) = 0$。我们希望用观测到的时间序列 $Y_1, Y_2, \cdots, Y_n$ 来估计 $\mu$。最常用的 $\mu$ 的估计是样本均值或平均数,定义为
\begin{equation}
\overline{Y} = \frac{1}{n} \sum_{t=1}^n Y_t \tag{2}
\end{equation}
在对式 $(1)$ 最少的假设下,可以看出 $E(\overline{Y}) = \mu$,因此 $\overline{Y}$ 是 $\mu$ 的无偏估计量。为了得到 $\overline{Y}$ 作为 $\mu$ 的估计量的精确度,需要对 $X_t$ 做进一步的假设。
假设 $\{Y_t\}$ 是平稳时间序列,具有自相关函数 $\rho_k$,则有
\begin{equation}
\mathrm{Var}(\overline{Y}) = \frac{\gamma_0}{n} \bigg[ \sum_{k=-n+1}^{n-1} \big( 1 – \frac{|k|}{n} \big) \rho_k \bigg]
= \frac{\gamma_0}{n} \bigg[ 1 + 2 \sum_{k=1}^{n-1} \big( 1 – \frac{k}{n} \big) \rho_k \bigg] \tag{3}
\end{equation}
如果式 $(1)$ 中的序列 $\{X_t\}$ 是白噪声,则对所有 $k > 0$ 有 $\rho_k = 0$,此时式 $(3)$ 变为 $\mathrm{Var}(\overline{Y}) = \frac{\gamma_0}{n}$。
在平稳滑动平均模型 $Y_t = e_t – \frac{1}{2} e_{t-1}$ 中,有
\begin{equation}
\gamma_0 = \mathrm{Var}(Y_t) = \mathrm{Var}(e_t – \frac{1}{2} e_{t-1}) = \sigma_e^2 + \frac{1}{4} \sigma_e^2 = \frac{5}{4} \sigma_e^2
\end{equation}
\begin{equation}
\gamma_1 = \mathrm{Cov}(Y_t, Y_{t-1}) = \mathrm{Cov}(e_t – \frac{1}{2} e_{t-1}, e_{t-1} – \frac{1}{2} e_{t-2}) = -\frac{1}{2} \mathrm{Cov}(Y_{t-1}, Y_{t-1}) = -\frac{1}{2} \sigma_e^2
\end{equation}
\begin{equation}
\rho_1 = \frac{\gamma_1}{\gamma_0} = \frac{-\frac{1}{2} \sigma_e^2}{\frac{5}{4} \sigma_e^2} = -0.4
\end{equation}
且对所有 $k >1$ 有 $\rho_k = 0$。由式 $(3)$ 可得
\begin{equation}
\mathrm{Var}(\overline{Y}) = \frac{\gamma_0}{n} \bigg[ 1 + 2 \big( 1 – \frac{1}{n} \big) (-0.4) \bigg] = \frac{\gamma_0}{n} \bigg[ 1 – 0.8\big( 1 – \frac{1}{n} \big) \bigg]
\end{equation}
在时间序列中,$n$ 得取值通常较大(如 $n > 50$),此时 $1-\frac{1}{n} \rightarrow 1$,可得
\begin{equation}
\mathrm{Var}(\overline{Y}) \approx 0.2 \frac{\gamma_0}{n}
\end{equation}
此时的 $0.2 \frac{\gamma_0}{n}$ 小于白噪声时的 $\frac{\gamma_0}{n}$,可见滑动平均中一阶滞后的负相关改善了对均值的估计。因为序列趋于围绕均值前后摆动,所以获得的样本均值更精确。
此外,如果对所有 $k \geq 1$ 有 $\rho_k \geq 0$,由式 $(3)$ 可见 $\mathrm{Var}(\overline{Y})$ 将会大于 $\frac{\gamma_0}{n}$。此时正相关性使得对均值的估计比在白噪声情况下更困难。
很多平稳过程随着滞后的增加,自相关函数迅速衰减,即
\begin{equation}
\sum_{k=0}^{\infty} |\rho_k| \leq \infty \tag{4}
\end{equation}
假设式 $(4)$ 和给定充分大的样本容量 $n$ 下,由式 $(3)$ 可得如下的近似
\begin{equation}
\mathrm{Var}(\overline{Y}) \approx \frac{\gamma_0}{n} \bigg[ \sum_{k=-\infty}^{\infty} \rho_k \bigg] \qquad n \; 充分大 \tag{5}
\end{equation}
按照该近似,方差与样本容量 $n$ 成反比。
例如,假设对所有 $k$ 有 $\rho_k – \phi^{|k|}$,其中 $\phi$ 严格介于 $-1$ 和 $1$ 之间,等比数列求和得到
\begin{equation}
\mathrm{Var}(\overline{Y}) = \frac{\gamma_0}{n} \frac{1 + \phi}{1 – \phi} \tag{6}
\end{equation}
对于非平稳过程,使用样本均值作为 $\mu$ 的估计量时,精确度会非常不同。例如设式 $(1)$ 中的 $\{X_t\}$ 是随机游动过程,则
\begin{align}
\mathrm{Var}(\overline{Y}) &= \frac{1}{n^2} \mathrm{Var} \bigg[ \sum_{i=1}^n Y_t \bigg] = \frac{1}{n^2} \mathrm{Var} \bigg[ \sum_{i=1}^n \sum_{j=1}^i e_j \bigg] \\
&= \frac{1}{n^2} \mathrm{Var}(e_1 + 2e_2 + 3e_3 + \cdots + ne_n) = \frac{\sigma_e^2}{n^2} \sum_{k=1}^n k^2 \\
&= \frac{\sigma_e^2}{n^2} \cdot \frac{n(n + 1)(2n + 1)}{6} = \sigma_e^2 \frac{(n + 1)(2n + 1)}{6n} \tag{7}
\end{align}
可见此时均值估计量的方差随样本容量 $n$ 的增加而增大,这是不可接受的。对于非平稳序列的均值,需要考虑其他估计方法。
3. 回归方法
传统的回归分析统计方法可以更方便地估计一般的非常数均值趋势模型的参数。
3.1. 时间的线性趋势和二次趋势
考虑如下的确定时间趋势
\begin{equation}
\mu_t = \beta_0 + \beta_1 t \tag{8}
\end{equation}
其中 $\beta_1$ 和 $\beta_0$ 分别代表斜率和截距,是未知的参数。古典最小二乘(或回归)法该通过最小化
\begin{equation}
Q(\beta_0, \beta_1) = \sum_{t=1}^n [Y_t – (\beta_0 + \beta_1 t)]^2
\end{equation}
来估计这两个参数。例如通过计算关于两个 $\beta$ 的偏导数,并使偏导数为零,得到关于 $\beta$ 的线性方程组,用 $\hat{\beta_0}$ 和 $\hat{\beta_1}$ 表示得到的解,有
\begin{equation}
\hat{\beta_1} = \frac{\sum\limits_{t=1}^n (Y_t – \overline{Y})(t – \overline{t})}{\sum\limits_{t=1}^n (t – \overline{t})^2} \\
\hat{\beta_0} = \overline{Y} – \hat{\beta_1} \overline{t} \tag{9}
\end{equation}
其中 $\overline{t} = (n + 1) / 2$,是 $1, 2, \cdots, n$ 的平均数。
3.2. 周期性或季节性趋势
考虑对季节性趋势进行建模和估计,假设观测到的序列可以表示为
\begin{equation}
Y_t = \mu_t + X_t
\end{equation}
其中,对所有 $t$,$E(X_t) = 0$。
对季节性数据,对 $\mu_t$ 最常用的假设是存在 $12$ 个常数(参数)$\beta_1, \beta_2, \cdots, \beta_12$,它们给出了 $12$ 个月每月的期望平均气温,可以记为
\begin{equation}
\mu_t =\begin{cases}\beta_1 & t = 1, 13, 25, \cdots \\
\beta_2 & t = 2, 14, 26, \cdots \\
\vdots \\
\beta_12 & t = 12, 24, 36, \cdots \\
\end{cases} \tag{10}
\end{equation}
该模型称为季节均值模型。
3.3. 余弦趋势
前述季节均值模型包含了 $12$ 个独立的参数,但完全没有考虑季节趋势的形状。例如 $3$ 月份和 $4$ 月份的均值非常接近,但与 $6$ 月份或 $7$ 月份不同,这一事实并没有反映在季节均值模型中。某些情况下,季节趋势可以简洁地用余弦趋势来模型化,余弦曲线即能反应从一个时期到另一个时期的平滑变化,也能保留季节性。
考虑用下式表示的余弦曲线
\begin{equation}
\mu_t = \beta \cos (2\pi ft + \Phi) \tag{11}
\end{equation}
其中 $\beta > 0$,为曲线振幅,$f$ 为曲线的频率,$\Phi$ 为曲线的相位。随着 $t$ 的变化,曲线在最大值 $\beta$ 和最小值 $-\beta$之间摆动。$1/f$ 称为余弦波动的周期,$\Phi$ 代表在时间轴上的任意初始值。对于月度数据,频率 $f = 1/12$,周期为 $12$。
式 $(11)$ 不便于估计,因为参数 $\beta$ 和 $\Phi$ 在表达式中不是现行的,由三角恒等式
\begin{equation}
\cos(A + B) = \cos A \cos B – \sin A \sin B
\end{equation}
可将式 $(11)$ 参数化为
\begin{equation}
\beta \cos (2\pi ft + \Phi) = \beta_1 \cos(2\pi ft) + \beta_2 \sin(2\pi ft) \tag{12}
\end{equation}
其中
\begin{equation}
\beta = \sqrt{\beta_1^2 + \beta_2^2}, \qquad \Phi = \mathrm{atan}(-\beta_2 / \beta_1) \tag{13}
\end{equation}
可以得到
\begin{equation}
\beta_1 = \beta \cos(\Phi) \qquad \beta_2 = \beta \sin(\Phi) \tag{14}
\end{equation}
用 $\cos(2\pi ft)$ 和 $\sin(2\pi ft)$ 作为回归变量,可以估计 $\beta_1$ 和 $\beta_2$。
这类趋势模型中最简单的可以表示如下
\begin{equation}
\mu_t = \beta_0 + \beta_1 \cos(2\pi ft) + \beta_1 \sin(2\pi ft) \tag{15}
\end{equation}
其中常数项 $\beta_0$ 可以看做是频率为零的余弦。