时间序列分析:平稳性
1. 为什么需要平稳性
时间序列随机过程的一个实现,对随机过程的分析,往往涉及研究随机过程中各个随机变量的联合概率分布。当随机变量数量较少时,研究联合概率分布可能还相对简单;而对于时间序列,往往需要研究很长一段时间的历史数据,其中每一个数据点都是一个随机变量,要研究这些随机变量的联合分布就非常困难了。
另一方面,对于时间序列,通常只能观察一次。例如记录每天的平均气温,每天只能观测到一个数值,一天结束后,当天的平均气温就已经确定,无法再回到过去重新观测历史上某一天的平均气温(并期望得到一个不同的结果)。我们只能根据序列的一次观测结果来对整个随机过程进行分析和预测。
由于时间序列的这些特点,我们希望所研究的时间序列具有某些特定的结构,只需要对时间序列观测一次,并研究其中有限长度的片段,就可以获知整个时间序列的特征。一个方便的假设是设备具有平稳性(Stationarity),即决定随机过程特性的统计规律不随时间的变化而改变。
2. 严平稳
对于时间序列 $\{X_t\}$,如果 $X_{t_1}, X_{t_2}, \cdots, X_{t_k}$ 与 $X_{t_1 + \tau}, X_{t_2 + \tau}, \cdots, X_{t_k + \tau}$ 具有相同的联合概率分布,则称序列 $\{X_t\}$ 是严平稳的(Strictly Stationary)。也就是说,只要在随机过程中任选一个时刻 $t_1$ 开始,研究长度为 $k$ 的一个子序列,就可以获知整个随机过程的特征。
注意严平稳并不要求 $\{X_t\}$ 中的各个随机变量是独立的,如果 $\{X_t\}$ 独立同分布,也就没有什么研究的价值了。
2.1. 均值函数和方差函数
如果令 $k = 1$,则有 $X_{t_1}$ 与 $X_{t_1 + \tau}$ 具有相同的分布,说明 $\{X_t\}$ 中的各个随机变量具有相同的分布。因此,$\{X_t\}$ 的均值函数和方差函数都是常数,分别为所属分布的均值和方差。于是,我们可以用过程中任意一个随机变量的均值和方差来估计整个过程的均值和方差。
2.2. 协方差函数
如果令 $k = 2$,则有 $X_{t_1}, X_{t_2}$ 与 $X_{t_1 + \tau}, X_{t_2 + \tau}$ 具有相同的分布。
\begin{equation}
\gamma_{t_1, t_2} = \mathrm{Cov}(X_{t_1}, X_{t_2}) = \mathrm{Cov}(X_{t_1+\tau}, X_{t_2+\tau})
\end{equation}
令 $\tau = -t_1$,有
\begin{equation}
\mathrm{Cov}(X_{t_1}, X_{t_2}) = \mathrm{Cov}(X_{t_1+\tau}, X_{t_2+\tau}) = \mathrm{Cov}(X_0, X_{t_2-t_1})
\end{equation}
令 $\tau = -t_2$,有
\begin{equation}
\mathrm{Cov}(X_{t_1}, X_{t_2}) = \mathrm{Cov}(X_{t_1+\tau}, X_{t_2+\tau}) = \mathrm{Cov}(X_{t_1 – t_2}, X_0)
\end{equation}
于是有
\begin{equation}
\gamma_{t_1, t_2} = \mathrm{Cov}(X_0, X_{t_2-t_1}) = \mathrm{Cov}(X_{t_1 – t_2}, X_0) = \mathrm{Cov}(X_0, X_{|t_1 – t_2|})
\end{equation}
可见协方差函数只是时间差 $|t_1 – t_2|$ 的函数。
如果一个过程是严平稳的,并且具有有限方差,那么协方差函数一定只依赖于时间的滞后长度。对于平稳过程,其协方差和自相关函数可以简化为
\begin{equation}
\gamma_k = \mathrm{Cov}(Y_t, Y_{t-k})
\end{equation}
\begin{equation}
\rho_k = \mathrm{Corr}(Y_t, Y_{t-k}) = \frac{\gamma_k}{\gamma_0}
\end{equation}
3. 弱平稳
在实际中,上面定义的严平稳的条件往往是难以满足的。将严平稳的条件放松一些,只考虑二阶矩以内的情况,结合严平稳均值函数和协方差函数的特点,定义当一个随机过程满足
- 均值函数在所有时间上恒为常数,即 $\mu_t = \mu$,其中 $\mu$ 为常数;
- 协方差函数只依赖于时间的滞后长度,即 $\gamma_{t, t+k} = \gamma_{0, k} = \gamma_k$。
时,称该随机过程是弱平稳的(Weakly Stationary),或称为二阶矩平稳的。
在上面的条件 2 中,令 $k = 0$,有 $\gamma_{t, t} = \gamma_0$,可知弱平稳过程的方差也是常数。
4. 将非平稳序列变为平稳序列
我们可以对非平稳时间序列进行一些变换,将其转换为平稳时间序列。在对平稳时间序列进行建模后,再转换为原始的非平稳时间序列。