Processing math: 100%

应用时间序列分析(1)基本概念

本系列为《时间序列分析及应用 R 语言》一书的整理。

1. 时间序列与随机过程

  随机变量序列 {Yt:t=0,±1,±2,±3,} 称为一个随机过程,以之作为观测时间序列的模型。该过程的完整概率结构是由所有 Y 的有限联合分布构成的分布族决定的。联合分布中的大部分信息可以用过均值、方差和协方差来描述,无需直接处理这些多元分布。因此可以把注意力集中在对一阶和二阶矩的研究上。如果 Y 的联合分布是多元正态分布,则所有的联合分布都可以由一阶和二阶矩完全确定。

2. 期望

  对于连续随机变量 X,其概率密度函数为 f(x),定义 X期望为:

E[X]=xf(x)dx

期望通常记做 μ。上式中,要求 |x|f(x)dx<

3. 方差

  随机变量 X方差定义为

Var(X)=E{[XE(X)]2}

方差通常记做 σ2 使用下式计算方差通常会更方便:

Var(X)=E(X2)[E(X)]2

  方差具有如下性质:

Var(X)0Var(a+bX)=b2Var(X)

如果 XY 独立,则

Var(X+Y)=Var(X)+Var(Y)

  方差的平方根称为标准差,记做 σ

  随机变量 (XμX)(σX) 称为 X标准化形式,标准化随机变量的均值为 0,标准差为 1

4. 均值

  对随机过程 {Yt:t=0,±1,±2,±3,}均值函数的定义为:

μt=E(Yt),t=0,±1,±2,

μt 是过程在 t 时刻的期望值,一般地,不同时刻 μt 可取不同的值。

5. 自协方差函数

  自协方差函数 γt,s 的定义为:

γt,s=Cov(Yt,Ys),t,s=0,±1,±2,

其中

Cov(Yt,Ys)=E[(Ytμt)(Ysμs)]

  协方差具有如下性质:

Cov(a+bX,c+dY)=bdCov(X,Y)Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)Cov(X,X)=Var(X)Cov(X,Y)=Cov(Y,X)

如果 XY 相互独立,则

Cov(X,Y)=0

  若 c1,c2,,cmd1,d2,,dn 表示常数,t1,t2,,tms1,s2,,sn 表示时点,则有

Cov[mi=1ciYti,nj=1djYsj]=mi=1nj=1cidjCov(Yti,Ysj)

特殊地,有

Var[ni=1ciYti]=ni=1c2iVar(Yti)+2ni=2i1j=1cicjCov(Yti,Ytj)

6. 自相关函数

  自相关函数 ρt,s 的定义为:

ρt,s=Corr(Yt,Ys),t,s=0,±1,±2,

其中

Corr(Yt,Ys)=Cov(Yt,Ys)Var(Yt)Var(Ys)=γt,sγt,tγs,s

  相关系数具有如下性质:

1Corr(X,Y)1Corr(a+bX,c+dY)=sign(bd)Corr(X,Y)

其中 sign 为符号函数

sign(x)={1x>00x=01x<0

Corr(X,Y)=±1 的充要条件是,存在常数 ab,使得 P(Y=aX+b)=1

  协方差和相关系数都是随机变量间(线性)相关关系的度量,相关系数没有量纲。协方差和相关系数间有如下关系:

γt,t=Var(Yt)ρt,t=1γt,s=γs,tρt,s=ρs,t|γt,s|γt,tγs,s|ρt,s|1

  ρt,s 的值接近 ±1 时,说明(线性)相关程度强;而接近 0 时,说明(线性)相关程度弱。若 ρt,s=0,则称 YtYs 不相关。注意这里的相关性仅指线性关系,不相关的两个随机变量不一定独立,独立的两个随机变量一定不相关。