应用时间序列分析(1)基本概念
本系列为《时间序列分析及应用 R 语言》一书的整理。
Contents [show]
1. 时间序列与随机过程
随机变量序列 {Yt:t=0,±1,±2,±3,⋯} 称为一个随机过程,以之作为观测时间序列的模型。该过程的完整概率结构是由所有 Y 的有限联合分布构成的分布族决定的。联合分布中的大部分信息可以用过均值、方差和协方差来描述,无需直接处理这些多元分布。因此可以把注意力集中在对一阶和二阶矩的研究上。如果 Y 的联合分布是多元正态分布,则所有的联合分布都可以由一阶和二阶矩完全确定。
2. 期望
对于连续随机变量 X,其概率密度函数为 f(x),定义 X 的期望为:
E[X]=∫∞−∞xf(x)dx
期望通常记做 μ。上式中,要求 ∫∞−∞|x|f(x)dx<∞。
3. 方差
随机变量 X 的方差定义为
Var(X)=E{[X–E(X)]2}
方差通常记做 σ2 使用下式计算方差通常会更方便:
Var(X)=E(X2)–[E(X)]2
方差具有如下性质:
Var(X)≥0Var(a+bX)=b2Var(X)
如果 X 和 Y 独立,则
Var(X+Y)=Var(X)+Var(Y)
方差的平方根称为标准差,记做 σ。
随机变量 (X–μX)(σX) 称为 X 的标准化形式,标准化随机变量的均值为 0,标准差为 1。
4. 均值
对随机过程 {Yt:t=0,±1,±2,±3,⋯},均值函数的定义为:
μt=E(Yt),t=0,±1,±2,⋯
μt 是过程在 t 时刻的期望值,一般地,不同时刻 μt 可取不同的值。
5. 自协方差函数
自协方差函数 γt,s 的定义为:
γt,s=Cov(Yt,Ys),t,s=0,±1,±2,⋯
其中
Cov(Yt,Ys)=E[(Yt–μt)(Ys–μs)]
协方差具有如下性质:
Cov(a+bX,c+dY)=bdCov(X,Y)Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)Cov(X,X)=Var(X)Cov(X,Y)=Cov(Y,X)
如果 X 与 Y 相互独立,则
Cov(X,Y)=0
若 c1,c2,⋯,cm 和 d1,d2,⋯,dn 表示常数,t1,t2,⋯,tm 和 s1,s2,⋯,sn 表示时点,则有
Cov[m∑i=1ciYti,n∑j=1djYsj]=m∑i=1n∑j=1cidjCov(Yti,Ysj)
特殊地,有
Var[n∑i=1ciYti]=n∑i=1c2iVar(Yti)+2n∑i=2i−1∑j=1cicjCov(Yti,Ytj)
6. 自相关函数
自相关函数 ρt,s 的定义为:
ρt,s=Corr(Yt,Ys),t,s=0,±1,±2,⋯
其中
Corr(Yt,Ys)=Cov(Yt,Ys)√Var(Yt)Var(Ys)=γt,s√γt,tγs,s
相关系数具有如下性质:
−1≤Corr(X,Y)≤1Corr(a+bX,c+dY)=sign(bd)Corr(X,Y)
其中 sign 为符号函数
sign(x)={1x>00x=0−1x<0
Corr(X,Y)=±1 的充要条件是,存在常数 a 和 b,使得 P(Y=aX+b)=1。
协方差和相关系数都是随机变量间(线性)相关关系的度量,相关系数没有量纲。协方差和相关系数间有如下关系:
γt,t=Var(Yt)ρt,t=1γt,s=γs,tρt,s=ρs,t|γt,s|≤√γt,tγs,s|ρt,s|≤1
ρt,s 的值接近 ±1 时,说明(线性)相关程度强;而接近 0 时,说明(线性)相关程度弱。若 ρt,s=0,则称 Yt 和 Ys 不相关。注意这里的相关性仅指线性关系,不相关的两个随机变量不一定独立,独立的两个随机变量一定不相关。