概率论 Cheat Sheet 4:随机变量的数学特征(2)
Contents [show]
3. 协方差及相关系数
定义 量 E{[X–E(X)][Y–E(Y)]} 称为随机变量 X 与 Y 的协方差。记为 Cov(X,Y),即
Cov(X,Y)=$E{[X–E(X)][Y–E(Y)]}
而
ρXY=Cov(X,Y)√D(X)√D(Y)
称为随机变量 X 与 Y 的相关系数。
由定义,即知
Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X)
由上述定义及前文 (2.5) 式知道,对于任意两个随机变量 X 和 Y,下列等式成立:
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
将 Cov(X,Y) 的定义展开,易得
Cov(X,Y)=E(XY)–E(X)E(Y)
常利用这一式子计算协方差。
协方差具有下述性质:
- Cov(aX,bY)=abCov(X,Y),a,b 是常数。
- Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
定理 1. |ρXY|≤1。2. |ρXY|=1 的充要条件是,存在常数 a,b,使
P{Y=a+bX}=1
当 ρXY=0 时,称 X 和 Y 不相关。假设随机变量 X,Y 的相关系数 ρXY 存在,当 X 和 Y 相互独立时,由数学期望的性质 4 及 (3.2) 式知 Cov(X,Y)=0,从而 ρXY=0,即 X,Y 不相关。反之,若 X,Y 不相关,X 和 Y 却不一定相互独立。上述情况,从“不相关”和“相互独立”的含义来看是明显的。这是因为不相关只是就线性关系来说的,而相互独立是就一般关系而言的。
不过,当 (X,Y) 服从二维正态分布时,X 和 Y 不相关与 X 和 Y 相互独立是等价的。二维正态分布的概率密度为
f(x,y)=12πσ1σ2√1−ρ2exp{−12(1−ρ2)[(x–μ1)2σ21–2ρ(x–μ1)(y–μ2)σ1σ2+(y–μ2)2σ22]}
其中的参数 ρ 就是 X 和 Y 的相关系数,因而二维正态随机变量的分布完全可由 X,Y 各自的数学期望、方差以及它们的相关系数所确定。若 (X,Y) 服从二维正态分布,那么 X 和 Y 相互独立的充要条件为 ρ=0。现在知道 ρ=ρXY,故知对于二维正态随机变量 (X,Y) 来说,X 和 Y 不相关与 X 和 Y 相互独立是等价的。
4. 矩、协方差矩阵
定义 设 X 和 Y 是随机变量,若
E(Xk),k=1,2,⋯
存在,则称它为 X 的 k 阶原点矩,简称 k 阶矩。
若
E{[X–E(X)]k},k=1,2,⋯
存在,则称它为 X 的 k 阶中心矩。
若
E{[X–E(X)]k[Y–E(Y)]l},k,l=1,2,⋯
存在,则称它为 X 和 Y 的 k+l 阶混合中心矩。
显然,X 的数学期望 E(X) 是 X 的一阶原点矩,方差 D(X) 是 X 的二阶中心距,协方差 Cov(X,Y) 是 X 和 Y 的二阶混合中心距。
二维随机变量 (X1,X2) 有四个二阶中心距(设它们都存在),分别记为
c11=E{[X1–E(X1)]2}c12=E{[X1–E(X1)][X2–E(X2)]}c21=E{[X2–E(X2)][X1–E(X1)]}c22=E{[X2–E(X2)]2}
将它们排成矩阵的形式
(c11c12c21c22)
这个矩阵称为随机变量 (X1,X2) 的协方差矩阵。
设 n 维随机变量 (X1,X2,⋯,Xn) 的二阶混合中心距
cij=Cov(Xi,Xj)=E{[Xi–E(Xi)][Xj–E(Xj)]},i,j=1,2,⋯,n
都存在,则称矩阵
C=[c11c12⋯c1nc21c22⋯c2n⋮⋮⋮cn1cn2⋯cnn]
为 n 维随机变量 (X1,X2,⋯,Xn) 的协方差矩阵。由于 cij=cji(i≠j;i,j=1,2,⋯,n),因而上述矩阵是一个对称矩阵。
一般,n 维随机变量的分布是不知道的,或者是太复杂,以致在数学上不易处理,因此在实际应用中协方差矩阵就显得重要了。
引入列矩阵
X=[x1x2⋮xn],μ=[μ1μ2⋮μn]=[E(X1)E(X2)⋮E(Xn)]
n 维正态随机变量 (X1,X2,⋯,Xn) 的概率密度定义为
f(x1,x2,⋯,xn)=1(2π)n/2(detC)1/2exp{−12(X–μ)TC−1(X–μ)}
其中 C 是 (X1,X2,⋯,Xn) 的协方差矩阵。
n 维正态随机变量具有以下四条重要的性质:
-
n 维正态随机变量 (X1,X2,⋯,Xn) 的每一分分量 Xi,i=1,2,⋯,n 都是正态随机变量;反之,若 X1,X2,⋯,Xn 都是正态随机变量,且相互独立,则 (X1,X2,⋯,Xn) 是 n 维正态随机变量。
-
n 维随机变量 (X1,X2,⋯,Xn) 服从 n 维正态分布的充要条件是 X1,X2,⋯,Xn 的任意线性组合
l1X1+l2X2+⋯+lnXn
服从一维正态分布(其中 l1,l2,⋯,ln 不全为零)。 -
若 (X1,X2,⋯,Xn) 服从 n 维正态分布,设 Y1,Y2,⋯,Yk 是 Xj(j=1,2,⋯,n) 的线性函数,则 (Y1,Y2,⋯,Yk) 也服从多维正态分布。这一性质称为正态变量的线性变换不变性。
-
设 (X1,X2,⋯,Xn) 服从 n 维正态分布,则 “X1,X2,⋯,Xn 相互独立” 与“X1,X2,⋯,Xn 两两不相关” 是等价的。