Processing math: 100%

概率论 Cheat Sheet 4:随机变量的数学特征(2)

3. 协方差及相关系数

  定义 量 E{[XE(X)][YE(Y)]} 称为随机变量 XY协方差。记为 Cov(X,Y),即

Cov(X,Y)=$E{[XE(X)][YE(Y)]}

ρXY=Cov(X,Y)D(X)D(Y)

称为随机变量 XY相关系数

  由定义,即知

Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X)

由上述定义及前文 (2.5) 式知道,对于任意两个随机变量 XY,下列等式成立:

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

  将 Cov(X,Y) 的定义展开,易得

Cov(X,Y)=E(XY)E(X)E(Y)

常利用这一式子计算协方差。

  协方差具有下述性质:

  1. Cov(aX,bY)=abCov(X,Y)a,b 是常数。
  2. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

  定理 1. |ρXY|1。2. |ρXY|=1 的充要条件是,存在常数 a,b,使
P{Y=a+bX}=1

  当 ρXY=0 时,称 XY 不相关。假设随机变量 X,Y 的相关系数 ρXY 存在,当 XY 相互独立时,由数学期望的性质 4 及 (3.2) 式知 Cov(X,Y)=0,从而 ρXY=0,即 X,Y 不相关。反之,若 X,Y 不相关,XY 却不一定相互独立。上述情况,从“不相关”和“相互独立”的含义来看是明显的。这是因为不相关只是就线性关系来说的,而相互独立是就一般关系而言的。

  不过,当 (X,Y) 服从二维正态分布时,XY 不相关与 XY 相互独立是等价的。二维正态分布的概率密度为

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ212ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]}

其中的参数 ρ 就是 XY 的相关系数,因而二维正态随机变量的分布完全可由 X,Y 各自的数学期望、方差以及它们的相关系数所确定。若 (X,Y) 服从二维正态分布,那么 XY 相互独立的充要条件为 ρ=0。现在知道 ρ=ρXY,故知对于二维正态随机变量 (X,Y) 来说,XY 不相关与 XY 相互独立是等价的。

4. 矩、协方差矩阵

  定义 设 XY 是随机变量,若

E(Xk),k=1,2,

存在,则称它为 Xk 阶原点矩,简称 k 阶矩

  若

E{[XE(X)]k},k=1,2,

存在,则称它为 Xk 阶中心矩

  若

E{[XE(X)]k[YE(Y)]l},k,l=1,2,

存在,则称它为 XYk+l 阶混合中心矩

  显然,X 的数学期望 E(X)X 的一阶原点矩,方差 D(X)X 的二阶中心距,协方差 Cov(X,Y)XY 的二阶混合中心距。

  二维随机变量 (X1,X2) 有四个二阶中心距(设它们都存在),分别记为

c11=E{[X1E(X1)]2}c12=E{[X1E(X1)][X2E(X2)]}c21=E{[X2E(X2)][X1E(X1)]}c22=E{[X2E(X2)]2}

将它们排成矩阵的形式

(c11c12c21c22)

这个矩阵称为随机变量 (X1,X2)协方差矩阵

  设 n 维随机变量 (X1,X2,,Xn) 的二阶混合中心距

cij=Cov(Xi,Xj)=E{[XiE(Xi)][XjE(Xj)]},i,j=1,2,,n

都存在,则称矩阵

C=[c11c12c1nc21c22c2ncn1cn2cnn]

n 维随机变量 (X1,X2,,Xn)协方差矩阵。由于 cij=cji(ij;i,j=1,2,,n),因而上述矩阵是一个对称矩阵。

  一般,n 维随机变量的分布是不知道的,或者是太复杂,以致在数学上不易处理,因此在实际应用中协方差矩阵就显得重要了。

  引入列矩阵

X=[x1x2xn],μ=[μ1μ2μn]=[E(X1)E(X2)E(Xn)]

n 维正态随机变量 (X1,X2,,Xn) 的概率密度定义为

f(x1,x2,,xn)=1(2π)n/2(detC)1/2exp{12(Xμ)TC1(Xμ)}

其中 C(X1,X2,,Xn) 的协方差矩阵。

  n 维正态随机变量具有以下四条重要的性质:

  1. n 维正态随机变量 (X1,X2,,Xn) 的每一分分量 Xi,i=1,2,,n 都是正态随机变量;反之,若 X1,X2,,Xn 都是正态随机变量,且相互独立,则 (X1,X2,,Xn)n 维正态随机变量。

  2. n 维随机变量 (X1,X2,,Xn) 服从 n 维正态分布的充要条件是 X1,X2,,Xn 的任意线性组合
    l1X1+l2X2++lnXn
    服从一维正态分布(其中 l1,l2,,ln 不全为零)。

  3. (X1,X2,,Xn) 服从 n 维正态分布,设 Y1,Y2,,YkXj(j=1,2,,n) 的线性函数,则 (Y1,Y2,,Yk) 也服从多维正态分布。这一性质称为正态变量的线性变换不变性。

  4. (X1,X2,,Xn) 服从 n 维正态分布,则 “X1,X2,,Xn 相互独立” 与“X1,X2,,Xn 两两不相关” 是等价的。