概率论 Cheat Sheet 10:连续型随机变量
Contents [show]
1. 定义
设 X 是一个随机变量,如果存在一个定义在实数轴上的非负函数 f,使得对于任一个实数集 B,满足
P{X∈B}=∫Bf(x)dx
则称 X 为连续型(Continuous)随机变量。函数 f 称为随机变量 X 的概率密度函数(Probability Density Function,PDF),或者称为密度函数。
式 (1) 表明 X 属于 B 的概率可以由概率密度函数 f(x) 在集合 B 上的积分得到。因为 X 必取某个值,所以 f 一定满足
1=P{X∈(−∞,∞)}=∫∞−∞f(x)dx
所有关于 X 的概率都可以由 f 得到。令 B=[a,b],则
P{a≤X≤b}=∫baf(x)dx
式 (2) 中,若令 a=b,则有
P{X=a}=∫aaf(x)dx=0
上式说明,连续型随机变量取任何固定值的概率都等于 0。因此,对于一个连续型随机变量 X,有
P{X<a}=P{X≤a}=F(a)=∫a−∞f(x)dx
由式 (2) 可以得到一个关于概率密度函数的更直观的解释:
P{a–ε2≤X≤a+ε2}=∫a+ε2a–ε2f(x)dx≈εf(a)
其中 ε 是一个非常小的数,f(⋅) 在 x=a 处连续。也就是说,X 取值于以点 a 为中心,长度为 ε 的区间内的概率近似等于 εf(a)。由此可以看出,密度函数 f(a) 是随机变量在点 a 附近取值可能性的一个度量。
分布函数 F 和密度函数 f 之间的关系可以表示为
F(a)=P{X∈(−∞,a]}=∫a−∞f(x)dx
对上式两边求导,得
ddxF(a)=f(a)
即密度函数是累计分布函数的导数。
2. 连续型随机变量的期望和方差
前文中,将离散型随机变量的期望定义如下
E[X]=∑xxP{X=x}
如果 X 是一个连续型随机变量,密度函数为 f(x),则对于很小的 dx 有
f(x)dx≈P{x≤X≤x+dx}
于是可以用类似的方法定义连续型随机变量的期望为
E[X]=∫∞−∞xf(x)dx
类似于离散型随机变量,对于连续型随机变量,也有如下结论成立。
命题 设 X 是一个连续型随机变量,其概率密度函数为 f(x),那么对于任一实值函数 g,有
E[g(X)]=∫∞−∞g(x)f(x)dx
引理 对于一个非负随机变量 Y,有
E[Y]=∫∞0P{Y>y}dy
推论 如果 a 和 b 都是常数,那么
E[aX+b]=aE[X]+b
连续型随机变量的方差的定义也和离散型随机变量一样,如果 X 是一个连续型随机变量,期望值为 μ,则 X 的方差定义为
Var(X)=E[(X–μ)2]
另一种定义公式为
Var(X)=E[X2]–(E[X])2
对于常数 a 和 b,有
Var(aX+b)=a2Var(X)