概率论 Cheat Sheet 12:正态随机变量
Contents [show]
1. 定义
如果随机变量 X 的密度函数为
f(x)=1√2πσe−(x–μ)22σ2−∞<x<∞
则称 X 是服从参数为 μ 和 σ2 的正态分布的随机变量,简称为正态随机变量。该密度函数是一条关于 μ 对称的钟形曲线。
如果 X 是一个服从参数为 μ 和 σ2 的正态分布的随机变量,令 Y=aX+b,X 和 Y 的分布函数分别为 FX 和 FY,则有
FY(x)=P{Y≤x}=P{aX+b≤x}=P{X≤x–ba}=FX(x–ba)
求导可得 Y 的密度函数
fY(x)=1afX(x–ba)=1√2πaσexp{−(x–ba–μ)2/(2σ2)}=1√2πaσexp{−(x–b–aμ)2/[2(aσ)2]}
上式说明 Y=aX+b 服从参数为 aμ+b 和 a2σ2 的正态分布。
类似地,如果 X 是一个参数为 (μ,σ2) 的正态随机变量,那么 Z=X–μσ 就是一个参数为 (0,1) 的正态随机变量,称为标准正态随机变量。
一般将标准正态随机变量的分布函数记为 Φ(x),即
Φ(x)=1√2π∫∞−∞e−y2/2dy
由标准正态密度函数的对称性可知,对于一个非负数 x,Φ(x) 的值可以通过下式计算得到
Φ(−x)=1–Φ(x)−∞<x<∞
上式表明,如果 Z 是一个标准正态随机变量,那么
P{Z≤−x}=P{Z>x}−∞<x<∞
当 X 服从参数为 (μ,σ2) 的正态分布时,Z=X–μσ 服从标准正态分布,X 的分布函数可以写成
FX(a)=P{X≤a}=P(X–μσ≤a–μσ)=Φ(a–μσ)
2. 期望和方差
标准正态随机变量 Z 的期望和方差为
E[Z]=∫∞−∞xfz(x)dx=1√2π∫∞−∞xe−x2/2dx=−1√2πe−x2/2|∞−∞=0
Var(Z)=E[Z2]=1√2π∫∞−∞x2e−x2/2dx
通过分部积分,令 u=x,dv=xe−x2/2,得
Var(Z)=1√2π(−xe−x2/2|∞−∞+∫∞−∞e−x2/2dx)=1√2π∫∞−∞e−x2/2dx=1
由 X=μ+δZ 得
E[X]=μ+σE[Z]=μ
Var(X)=σ2E[Z]=σ2
3. 二项分布的正态近似
棣莫弗-拉普拉斯极限定理 在 n 次独立重复试验中,设每次成功的概率为 p,记成功的总次数为 Sn,那么对任意 a<b,当 n→∞ 时
P{a≤Sn–np√np(1–p)≤b}→Φ(b)–Φ(a)
棣莫弗-拉普拉斯极限定理表明,当 n 足够大时,参数为 (n,p) 的二项分布随机变量可以由正态随机变量来近似,其中正态随机变量的期望和方差与二项随机变量的期望和方差相同。
结合前文,二项分布现在有两种可能的近似:当 n 较大而 p 较小时,二项分布很好地近似于泊松分布;当 np(1–p) 较大时,二项分布很好地近似于正态分布。一般来说,当 np(1–p)≥10 时,正态分布的近似效果就非常好。