概率论 Cheat Sheet 13:指数随机变量
Contents [show]
1. 定义
如果一个连续型随机变量的密度函数对于参数 λ>0 有
f(x)={λe−λx当x≥00当x<0
则称该随机变量是参数为 λ 的指数随机变量。
指数随机变量的分布函数 F(a) 为
F(a)=P{X≤a}=∫a0λe−λxdx=−e−λx|a0=1–e−λaa≥0
2. 期望和方差
由式 (1) 计算 E[Xn] 如下
E[Xn]=∫∞0xnλe−λxdx
令 λe−λxdx=dv,u=xn,通过分部积分,得
E[Xn]=−xne−λx|∞0+∫∞0e−λxnxn–1dx=0+nλ∫∞0λe−λxxn–1dx=nλE[Xn–1]
依次令 n=1 和 n=2,得
E[X]=1λ
E[X2]=2λE[X]=2λ2
于是有
Var(x)=2λ2–(1λ)2=1λ2
上面各式说明,即指数分布的期望等于参数 λ 的倒数,方差等于期望的平方。
3. 应用
实践中,指数分布常用来描述某个时间发生的等待时间的分布,例如从现在开始地震发生的时间间隔、从现在开始接到下一个误拨电话的时间间隔等。
对于一个非负随机变量 X,如果它满足
P{X>s+t|X>t}=P{X>s}对于所有s,t≥0
则称随机变量 X 是无记忆的(Memoryless)。假设某个设备的寿命 X 满足式 (5),则该设备在已使用 t 小时的条件下、至少还能再使用 s 小时的概率,与该设备一开始就至少能使用 s 小时的概率是一样的——该设备对是经使用了 t 小时是无记忆的。
式 (5) 等价于
P{X>s+t,X>t}P{X>t}=P{X>s}
即
P{X>s+t}=P{X>s}P{X>t}
当 X 服从指数分布时,有
P{X>s+t}=e−λ(s+t)=e−λse−λt=P{X>s}P{X>t}
式 (7) 成立,指数随机变量是无记忆的。
进一步地,可以证明指数分布不仅具有无记忆性,而且是唯一具有无记忆性的分布。
4. 危险率函数
对于一个正值连续型随机变量 X,分布函数为 F,分布密度为 f,定义危险率(Hazard Rate)函数 λ(t) 如下
λ(t)=f(t)¯F(t)其中¯F(t)=1–F
危险率也称为失效率,如果将 X 解释为某个零件的寿命,则考虑该零件已经使用了 t 小时,那么它不能继续使用 dt 小时的概率为
P{X∈(t,t+dt|X>t)}=P{X∈(t,t+dt,X>t)}P{X>t}=P{X∈(t,t+dt)}P{X>t}≈f(t)F(t)dt
可以看出,λ(t) 表示使用时间为 t 的零件不能再继续使用的条件概率的强度。
假设零件寿命服从指数分布,则它的寿命具有无记忆性,对于一个使用时间为 t 的零件,它剩下的寿命和新的零件是一样的。因此 λ(t) 是一个常数,即
λ(t)=λe−λte−λt=λ
也就是说,指数分布的危险率函数是一个常数,参数 λ 称为指数分布的比率(Rate)。
实际上,根据危险率函数 λ(s)(s≥0)可以唯一地确定它的分布函数 F。对 λ(s) 从 0 到 t 进行积分可得
∫t0λ(s)ds=∫t0f(s)1–F(s)ds=−ln(1–F(s))|t0=−ln(1–F(t))+ln(1–F(0))=−ln(1–F(t))
由上式可以解得
F(t)=1–exp{−∫t0λ(s)ds}
有式 (9) 可知,一个正值连续型随机变量的分布函数可以由其危险率函数唯一确定。例如对于
λ(t)=a+bt
其分布函数和密度函数为
F(t)=1–e−at–bt2/2
f(t)=(a+bt)e−at–bt2/2t≥0
当 a=0 时,上式即为瑞利分布(Rayleigh Distribution)的密度函数。