Processing math: 100%

概率论 Cheat Sheet 13:指数随机变量

1. 定义

  如果一个连续型随机变量的密度函数对于参数 λ>0

f(x)={λeλxx00x<0

则称该随机变量是参数为 λ 的指数随机变量。

  指数随机变量的分布函数 F(a)

F(a)=P{Xa}=a0λeλxdx=eλx|a0=1eλaa0

2. 期望和方差

  由式 (1) 计算 E[Xn] 如下

E[Xn]=0xnλeλxdx

λeλxdx=dvu=xn,通过分部积分,得

E[Xn]=xneλx|0+0eλxnxn1dx=0+nλ0λeλxxn1dx=nλE[Xn1]

依次令 n=1n=2,得

E[X]=1λ

E[X2]=2λE[X]=2λ2

于是有

Var(x)=2λ2(1λ)2=1λ2

上面各式说明,即指数分布的期望等于参数 λ 的倒数,方差等于期望的平方。

3. 应用

  实践中,指数分布常用来描述某个时间发生的等待时间的分布,例如从现在开始地震发生的时间间隔、从现在开始接到下一个误拨电话的时间间隔等。

  对于一个非负随机变量 X,如果它满足

P{X>s+t|X>t}=P{X>s}s,t0

则称随机变量 X无记忆的(Memoryless)。假设某个设备的寿命 X 满足式 (5),则该设备在已使用 t 小时的条件下、至少还能再使用 s 小时的概率,与该设备一开始就至少能使用 s 小时的概率是一样的——该设备对是经使用了 t 小时是无记忆的。

  式 (5) 等价于

P{X>s+t,X>t}P{X>t}=P{X>s}

P{X>s+t}=P{X>s}P{X>t}

  当 X 服从指数分布时,有

P{X>s+t}=eλ(s+t)=eλseλt=P{X>s}P{X>t}

(7) 成立,指数随机变量是无记忆的。

  进一步地,可以证明指数分布不仅具有无记忆性,而且是唯一具有无记忆性的分布。

4. 危险率函数

  对于一个正值连续型随机变量 X,分布函数为 F,分布密度为 f,定义危险率(Hazard Rate)函数 λ(t) 如下

λ(t)=f(t)¯F(t)¯F(t)=1F

危险率也称为失效率,如果将 X 解释为某个零件的寿命,则考虑该零件已经使用了 t 小时,那么它不能继续使用 dt 小时的概率为

P{X(t,t+dt|X>t)}=P{X(t,t+dt,X>t)}P{X>t}=P{X(t,t+dt)}P{X>t}f(t)F(t)dt

可以看出,λ(t) 表示使用时间为 t 的零件不能再继续使用的条件概率的强度。

  假设零件寿命服从指数分布,则它的寿命具有无记忆性,对于一个使用时间为 t 的零件,它剩下的寿命和新的零件是一样的。因此 λ(t) 是一个常数,即

λ(t)=λeλteλt=λ

也就是说,指数分布的危险率函数是一个常数,参数 λ 称为指数分布的比率(Rate)。

  实际上,根据危险率函数 λ(s)s0)可以唯一地确定它的分布函数 F。对 λ(s)0t 进行积分可得

t0λ(s)ds=t0f(s)1F(s)ds=ln(1F(s))|t0=ln(1F(t))+ln(1F(0))=ln(1F(t))

由上式可以解得

F(t)=1exp{t0λ(s)ds}

  有式 (9) 可知,一个正值连续型随机变量的分布函数可以由其危险率函数唯一确定。例如对于

λ(t)=a+bt

其分布函数和密度函数为

F(t)=1eatbt2/2

f(t)=(a+bt)eatbt2/2t0

a=0 时,上式即为瑞利分布(Rayleigh Distribution)的密度函数。