Processing math: 100%

概率论 Cheat Sheet 14:其他连续型概率分布

1. Γ 分布

  如果一个随机变量具有密度函数

f(x)={λeλx(λx)α1Γ(α)x00x<0

其中 Γ(α) 称为 Γ 函数,则称该随机变量服从参数为 (α,λ)Γ 分布,其中 α>0λ>0Γ 函数的定义为

Γ(α)=0eyyα1dy

  对上式右边进行分部积分可得

Γ(α)=eyyα1|0+0ey(α1)yα2dy=(α1)0eyyα2=(α1)Γ(α1)

α=n,重复应用式 (3),得到

Γ(n)=(n1)Γ(n1)=(n1)(n2)Γ(n2)==(n1)×(n1)××2×Γ(1)

又由

Γ(1)=0eydy=1

于是

Γ(n)=(n1)!

  当 α 为一个正整数,如 α=n 时,参数为 (α,λ)Γ 分布在实践中常作为某个事件总共要发生 n 次的等待时间的分布。具体来说,如果 n 个事件是随机发生的,且满足前文的三个条件,则可以证明要等待某个事件一共发生 n 次的时间是服从参数为 (n,λ)Γ 分布。令 Tn 表示第 n 个事件地发生事件,注意 Tnt 的充要条件是在时刻 t 以前至少发生了 n 次事件,既在时间区间 [0,t] 内发生的事件数 N(t)n,因此

P{Tnt}=P{N(t)n}=j=nP{N(t)=j}

由于在 [0,t] 内发生的事件数服从参数为 λt 的泊松分布,于是有

P{Tnt}=j=neλt(λt)jj!

对上式求导,得到 Tn 的概率密度函数如下

f(t)=j=neλtj(λt)j1λj!j=nλeλt(λt)jj!=j=neλt(λt)j1λ(j1)!j=nλeλt(λt)jj!=λeλt(λt)(n1)(n1)!

因此 Tn 服从参数为 (n,λ)Γ 分布。当 n=1 时,该分布退化为指数分布。

  参数为 λ=12α=n2n 为正整数)的 Γ 分布称为自由度为 nχ2 分布。实际中,卡方分布经常出现在误差分布中。例如在 n 维空间中射击一个靶子,中弹点各坐标的的偏差相互独立且为标准正态分布,则偏差的平方和服从自由度为 nχ2 分布。

  随机变量 X 服从参数为 (α,λ)Γ 分布,由式 (1),计算其期望为

E[X]=1Γ(α)0xλeλx(λx)α1dx=1λΓ(α)0λeλx(λx)αdx=Γ(α+1)λΓ(α)=αλ

  通过 E[X2] 计算其方差为

Var(X)=aλ2

2. 韦布尔分布

  韦布尔分布的分布函数具有如下形式

F(x)={0xν1exp{(xνα)β}x>ν

如果一个随机变量的分布函数具有式 (8) 的形式,则称其服从参数为 ναβ韦布尔分布

  对式 (8) 求导得到密度函数为

f(x)={0xνβα(xνα)β1exp{(xνα)β}x>ν

  韦布尔分布最初是在解释疲劳数据时提出的,在有关生命现象的领域有着广泛的应用。当某对象符合“最弱链”模型时,其寿命就符合韦布尔分布。例如对于一个由许多部分组成的对象,假定当它的任何一部分毁坏时此对象的寿命就终止,此时韦布尔分布为这个对象的寿命提供了一个很好的近似。

3. 柯西分布

  如果一个随机变量的密度函数形如

f(x)=1π11+(xθ)2<x<

则称该随机变量服从参数为 θ<θ<)的柯西分布

4. β 分布

  如果一个随机变量的密度函数形如

f(x)={1B(a,b)xa1(1x)b10<x<10

其中 B(a,b) 称为 β 函数,定义为

B(a,b)=10xa1(1x)b1dx

则称该随机变量服从 β 分布

  β 分布通常用来为取值于某有线区间 [c,d] 的随机现象建立模型。如果设 c 为原点,dc 为度量单位,那么可将取值区间转化为 [0,1]

  当 a=b 是,β 分布的密度函数关于 x=12 对称,随着公共值 a 的增大,取值于 12 附近的权重会越来越大;当 a=b=1 时,β 分布就退化成区间 (0,1) 上的均匀分布。当 b>a 时,密度函数向左偏斜,即取小值的可能性更大;当 a>b 时,密度函数向右偏斜。

  可以证明,式 (12) 所示的 β 函数与 Γ 函数之间存在以下关系

B(a,b)=Γ(a)Γ(b)Γ(a+b)

利用式 (3) 和式 (13),可以证明,如果 X 是参数为 abβ 随机变量,那么

E[X]=aa+b

Var(x)=ab(a+b)2(a+b+1)