概率论 Cheat Sheet 14:其他连续型概率分布
Contents [show]
1. Γ 分布
如果一个随机变量具有密度函数
f(x)={λe−λx(λx)α–1Γ(α)x≥00x<0
其中 Γ(α) 称为 Γ 函数,则称该随机变量服从参数为 (α,λ) 的 Γ 分布,其中 α>0,λ>0。 Γ 函数的定义为
Γ(α)=∫∞0e−yyα–1dy
对上式右边进行分部积分可得
Γ(α)=−e−yyα–1|∞0+∫∞0e−y(α–1)yα–2dy=(α–1)∫∞0e−yyα–2=(α–1)Γ(α–1)
对 α=n,重复应用式 (3),得到
Γ(n)=(n–1)Γ(n–1)=(n–1)(n–2)Γ(n–2)=⋯=(n–1)×(n–1)×⋯×2×Γ(1)
又由
Γ(1)=∫∞0e−ydy=1
于是
Γ(n)=(n–1)!
当 α 为一个正整数,如 α=n 时,参数为 (α,λ) 的 Γ 分布在实践中常作为某个事件总共要发生 n 次的等待时间的分布。具体来说,如果 n 个事件是随机发生的,且满足前文的三个条件,则可以证明要等待某个事件一共发生 n 次的时间是服从参数为 (n,λ) 的 Γ 分布。令 Tn 表示第 n 个事件地发生事件,注意 Tn≤t 的充要条件是在时刻 t 以前至少发生了 n 次事件,既在时间区间 [0,t] 内发生的事件数 N(t)≥n,因此
P{Tn≤t}=P{N(t)≥n}=∞∑j=nP{N(t)=j}
由于在 [0,t] 内发生的事件数服从参数为 λt 的泊松分布,于是有
P{Tn≤t}=∞∑j=ne−λt(λt)jj!
对上式求导,得到 Tn 的概率密度函数如下
f(t)=∞∑j=ne−λtj(λt)j–1λj!–∞∑j=nλe−λt(λt)jj!=∞∑j=ne−λt(λt)j–1λ(j–1)!–∞∑j=nλe−λt(λt)jj!=λe−λt(λt)(n–1)(n–1)!
因此 Tn 服从参数为 (n,λ) 的 Γ 分布。当 n=1 时,该分布退化为指数分布。
参数为 λ=12,α=n2(n 为正整数)的 Γ 分布称为自由度为 n 的 χ2 分布。实际中,卡方分布经常出现在误差分布中。例如在 n 维空间中射击一个靶子,中弹点各坐标的的偏差相互独立且为标准正态分布,则偏差的平方和服从自由度为 n 的 χ2 分布。
随机变量 X 服从参数为 (α,λ) 的 Γ 分布,由式 (1),计算其期望为
E[X]=1Γ(α)∫∞0xλe−λx(λx)α–1dx=1λΓ(α)∫∞0λe−λx(λx)αdx=Γ(α+1)λΓ(α)=αλ
通过 E[X2] 计算其方差为
Var(X)=aλ2
2. 韦布尔分布
韦布尔分布的分布函数具有如下形式
F(x)={0x≤ν1–exp{−(x–να)β}x>ν
如果一个随机变量的分布函数具有式 (8) 的形式,则称其服从参数为 ν,α 和 β 的韦布尔分布。
对式 (8) 求导得到密度函数为
f(x)={0x≤νβα(x–να)β–1exp{−(x–να)β}x>ν
韦布尔分布最初是在解释疲劳数据时提出的,在有关生命现象的领域有着广泛的应用。当某对象符合“最弱链”模型时,其寿命就符合韦布尔分布。例如对于一个由许多部分组成的对象,假定当它的任何一部分毁坏时此对象的寿命就终止,此时韦布尔分布为这个对象的寿命提供了一个很好的近似。
3. 柯西分布
如果一个随机变量的密度函数形如
f(x)=1π11+(x–θ)2−∞<x<∞
则称该随机变量服从参数为 θ(−∞<θ<∞)的柯西分布。
4. β 分布
如果一个随机变量的密度函数形如
f(x)={1B(a,b)xa–1(1–x)b–10<x<10其他
其中 B(a,b) 称为 β 函数,定义为
B(a,b)=∫10xa–1(1–x)b–1dx
则称该随机变量服从 β 分布。
β 分布通常用来为取值于某有线区间 [c,d] 的随机现象建立模型。如果设 c 为原点,d–c 为度量单位,那么可将取值区间转化为 [0,1]。
当 a=b 是,β 分布的密度函数关于 x=12 对称,随着公共值 a 的增大,取值于 12 附近的权重会越来越大;当 a=b=1 时,β 分布就退化成区间 (0,1) 上的均匀分布。当 b>a 时,密度函数向左偏斜,即取小值的可能性更大;当 a>b 时,密度函数向右偏斜。
可以证明,式 (12) 所示的 β 函数与 Γ 函数之间存在以下关系
B(a,b)=Γ(a)Γ(b)Γ(a+b)
利用式 (3) 和式 (13),可以证明,如果 X 是参数为 a 和 b 的 β 随机变量,那么
E[X]=aa+b
Var(x)=ab(a+b)2(a+b+1)