概率论 Cheat Sheet 16:联合分布函数
Contents [show]
1. 联合概率分布函数
为了处理两个随机变量的概率问题,定义两个随机变量 X 和 Y 的联合概率分布函数(Joint Cumulative Probability Distribution Function)如下
F(a,b)=P{X≤a,Y≤b}−∞<a,b<∞
X 的分布可以通过 X 和 Y 的联合分布得到,即
FX(a)=P{X≤a}=P{X≤a,Y<∞}=P(limb→∞{X≤a,Y≤b})=limb→∞P{X≤a,Y≤b}=limb→∞F(a,b)=F(a,∞)
类似地,可得 Y 的分布函数为
FY(b)=P{Y≤b}=lima→∞F(a,b)=F(∞,b)
分布函数 FX 和 FY 称为 X 和 Y 的边缘分布(Marginal Distribution)。
理论上,所有关于 X 和 Y 的联合概率问题都可以通过其联合分布函数来解决。例如对于 X>a 和 Y>b 的联合概率,有
P{X>a,Y>b}=1–P{X>a,Y>b}c=1–P({X>a}c⋃{Y>b}c)=1–P({X≤q}⋃{Y≤b})=1–[P{X≤a}+P{Y≤b}–P{X≤a,Y≤b}]=1–FX(a)–FY(b)+F(a,b)
上式实际上是以下等式的特例
P{a1<X≤a2,b2<Y≤b2}=F(a2,b2)+F(a1,b1)–F(a1,b2)–F(a2,b1)
其中 a1<a2,b1<b2。
2. 联合概率分布列
当 X 和 Y 都是离散型随机变量时,X 和 Y 的联合概率分布列(Joint Probability Mass Function)定义如下
p(x,y)=P{X=x,Y=y}
由 p(x,y) 可得 X 的分布列为
pX(x)=P{X=x}=∑y:p(x,y)>0p(x,y)
类似地可得 Y 的分布列为
pY(y)=P{Y=y}=∑x:p(x,y)>0p(x,y)
3. 联合密度函数
如果存在一个定义于任意实数 x 和 y 上的函数 f(x,y),满足任意实数对集合 C,有
P{(X,Y)∈C}=∬(x,y)∈Cf(x,y)dxdy
则其中 C 是二维空间中的集合,则称 X 和 Y 是联合连续的(Jointly Continuous),函数 f(x,y) 称为 X 和 Y 的联合密度函数(Joint Probability Density Function)。如果 A 和 B 为任意实数集,定义 C={(x,y):x∈A,y∈B},通过式 (5) 可以得到
P{X∈A,Y∈B}=∫B∫Af(x,y)dxdy
由
F(a,b)=P{X∈(−∞,a),Y∈(−∞,b)}=∫b−∞∫a−∞f(x,y)dxdy
求导可得(如果偏导数有意义)
f(a,b)=∂2∂a∂bF(a,b)
从式 (5) 可以从另一个角度理解联合密度函数,由
P{a<X≤a+da,b<Y≤b+db}=∫b+dbb∫a+daaf(x,y)dxdy≈f(a,b)dadb
其中 da 和 db 都是很小的值,且 f(x,y) 在 (a,b) 处连续。因此,f(a,b) 表示随机向量 (X,Y) 取值于 (a,b) 附近的可能性的大小。
如果 X 和 Y 是联合连续的,那么它们各自都连续。它们各自的密度函数可以如下得到
P{X∈A}=P{X∈A,Y∈(−∞,∞)}=∫A∫∞−∞f(x,y)dydx=∫AfX(x)dx
其中
fX(x)=∫∞−∞f(x,y)dy
为 X 的概率密度。类似地,Y 的概率密度为
fY(y)=∫∞−∞f(x,y)dx
4. 多项分布
进行 n 次独立重复试验,每次试验有 r 种可能的结果,每种结果发生的概率为 p1,p2,⋯,pr,∑ri=1pi=1。若令 Xi 表示 n 次试验中第 i 个结果出现的次数,那么
P{X1=n1,X2=n2,⋯,Xr=nr}=n!n1!n2!⋯nr!pn11pn22⋯pnrr
其中 r∑i=1ni=n。
以式 (10) 为联合密度函数的联合分布称为多项分布(Multinomial Distribution)。当 r=2 时,多项分布就退化为二项分布。
在多项分布中,对于任意一组固定的集合,Xi 之和都服从二项分布。对于 N⊂{1,2,⋯,r},∑i∈NXi 表示 n 次试验中试验结果取在 N 中,因为每次试验都是独立的,所以其概率为 ∑i∈Npi。于是 ∑i∈NXi 服从参数为 n 和 p=∑i∈Npi 的二项分布。