Processing math: 100%

概率论 Cheat Sheet 16:联合分布函数

1. 联合概率分布函数

  为了处理两个随机变量的概率问题,定义两个随机变量 XY联合概率分布函数(Joint Cumulative Probability Distribution Function)如下

F(a,b)=P{Xa,Yb}<a,b<

X 的分布可以通过 XY 的联合分布得到,即

FX(a)=P{Xa}=P{Xa,Y<}=P(limb{Xa,Yb})=limbP{Xa,Yb}=limbF(a,b)=F(a,)

类似地,可得 Y 的分布函数为

FY(b)=P{Yb}=limaF(a,b)=F(,b)

分布函数 FXFY 称为 XY边缘分布(Marginal Distribution)。

  理论上,所有关于 XY 的联合概率问题都可以通过其联合分布函数来解决。例如对于 X>aY>b 的联合概率,有

P{X>a,Y>b}=1P{X>a,Y>b}c=1P({X>a}c{Y>b}c)=1P({Xq}{Yb})=1[P{Xa}+P{Yb}P{Xa,Yb}]=1FX(a)FY(b)+F(a,b)

上式实际上是以下等式的特例

P{a1<Xa2,b2<Yb2}=F(a2,b2)+F(a1,b1)F(a1,b2)F(a2,b1)

其中 a1<a2b1<b2

2. 联合概率分布列

  当 XY 都是离散型随机变量时,XY联合概率分布列(Joint Probability Mass Function)定义如下

p(x,y)=P{X=x,Y=y}

p(x,y) 可得 X 的分布列为

pX(x)=P{X=x}=y:p(x,y)>0p(x,y)

类似地可得 Y 的分布列为

pY(y)=P{Y=y}=x:p(x,y)>0p(x,y)

3. 联合密度函数

  如果存在一个定义于任意实数 xy 上的函数 f(x,y),满足任意实数对集合 C,有

P{(X,Y)C}=(x,y)Cf(x,y)dxdy

则其中 C 是二维空间中的集合,则称 XY联合连续的(Jointly Continuous),函数 f(x,y) 称为 XY联合密度函数(Joint Probability Density Function)。如果 AB 为任意实数集,定义 C={(x,y):xA,yB},通过式 (5) 可以得到

P{XA,YB}=BAf(x,y)dxdy

F(a,b)=P{X(,a),Y(,b)}=baf(x,y)dxdy

求导可得(如果偏导数有意义)

f(a,b)=2abF(a,b)

  从式 (5) 可以从另一个角度理解联合密度函数,由

P{a<Xa+da,b<Yb+db}=b+dbba+daaf(x,y)dxdyf(a,b)dadb

其中 dadb 都是很小的值,且 f(x,y)(a,b) 处连续。因此,f(a,b) 表示随机向量 (X,Y) 取值于 (a,b) 附近的可能性的大小。

  如果 XY 是联合连续的,那么它们各自都连续。它们各自的密度函数可以如下得到

P{XA}=P{XA,Y(,)}=Af(x,y)dydx=AfX(x)dx

其中

fX(x)=f(x,y)dy

X 的概率密度。类似地,Y 的概率密度为

fY(y)=f(x,y)dx

4. 多项分布

  进行 n 次独立重复试验,每次试验有 r 种可能的结果,每种结果发生的概率为 p1,p2,,prri=1pi=1。若令 Xi 表示 n 次试验中第 i 个结果出现的次数,那么

P{X1=n1,X2=n2,,Xr=nr}=n!n1!n2!nr!pn11pn22pnrr

其中 ri=1ni=n

  以式 (10) 为联合密度函数的联合分布称为多项分布(Multinomial Distribution)。当 r=2 时,多项分布就退化为二项分布。

  在多项分布中,对于任意一组固定的集合,Xi 之和都服从二项分布。对于 N{1,2,,r}iNXi 表示 n 次试验中试验结果取在 N 中,因为每次试验都是独立的,所以其概率为 iNpi。于是 iNXi 服从参数为 np=iNpi 的二项分布。