概率论 Cheat Sheet 20:次序统计量与可交换随机变量
Contents [show]
1. 次序统计量
设 X1,X2,⋯,Xn 为 n 个独立同分布的连续型随机变量,其分布函数为 F(x),密度函数为 f(x),定义
X(1)=X1,X2,⋯,Xn中的最小者X(2)=X1,X2,⋯,Xn中的第2小者⋮X(j)=X1,X2,⋯,Xn中的第j小者⋮X(n)=X1,X2,⋯,Xn中的最大者
排序后的 X(1)≤X(2)≤⋯≤X(n) 称为 X1,X2,⋯,Xn 的次序统计量(Order Statistics),换言之,X(1)≤X(2)≤⋯≤X(n) 是 X1.⋯,Xn 排序后的值。
为了计算 X(1)≤X(2)≤⋯≤X(n) 的联合密度,注意到 X(1)≤X(2)≤⋯≤X(n) 取值为 x1≤x2≤⋯≤xn 的充要条件是存在 (1,2,⋯,n) 的一个排列 (i1,i2,⋯,in) 使得
X1=xi1,X2=xi2,⋯,Xn=xin
而对于任何 (1,2,⋯,n) 的排列 (i1,⋯,in),
P{xi1–ε2<X1<xi1+ε2,⋯,xin–ε2<Xn<xin+ε2}≈εnfX1,⋯,Xn(xi1,⋯,xin)=εnf(xi1)⋯f(xin)=εnf(x1)⋯f(xn)
由此可知,对 x1<x2<⋯<xn,有
P{x1–ε2<X1<x1+ε2,⋯,xn–ε2<Xn<xn+ε2}≈n!εnf(x1)⋯f(xn)
上式两端同除以 εn,并令 ε→0,得
fX(1),⋯,X(n)(x1,⋯,xn)=n!f(x1)⋯f(xn)x1<x2<⋯<xn
可以这样来理解上式:向量 ⟨X(1),⋯,X(n)⟩ 等于 ⟨x1,⋯,xn⟩ 的充要条件是 ⟨X(1),⋯,X(n)⟩ 等于 ⟨x1,⋯,xn⟩ 的 n! 种排列之一,而 ⟨X(1),⋯,X(n)⟩ 等于 ⟨x1,⋯,xn⟩ 的任一排列的概率(密度)刚好是 f(x1)⋯f(xn)。
2. 可交换随机变量
对于随机变量 X1,⋯,Xn,如果对于 1,2,⋯,n 的每一个排列 i1,⋯,in,有
P{Xi1≤x1,Xi2≤x2,⋯,Xin≤xn}=P{X1≤x1,X2≤x2,⋯,Xn≤xn}
对一切 x1,⋯,xn 成立,则称随机变量 X1,⋯,Xn 是可交换的(Exchangeable)。也就是说,如果 n 个随机变量的联合分布与这些随机变量的次序无关,则这些随机变量是可交换的。
当 X1,⋯,Xn 为离散型随机变量时,可交换条件是
P{Xi1=x1,Xi2=x2,⋯,Xin=xn}=P{X1=x1,X2=x2,⋯,Xn=xn}
对任意排列 i1,⋯,in 和一切 x1,⋯,xn 成立。它与下面的表述是等价的:分布列 p(x1,⋯,xn)=P{Xi1=x1,⋯,Xin=xn} 是向量 (x1,⋯,xn) 的对称函数,或者说当向量 x1,⋯,xn 的值任意排列后,相应的概率值不变。