概率论 Cheat Sheet 22:试验序列中事件发生次数的矩
对于给定的事件序列 A1,⋯,An,令 X 表示这些事件在试验中发生的次数,计算 E[X] 的一个方法是考虑每个事件 Ai 的示性变量
Ii={1若Ai发生0其他
由
X=n∑i=1Ii
得
E[X]=E[n∑i=1Ii]=n∑i=1E[Ii]=n∑i=1P(Ai)
现在考虑成对事件出现的次数,如果事件 Ai 和 Aj 在试验中发生,则 IiIj=1,反之则 IiIj=0。因此在试验序列中,∑i<jIiIj 表示事件成对发生的次数。又因为 X 表示试验序列中单个事件发生的次数,故事件成对发生的次数为 (X2),由此有
(X2)=∑i<jIiIj
上式两边求期望,得
E[(X2)]=∑i<jE[IiIj]=∑i<jP(AiAj)
即
E[X(X–1)2]=∑i<jP(AiAj)
E[X2]–E[X]=2∑i<jP(AiAj)
由上式可以解得 E[X2],进而可由 Var(X)=E[X2]–(E[X])2 得到 Var(X)。
此外,考虑在一个试验序列中,k 个不同事件构成的组出现的次数,可得
(Xk)=∑i1<i2<⋯<ikIi1Ii2⋯Iik
上式两边求期望,得
E[(Xk)]=∑i1<i2<⋯<ikE[Ii1Ii2⋯Iik]=∑i1<i2<⋯<ikP{Ai1Ai2⋯Aik}
一般情况下,利用 P{Ai1Ai2⋯Aik}=pk,式 (4) 变为
E[(Xk)]=∑i1<i2<⋯<ikpk=(nk)pk
上式最后一个等式成立是因为求和项中共有 (nk) 项,该求和项中各项相当于从 1 到 n 这 n 个数中任取 k 个(一共有 (nk) 种取法),再按升序排列得到 i1<i2<⋯<ik。由上式可得
E[X(X–1)⋯(X–k+1)]=n(n–1)⋯(n–k+1)pk
由式 (5) 可以得到各阶矩 E[Xk](k≥3)。例如当 k=3 时,有
E[X(X–1)(X–2)]=n(n–1)(n–2)p3
E[X3=3X2+2X]=n(n–1)(n–2)p3
E[X3]=3E[X2]–2E[X]+n(n–1)(n–2)p3=3n(n–1)p2+np+n(n–1)(n–2)p2
Contents [show]
1. 二项随机变量的矩
考虑 n 次独立重复试验,每次成功的概率为 p,记 Ai 为第 i 次试验成功这一事件,当 i≠j 时,P(AiAj)=p2,由式 (2)、(3),可得
E[(X2)]=∑i<jp2=(n2)p2
即
E[X(X–1)]=n(n–1)p2
E[X2]–E[X]=n(n–1)p2
由式 (1) 得到 E[X]=n∑i=1P(Ai)=np,可得
Var(X)=E[X2]–(E[X])2=n(n–1)p2+np–(np)2=np(1–p)
这与前文得到的结论相同。
2. 超几何随机变量的矩
设一个坛子里有 N 个球,其中有 m 个白球。现从坛子中随机取出 n 个球,用 Ai 表示取出的第 i 个球为白球,则此时 n 个球中白球的个数 X 就是事件 A1,⋯,An 的发生次数。由于第 i 个球可以是 N 个球中的任意一个,且 N 个球中有 m 个白球,故 P(Ai)=mN,由式 (1) 得到
E[X]=n∑i=1P(Ai)=mn
又因
P(AiAj)=P(Ai)P(Aj|Ai)=mNm–1N–1
由式 (2)、(3) 得
E[(X2)]=∑i<jm(m–1)N(N–1)=(n2)m(m–1)N(N–1)
E[X(X–1)]=n(n–1)m(m–1)N(N–1)
E[X2]=n(n–1)m(m–1)N(N–1)+E[X]=n(n–1)m(m–1)N(N–1)+mnN
于是得
Var(X)=E[X2]–(E[X])2=(n–1)m(m–1)N(N–1)+mnN–(mnN)2=mnN[(n–1)(m–1)N–1+1–mnN]
这与前文得到的结论相同。