概率论 Cheat Sheet 22:试验序列中事件发生次数的矩
对于给定的事件序列 A1,⋯,An,令 X 表示这些事件在试验中发生的次数,计算 E[X] 的一个方法是考虑每个事件 Ai 的示性变量
Ii={1若Ai发生0其他
由
X=n∑i=1Ii
得
E[X]=E[n∑i=1Ii]=n∑i=1E[Ii]=n∑i=1P(Ai)
现在考虑成对事件出现的次数,如果事件 Ai 和 Aj 在试验中发生,则 IiIj=1,反之则 IiIj=0。因此在试验序列中,∑i<jIiIj 表示事件成对发生的次数。又因为 X 表示试验序列中单个事件发生的次数,故事件成对发生的次数为 \binom{X}{2},由此有
\begin{equation} \binom{X}{2} = \sum\limits_{i < j}I_i I_j \end{equation}
上式两边求期望,得
\begin{equation} E\Big[\binom{X}{2}\Big] = \sum_{i < j} E[I_i I_j] = \sum_{i < j} P(A_i A_j) \tag{2} \end{equation}
即
\begin{equation} E\Big[\frac{X (X – 1)}{2}\Big] = \sum_{i < j} P(A_i A_j) \end{equation}
\begin{equation} E[X^2] – E[X] = 2 \sum_{i < j} P(A_i A_j) \tag{3} \end{equation}
由上式可以解得 E[X^2],进而可由 \mathrm{Var}(X) = E[X^2] – (E[X])^2 得到 \mathrm{Var}(X)。
此外,考虑在一个试验序列中,k 个不同事件构成的组出现的次数,可得
\begin{equation} \binom{X}{k} = \sum_{i_1 < i_2 < \cdots < i_k} I_{i_1} I_{i_2} \cdots I_{i_k} \end{equation}
上式两边求期望,得
\begin{equation} E\Big[\binom{X}{k}\Big] = \sum_{i_1 < i_2 < \cdots < i_k} E[I_{i_1} I_{i_2} \cdots I_{i_k}] = \sum_{i_1 < i_2 < \cdots < i_k} P\{A_{i_1} A_{i_2} \cdots A_{i_k}\} \tag{4} \end{equation}
一般情况下,利用 P\{A_{i_1} A_{i_2} \cdots A_{i_k}\} = p^k,式 (4) 变为
\begin{equation} E\Big[\binom{X}{k}\Big] = \sum_{i_1 < i_2 < \cdots < i_k} p^k = \binom{n}{k} p^k \end{equation}
上式最后一个等式成立是因为求和项中共有 \binom{n}{k} 项,该求和项中各项相当于从 1 到 n 这 n 个数中任取 k 个(一共有 \binom{n}{k} 种取法),再按升序排列得到 i_1 < i_2 < \cdots < i_k。由上式可得
\begin{equation} E[X(X – 1)\cdots(X – k + 1)] = n(n – 1)\cdots(n – k + 1)p^k \tag{5} \end{equation}
由式 (5) 可以得到各阶矩 E[X^k](k \geq 3)。例如当 k = 3 时,有
\begin{equation} E[X(X – 1)(X – 2)] = n(n – 1)(n – 2) p^3 \end{equation}
\begin{equation} E[X^3 = 3X^2 + 2X] = n(n – 1)(n – 2) p^3 \end{equation}
\begin{equation} E[X^3] = 3E[X^2] – 2E[X] + n(n – 1)(n – 2) p^3 = 3n(n – 1)p^2 + np + n(n – 1)(n – 2)p^2 \end{equation}
Contents [show]
1. 二项随机变量的矩
考虑 n 次独立重复试验,每次成功的概率为 p,记 A_i 为第 i 次试验成功这一事件,当 i \neq j 时,P(A_i A_j) = p^2,由式 (2)、(3),可得
\begin{equation} E\Big[\binom{X}{2}\Big] = \sum_{i < j} p^2 = \binom{n}{2} p^2 \end{equation}
即
\begin{equation} E[X(X – 1)] = n(n – 1) p^2 \end{equation}
\begin{equation} E[X^2] – E[X] = n(n – 1) p^2 \end{equation}
由式 (1) 得到 E[X] = \sum\limits_{i=1}^n P(A_i) = np,可得
\begin{equation} \mathrm{Var}(X) = E[X^2] – (E[X])^2 = n(n – 1)p^2 + np – (np)^2 = np(1 – p) \end{equation}
这与前文得到的结论相同。
2. 超几何随机变量的矩
设一个坛子里有 N 个球,其中有 m 个白球。现从坛子中随机取出 n 个球,用 A_i 表示取出的第 i 个球为白球,则此时 n 个球中白球的个数 X 就是事件 A_1, \cdots, A_n 的发生次数。由于第 i 个球可以是 N 个球中的任意一个,且 N 个球中有 m 个白球,故 P(A_i) = \frac{m}{N},由式 (1) 得到
\begin{equation} E[X] = \sum_{i=1}^n P(A_i) = \frac{mn}{} \end{equation}
又因
\begin{equation} P(A_i A_j) = P(A_i)P(A_j | A_i) = \frac{m}{N} \frac{m – 1}{N – 1} \end{equation}
由式 (2)、(3) 得
\begin{equation} E\Big[\binom{X}{2}\Big] = \sum_{i < j} \frac{m(m – 1)}{N(N – 1)} = \binom{n}{2} \frac{m(m – 1)}{N(N – 1)} \end{equation}
\begin{equation} E[X(X – 1)] = n(n – 1) \frac{m(m – 1)}{N(N – 1)} \end{equation}
\begin{equation} E[X^2] = n(n – 1) \frac{m(m – 1)}{N(N – 1)} + E[X] = n(n – 1) \frac{m(m – 1)}{N(N – 1)} + \frac{mn}{N} \end{equation}
于是得
\begin{align} \mathrm{Var}(X) &= E[X^2] – (E[X])^2 = (n – 1) \frac{m(m – 1)}{N(N – 1)} + \frac{mn}{N} – \Big(\frac{mn}{N}\Big)^2 \\ &= \frac{mn}{N} \Big[\frac{(n – 1)(m – 1)}{N – 1} + 1 – \frac{mn}{N}\Big] \end{align}
这与前文得到的结论相同。