Processing math: 100%

概率论 Cheat Sheet 28:中心极限定理和强大数定律

1. 中心极限定理

  中心极限定理 设 X1,X2, 为独立同分布的随机变量序列,其公共分布的均值为 μ,方差为 σ2。则随机变量

X1++Xnnμσn

的分布当 n 时趋向于标准正态分布,即对任何 <a<,有

P{X1++Xnnμσna}12πaex2/2dxn

  中心极限定理说明大量独立随机变量的和近似地服从正态分布。中心极限定理不仅提供了计算独立随机变量和的简便方法,同时也帮助解释了现实世界中许多实际的总体分布的频率曲线呈现钟形曲线(即正态密度)的原因。

  引理 设 Z1,Z2, 为一公共分布函数为 FZn 的随机变量序列,相应的矩母函数为 MZnn1)。又设 Z 的分布为 FZ,矩母函数为 MZ,若 MZn(t)MZ(t) 对一切 t 成立,则 FZn(t)FZ(t) 对于 FZ(t) 的所有连续点成立。

  若 Z 为标准正态分布,则 MZ(t)=et2/2,由上述引理可知,若当 nMZn(t)et2/2,则当 nFZn(t)Φ(t)

2. 强大数定律

  强大数定律 设 X1,X2, 为一独立同分布的随机变量序列,其公共均值 μ=E[X] 有限,则下式以概率 1 成立

X1+X2++Xnnμn

  强大数定律说明独立同分布的随机变量序列的均值以概率 1 收敛到分布的均值。作为强大数定律的一个应用,设有一独立重复试验序列,令 E 为某一事件,P(E) 为事件 E 发生的概率,又令

Xi={1Ei0Ei

由强大数定律,以概率 1

X1+X2++XnnE[X]=P(E)

因为 X1++Xn 表示在前 n 次试验中事件 E 发生的次数,因此式 (4) 说明事件 E 在前 n 次试验中发生的频率以概率 1 收敛到它的概率 P(E)

3. 其他不等式

  有时候我们希望得到概率的上界,形如 P{Xμa},其中 a 为一正数,均值 μ=E[X] 和方差 σ2=Var(X) 已知。因为 Xμa 蕴含 |Xμ|a,由切比雪夫不等式,有

P{Xμa}P{|Xμ|a}σ2a2a>0

然而,下面的命题指出,还可以得到更准确的上界

  单边的切比雪夫不等式 设 X 具有 0 均值和有限方差 σ2,则对任意 a0,有

P{Xa}σ2σ2+a2

  推论 若 E[X]=μVar(X)=σ2,则对于 a>0,下列不等式成立

P{Xμ+a}σ2σ2+a2

  当随机变量 X 的矩母函数为已知时,我们可以得到更加有效的 P{Xa} 的上界。令

M(t)=E[etX]

为随机变量 X 的矩母函数,则对于 t>0,有

P{Xa}=P{etXeta}E[etX]eta

类似地,对于 t<0,有

P{Xa}=P{etXeta}E[etX]eta

于是有以下命题成立:

  切尔诺夫界

P{Xa}E[etX]etat>0

P{Xa}E[etX]etat<0

  由于切尔诺夫界对 t 为正或为负都成立,可以通过找到使 etaM(t) 达到最小的 t 值,来获得 P{Xa} 的最佳上界。

  定义 对于一个二次可微的实值函数 f(x),若 f(x)0 对一切 x 成立,则称 f(x) 为凸的。反之,若 f(x)0 对一切 x 成立,则称 f(x) 为凹的。

  例如 f(x)=x2f(x)=eaxf(x)=x1nx0)都是凸函数。若 f(x) 为凸函数,则 g(x)=f(x) 就是凹函数,反之亦然。

  詹森不等式 若 f(x) 时凸函数,且 E[X] 存在且有限,则

E[f(x)]f(E[X])