[DL Note] 概率论:常用概率分布
1. 伯努利分布 对于结果只有成功或失败的试验,令 \begin{equation} X= \begin{cases} 1 & 当试验结果为成功时 \\ 0 & 当试验结果为失败时 \end{cases} \end{equation} 则 $X$ 的分布列为 \begin{align} &p(0) = P\{X = 0\} = 1 …
Read more
learn, build, evaluate
1. 伯努利分布 对于结果只有成功或失败的试验,令 \begin{equation} X= \begin{cases} 1 & 当试验结果为成功时 \\ 0 & 当试验结果为失败时 \end{cases} \end{equation} 则 $X$ 的分布列为 \begin{align} &p(0) = P\{X = 0\} = 1 …
Read more
1. 中心极限定理 中心极限定理 设 $X_1, X_2, \cdots$ 为独立同分布的随机变量序列,其公共分布的均值为 $\mu$,方差为 $\sigma^2$。则随机变量 \begin{equation} \frac{X_1 + \cdots + X_n – n\mu}{\sigma \sqrt{n}} \tag{1} \end{equation} 的分布当 $n \righ…
Read more
在概率论中,极限定理是最重要的理论结果。极限定理中,最核心的是大数定律和中心极限定理。通常,大数定律是考虑随机变量序列的平均值(在某种条件下)收敛到某期望值。相比之下,中心极限定理证明大量随机变量之和的分布在某种条件下逼近正态分布。 马尔可夫不等式 设 $X$ 为取非负值得随机变量,则对于任何常数 $a > 0$,有 \begin{equation} P\{X \geq a\…
Read more
1. 多元正态分布 设 $Z_1, \cdots, Z_n$ 为 $n$ 个相互独立的标准正态随机变量,若 $X_1, \cdots, X_m$ 可以表示如下 \begin{align} X_1 &= a_{11}Z_1 + \cdots + a_{1n}Z_n + \mu_1 \\ X_2 &= a_{21}Z_1 + \cdots + a_{2n}Z_n +…
Read more
1. 矩母函数 随机变量 $X$ 的矩母函数 $M(t)$ 定义为 \begin{equation} M(t) = E[e^{tX}] = \begin{cases} \sum_x e^{tx} p(x) & 若 \; X \; 离散,分布列为 \; p(x) \\ \int_{-\infty}^{\infty} e^{tx} f(x) \mathrm{d}x &…
Read more
1. 定义 当 $X$ 和 $Y$ 的联合分布为离散分布时,对于 $P\{Y = y\} > 0$ 的 $y$ 值,给定 $Y = y$ 之下,$X$ 的条件分布列定义为 \begin{equation} p_{X|Y}(x|y) = P\{X = x | Y = y\} = \frac{p(x, y)}{p_Y(y)} \tag{1} \end{equa…
Read more
假设 $X, Y$ 联合连续且具有联合密度 $f(x, y)$,因此有 \begin{align} E[g(X)h(Y)] &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x)h(y)f(x, y) \mathrm{d}x \mathrm{d}y = \int_{-\infty}^{\infty} \int_{-\infty}^…
Read more
对于给定的事件序列 $A_1, \cdots, A_n$,令 $X$ 表示这些事件在试验中发生的次数,计算 $E[X]$ 的一个方法是考虑每个事件 $A_i$ 的示性变量 \begin{equation} I_i =\begin{cases}1 & 若 \; A_i \; 发生 \\ 0 & 其他\end{cases} \end{equation} 由 \beg…
Read more
1. 期望的定义 离散型随机变量 $X$ 的期望定义为 \begin{equation} E[X] = \sum_x x p(x) \end{equation} 其中 $p(x)$ 是离散型随机变量 $X$ 的分布列。 连续型随机变量 $X$ 的期望定义为 \begin{equation} E[X] = \int_{-\infty}^{\infty} x f(x) \mathrm{d}x …
Read more
1. 次序统计量 设 $X_1, X_2, \cdots, X_n$ 为 $n$ 个独立同分布的连续型随机变量,其分布函数为 $F(x)$,密度函数为 $f(x)$,定义 \begin{align} X_{(1)} &= X_1, X_2, \cdots, X_n \; 中的最小者 \\ X_{(2)} &= X_1, X_2, \cdots, X_n \; 中…
Read more