概率论 Cheat Sheet 3：多维随机变量及其分布（1）

Author: nex3z 2018-05-26

1. 二维随机变量

　　一般，设 $E$ 是一个随机试验，它的样本空间是 $S = {e}$，设 $X = X(e)$ 和 $Y = Y(e)$ 是定义在 $S$ 上的随机变量，由它们构成的一个向量 $(X, Y)$，叫做二维随机向量或二维随机变量。

　　二维随机变量 $(X, Y)$ 的性质不仅与 $X$ 及 $Y$ 有关，而且还依赖于这两个随机变量的相互关系。因此，逐个地来研究 $X$ 或 $Y$ 的性质是不够的，还需将 $X, Y$ 作为一个整体来进行研究。

　　定义　设 $(X, Y)$ 是二维随机变量，对于任意实数 $x, y$，二元函数：

\begin{equation}
F(x, y) = P\{(X \leq x) \cap (Y \leq y) \} \overset{\mathrm{记成}}{=} P\{X \leq x, Y \leq y\}
\end{equation}

称为二维随机变量 $(X, Y)$ 的分布函数，或称为随机变量 $X$ 和 $Y$ 的联合分布函数。

　　如果将二维随机变量 $(X, Y)$ 看成是平面上随机点的坐标，那么，分布函数 $F(x, y)$ 在 $(x, y)$ 处的函数值就是随机点 $(X, Y)$ 落在以点 $(x, y)$ 为顶点而位于该点左下方的无穷矩形域内的概率。容易算出随机点 $(X, Y)$ 落在矩形域 $\{(x, y)|x_1 < x \leq x_2, y_1 < y \leq y_2\}$ 的概率为

\begin{equation}
P\{x_1 < X \leq x_2, y_1 < Y \leq y_2\} = F(x_2, y_2) – F(x_2, y_1) + F(x_1, y_1) – F(x_1, y_2) \tag{1.1}
\end{equation}

　　分布函数 $F(x, y)$ 具有以下的基本性质：

$F(x, y)$ 是变量 $x$ 和 $y$ 的不减函数，即对于任意固定的 $y$，当 $x_2 > x_1$ 时 $F(x_2, y) \geq F(x_1, y)$；对于任意固定的的 $x$，当 $y_2 > y_1$ 时 $F(x, y_2) \geq F(x, y_1)$。
$0 \leq F(x, y) \leq 1$，且
　　对于任意固定的 $y$，$F(-\infty, y) = 0$，
　　对于任意固定的 $x$，$F(x, -\infty) = 0$，
　　$F(-\infty, -\infty) = 0$，$F(\infty, \infty) = 1$
$F(x + 0, y) = F(x, y)$，$F(x, y + 0) = F(x, y)$，即 $F(x, y)$ 关于 $x$ 右连续，关于 $y$ 也右连续。
对于任意 $(x_1, y_1),(x_2, y_2), x_1 < x_2, y_1 < y_2)$，下述不等式成立：
\begin{equation}
F(x_2, y_2) – F(x_2, y_1) + F(x_1, y_1) – F(x_1, y_2) \geq 0
\end{equation}

　　如果二维随机变量 $(X, Y)$ 全部可能取到的值是有限对或可列无限对，则称 $(X, Y)$ 是离散型的随机变量。

　　设二维离散随机变量 $(X, Y)$ 所有可能取的值为 $(x_i, y_i), i, j = 1,2,\cdots$，记 $P{X = x_i, Y = y_j} = p_{ij}, i, j = 1,2,\cdots$，则由概率的定义有

\begin{equation}
p_{ij} > 0，\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} p_{ij} = 1
\end{equation}

　　称 $P\{X = x_i, Y = y_j\} = p_{ij}, i, j = 1,2,\cdots$ 为二维离散型随机变量 $(X, Y)$ 的分布律，或称为随机变量 $X$ 和 $Y$ 的联合分布律。

　　将 $(X, Y)$ 看成一个随机点的坐标，离散型随机变量 $X$ 和 $Y$ 的联合分布函数为

\begin{equation}
F(x, y) = \sum_{x_i \leq x} \sum_{y_j \leq y} p_{ij} \tag{1.2}
\end{equation}

其中和式是对一切满足 $x_i \leq x, y_j \leq y$ 的 $i, j$ 来求和的。

　　与一维随机变量类似，对于二维随机变量 $(X, Y)$ 的分布函数 $F(x, y)$，如果存在非负可积函数 $f(x, y)$ 使对于任意 $x, y$ 有

\begin{equation}
F(x, y) = \int_{-\infty}^y \int_{-\infty}^x f(u, v)dudv
\end{equation}

则称 $(X, Y)$ 是连续型的二维随机变量，函数 $f(x, y)$ 称为二维随机变量 $(X, Y)$ 的概率密度，或称为随机变量 $X$ 和 $Y$ 的联合概率密度。

　　按定义， $f(x, y)$ 具有以下性质：

$f(x, y) \geq 0$。
$\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(u, v)dudv = F(\infty, {\infty}) = 1$。
设 $G$ 是 $xOy$ 平面上的区域，点 $(X, Y)$ 落在 $G$ 内的概率为
\begin{equation}
P\{(X, Y) \in G\} = \iint_G f(x, y)dxdy \tag{1.3}
\end{equation}
若 $f(x, y)$ 在点 $(x, y)$ 连续，则有
\begin{equation}
\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)
\end{equation}

　　由性质 4，在 $f(x, y)$ 的连续点处有

\begin{align}
& \lim_{\substack{\Delta x \rightarrow 0^+ \\ \Delta y \rightarrow 0^+}} \frac{P\{x < X \leq x + \Delta x, y < Y < y + \Delta y\}}{\Delta x \Delta y} \\
& \overset{\mathrm{由(1.1)}}{=} \lim_{\substack{\Delta x \rightarrow 0^+ \\ \Delta y \rightarrow 0^+}} \frac{1}{\Delta x \Delta y} \left[ F(x + \Delta， y + \Delta) – F(x + \Delta, y) – F(x, y + \Delta) + F(x, y) \right] \\
&= \frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)
\end{align}

这表示若 $f(x, y)$ 在点 $(x, y)$ 出连续，则当 $\Delta x, \Delta y$ 很小时

\begin{equation}
P\{x < X \leq x + \Delta x, y < Y < y + \Delta y\} \approx f(x, y) \Delta x \Delta y
\end{equation}

也就是点 $(X, Y)$ 落在小长方形 $(x, x + \Delta x] \times (y, y + \Delta y]$ 内的概率近似地等于 $f(x, y) \Delta x \Delta y$。

　　在几何上，$z = f(x, y)$ 表示空间的一个曲面。有性质 2 知，介于它和 $xOy$ 平面的空间区域的体积为 $1$。由性质 3，$P\{(x, y) \in G\}$ 的值等于以 $G$ 为底，以曲面 $z = f(x, y)$ 为顶面的柱体体积。

　　一般，设 $E$ 是一个随机试验，它的样本空间是 $S = \{e\}$，设 $X_1 = X_1(e), X_2 = X_2(e), \cdots, X_n = X_n(e)$ 是定义在 $S$ 上的随机变量，由它们构成的一个 $n$ 维向量 $(X_1, X_2, \cdots, X_n)$ 叫做 $n$ 维随机向量或 $n$ 维随机变量。

　　对于任意 $n$ 个实数 $x_1, x_2, \cdots, x_n$，$n$ 元函数

\begin{equation}
F(x_1, x_2, \cdots, x_n) = P\{X_1 \leq x_1, X_2 \leq x_2, \cdots, X_n \leq x_n\}
\end{equation}

称为 $n$ 元随机变量 $X_1, X_2, \cdots, X_n$ 的分布函数或随机变量 $X_1, X_2, \cdots, X_n$ 的联合分布函数。它具有类似于二维随机变量的分布函数的性质。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31