概率论 Cheat Sheet 3:多维随机变量及其分布(1)
1. 二维随机变量
一般,设 $E$ 是一个随机试验,它的样本空间是 $S = {e}$,设 $X = X(e)$ 和 $Y = Y(e)$ 是定义在 $S$ 上的随机变量,由它们构成的一个向量 $(X, Y)$,叫做二维随机向量或二维随机变量。
二维随机变量 $(X, Y)$ 的性质不仅与 $X$ 及 $Y$ 有关,而且还依赖于这两个随机变量的相互关系。因此,逐个地来研究 $X$ 或 $Y$ 的性质是不够的,还需将 $X, Y$ 作为一个整体来进行研究。
定义 设 $(X, Y)$ 是二维随机变量,对于任意实数 $x, y$,二元函数:
\begin{equation}
F(x, y) = P\{(X \leq x) \cap (Y \leq y) \} \overset{\mathrm{记成}}{=} P\{X \leq x, Y \leq y\}
\end{equation}
称为二维随机变量 $(X, Y)$ 的分布函数,或称为随机变量 $X$ 和 $Y$ 的联合分布函数。
如果将二维随机变量 $(X, Y)$ 看成是平面上随机点的坐标,那么,分布函数 $F(x, y)$ 在 $(x, y)$ 处的函数值就是随机点 $(X, Y)$ 落在以点 $(x, y)$ 为顶点而位于该点左下方的无穷矩形域内的概率。容易算出随机点 $(X, Y)$ 落在矩形域 $\{(x, y)|x_1 < x \leq x_2, y_1 < y \leq y_2\}$ 的概率为
\begin{equation}
P\{x_1 < X \leq x_2, y_1 < Y \leq y_2\} = F(x_2, y_2) – F(x_2, y_1) + F(x_1, y_1) – F(x_1, y_2) \tag{1.1}
\end{equation}
分布函数 $F(x, y)$ 具有以下的基本性质:
- $F(x, y)$ 是变量 $x$ 和 $y$ 的不减函数,即对于任意固定的 $y$,当 $x_2 > x_1$ 时 $F(x_2, y) \geq F(x_1, y)$;对于任意固定的的 $x$,当 $y_2 > y_1$ 时 $F(x, y_2) \geq F(x, y_1)$。
- $0 \leq F(x, y) \leq 1$,且
对于任意固定的 $y$,$F(-\infty, y) = 0$,
对于任意固定的 $x$,$F(x, -\infty) = 0$,
$F(-\infty, -\infty) = 0$,$F(\infty, \infty) = 1$ - $F(x + 0, y) = F(x, y)$,$F(x, y + 0) = F(x, y)$,即 $F(x, y)$ 关于 $x$ 右连续,关于 $y$ 也右连续。
- 对于任意 $(x_1, y_1),(x_2, y_2), x_1 < x_2, y_1 < y_2)$,下述不等式成立:
\begin{equation}
F(x_2, y_2) – F(x_2, y_1) + F(x_1, y_1) – F(x_1, y_2) \geq 0
\end{equation}
如果二维随机变量 $(X, Y)$ 全部可能取到的值是有限对或可列无限对,则称 $(X, Y)$ 是离散型的随机变量。
设二维离散随机变量 $(X, Y)$ 所有可能取的值为 $(x_i, y_i), i, j = 1,2,\cdots$,记 $P{X = x_i, Y = y_j} = p_{ij}, i, j = 1,2,\cdots$,则由概率的定义有
\begin{equation}
p_{ij} > 0,\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} p_{ij} = 1
\end{equation}
称 $P\{X = x_i, Y = y_j\} = p_{ij}, i, j = 1,2,\cdots$ 为二维离散型随机变量 $(X, Y)$ 的分布律,或称为随机变量 $X$ 和 $Y$ 的联合分布律。
将 $(X, Y)$ 看成一个随机点的坐标,离散型随机变量 $X$ 和 $Y$ 的联合分布函数为
\begin{equation}
F(x, y) = \sum_{x_i \leq x} \sum_{y_j \leq y} p_{ij} \tag{1.2}
\end{equation}
其中和式是对一切满足 $x_i \leq x, y_j \leq y$ 的 $i, j$ 来求和的。
与一维随机变量类似,对于二维随机变量 $(X, Y)$ 的分布函数 $F(x, y)$,如果存在非负可积函数 $f(x, y)$ 使对于任意 $x, y$ 有
\begin{equation}
F(x, y) = \int_{-\infty}^y \int_{-\infty}^x f(u, v)dudv
\end{equation}
则称 $(X, Y)$ 是连续型的二维随机变量,函数 $f(x, y)$ 称为二维随机变量 $(X, Y)$ 的概率密度,或称为随机变量 $X$ 和 $Y$ 的联合概率密度。
按定义, $f(x, y)$ 具有以下性质:
- $f(x, y) \geq 0$。
- $\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(u, v)dudv = F(\infty, {\infty}) = 1$。
- 设 $G$ 是 $xOy$ 平面上的区域,点 $(X, Y)$ 落在 $G$ 内的概率为
\begin{equation}
P\{(X, Y) \in G\} = \iint_G f(x, y)dxdy \tag{1.3}
\end{equation} - 若 $f(x, y)$ 在点 $(x, y)$ 连续,则有
\begin{equation}
\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)
\end{equation}
由性质 4,在 $f(x, y)$ 的连续点处有
\begin{align}
& \lim_{\substack{\Delta x \rightarrow 0^+ \\ \Delta y \rightarrow 0^+}} \frac{P\{x < X \leq x + \Delta x, y < Y < y + \Delta y\}}{\Delta x \Delta y} \\
& \overset{\mathrm{由(1.1)}}{=} \lim_{\substack{\Delta x \rightarrow 0^+ \\ \Delta y \rightarrow 0^+}} \frac{1}{\Delta x \Delta y} \left[ F(x + \Delta, y + \Delta) – F(x + \Delta, y) – F(x, y + \Delta) + F(x, y) \right] \\
&= \frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)
\end{align}
这表示若 $f(x, y)$ 在点 $(x, y)$ 出连续,则当 $\Delta x, \Delta y$ 很小时
\begin{equation}
P\{x < X \leq x + \Delta x, y < Y < y + \Delta y\} \approx f(x, y) \Delta x \Delta y
\end{equation}
也就是点 $(X, Y)$ 落在小长方形 $(x, x + \Delta x] \times (y, y + \Delta y]$ 内的概率近似地等于 $f(x, y) \Delta x \Delta y$。
在几何上,$z = f(x, y)$ 表示空间的一个曲面。有性质 2 知,介于它和 $xOy$ 平面的空间区域的体积为 $1$。由性质 3,$P\{(x, y) \in G\}$ 的值等于以 $G$ 为底,以曲面 $z = f(x, y)$ 为顶面的柱体体积。
一般,设 $E$ 是一个随机试验,它的样本空间是 $S = \{e\}$,设 $X_1 = X_1(e), X_2 = X_2(e), \cdots, X_n = X_n(e)$ 是定义在 $S$ 上的随机变量,由它们构成的一个 $n$ 维向量 $(X_1, X_2, \cdots, X_n)$ 叫做 $n$ 维随机向量或 $n$ 维随机变量。
对于任意 $n$ 个实数 $x_1, x_2, \cdots, x_n$,$n$ 元函数
\begin{equation}
F(x_1, x_2, \cdots, x_n) = P\{X_1 \leq x_1, X_2 \leq x_2, \cdots, X_n \leq x_n\}
\end{equation}
称为 $n$ 元随机变量 $X_1, X_2, \cdots, X_n$ 的分布函数或随机变量 $X_1, X_2, \cdots, X_n$ 的联合分布函数。它具有类似于二维随机变量的分布函数的性质。