数理统计 Cheat Sheet 12:假设检验

1. 定义

  假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些未知特性,提出某些关于总体的假设,并根据样本对所提出的假设做出接受还是拒绝的决策。

  例如对于某正态总体 $X$,已知其方差为 $\sigma^2$,但不知其均值 $\mu$。现在要根据样本判断均值 $\mu$ 是否为某一特定值 $\mu_0$,提出两个相互对立的假设:

\begin{align}
&H_0: \mu = \mu_0 \\
&H_1: \mu \neq \mu_0
\end{align}

  因为 $\overline X$ 是 $\mu$ 的无偏估计,$\overline X$ 的观察值 $\overline x$ 的大小在一定程度上可以反映 $\mu$ 的大小。因此,如果假设 $H_0$ 为真,则观察值 $\overline x$ 与 $\mu_0$ 的偏差 $|\overline x – \mu_0|$ 一般不应太大。若 $|\overline x – \mu_0|$ 过分大,则有理由怀疑 $H_0$ 的正确性,从而拒绝 $H_0$。当 $H_0$ 为真时,$\frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$,而衡量 $|\overline x – \mu_0|$ 的大小可以回结尾衡量 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$ 的大小。基于以上考虑,可以适当选定一正数 $k$,使当观察值 $\overline x$ 满足 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq k$ 时就拒绝 $H_0$;反之,若 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} < k$ 时则接受 $H_0$。

  由于做出决策的依据是一个样本,实际上 $H_0$ 为真时仍可能做出拒绝 $H_0$ 的决策,这种错误记为

\begin{equation}
P\{当 \; H_0 \; 为真拒绝 \; H_0 \} \; 或 \; P_{\mu_0}\{拒绝 \; H_0 \} \; 或 \; P_{\mu \in H_0}\{拒绝 \; H_0 \}
\end{equation}

记号 $P_{\mu_0}\{\cdot\}$ 表示参数 $\mu$ 取 $\mu_0$ 时事件 $\{\cdot\}$ 的概率,$P_{\mu \in H_0}\{\cdot\}$ 表示 $\mu$ 取 $H_0$ 规定的值时 $\{\cdot\}$ 的概率。我们无法排除犯这类错误的可能性,但希望将犯这类错误的概率控制在一定范围内,即给出一个较小的数 $\alpha$($0 < \alpha < 1$),使犯这类错误的概率不超过 $\alpha$,即使得

\begin{equation}
P\{当 \; H_0 \; 为真拒绝 \; H_0 \} \leq \alpha \tag{1}
\end{equation}

  为了确定常数 $k$,考虑统计量 $\frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$,由于只允许犯这类错误的概率最大为 $\alpha$,令式 $(1)$ 右端取等号,即令

\begin{equation}
P\{当 \; H_0 \; 为真拒绝 \; H_0 \} = P_{\mu_0}\bigg\{ \bigg\vert \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \bigg\vert \geq k \bigg\} = \alpha
\end{equation}

由于当 $H_0$ 为真时,$Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$,由标准正态分布分位点的定义,有

\begin{equation}
k = z_{\alpha / 2}
\end{equation}

  因而若 $Z$ 的观察值满足

\begin{equation}
|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k = z_{\alpha / 2}
\end{equation}

则拒绝 $H_0$。而若

\begin{equation}
|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k = z_{\alpha / 2}
\end{equation}

则接受 $H_0$。

  当样本容量固定时,选定 $\alpha$ 后,数 $k$ 就可以确定,然后按照统计量 $Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 的观察值的绝对值 $|z|$ 大于等于 $k$ 还是小于 $k$ 来做出决策。数 $k$ 是检验假设的一个门槛值,如果 $|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k$,则称 $\overline x$ 与 $\mu_0$ 的差异是显著的,这时拒绝 $H_0$;反之,如果 $|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k$,则称$\overline x$ 与 $\mu_0$ 的差异是不显著的,这时接受$H_0$。数 $\alpha$ 称为显著性水平,上面关于 $\overline x$ 与 $\mu_0$ 的有无显著差异的判断是在显著性水平 $\alpha$ 之下做出的。

  统计量 $Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 称为检验统计量

2. 双边假设检验

  前面的检验问题可以叙述成:在显著性水平 $\alpha$ 下,检验假设

\begin{equation}
H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0 \tag{2}
\end{equation}

也常说成“在显著性水平 $\alpha$ 下,针对 $H_1$ 检验 $H_0$”。$H_0$ 称为原假设零假设,$H_1$ 称为备择假设。我们要根据样本,按上述检验方法做出在 $H_0$ 和 $H_1$ 中接受其一的决策。

  当检验统计量取某个区域 $C$ 中的值时,我们拒绝原假设 $H_0$,则称区域 $C$ 为拒绝域,拒绝域的边界点称为临界点。如在前文中,拒绝域为 $|z| \geq z_{\alpha / 2}$,而 $z = – z_{\alpha / 2}$ 和 $z = z_{\alpha / 2}$ 为临界点。

  由于检验法则是根据样本做出的,总有可能做出错误的决策。在假设 $H_0$ 为真时,可能犯拒绝 $H_0$ 的错误,称这类“弃真”的错误为第 I 累错误。又当 $H_0$ 实际上不真时,也有可能接受 $H_0$,称这类“取伪”的错误为第 II 类错误。犯第 II 类错误的概率记为

\begin{equation}
P\{当 \; H_0 \; 不真接受 \; H_0 \} \; 或 \; P_{\mu_0 \in H_1}\{接受 \; H_0 \}
\end{equation}

  为此,在确定检验法则时,应尽可能使犯两类错误的概率都较小,但一般来说,当样本容量固定时,若减小犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第 I 类错误的概率,是它不大于 $\alpha$,$\alpha$ 通常去 $0.1, 0.05, 0.01, 0.005$ 等值。这种只对犯第 I 类错误的概率加以控制,而不考虑犯第 II 类错误的概率的检验,称为显著性检验

  形如式 $(2)$ 中的备择假设 $H_1$,表示 $\mu$ 可能大于 $\mu_0$,也可能小于 $\mu_0$,称为双边备择假设,而称形如 $(2)$ 的假设检验为双边假设检验

3. 单边假设检验

  有时我们只关心总体均值是否增大,例如总体均值为 $\mu$(未知),新样本的均值为 $\mu_0$,形如

\begin{equation}
H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0 \tag{3}
\end{equation}

的假设检验称为右边检验。类似地,形如

\begin{equation}
H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0 \tag{4}
\end{equation}

的假设检验称为左边检验

  设总体 $X \sim N(\mu, \sigma^2)$,$\mu$ 未知,$\sigma^2$ 已知,$X_1, X_2, \cdots, X_n$ 是来自 $X$ 的样本。给定显著性水平 $\alpha$,考虑 $(3)$ 中的检验问题

\begin{equation}
H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0
\end{equation}

因 $H_0$ 中的全部 $\mu$ 都比 $H_1$ 中的 $\mu$ 小,当 $H_1$ 为真时,观察值 $\overline x$ 往往偏大,因此拒绝域的形式为

\begin{equation}
\overline x > k, \quad k \; 是某一正常数
\end{equation}

为确定常数 $k$,由

\begin{align}
P\{当 \; H_0 \; 为真拒绝 \; H_0\} &= P_{\mu \in H_0} \{\overline X > k \} \\
&= P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} \\
&\leq P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\}
\end{align}

要控制 $P\{当 \; H_0 \; 为真拒绝 \; H_0\} \leq \alpha$,只需令

\begin{equation}
P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} = \alpha \tag{5}
\end{equation}

由于 $\frac{\overline X – \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$,由式 $(5)$ 得到 $\frac{k – \mu_0}{\sigma / \sqrt{n}} = z_\alpha$,$k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha$,即得检验问题 $(3)$ 的拒绝域为

\begin{equation}
\overline x \geq \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha
\end{equation}

\begin{equation}
z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq z_\alpha \tag{6}
\end{equation}

  类似地,可得左边检验问题 $(4)$

\begin{equation}
H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0
\end{equation}

的拒绝域为

\begin{equation}
z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \leq – z_\alpha \tag{7}
\end{equation}

4. 一般步骤

  综上所述,处理参数的假设检验问题的步骤为:

  1. 根据实际问题的要求,提出原假设 $H_0$ 及备择假设 $H_1$;
  2. 给定显著性水平 $\alpha$ 以及样本容量 $n$;
  3. 确定检验统计量及拒绝域的形式;
  4. 按 $P\{当 \; H_0 \; 为真拒绝 \; H_0\} \leq \alpha$ 求出拒绝域;
  5. 取样,根据样本观察值做出决策,是接受 $H_0$ 还是拒绝 $H_0$。、