数理统计 Cheat Sheet 12：假设检验

Author: nex3z 2019-04-16

Math

Statistics

Contents

1. 定义
2. 双边假设检验
3. 单边假设检验
4. 一般步骤

1. 定义

　　假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下，为了推断总体的某些未知特性，提出某些关于总体的假设，并根据样本对所提出的假设做出接受还是拒绝的决策。

　　例如对于某正态总体 $X$，已知其方差为 $\sigma^2$，但不知其均值 $\mu$。现在要根据样本判断均值 $\mu$ 是否为某一特定值 $\mu_0$，提出两个相互对立的假设：

\begin{align}
&H_0: \mu = \mu_0 \\
&H_1: \mu \neq \mu_0
\end{align}

　　因为 $\overline X$ 是 $\mu$ 的无偏估计，$\overline X$ 的观察值 $\overline x$ 的大小在一定程度上可以反映 $\mu$ 的大小。因此，如果假设 $H_0$ 为真，则观察值 $\overline x$ 与 $\mu_0$ 的偏差 $|\overline x – \mu_0|$ 一般不应太大。若 $|\overline x – \mu_0|$ 过分大，则有理由怀疑 $H_0$ 的正确性，从而拒绝 $H_0$。当 $H_0$ 为真时，$\frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$，而衡量 $|\overline x – \mu_0|$ 的大小可以回结尾衡量 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$ 的大小。基于以上考虑，可以适当选定一正数 $k$，使当观察值 $\overline x$ 满足 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq k$ 时就拒绝 $H_0$；反之，若 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} < k$ 时则接受 $H_0$。

　　由于做出决策的依据是一个样本，实际上 $H_0$ 为真时仍可能做出拒绝 $H_0$ 的决策，这种错误记为

\begin{equation}
P\{当 \; H_0 \; 为真拒绝 \; H_0 \} \; 或 \; P_{\mu_0}\{拒绝 \; H_0 \} \; 或 \; P_{\mu \in H_0}\{拒绝 \; H_0 \}
\end{equation}

记号 $P_{\mu_0}\{\cdot\}$ 表示参数 $\mu$ 取 $\mu_0$ 时事件 $\{\cdot\}$ 的概率，$P_{\mu \in H_0}\{\cdot\}$ 表示 $\mu$ 取 $H_0$ 规定的值时 $\{\cdot\}$ 的概率。我们无法排除犯这类错误的可能性，但希望将犯这类错误的概率控制在一定范围内，即给出一个较小的数 $\alpha$（$0 < \alpha < 1$），使犯这类错误的概率不超过 $\alpha$，即使得

\begin{equation}
P\{当 \; H_0 \; 为真拒绝 \; H_0 \} \leq \alpha \tag{1}
\end{equation}

　　为了确定常数 $k$，考虑统计量 $\frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$，由于只允许犯这类错误的概率最大为 $\alpha$，令式 $(1)$ 右端取等号，即令

\begin{equation}
P\{当 \; H_0 \; 为真拒绝 \; H_0 \} = P_{\mu_0}\bigg\{ \bigg\vert \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \bigg\vert \geq k \bigg\} = \alpha
\end{equation}

由于当 $H_0$ 为真时，$Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$，由标准正态分布分位点的定义，有

\begin{equation}
k = z_{\alpha / 2}
\end{equation}

　　因而若 $Z$ 的观察值满足

\begin{equation}
|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k = z_{\alpha / 2}
\end{equation}

则拒绝 $H_0$。而若

\begin{equation}
|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k = z_{\alpha / 2}
\end{equation}

则接受 $H_0$。

　　当样本容量固定时，选定 $\alpha$ 后，数 $k$ 就可以确定，然后按照统计量 $Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 的观察值的绝对值 $|z|$ 大于等于 $k$ 还是小于 $k$ 来做出决策。数 $k$ 是检验假设的一个门槛值，如果 $|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k$，则称 $\overline x$ 与 $\mu_0$ 的差异是显著的，这时拒绝 $H_0$；反之，如果 $|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k$，则称$\overline x$ 与 $\mu_0$ 的差异是不显著的，这时接受$H_0$。数 $\alpha$ 称为显著性水平，上面关于 $\overline x$ 与 $\mu_0$ 的有无显著差异的判断是在显著性水平 $\alpha$ 之下做出的。

　　统计量 $Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 称为检验统计量。

2. 双边假设检验

　　前面的检验问题可以叙述成：在显著性水平 $\alpha$ 下，检验假设

\begin{equation}
H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0 \tag{2}
\end{equation}

也常说成“在显著性水平 $\alpha$ 下，针对 $H_1$ 检验 $H_0$”。$H_0$ 称为原假设或零假设，$H_1$ 称为备择假设。我们要根据样本，按上述检验方法做出在 $H_0$ 和 $H_1$ 中接受其一的决策。

　　当检验统计量取某个区域 $C$ 中的值时，我们拒绝原假设 $H_0$，则称区域 $C$ 为拒绝域，拒绝域的边界点称为临界点。如在前文中，拒绝域为 $|z| \geq z_{\alpha / 2}$，而 $z = – z_{\alpha / 2}$ 和 $z = z_{\alpha / 2}$ 为临界点。

　　由于检验法则是根据样本做出的，总有可能做出错误的决策。在假设 $H_0$ 为真时，可能犯拒绝 $H_0$ 的错误，称这类“弃真”的错误为第 I 累错误。又当 $H_0$ 实际上不真时，也有可能接受 $H_0$，称这类“取伪”的错误为第 II 类错误。犯第 II 类错误的概率记为

\begin{equation}
P\{当 \; H_0 \; 不真接受 \; H_0 \} \; 或 \; P_{\mu_0 \in H_1}\{接受 \; H_0 \}
\end{equation}

　　为此，在确定检验法则时，应尽可能使犯两类错误的概率都较小，但一般来说，当样本容量固定时，若减小犯一类错误的概率，则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小，除非增加样本容量。在给定样本容量的情况下，一般来说，我们总是控制犯第 I 类错误的概率，是它不大于 $\alpha$，$\alpha$ 通常去 $0.1, 0.05, 0.01, 0.005$ 等值。这种只对犯第 I 类错误的概率加以控制，而不考虑犯第 II 类错误的概率的检验，称为显著性检验。

　　形如式 $(2)$ 中的备择假设 $H_1$，表示 $\mu$ 可能大于 $\mu_0$，也可能小于 $\mu_0$，称为双边备择假设，而称形如 $(2)$ 的假设检验为双边假设检验。

3. 单边假设检验

　　有时我们只关心总体均值是否增大，例如总体均值为 $\mu$（未知），新样本的均值为 $\mu_0$，形如

\begin{equation}
H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0 \tag{3}
\end{equation}

的假设检验称为右边检验。类似地，形如

\begin{equation}
H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0 \tag{4}
\end{equation}

的假设检验称为左边检验。

　　设总体 $X \sim N(\mu, \sigma^2)$，$\mu$ 未知，$\sigma^2$ 已知，$X_1, X_2, \cdots, X_n$ 是来自 $X$ 的样本。给定显著性水平 $\alpha$，考虑 $(3)$ 中的检验问题

\begin{equation}
H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0
\end{equation}

因 $H_0$ 中的全部 $\mu$ 都比 $H_1$ 中的 $\mu$ 小，当 $H_1$ 为真时，观察值 $\overline x$ 往往偏大，因此拒绝域的形式为

\begin{equation}
\overline x > k, \quad k \; 是某一正常数
\end{equation}

为确定常数 $k$，由

\begin{align}
P\{当 \; H_0 \; 为真拒绝 \; H_0\} &= P_{\mu \in H_0} \{\overline X > k \} \\
&= P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} \\
&\leq P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\}
\end{align}

要控制 $P\{当 \; H_0 \; 为真拒绝 \; H_0\} \leq \alpha$，只需令

\begin{equation}
P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} = \alpha \tag{5}
\end{equation}

由于 $\frac{\overline X – \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$，由式 $(5)$ 得到 $\frac{k – \mu_0}{\sigma / \sqrt{n}} = z_\alpha$，$k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha$，即得检验问题 $(3)$ 的拒绝域为

\begin{equation}
\overline x \geq \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha
\end{equation}

即

\begin{equation}
z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq z_\alpha \tag{6}
\end{equation}

　　类似地，可得左边检验问题 $(4)$

\begin{equation}
H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0
\end{equation}

的拒绝域为

\begin{equation}
z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \leq – z_\alpha \tag{7}
\end{equation}

4. 一般步骤

　　综上所述，处理参数的假设检验问题的步骤为：

根据实际问题的要求，提出原假设 $H_0$ 及备择假设 $H_1$；
给定显著性水平 $\alpha$ 以及样本容量 $n$；
确定检验统计量及拒绝域的形式；
按 $P\{当 \; H_0 \; 为真拒绝 \; H_0\} \leq \alpha$ 求出拒绝域；
取样，根据样本观察值做出决策，是接受 $H_0$ 还是拒绝 $H_0$。、

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30