数理统计 Cheat Sheet 12:假设检验
Contents [show]
1. 定义
假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些未知特性,提出某些关于总体的假设,并根据样本对所提出的假设做出接受还是拒绝的决策。
例如对于某正态总体 X,已知其方差为 σ2,但不知其均值 μ。现在要根据样本判断均值 μ 是否为某一特定值 μ0,提出两个相互对立的假设:
H0:μ=μ0H1:μ≠μ0
因为 ¯X 是 μ 的无偏估计,¯X 的观察值 ¯x 的大小在一定程度上可以反映 μ 的大小。因此,如果假设 H0 为真,则观察值 ¯x 与 μ0 的偏差 |\overline x – \mu_0| 一般不应太大。若 |\overline x – \mu_0| 过分大,则有理由怀疑 H_0 的正确性,从而拒绝 H_0。当 H_0 为真时,\frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1),而衡量 |\overline x – \mu_0| 的大小可以回结尾衡量 \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1) 的大小。基于以上考虑,可以适当选定一正数 k,使当观察值 \overline x 满足 \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq k 时就拒绝 H_0;反之,若 \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} < k 时则接受 H_0。
由于做出决策的依据是一个样本,实际上 H_0 为真时仍可能做出拒绝 H_0 的决策,这种错误记为
\begin{equation} P\{当 \; H_0 \; 为真拒绝 \; H_0 \} \; 或 \; P_{\mu_0}\{拒绝 \; H_0 \} \; 或 \; P_{\mu \in H_0}\{拒绝 \; H_0 \} \end{equation}
记号 P_{\mu_0}\{\cdot\} 表示参数 \mu 取 \mu_0 时事件 \{\cdot\} 的概率,P_{\mu \in H_0}\{\cdot\} 表示 \mu 取 H_0 规定的值时 \{\cdot\} 的概率。我们无法排除犯这类错误的可能性,但希望将犯这类错误的概率控制在一定范围内,即给出一个较小的数 \alpha(0 < \alpha < 1),使犯这类错误的概率不超过 \alpha,即使得
\begin{equation} P\{当 \; H_0 \; 为真拒绝 \; H_0 \} \leq \alpha \tag{1} \end{equation}
为了确定常数 k,考虑统计量 \frac{\overline X – \mu_0}{\sigma / \sqrt{n}},由于只允许犯这类错误的概率最大为 \alpha,令式 (1) 右端取等号,即令
\begin{equation} P\{当 \; H_0 \; 为真拒绝 \; H_0 \} = P_{\mu_0}\bigg\{ \bigg\vert \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \bigg\vert \geq k \bigg\} = \alpha \end{equation}
由于当 H_0 为真时,Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1),由标准正态分布分位点的定义,有
\begin{equation} k = z_{\alpha / 2} \end{equation}
因而若 Z 的观察值满足
\begin{equation} |z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k = z_{\alpha / 2} \end{equation}
则拒绝 H_0。而若
\begin{equation} |z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k = z_{\alpha / 2} \end{equation}
则接受 H_0。
当样本容量固定时,选定 \alpha 后,数 k 就可以确定,然后按照统计量 Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} 的观察值的绝对值 |z| 大于等于 k 还是小于 k 来做出决策。数 k 是检验假设的一个门槛值,如果 |z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k,则称 \overline x 与 \mu_0 的差异是显著的,这时拒绝 H_0;反之,如果 |z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k,则称\overline x 与 \mu_0 的差异是不显著的,这时接受H_0。数 \alpha 称为显著性水平,上面关于 \overline x 与 \mu_0 的有无显著差异的判断是在显著性水平 \alpha 之下做出的。
统计量 Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} 称为检验统计量。
2. 双边假设检验
前面的检验问题可以叙述成:在显著性水平 \alpha 下,检验假设
\begin{equation} H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0 \tag{2} \end{equation}
也常说成“在显著性水平 \alpha 下,针对 H_1 检验 H_0”。H_0 称为原假设或零假设,H_1 称为备择假设。我们要根据样本,按上述检验方法做出在 H_0 和 H_1 中接受其一的决策。
当检验统计量取某个区域 C 中的值时,我们拒绝原假设 H_0,则称区域 C 为拒绝域,拒绝域的边界点称为临界点。如在前文中,拒绝域为 |z| \geq z_{\alpha / 2},而 z = – z_{\alpha / 2} 和 z = z_{\alpha / 2} 为临界点。
由于检验法则是根据样本做出的,总有可能做出错误的决策。在假设 H_0 为真时,可能犯拒绝 H_0 的错误,称这类“弃真”的错误为第 I 累错误。又当 H_0 实际上不真时,也有可能接受 H_0,称这类“取伪”的错误为第 II 类错误。犯第 II 类错误的概率记为
\begin{equation} P\{当 \; H_0 \; 不真接受 \; H_0 \} \; 或 \; P_{\mu_0 \in H_1}\{接受 \; H_0 \} \end{equation}
为此,在确定检验法则时,应尽可能使犯两类错误的概率都较小,但一般来说,当样本容量固定时,若减小犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第 I 类错误的概率,是它不大于 \alpha,\alpha 通常去 0.1, 0.05, 0.01, 0.005 等值。这种只对犯第 I 类错误的概率加以控制,而不考虑犯第 II 类错误的概率的检验,称为显著性检验。
形如式 (2) 中的备择假设 H_1,表示 \mu 可能大于 \mu_0,也可能小于 \mu_0,称为双边备择假设,而称形如 (2) 的假设检验为双边假设检验。
3. 单边假设检验
有时我们只关心总体均值是否增大,例如总体均值为 \mu(未知),新样本的均值为 \mu_0,形如
\begin{equation} H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0 \tag{3} \end{equation}
的假设检验称为右边检验。类似地,形如
\begin{equation} H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0 \tag{4} \end{equation}
的假设检验称为左边检验。
设总体 X \sim N(\mu, \sigma^2),\mu 未知,\sigma^2 已知,X_1, X_2, \cdots, X_n 是来自 X 的样本。给定显著性水平 \alpha,考虑 (3) 中的检验问题
\begin{equation} H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0 \end{equation}
因 H_0 中的全部 \mu 都比 H_1 中的 \mu 小,当 H_1 为真时,观察值 \overline x 往往偏大,因此拒绝域的形式为
\begin{equation} \overline x > k, \quad k \; 是某一正常数 \end{equation}
为确定常数 k,由
\begin{align} P\{当 \; H_0 \; 为真拒绝 \; H_0\} &= P_{\mu \in H_0} \{\overline X > k \} \\ &= P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} \\ &\leq P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} \end{align}
要控制 P\{当 \; H_0 \; 为真拒绝 \; H_0\} \leq \alpha,只需令
\begin{equation} P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} = \alpha \tag{5} \end{equation}
由于 \frac{\overline X – \mu}{\sigma / \sqrt{n}} \sim N(0, 1),由式 (5) 得到 \frac{k – \mu_0}{\sigma / \sqrt{n}} = z_\alpha,k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha,即得检验问题 (3) 的拒绝域为
\begin{equation} \overline x \geq \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha \end{equation}
即
\begin{equation} z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq z_\alpha \tag{6} \end{equation}
类似地,可得左边检验问题 (4)
\begin{equation} H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0 \end{equation}
的拒绝域为
\begin{equation} z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \leq – z_\alpha \tag{7} \end{equation}
4. 一般步骤
综上所述,处理参数的假设检验问题的步骤为:
- 根据实际问题的要求,提出原假设 H_0 及备择假设 H_1;
- 给定显著性水平 \alpha 以及样本容量 n;
- 确定检验统计量及拒绝域的形式;
- 按 P\{当 \; H_0 \; 为真拒绝 \; H_0\} \leq \alpha 求出拒绝域;
- 取样,根据样本观察值做出决策,是接受 H_0 还是拒绝 H_0。、