数理统计 Cheat Sheet 12:假设检验

1. 定义

  假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些未知特性,提出某些关于总体的假设,并根据样本对所提出的假设做出接受还是拒绝的决策。

  例如对于某正态总体 X,已知其方差为 σ2,但不知其均值 μ。现在要根据样本判断均值 μ 是否为某一特定值 μ0,提出两个相互对立的假设:

H0:μ=μ0H1:μμ0

  因为 ¯Xμ 的无偏估计,¯X 的观察值 ¯x 的大小在一定程度上可以反映 μ 的大小。因此,如果假设 H0 为真,则观察值 ¯xμ0 的偏差 |¯xμ0| 一般不应太大。若 |¯xμ0| 过分大,则有理由怀疑 H0 的正确性,从而拒绝 H0。当 H0 为真时,¯Xμ0σ/nN(0,1),而衡量 |¯xμ0| 的大小可以回结尾衡量 ¯xμ0σ/nN(0,1) 的大小。基于以上考虑,可以适当选定一正数 k,使当观察值 ¯x 满足 ¯xμ0σ/nk 时就拒绝 H0;反之,若 ¯xμ0σ/n<k 时则接受 H0

  由于做出决策的依据是一个样本,实际上 H0 为真时仍可能做出拒绝 H0 的决策,这种错误记为

P{H0H0}Pμ0{H0}PμH0{H0}

记号 Pμ0{} 表示参数 μμ0 时事件 {} 的概率,PμH0{} 表示 μH0 规定的值时 {} 的概率。我们无法排除犯这类错误的可能性,但希望将犯这类错误的概率控制在一定范围内,即给出一个较小的数 α0<α<1),使犯这类错误的概率不超过 α,即使得

P{H0H0}α

  为了确定常数 k,考虑统计量 ¯Xμ0σ/n,由于只允许犯这类错误的概率最大为 α,令式 (1) 右端取等号,即令

P{H0H0}=Pμ0{|¯Xμ0σ/n|k}=α

由于当 H0 为真时,Z=¯Xμ0σ/nN(0,1),由标准正态分布分位点的定义,有

k=zα/2

  因而若 Z 的观察值满足

|z|=|¯xμ0σ/n|k=zα/2

则拒绝 H0。而若

|z|=|¯xμ0σ/n|<k=zα/2

则接受 H0

  当样本容量固定时,选定 α 后,数 k 就可以确定,然后按照统计量 Z=¯Xμ0σ/n 的观察值的绝对值 |z| 大于等于 k 还是小于 k 来做出决策。数 k 是检验假设的一个门槛值,如果 |z|=|¯xμ0σ/n|k,则称 ¯xμ0 的差异是显著的,这时拒绝 H0;反之,如果 |z|=|¯xμ0σ/n|<k,则称¯xμ0 的差异是不显著的,这时接受H0。数 α 称为显著性水平,上面关于 ¯xμ0 的有无显著差异的判断是在显著性水平 α 之下做出的。

  统计量 Z=¯Xμ0σ/n 称为检验统计量

2. 双边假设检验

  前面的检验问题可以叙述成:在显著性水平 α 下,检验假设

H0:μ=μ0,H1:μμ0

也常说成“在显著性水平 α 下,针对 H1 检验 H0”。H0 称为原假设零假设H1 称为备择假设。我们要根据样本,按上述检验方法做出在 H0H1 中接受其一的决策。

  当检验统计量取某个区域 C 中的值时,我们拒绝原假设 H0,则称区域 C拒绝域,拒绝域的边界点称为临界点。如在前文中,拒绝域为 |z|zα/2,而 z=zα/2z=zα/2 为临界点。

  由于检验法则是根据样本做出的,总有可能做出错误的决策。在假设 H0 为真时,可能犯拒绝 H0 的错误,称这类“弃真”的错误为第 I 累错误。又当 H0 实际上不真时,也有可能接受 H0,称这类“取伪”的错误为第 II 类错误。犯第 II 类错误的概率记为

P{H0H0}Pμ0H1{H0}

  为此,在确定检验法则时,应尽可能使犯两类错误的概率都较小,但一般来说,当样本容量固定时,若减小犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第 I 类错误的概率,是它不大于 αα 通常去 0.1,0.05,0.01,0.005 等值。这种只对犯第 I 类错误的概率加以控制,而不考虑犯第 II 类错误的概率的检验,称为显著性检验

  形如式 (2) 中的备择假设 H1,表示 μ 可能大于 μ0,也可能小于 μ0,称为双边备择假设,而称形如 (2) 的假设检验为双边假设检验

3. 单边假设检验

  有时我们只关心总体均值是否增大,例如总体均值为 μ(未知),新样本的均值为 μ0,形如

H0:μμ0,H1:μ>μ0

的假设检验称为右边检验。类似地,形如

H0:μμ0,H1:μ<μ0

的假设检验称为左边检验

  设总体 XN(μ,σ2)μ 未知,σ2 已知,X1,X2,,Xn 是来自 X 的样本。给定显著性水平 α,考虑 (3) 中的检验问题

H0:μμ0,H1:μ>μ0

H0 中的全部 μ 都比 H1 中的 μ 小,当 H1 为真时,观察值 ¯x 往往偏大,因此拒绝域的形式为

¯x>k,k

为确定常数 k,由

P{H0H0}=PμH0{¯X>k}=Pμμ0{¯Xμ0σ/nkμ0σ/n}Pμμ0{¯Xμσ/nkμ0σ/n}

要控制 P{H0H0}α,只需令

Pμμ0{¯Xμσ/nkμ0σ/n}=α

由于 ¯Xμσ/nN(0,1),由式 (5) 得到 kμ0σ/n=zαk=μ0+σnzα,即得检验问题 (3) 的拒绝域为

¯xμ0+σnzα

z=¯xμ0σ/nzα

  类似地,可得左边检验问题 (4)

H0:μμ0,H1:μ<μ0

的拒绝域为

z=¯xμ0σ/nzα

4. 一般步骤

  综上所述,处理参数的假设检验问题的步骤为:

  1. 根据实际问题的要求,提出原假设 H0 及备择假设 H1
  2. 给定显著性水平 α 以及样本容量 n
  3. 确定检验统计量及拒绝域的形式;
  4. P{H0H0}α 求出拒绝域;
  5. 取样,根据样本观察值做出决策,是接受 H0 还是拒绝 H0。、