数理统计 Cheat Sheet 12:假设检验
Contents [show]
1. 定义
假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些未知特性,提出某些关于总体的假设,并根据样本对所提出的假设做出接受还是拒绝的决策。
例如对于某正态总体 X,已知其方差为 σ2,但不知其均值 μ。现在要根据样本判断均值 μ 是否为某一特定值 μ0,提出两个相互对立的假设:
H0:μ=μ0H1:μ≠μ0
因为 ¯X 是 μ 的无偏估计,¯X 的观察值 ¯x 的大小在一定程度上可以反映 μ 的大小。因此,如果假设 H0 为真,则观察值 ¯x 与 μ0 的偏差 |¯x–μ0| 一般不应太大。若 |¯x–μ0| 过分大,则有理由怀疑 H0 的正确性,从而拒绝 H0。当 H0 为真时,¯X–μ0σ/√n∼N(0,1),而衡量 |¯x–μ0| 的大小可以回结尾衡量 ¯x–μ0σ/√n∼N(0,1) 的大小。基于以上考虑,可以适当选定一正数 k,使当观察值 ¯x 满足 ¯x–μ0σ/√n≥k 时就拒绝 H0;反之,若 ¯x–μ0σ/√n<k 时则接受 H0。
由于做出决策的依据是一个样本,实际上 H0 为真时仍可能做出拒绝 H0 的决策,这种错误记为
P{当H0为真拒绝H0}或Pμ0{拒绝H0}或Pμ∈H0{拒绝H0}
记号 Pμ0{⋅} 表示参数 μ 取 μ0 时事件 {⋅} 的概率,Pμ∈H0{⋅} 表示 μ 取 H0 规定的值时 {⋅} 的概率。我们无法排除犯这类错误的可能性,但希望将犯这类错误的概率控制在一定范围内,即给出一个较小的数 α(0<α<1),使犯这类错误的概率不超过 α,即使得
P{当H0为真拒绝H0}≤α
为了确定常数 k,考虑统计量 ¯X–μ0σ/√n,由于只允许犯这类错误的概率最大为 α,令式 (1) 右端取等号,即令
P{当H0为真拒绝H0}=Pμ0{|¯X–μ0σ/√n|≥k}=α
由于当 H0 为真时,Z=¯X–μ0σ/√n∼N(0,1),由标准正态分布分位点的定义,有
k=zα/2
因而若 Z 的观察值满足
|z|=|¯x–μ0σ/√n|≥k=zα/2
则拒绝 H0。而若
|z|=|¯x–μ0σ/√n|<k=zα/2
则接受 H0。
当样本容量固定时,选定 α 后,数 k 就可以确定,然后按照统计量 Z=¯X–μ0σ/√n 的观察值的绝对值 |z| 大于等于 k 还是小于 k 来做出决策。数 k 是检验假设的一个门槛值,如果 |z|=|¯x–μ0σ/√n|≥k,则称 ¯x 与 μ0 的差异是显著的,这时拒绝 H0;反之,如果 |z|=|¯x–μ0σ/√n|<k,则称¯x 与 μ0 的差异是不显著的,这时接受H0。数 α 称为显著性水平,上面关于 ¯x 与 μ0 的有无显著差异的判断是在显著性水平 α 之下做出的。
统计量 Z=¯X–μ0σ/√n 称为检验统计量。
2. 双边假设检验
前面的检验问题可以叙述成:在显著性水平 α 下,检验假设
H0:μ=μ0,H1:μ≠μ0
也常说成“在显著性水平 α 下,针对 H1 检验 H0”。H0 称为原假设或零假设,H1 称为备择假设。我们要根据样本,按上述检验方法做出在 H0 和 H1 中接受其一的决策。
当检验统计量取某个区域 C 中的值时,我们拒绝原假设 H0,则称区域 C 为拒绝域,拒绝域的边界点称为临界点。如在前文中,拒绝域为 |z|≥zα/2,而 z=–zα/2 和 z=zα/2 为临界点。
由于检验法则是根据样本做出的,总有可能做出错误的决策。在假设 H0 为真时,可能犯拒绝 H0 的错误,称这类“弃真”的错误为第 I 累错误。又当 H0 实际上不真时,也有可能接受 H0,称这类“取伪”的错误为第 II 类错误。犯第 II 类错误的概率记为
P{当H0不真接受H0}或Pμ0∈H1{接受H0}
为此,在确定检验法则时,应尽可能使犯两类错误的概率都较小,但一般来说,当样本容量固定时,若减小犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第 I 类错误的概率,是它不大于 α,α 通常去 0.1,0.05,0.01,0.005 等值。这种只对犯第 I 类错误的概率加以控制,而不考虑犯第 II 类错误的概率的检验,称为显著性检验。
形如式 (2) 中的备择假设 H1,表示 μ 可能大于 μ0,也可能小于 μ0,称为双边备择假设,而称形如 (2) 的假设检验为双边假设检验。
3. 单边假设检验
有时我们只关心总体均值是否增大,例如总体均值为 μ(未知),新样本的均值为 μ0,形如
H0:μ≤μ0,H1:μ>μ0
的假设检验称为右边检验。类似地,形如
H0:μ≥μ0,H1:μ<μ0
的假设检验称为左边检验。
设总体 X∼N(μ,σ2),μ 未知,σ2 已知,X1,X2,⋯,Xn 是来自 X 的样本。给定显著性水平 α,考虑 (3) 中的检验问题
H0:μ≤μ0,H1:μ>μ0
因 H0 中的全部 μ 都比 H1 中的 μ 小,当 H1 为真时,观察值 ¯x 往往偏大,因此拒绝域的形式为
¯x>k,k是某一正常数
为确定常数 k,由
P{当H0为真拒绝H0}=Pμ∈H0{¯X>k}=Pμ≤μ0{¯X–μ0σ/√n≥k–μ0σ/√n}≤Pμ≤μ0{¯X–μσ/√n≥k–μ0σ/√n}
要控制 P{当H0为真拒绝H0}≤α,只需令
Pμ≤μ0{¯X–μσ/√n≥k–μ0σ/√n}=α
由于 ¯X–μσ/√n∼N(0,1),由式 (5) 得到 k–μ0σ/√n=zα,k=μ0+σ√nzα,即得检验问题 (3) 的拒绝域为
¯x≥μ0+σ√nzα
即
z=¯x–μ0σ/√n≥zα
类似地,可得左边检验问题 (4)
H0:μ≥μ0,H1:μ<μ0
的拒绝域为
z=¯x–μ0σ/√n≤–zα
4. 一般步骤
综上所述,处理参数的假设检验问题的步骤为:
- 根据实际问题的要求,提出原假设 H0 及备择假设 H1;
- 给定显著性水平 α 以及样本容量 n;
- 确定检验统计量及拒绝域的形式;
- 按 P{当H0为真拒绝H0}≤α 求出拒绝域;
- 取样,根据样本观察值做出决策,是接受 H0 还是拒绝 H0。、