数理统计 Cheat Sheet 13:正态总体均值的假设检验
Contents
1. 单个总体 $N(\mu, \sigma^2)$ 均值 $\mu$ 的检验
1.1. $\sigma^2$ 已知,关于 $\mu$ 的检验($Z$ 检验)
前文 已经给出正态总体 $N(\mu, \sigma^2)$ 当 $\sigma^2$ 已知时关于 $\mu$ 的检验问题。此时使用统计量
\begin{equation}
Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}
\end{equation}
来确定拒绝域。这种检验方法常称为 $Z$ 检验法。
1.2. $\sigma^2$ 未知,关于 $\mu$ 的检验($t$ 检验)
设总体 $X \sim N(\mu, \sigma^2)$,其中 $\mu, \sigma^2$ 未知,考虑检验问题
\begin{equation}
H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0
\end{equation}
设 $X_1, X_2, \cdots, X_n$ 是来自总体 $X$ 的一个样本,由于 $\sigma^2$ 未知,此时不能使用 $\frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 来确定拒绝域。注意到 $S^2$ 是 $\sigma^2$ 的无偏估计,用 $S$ 代替 $\sigma$,采用
\begin{equation}
Z = \frac{\overline X – \mu_0}{S / \sqrt{n}}
\end{equation}
作为检验统计量,当观察值 $|t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg|$ 过分大时就拒绝 $H_0$,拒绝域的形式为
\begin{equation}
|t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| \geq k
\end{equation}
由前文定理三,当 $H_0$ 为真时,$\frac{\overline X – \mu_0}{S / \sqrt{n}} \sim t(n – 1)$,故由
\begin{equation}
P\{当\;H_0\;为真拒绝\;H_0\} = P_{\mu_0} \bigg\{ \bigg| \frac{\overline X – \mu_0}{S / \sqrt{n}} \bigg| \geq k \bigg\} = \alpha
\end{equation}
得 $t = t_{\alpha / 2}(n – 1)$,即得拒绝域为
\begin{equation}
|t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| \geq t_{\alpha / 2}(n – 1) \tag{1}
\end{equation}
上述利用 $t$ 统计量得出的检验方法称为 $t$ 检验法。在实际应用中,正态总体的方差常为未知,故常用 $t$ 检验法来检验关于正态总体均值的检验问题。
2. 两个正态总体均值差的检验($t$ 检验)
$t$ 检验法也可以用于检验具有相同方差的两正态总体均值差的假设。设 $X_1, X_2, \cdots, X_n$ 是来自正态总体 $N(\mu_1, \sigma^2)$ 的样本,$Y_1, Y_2, \cdots, Y_n$ 是来自正态总体 $N(\mu_2, \sigma^2)$ 的样本,且设两样本独立。记两个样本的样本均值分别为 $\overline X, \overline Y$,样本方差分别为 $S_1^2, S_2^2$。设 $\mu_1, \mu_2, \sigma_1^2, \sigma_2^2$ 均为未知。对于检验问题
\begin{equation}
H_0: \mu_1 – \mu_2 = \delta, \quad H_1: \mu_1 – \mu_2 \neq \delta
\end{equation}
使用下述 $t$ 统计量作为检验统计量
\begin{equation}
t = \frac{(\overline X – \overline Y) – \delta}{S_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}
\end{equation}
其中
\begin{equation}
S_w^2 = \frac{(n_1 – 1)S_1^2 + (n_2 – 1)S_1^2}{n_1 + n_2 – 2}, \quad S_w = \sqrt{S_w^2}
\end{equation}
当 $H_0$ 为真时,由前文定理四,有 $t \sim t(n_1 + n_2 – 2)$。与单个总体的 $t$ 检验类似,其拒绝域形式为
\begin{equation}
\Bigg| \frac{(\overline x – \overline y) – \delta}{s_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \Bigg| \geq k
\end{equation}
由
\begin{equation}
P\{当\;H_0\;为真拒绝\;H_0\} = P_{\mu_1 – \mu_2 = \delta} \Bigg\{ \Bigg| \frac{(\overline X – \overline Y) – \delta}{S_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \Bigg| \geq k \Bigg\} = \alpha
\end{equation}
可得 $k = t_{\alpha / 2}(n_1 + n_2 – 2)$。于是得拒绝域为
\begin{equation}
|t| = \frac{|(\overline x – \overline y) – \delta|}{s_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \geq t_{\alpha / 2}(n_1 + n_2 – 2) \tag{2}
\end{equation}
类似地,当两个正态总体的方差均为已知(不一定相等)时,我们可用 $Z$ 检验法来检验两正态总体均值差的假设问题。
3. 基于成对数据的检验($t$ 检验)
有时为了比较两种产品、两种方法等的差异,常在相同的条件下做对比实验,得到一批成对的观察值,然后分析观察数据做出推断。这种方法常称为逐对观察法。
一般地,设有 $n$ 对相互独立的观察结果 $(X_1, Y_1), (X_2, Y_2), \cdots, (X_n, Y_n)$,令 $D_1 = X_1 – Y_1$,$D_2 = X_2 – Y_2$, $\cdots$,$D_n = X_n – Y_n$,则 $D_1, D_2, \cdots, D_n$ 相互独立。又由于 $D_1, D_2, \cdots, D_n$ 是由同一因素所引起的,可以认为它们服从同一分布。现假设 $D_i \sim N(\mu_D, \sigma_D^2)$($i = 1, 2, \cdots, n$),也就是说 $D_1, D_2, \cdots, D_n$ 构成正态总体 $N(\mu_D, \sigma_D^2)$ 的一个样本,其中 $\mu_D, \sigma_D^2$ 未知。我们需要基于这一样本检验假设
\begin{align}
&(1) \quad H_0: \mu_D = 0, \quad, H_1: \mu_D \neq 0 \\
&(2) \quad H_0: \mu_D \leq 0, \quad, H_1: \mu_D > 0 \\
&(3) \quad H_0: \mu_D \geq 0, \quad, H_1: \mu_D < 0
\end{align}
分别记 $D_1, D_2, \cdots, D_n$ 的样本均值和样本方差的观察值为 $\overline d, s_D^2$,可知检验问题 $(1),(2),(3)$ 的拒绝域分别为(显著性水平 $\alpha$):
\begin{align}
|t| &= \bigg| \frac{\overline d}{s_D / \sqrt{n}} \bigg| \geq t_{\alpha / 2}(n – 1) \\
t &= \frac{\overline d}{s_D / \sqrt{n}} \geq t_{\alpha}(n – 1) \\
t &= \frac{\overline d}{s_D / \sqrt{n}} \leq – t_{\alpha}(n – 1)
\end{align}