数理统计 Cheat Sheet 13:正态总体均值的假设检验
Contents [show]
1. 单个总体 N(μ,σ2) 均值 μ 的检验
1.1. σ2 已知,关于 μ 的检验(Z 检验)
前文 已经给出正态总体 N(μ,σ2) 当 σ2 已知时关于 μ 的检验问题。此时使用统计量
\begin{equation} Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \end{equation}
来确定拒绝域。这种检验方法常称为 Z 检验法。
1.2. \sigma^2 未知,关于 \mu 的检验(t 检验)
设总体 X \sim N(\mu, \sigma^2),其中 \mu, \sigma^2 未知,考虑检验问题
\begin{equation} H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0 \end{equation}
设 X_1, X_2, \cdots, X_n 是来自总体 X 的一个样本,由于 \sigma^2 未知,此时不能使用 \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} 来确定拒绝域。注意到 S^2 是 \sigma^2 的无偏估计,用 S 代替 \sigma,采用
\begin{equation} Z = \frac{\overline X – \mu_0}{S / \sqrt{n}} \end{equation}
作为检验统计量,当观察值 |t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| 过分大时就拒绝 H_0,拒绝域的形式为
\begin{equation} |t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| \geq k \end{equation}
由前文定理三,当 H_0 为真时,\frac{\overline X – \mu_0}{S / \sqrt{n}} \sim t(n – 1),故由
\begin{equation} P\{当\;H_0\;为真拒绝\;H_0\} = P_{\mu_0} \bigg\{ \bigg| \frac{\overline X – \mu_0}{S / \sqrt{n}} \bigg| \geq k \bigg\} = \alpha \end{equation}
得 t = t_{\alpha / 2}(n – 1),即得拒绝域为
\begin{equation} |t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| \geq t_{\alpha / 2}(n – 1) \tag{1} \end{equation}
上述利用 t 统计量得出的检验方法称为 t 检验法。在实际应用中,正态总体的方差常为未知,故常用 t 检验法来检验关于正态总体均值的检验问题。
2. 两个正态总体均值差的检验(t 检验)
t 检验法也可以用于检验具有相同方差的两正态总体均值差的假设。设 X_1, X_2, \cdots, X_n 是来自正态总体 N(\mu_1, \sigma^2) 的样本,Y_1, Y_2, \cdots, Y_n 是来自正态总体 N(\mu_2, \sigma^2) 的样本,且设两样本独立。记两个样本的样本均值分别为 \overline X, \overline Y,样本方差分别为 S_1^2, S_2^2。设 \mu_1, \mu_2, \sigma_1^2, \sigma_2^2 均为未知。对于检验问题
\begin{equation} H_0: \mu_1 – \mu_2 = \delta, \quad H_1: \mu_1 – \mu_2 \neq \delta \end{equation}
使用下述 t 统计量作为检验统计量
\begin{equation} t = \frac{(\overline X – \overline Y) – \delta}{S_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \end{equation}
其中
\begin{equation} S_w^2 = \frac{(n_1 – 1)S_1^2 + (n_2 – 1)S_1^2}{n_1 + n_2 – 2}, \quad S_w = \sqrt{S_w^2} \end{equation}
当 H_0 为真时,由前文定理四,有 t \sim t(n_1 + n_2 – 2)。与单个总体的 t 检验类似,其拒绝域形式为
\begin{equation} \Bigg| \frac{(\overline x – \overline y) – \delta}{s_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \Bigg| \geq k \end{equation}
由
\begin{equation} P\{当\;H_0\;为真拒绝\;H_0\} = P_{\mu_1 – \mu_2 = \delta} \Bigg\{ \Bigg| \frac{(\overline X – \overline Y) – \delta}{S_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \Bigg| \geq k \Bigg\} = \alpha \end{equation}
可得 k = t_{\alpha / 2}(n_1 + n_2 – 2)。于是得拒绝域为
\begin{equation} |t| = \frac{|(\overline x – \overline y) – \delta|}{s_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \geq t_{\alpha / 2}(n_1 + n_2 – 2) \tag{2} \end{equation}
类似地,当两个正态总体的方差均为已知(不一定相等)时,我们可用 Z 检验法来检验两正态总体均值差的假设问题。
3. 基于成对数据的检验(t 检验)
有时为了比较两种产品、两种方法等的差异,常在相同的条件下做对比实验,得到一批成对的观察值,然后分析观察数据做出推断。这种方法常称为逐对观察法。
一般地,设有 n 对相互独立的观察结果 (X_1, Y_1), (X_2, Y_2), \cdots, (X_n, Y_n),令 D_1 = X_1 – Y_1,D_2 = X_2 – Y_2, \cdots,D_n = X_n – Y_n,则 D_1, D_2, \cdots, D_n 相互独立。又由于 D_1, D_2, \cdots, D_n 是由同一因素所引起的,可以认为它们服从同一分布。现假设 D_i \sim N(\mu_D, \sigma_D^2)(i = 1, 2, \cdots, n),也就是说 D_1, D_2, \cdots, D_n 构成正态总体 N(\mu_D, \sigma_D^2) 的一个样本,其中 \mu_D, \sigma_D^2 未知。我们需要基于这一样本检验假设
\begin{align} &(1) \quad H_0: \mu_D = 0, \quad, H_1: \mu_D \neq 0 \\ &(2) \quad H_0: \mu_D \leq 0, \quad, H_1: \mu_D > 0 \\ &(3) \quad H_0: \mu_D \geq 0, \quad, H_1: \mu_D < 0 \end{align}
分别记 D_1, D_2, \cdots, D_n 的样本均值和样本方差的观察值为 \overline d, s_D^2,可知检验问题 (1),(2),(3) 的拒绝域分别为(显著性水平 \alpha):
\begin{align} |t| &= \bigg| \frac{\overline d}{s_D / \sqrt{n}} \bigg| \geq t_{\alpha / 2}(n – 1) \\ t &= \frac{\overline d}{s_D / \sqrt{n}} \geq t_{\alpha}(n – 1) \\ t &= \frac{\overline d}{s_D / \sqrt{n}} \leq – t_{\alpha}(n – 1) \end{align}