数理统计 Cheat Sheet 9:正态总体均值与方差的区间估计
1. 单个总体 $N(\mu, \sigma^2)$ 的情况
设已给定置信水平为 $1 – \alpha$,设 $X_1, X_2, \cdots, X_n$ 为总体 $N(\mu, \sigma^2)$ 的样本,$\overline X$ 和 $S^2$ 分别为样本均值和样本方差。
1.1. 均值 $\mu$ 的置信区间
1.1.1. $\sigma^2$ 为已知的情况
若 $\sigma^2$ 为已知,由前文可知,采用枢轴量 $\frac{\overline X – \mu}{\sigma / \sqrt{n}}$,得到 $\mu$ 的一个置信水平为 $1 – \alpha$ 的置信区间为
\begin{equation}
\bigg( \overline X \pm \frac{\sigma}{\sqrt{n}} z_{\alpha / 2} \bigg) \tag{1}
\end{equation}
1.1.2. $\sigma^2$ 为未知的情况
若 $\sigma^2$ 为未知,则式 $(1)$ 给出的区间中含有未知参数 $\sigma$,无法用其作为置信区间。考虑 $S^2$ 是 $\sigma^2$ 的无偏估计,由前文定理三,有
\begin{equation}
\frac{\overline X – \mu}{S / \sqrt{n}} \sim t(n – 1) \tag{2}
\end{equation}
注意式 $(2)$ 右边的分布 $t(n – 1)$ 不依赖于任何未知参数,故使用式 $(2)$ 左边作为枢轴量,可得
\begin{equation}
P\bigg\{ -t_{\alpha/2}(n – 1) < \frac{\overline X – \mu}{S / \sqrt{n}} < t_{\alpha/2}(n – 1) \bigg\} = 1 – \alpha \tag{3}
\end{equation}
即
\begin{equation}
P \bigg\{ \overline X – \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) < \mu < \overline X + \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) \bigg\}
\end{equation}
于是得到 $\mu$ 的一个置信水平为 $1 – \alpha$ 的置信区间
\begin{equation}
\bigg( X \pm \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) \bigg) \tag{4}
\end{equation}
在实际应用问题中,总方差 $\sigma^2$ 往往是未知的,故区间 $(4)$ 较区间 $(1)$ 有更大的实用价值。
1.2. 方差 $\sigma^2$ 的置信区间
1.2.1. $\mu$ 为未知的情况
若 $\mu$ 为未知,由前文定理二,有
\begin{equation}
\frac{(n – 1)S^2}{\sigma^2} \sim \chi^2(n – 1) \tag{5}
\end{equation}
注意式 $(5)$ 右边的分布 $\chi^2(n – 1)$ 不依赖于任何未知参数,故使用式 $(5)$ 左边作为枢轴量,可得
\begin{equation}
P\bigg\{ \chi_{1 – \alpha/2}(n – 1) < \frac{(n – 1)S^2}{\sigma^2} < \chi^2_{\alpha/2}(n – 1) \bigg\} = 1 – \alpha \tag{6}
\end{equation}
即
\begin{equation}
P\bigg\{ \frac{(n – 1)S^2}{\chi^2_{\alpha/2}(n – 1)} < \sigma^2 < \frac{(n – 1)S^2}{\chi^2_{1 – \alpha/2}(n – 1)} = 1 – \alpha\bigg\}
\end{equation}
于是得到 $\sigma^2$ 的一个置信水平为 $1 – \alpha$ 的置信区间
\begin{equation}
\bigg( \frac{(n – 1)S^2}{\chi^2_{\alpha/2}(n – 1)}, \frac{(n – 1)S^2}{\chi^2_{1 – \alpha/2}(n – 1)} \bigg) \tag{7}
\end{equation}
此外还可以得到标准差 $\sigma$ 的一个置信水平为 $1 – \alpha$ 的置信区间
\begin{equation}
\bigg( \frac{\sqrt{n – 1}S}{\sqrt{\chi^2_{\alpha/2}(n – 1)}}, \frac{\sqrt{n – 1}S}{\sqrt{\chi^2_{1 – \alpha/2}(n – 1)}} \bigg) \tag{8}
\end{equation}
注意如 $\chi^2$ 分布和 $F$ 分布的密度函数不对称,但习惯上任然是取对称的分位点。
2. 两个总体 $N(\mu_1, \sigma_1^2)$ 和 $N(\mu_2, \sigma_2^2)$ 的情况
设已给定置信水平为 $1 – \alpha$,并设 $X_1, X_2, \cdots, X_{n_1}$ 是来自第一个综艺的样本,$Y_1, Y_2, \cdots, Y_{n_2}$ 是来自第二个总体的样本,这两个样本相互独立。且设 $\overline X, \overline Y$ 分别为第一、第二总体的样本均值,$S_1^2, S_2^2$ 分别为第一、第二总体的样本方差。
2.1. 两个总体均值差 $\mu_1 – \mu_2$ 的置信区间
2.1.1. $\sigma_2^2, \sigma_2^2$ 均为已知的情况
由 $\overline X, \overline Y$ 分别为 $\mu_1, \mu_2$ 的无偏估计,故 $\overline X – \overline Y$ 是 $\mu_1 – \mu_2$ 的无偏估计。由 $\overline X, \overline Y$ 的独立性及 $\overline X \sim N(\mu_1, \sigma_1^2 / n_1)$,$\overline Y \sim N(\mu_2, \sigma_2^2 / n_2)$,得
\begin{equation}
\overline X – \overline Y \sim N(\mu_1 – \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2})
\end{equation}
或
\begin{equation}
\frac{(\overline X – \overline Y) – (\mu_1 – \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) \tag{9}
\end{equation}
取式 $(9)$ 左边为枢轴量,即得 $\mu_1 – \mu_2$ 的一个置信水平为 $1 – \alpha$ 的置信区间
\begin{equation}
\bigg( \overline X – \overline Y \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \bigg) \tag{10}
\end{equation}
2.1.2. $\sigma_1^2 = \sigma_2^2 = \sigma^2$,但 $\sigma^2$ 为未知的情况
此时由前文定理四,有
\begin{equation}
\frac{(\overline X – \overline Y) – (\mu_1 – \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 – 2) \tag{11}
\end{equation}
取式 $(11)$ 左边为枢轴量,即得 $\mu_1 – \mu_2$ 的一个置信水平为 $1 – \alpha$ 的置信区间
\begin{equation}
\bigg( \overline X – \overline Y \pm t_{\alpha/2}(n_1 + n_2 – 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}} \bigg) \tag{12}
\end{equation}
其中
\begin{equation}
S_w^2 = \frac{(n_1 – 1)S_1^2 + (n_2 – 2)S_2^2}{n_1 + n_2 – 2}, \quad S_w = \sqrt{S_w^2} \tag{13}
\end{equation}
2.2. 两个总体方差比 $\sigma_1^2 / \sigma_2^2$ 的置信区间
2.2.1. 总体均值 $\mu_1, \mu_2$ 均为未知的情况
此时由前文定理四,有
\begin{equation}
\frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 – 1, n_2 – 1) \tag{14}
\end{equation}
取式 $(14)$ 左边为枢轴量,得
\begin{equation}
P\bigg\{ F_{1 – \alpha/2}(n_1 – 1, n_2 – 1) < F_{\alpha/2}(n_1 – 1, n_2 – 1) < F_{\alpha / 2}(n_1 – 1, n_2 – 1) \bigg\} = 1 – \alpha \tag{15}
\end{equation}
即
\begin{equation}
P\bigg\{ \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha / 2}(n_1 – 1, n_2 – 1)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{S_1^2}{S_2^2} \frac{1}{F_{1 – \alpha / 2}(n_1 – 1, n_2 – 1)} \bigg\} = 1 – \alpha
\end{equation}
于是得 $\sigma_1^2 / \sigma_2^2$ 的一个置信水平为 $1 – \alpha$ 的置信区间
\begin{equation}
\bigg( \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha / 2}(n_1 – 1, n_2 – 1)}, \frac{S_1^2}{S_2^2} \frac{1}{F_{1 – \alpha / 2}(n_1 – 1, n_2 – 1)} \bigg) \tag{16}
\end{equation}