数理统计 Cheat Sheet 9:正态总体均值与方差的区间估计
Contents [show]
1. 单个总体 N(\mu, \sigma^2) 的情况
设已给定置信水平为 1 – \alpha,设 X_1, X_2, \cdots, X_n 为总体 N(\mu, \sigma^2) 的样本,\overline X 和 S^2 分别为样本均值和样本方差。
1.1. 均值 \mu 的置信区间
1.1.1. \sigma^2 为已知的情况
若 \sigma^2 为已知,由前文可知,采用枢轴量 \frac{\overline X – \mu}{\sigma / \sqrt{n}},得到 \mu 的一个置信水平为 1 – \alpha 的置信区间为
\begin{equation} \bigg( \overline X \pm \frac{\sigma}{\sqrt{n}} z_{\alpha / 2} \bigg) \tag{1} \end{equation}
1.1.2. \sigma^2 为未知的情况
若 \sigma^2 为未知,则式 (1) 给出的区间中含有未知参数 \sigma,无法用其作为置信区间。考虑 S^2 是 \sigma^2 的无偏估计,由前文定理三,有
\begin{equation} \frac{\overline X – \mu}{S / \sqrt{n}} \sim t(n – 1) \tag{2} \end{equation}
注意式 (2) 右边的分布 t(n – 1) 不依赖于任何未知参数,故使用式 (2) 左边作为枢轴量,可得
\begin{equation} P\bigg\{ -t_{\alpha/2}(n – 1) < \frac{\overline X – \mu}{S / \sqrt{n}} < t_{\alpha/2}(n – 1) \bigg\} = 1 – \alpha \tag{3} \end{equation}
即
\begin{equation} P \bigg\{ \overline X – \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) < \mu < \overline X + \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) \bigg\} \end{equation}
于是得到 \mu 的一个置信水平为 1 – \alpha 的置信区间
\begin{equation} \bigg( X \pm \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) \bigg) \tag{4} \end{equation}
在实际应用问题中,总方差 \sigma^2 往往是未知的,故区间 (4) 较区间 (1) 有更大的实用价值。
1.2. 方差 \sigma^2 的置信区间
1.2.1. \mu 为未知的情况
若 \mu 为未知,由前文定理二,有
\begin{equation} \frac{(n – 1)S^2}{\sigma^2} \sim \chi^2(n – 1) \tag{5} \end{equation}
注意式 (5) 右边的分布 \chi^2(n – 1) 不依赖于任何未知参数,故使用式 (5) 左边作为枢轴量,可得
\begin{equation} P\bigg\{ \chi_{1 – \alpha/2}(n – 1) < \frac{(n – 1)S^2}{\sigma^2} < \chi^2_{\alpha/2}(n – 1) \bigg\} = 1 – \alpha \tag{6} \end{equation}
即
\begin{equation} P\bigg\{ \frac{(n – 1)S^2}{\chi^2_{\alpha/2}(n – 1)} < \sigma^2 < \frac{(n – 1)S^2}{\chi^2_{1 – \alpha/2}(n – 1)} = 1 – \alpha\bigg\} \end{equation}
于是得到 \sigma^2 的一个置信水平为 1 – \alpha 的置信区间
\begin{equation} \bigg( \frac{(n – 1)S^2}{\chi^2_{\alpha/2}(n – 1)}, \frac{(n – 1)S^2}{\chi^2_{1 – \alpha/2}(n – 1)} \bigg) \tag{7} \end{equation}
此外还可以得到标准差 \sigma 的一个置信水平为 1 – \alpha 的置信区间
\begin{equation} \bigg( \frac{\sqrt{n – 1}S}{\sqrt{\chi^2_{\alpha/2}(n – 1)}}, \frac{\sqrt{n – 1}S}{\sqrt{\chi^2_{1 – \alpha/2}(n – 1)}} \bigg) \tag{8} \end{equation}
注意如 \chi^2 分布和 F 分布的密度函数不对称,但习惯上任然是取对称的分位点。
2. 两个总体 N(\mu_1, \sigma_1^2) 和 N(\mu_2, \sigma_2^2) 的情况
设已给定置信水平为 1 – \alpha,并设 X_1, X_2, \cdots, X_{n_1} 是来自第一个综艺的样本,Y_1, Y_2, \cdots, Y_{n_2} 是来自第二个总体的样本,这两个样本相互独立。且设 \overline X, \overline Y 分别为第一、第二总体的样本均值,S_1^2, S_2^2 分别为第一、第二总体的样本方差。
2.1. 两个总体均值差 \mu_1 – \mu_2 的置信区间
2.1.1. \sigma_2^2, \sigma_2^2 均为已知的情况
由 \overline X, \overline Y 分别为 \mu_1, \mu_2 的无偏估计,故 \overline X – \overline Y 是 \mu_1 – \mu_2 的无偏估计。由 \overline X, \overline Y 的独立性及 \overline X \sim N(\mu_1, \sigma_1^2 / n_1),\overline Y \sim N(\mu_2, \sigma_2^2 / n_2),得
\begin{equation} \overline X – \overline Y \sim N(\mu_1 – \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}) \end{equation}
或
\begin{equation} \frac{(\overline X – \overline Y) – (\mu_1 – \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) \tag{9} \end{equation}
取式 (9) 左边为枢轴量,即得 \mu_1 – \mu_2 的一个置信水平为 1 – \alpha 的置信区间
\begin{equation} \bigg( \overline X – \overline Y \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \bigg) \tag{10} \end{equation}
2.1.2. \sigma_1^2 = \sigma_2^2 = \sigma^2,但 \sigma^2 为未知的情况
此时由前文定理四,有
\begin{equation} \frac{(\overline X – \overline Y) – (\mu_1 – \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 – 2) \tag{11} \end{equation}
取式 (11) 左边为枢轴量,即得 \mu_1 – \mu_2 的一个置信水平为 1 – \alpha 的置信区间
\begin{equation} \bigg( \overline X – \overline Y \pm t_{\alpha/2}(n_1 + n_2 – 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}} \bigg) \tag{12} \end{equation}
其中
\begin{equation} S_w^2 = \frac{(n_1 – 1)S_1^2 + (n_2 – 2)S_2^2}{n_1 + n_2 – 2}, \quad S_w = \sqrt{S_w^2} \tag{13} \end{equation}
2.2. 两个总体方差比 \sigma_1^2 / \sigma_2^2 的置信区间
2.2.1. 总体均值 \mu_1, \mu_2 均为未知的情况
此时由前文定理四,有
\begin{equation} \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 – 1, n_2 – 1) \tag{14} \end{equation}
取式 (14) 左边为枢轴量,得
\begin{equation} P\bigg\{ F_{1 – \alpha/2}(n_1 – 1, n_2 – 1) < F_{\alpha/2}(n_1 – 1, n_2 – 1) < F_{\alpha / 2}(n_1 – 1, n_2 – 1) \bigg\} = 1 – \alpha \tag{15} \end{equation}
即
\begin{equation} P\bigg\{ \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha / 2}(n_1 – 1, n_2 – 1)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{S_1^2}{S_2^2} \frac{1}{F_{1 – \alpha / 2}(n_1 – 1, n_2 – 1)} \bigg\} = 1 – \alpha \end{equation}
于是得 \sigma_1^2 / \sigma_2^2 的一个置信水平为 1 – \alpha 的置信区间
\begin{equation} \bigg( \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha / 2}(n_1 – 1, n_2 – 1)}, \frac{S_1^2}{S_2^2} \frac{1}{F_{1 – \alpha / 2}(n_1 – 1, n_2 – 1)} \bigg) \tag{16} \end{equation}