数理统计 Cheat Sheet 9：正态总体均值与方差的区间估计

Author: nex3z 2019-04-14

Math

Statistics

Contents

1. 单个总体 $N(\mu, \sigma^2)$ 的情况
- 1.1. 均值 $\mu$ 的置信区间
  - 1.1.1. $\sigma^2$ 为已知的情况
  - 1.1.2. $\sigma^2$ 为未知的情况
- 1.2. 方差 $\sigma^2$ 的置信区间
  - 1.2.1. $\mu$ 为未知的情况
2. 两个总体 $N(\mu_1, \sigma_1^2)$ 和 $N(\mu_2, \sigma_2^2)$ 的情况
- 2.1. 两个总体均值差 $\mu_1 – \mu_2$ 的置信区间
  - 2.1.1. $\sigma_2^2, \sigma_2^2$ 均为已知的情况
  - 2.1.2. $\sigma_1^2 = \sigma_2^2 = \sigma^2$，但 $\sigma^2$ 为未知的情况
- 2.2. 两个总体方差比 $\sigma_1^2 / \sigma_2^2$ 的置信区间
  - 2.2.1. 总体均值 $\mu_1, \mu_2$ 均为未知的情况

1. 单个总体 $N(\mu, \sigma^2)$ 的情况

　　设已给定置信水平为 $1 – \alpha$，设 $X_1, X_2, \cdots, X_n$ 为总体 $N(\mu, \sigma^2)$ 的样本，$\overline X$ 和 $S^2$ 分别为样本均值和样本方差。

1.1. 均值 $\mu$ 的置信区间

1.1.1. $\sigma^2$ 为已知的情况

　　若 $\sigma^2$ 为已知，由前文可知，采用枢轴量 $\frac{\overline X – \mu}{\sigma / \sqrt{n}}$，得到 $\mu$ 的一个置信水平为 $1 – \alpha$ 的置信区间为

\begin{equation}
\bigg( \overline X \pm \frac{\sigma}{\sqrt{n}} z_{\alpha / 2} \bigg) \tag{1}
\end{equation}

1.1.2. $\sigma^2$ 为未知的情况

　　若 $\sigma^2$ 为未知，则式 $(1)$ 给出的区间中含有未知参数 $\sigma$，无法用其作为置信区间。考虑 $S^2$ 是 $\sigma^2$ 的无偏估计，由前文定理三，有

\begin{equation}
\frac{\overline X – \mu}{S / \sqrt{n}} \sim t(n – 1) \tag{2}
\end{equation}

注意式 $(2)$ 右边的分布 $t(n – 1)$ 不依赖于任何未知参数，故使用式 $(2)$ 左边作为枢轴量，可得

\begin{equation}
P\bigg\{ -t_{\alpha/2}(n – 1) < \frac{\overline X – \mu}{S / \sqrt{n}} < t_{\alpha/2}(n – 1) \bigg\} = 1 – \alpha \tag{3}
\end{equation}

即

\begin{equation}
P \bigg\{ \overline X – \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) < \mu < \overline X + \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) \bigg\}
\end{equation}

于是得到 $\mu$ 的一个置信水平为 $1 – \alpha$ 的置信区间

\begin{equation}
\bigg( X \pm \frac{S}{\sqrt{n}} t_{\alpha/2}(n – 1) \bigg) \tag{4}
\end{equation}

　　在实际应用问题中，总方差 $\sigma^2$ 往往是未知的，故区间 $(4)$ 较区间 $(1)$ 有更大的实用价值。

1.2. 方差 $\sigma^2$ 的置信区间

1.2.1. $\mu$ 为未知的情况

　　若 $\mu$ 为未知，由前文定理二，有

\begin{equation}
\frac{(n – 1)S^2}{\sigma^2} \sim \chi^2(n – 1) \tag{5}
\end{equation}

注意式 $(5)$ 右边的分布 $\chi^2(n – 1)$ 不依赖于任何未知参数，故使用式 $(5)$ 左边作为枢轴量，可得

\begin{equation}
P\bigg\{ \chi_{1 – \alpha/2}(n – 1) < \frac{(n – 1)S^2}{\sigma^2} < \chi^2_{\alpha/2}(n – 1) \bigg\} = 1 – \alpha \tag{6}
\end{equation}

即

\begin{equation}
P\bigg\{ \frac{(n – 1)S^2}{\chi^2_{\alpha/2}(n – 1)} < \sigma^2 < \frac{(n – 1)S^2}{\chi^2_{1 – \alpha/2}(n – 1)} = 1 – \alpha\bigg\}
\end{equation}

于是得到 $\sigma^2$ 的一个置信水平为 $1 – \alpha$ 的置信区间

\begin{equation}
\bigg( \frac{(n – 1)S^2}{\chi^2_{\alpha/2}(n – 1)}, \frac{(n – 1)S^2}{\chi^2_{1 – \alpha/2}(n – 1)} \bigg) \tag{7}
\end{equation}

此外还可以得到标准差 $\sigma$ 的一个置信水平为 $1 – \alpha$ 的置信区间

\begin{equation}
\bigg( \frac{\sqrt{n – 1}S}{\sqrt{\chi^2_{\alpha/2}(n – 1)}}, \frac{\sqrt{n – 1}S}{\sqrt{\chi^2_{1 – \alpha/2}(n – 1)}} \bigg) \tag{8}
\end{equation}

注意如 $\chi^2$ 分布和 $F$ 分布的密度函数不对称，但习惯上任然是取对称的分位点。

2. 两个总体 $N(\mu_1, \sigma_1^2)$ 和 $N(\mu_2, \sigma_2^2)$ 的情况

　　设已给定置信水平为 $1 – \alpha$，并设 $X_1, X_2, \cdots, X_{n_1}$ 是来自第一个综艺的样本，$Y_1, Y_2, \cdots, Y_{n_2}$ 是来自第二个总体的样本，这两个样本相互独立。且设 $\overline X, \overline Y$ 分别为第一、第二总体的样本均值，$S_1^2, S_2^2$ 分别为第一、第二总体的样本方差。

2.1. 两个总体均值差 $\mu_1 – \mu_2$ 的置信区间

2.1.1. $\sigma_2^2, \sigma_2^2$ 均为已知的情况

　　由 $\overline X, \overline Y$ 分别为 $\mu_1, \mu_2$ 的无偏估计，故 $\overline X – \overline Y$ 是 $\mu_1 – \mu_2$ 的无偏估计。由 $\overline X, \overline Y$ 的独立性及 $\overline X \sim N(\mu_1, \sigma_1^2 / n_1)$，$\overline Y \sim N(\mu_2, \sigma_2^2 / n_2)$，得

\begin{equation}
\overline X – \overline Y \sim N(\mu_1 – \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2})
\end{equation}

或

\begin{equation}
\frac{(\overline X – \overline Y) – (\mu_1 – \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) \tag{9}
\end{equation}

取式 $(9)$ 左边为枢轴量，即得 $\mu_1 – \mu_2$ 的一个置信水平为 $1 – \alpha$ 的置信区间

\begin{equation}
\bigg( \overline X – \overline Y \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \bigg) \tag{10}
\end{equation}

2.1.2. $\sigma_1^2 = \sigma_2^2 = \sigma^2$，但 $\sigma^2$ 为未知的情况

　　此时由前文定理四，有

\begin{equation}
\frac{(\overline X – \overline Y) – (\mu_1 – \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 – 2) \tag{11}
\end{equation}

取式 $(11)$ 左边为枢轴量，即得 $\mu_1 – \mu_2$ 的一个置信水平为 $1 – \alpha$ 的置信区间

\begin{equation}
\bigg( \overline X – \overline Y \pm t_{\alpha/2}(n_1 + n_2 – 2) S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}} \bigg) \tag{12}
\end{equation}

其中

\begin{equation}
S_w^2 = \frac{(n_1 – 1)S_1^2 + (n_2 – 2)S_2^2}{n_1 + n_2 – 2}, \quad S_w = \sqrt{S_w^2} \tag{13}
\end{equation}

2.2. 两个总体方差比 $\sigma_1^2 / \sigma_2^2$ 的置信区间

2.2.1. 总体均值 $\mu_1, \mu_2$ 均为未知的情况

　　此时由前文定理四，有

\begin{equation}
\frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 – 1, n_2 – 1) \tag{14}
\end{equation}

取式 $(14)$ 左边为枢轴量，得

\begin{equation}
P\bigg\{ F_{1 – \alpha/2}(n_1 – 1, n_2 – 1) < F_{\alpha/2}(n_1 – 1, n_2 – 1) < F_{\alpha / 2}(n_1 – 1, n_2 – 1) \bigg\} = 1 – \alpha \tag{15}
\end{equation}

即

\begin{equation}
P\bigg\{ \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha / 2}(n_1 – 1, n_2 – 1)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{S_1^2}{S_2^2} \frac{1}{F_{1 – \alpha / 2}(n_1 – 1, n_2 – 1)} \bigg\} = 1 – \alpha
\end{equation}

于是得 $\sigma_1^2 / \sigma_2^2$ 的一个置信水平为 $1 – \alpha$ 的置信区间

\begin{equation}
\bigg( \frac{S_1^2}{S_2^2} \frac{1}{F_{\alpha / 2}(n_1 – 1, n_2 – 1)}, \frac{S_1^2}{S_2^2} \frac{1}{F_{1 – \alpha / 2}(n_1 – 1, n_2 – 1)} \bigg) \tag{16}
\end{equation}

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30