数理统计 Cheat Sheet 15:检验假设问题的 p 值法

  设总体 $X \sim N(\mu, \sigma^2)$,$\mu$ 未知,$\sigma^2 = 100$,现有样本 $x_1, x_2, \cdots, x_{52}$,算得 $\overline x = 62.75$,现在来检验假设

\begin{equation}
H_0: \mu \leq \mu_0 = 60, \quad H_1: \mu > 60
\end{equation}

  采用 $Z$ 检验法,检验统计量为

\begin{equation}
Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}
\end{equation}

代入数据,得 $Z$ 的观察值为

\begin{equation}
z = \frac{62.75 – 60}{10 / \sqrt{52}} = 1.983
\end{equation}

概率

\begin{equation}
P\{Z \geq z_0\} = P\{Z \geq 1.983\} = 1 – \Phi(1.983) = 0.0238
\end{equation}

此概率称为 $Z$ 检验法的右边检验的 $p$ 值,记为

\begin{equation}
P\{Z \geq z_0\} = p\;值(= 0.0238)
\end{equation}

  若显著性水平 $\alpha \geq p = 0.0238$,则对应的临界值 $z_\alpha \leq 1.983$,这表示观察值 $z_0 = 1.983$ 落在拒绝域内,因而拒绝 $H_0$;又若 $\alpha < p = 0.0238$,则对应的临界值 $z_\alpha > 1.983$,这表观察值 $z_0 = 1.983$ 不落在拒绝域内,因而接受 $H_0$。

  定义 假设检验的 $p$ 值(Probability Value)是由检验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平。

  常用的检验问题的 $p$ 值可以根据检验统计量的样本观察值以及检验统计量在 $H_0$ 下一个特定参数值(一般是 $H_0$ 与 $H_1$ 所规定的参数的分界点)对应的分布求出。例如在正态总体 $N(\mu, \sigma^2)$ 均值的检验中,当 $\sigma$ 未知时,可采用检验统计量 $t = \frac{\overline X – \mu_0}{S / \sqrt{n}}$,在一下三个检验问题中,当 $\mu = \mu_0$ 时 $t \sim t(n – 1)$。如果由样本求得统计量 $t$ 的观察值为 $t_0$,那么

(1)在检验问题

\begin{equation}
H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0
\end{equation}

中,

\begin{equation}
p\;值 = P_{\mu_0} \{t \geq t_0\} = t_0\;右侧尾部面积
\end{equation}

(2)在检验问题

\begin{equation}
H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0
\end{equation}

中,

\begin{equation}
p\;值 = P_{\mu_0} \{t \leq t_0\} = t_0\;左侧尾部面积
\end{equation}

(3)在检验问题

\begin{equation}
H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0
\end{equation}

中,

(i) 当 $t_0 > 0$ 时

\begin{align}
p\;值 &= P_{\mu_0} \{|t| \geq t_0 \} = P_{\mu_0} \{ (t \leq -t_0) \cup (t \geq t_0) \}
&= 2 \times (t_0\;右侧尾部面积)
\end{align}

(ii) 当 $t_0 < 0$ 时

\begin{align}
p\;值 &= P_{\mu_0} \{|t| \geq -t_0 \} = P_{\mu_0} \{ (t \leq t_0) \cup (t \geq -t_0) \}
&= 2 \times (t_0\;左侧尾部面积)
\end{align}

综合(i)、(ii),$p\;值 = 2 \times (由\;t_0\;界定的尾部面积)$。

  按 $p$ 值的定义,对于任意指定的显著性水平 $\alpha$,就有

  1. 若 $p\;值 \leq \alpha$,则在显著性水平 $\alpha$ 下拒绝 $H_0$。
  2. 若 $p\;值 > \alpha$,则在显著性水平 $\alpha$ 下接受 $H_0$。

  由此就可以方便地确定是否拒绝 $H_0$。这种利用 $p$ 值来确定是否拒绝 $H_0$ 的方法称为 $p$ 值法。而前文中讨论的假设检验方法称为临界值法。

  用临界值法来确定 $H_0$ 的拒绝域时,例如当取 $\alpha = 0.05$ 时知道要拒绝 $H_0$,再取 $\alpha = 0.01$ 也要拒绝 $H_0$,但不能知道将 $\alpha$ 在降低一些是否也要拒绝 $H_0$。而 $p$ 值法给出了拒绝 $H_0$ 的最小显著性水平。因此 $p$ 值法比临界值法给出了有关拒绝域的更多信息。

  $p$ 值表示反对原假设 $H_0$ 的依据的强度,$p$ 值越小,反对 $H_0$ 的依据越强、越充分。一般,若 $p\;值\leq 0.01$,则称推断拒绝 $H_0$ 的依据很强,或称检验是高度显著的;若 $0.01 < p\;值 < 0.05$,称推断拒绝 $H_0$ 的依据是强的,检验是显著的;若 $0.05 < p\;值 < 0.1$,称推断拒绝 $H_0$ 的依据是弱的,检验是不显著的;若 $p\;值 > 0.1$,一般来说没有理由拒绝 $H_0$。