数理统计 Cheat Sheet 12:假设检验
1. 定义 假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些未知特性,提出某些关于总体的假设,并根据样本对所提出的假设做出接受还是拒绝的决策。 例如对于某正态总体 $X$,已知其方差为 $\sigma^2$,但不知其均值 $\mu$。现在要根据样本判断均值 $\mu$ 是否为某一特定值 $\mu_0$,提出两个相互对立的假设: \begin{align…
Read more
learn, build, evaluate
1. 定义 假设检验是在总体分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些未知特性,提出某些关于总体的假设,并根据样本对所提出的假设做出接受还是拒绝的决策。 例如对于某正态总体 $X$,已知其方差为 $\sigma^2$,但不知其均值 $\mu$。现在要根据样本判断均值 $\mu$ 是否为某一特定值 $\mu_0$,提出两个相互对立的假设: \begin{align…
Read more
1. 单侧置信区间 对于给定值 $\alpha$($0 < \alpha < 1$),若由样本 $X_1, X_2, \cdots, X_n$ 确定的统计量 $\underline\theta = \underline\theta(X_1, X_2, \cdots, X_n)$ 对于任意 $\theta \in \Theta$,满足 \begin{equation} P\{…
Read more
设有一容量 $n > 50$ 的大样本,它来自 $(0-1)$ 分布的总体 $X$,$X$ 的分布律为 \begin{equation} f(x; p) = p^x (1 – p)^{1 – x}, \quad x = 0, 1 \tag{1} \end{equation} 其中 $p$ 为未知参数。 已知 $(0-1)$ 分布的均值和方差分别为 \begin{eq…
Read more
1. 单个总体 $N(\mu, \sigma^2)$ 的情况 设已给定置信水平为 $1 – \alpha$,设 $X_1, X_2, \cdots, X_n$ 为总体 $N(\mu, \sigma^2)$ 的样本,$\overline X$ 和 $S^2$ 分别为样本均值和样本方差。 1.1. 均值 $\mu$ 的置信区间 1.1.1. $\sigma^2$ 为已知的情况 若 …
Read more
1. 置信区间 在测量或计算一个未知量时,除了希望得到一个近似值,还希望得到这个近似值的精确程度(所求真值所在的范围),即估计误差。类似地,在估计未知参数 $\theta$ 时,在得到点估计 $\hat\theta$ 之外,还希望能估计出一个范围,并希望知道这个范围包含参数 $\theta$ 真值得可信程度。这样的范围常以区间的形式给出,并同时给出此区间包含参数 $\theta$ 真值得可信程…
Read more
使用不同的估计方法对同一未知参数进行估计,可能会得到不同的估计量。原则上任何统计量都可以作为未知参数的估计量,通常使用如下的标准来评价统计量的质量。 1. 无偏性 设 $X_1, X_2, \cdots, X_n$ 是总体 $X$ 的一个样本,$\theta \in \Theta$ 是包含在总体 $X$ 的分布中的待估参数,$\Theta$ 是 $\theta$ 的取值范围。 无偏性 …
Read more
估计和假设检验是统计推断所研究的两大基本问题,其中对总体参数的估计主要分为点估计和区间估计。 点估计问题指的是当总体 $X$ 的分布函数的形式已知,而它的一个或多个参数未知,借助于总体 $X$ 的一个样本来估计总体未知参数的值的问题。 点估计问题的一般提法为:设总体 $X$ 的分布函数 $F(x;\theta)$ 的形式为已知,$\theta$ 为待估计参数,$X_1, X_2, \c…
Read more
对于任意分布的总体 $X$,设其均值和方差均存在,分别为 $\mu$ 和 $\sigma^2$;$X_1, X_2, \cdots, X_n$ 是来自 $X$ 的一个样本,$\overline{X}$ 和 $S^2$ 分别为样本均值和样本方差,则有 \begin{equation} E(\overline{X}) = \mu, \quad D(\overline{X}) = \sigma^2 …
Read more
统计量的分布称为抽样分布。在使用统计量进行统计推断时,常需要知道它的分布。当总体分布函数已知时,抽样分布是确定的,但要求出统计量的精确分布一般来说是困难的。以下给三个常用统计量的分布。 1. $\chi^2$ 分布 设 $X_1, X_2, \cdots, X_n$ 是来自总体 $N(0, 1)$ 的样本,则称统计量 \begin{equation} \chi^2 = X_1^2 + X_…
Read more
1. 随机样本 定义 设 $X$ 是具有分布函数 $F$ 的随机变量,若 $X_1, X_2, \cdots, X_n$ 是具有同一分布函数 $F$ 的、相互独立的随机变量,则称 $X_1, X_2, \cdots, X_n$ 为从分布函数 $F$(或总体 $F$、或总体 $X$)得到的容量为 $n$ 的简单随机样本,简称样本。它们的观察值 $x_1, x_2, \cdots, x_n$ 称为…
Read more