数理统计 Cheat Sheet 4:常用统计量的分布
统计量的分布称为抽样分布。在使用统计量进行统计推断时,常需要知道它的分布。当总体分布函数已知时,抽样分布是确定的,但要求出统计量的精确分布一般来说是困难的。以下给三个常用统计量的分布。
Contents [show]
1. χ2 分布
设 X1,X2,⋯,Xn 是来自总体 N(0,1) 的样本,则称统计量
χ2=X21+X22+⋯+X2n
服从自由度为 n 的 χ2 分布,记为 χ2∼χ2(n)。
此处自由度是指式 (1) 右端包含的独立变量的个数。
χ2(n) 分布的概率密度为
f(y)={12n/2Γ(n/2)yn/2−1e−y/2,y>00其他
χ2(1) 分布即为 Γ(12,2) 分布,现 Xi∼N(0,1),由定义 X2i∼χ2(1),即 X2i∼Γ(12,2),i=1,2,⋯,n。再由 X1,X2,⋯,Xn 的独立性知 X21,X22,⋯,X2n 也相互独立,从而由 Γ 分布的可加性知
χ2=n∑i=1Xi∼Γ(n2,2)
即得 χ2 的概率密度如式 (2)。
由 Γ 分布的可加性易知 χ2 的可加性:
χ2 分布的可加性 设 χ21∼χ2(n1),χ22∼χ2(n2),并且 χ21,χ22 相互独立,则有
χ21+χ22∼χ2(n1+n2)
χ2 分布的数学期望和方差 若 χ2∼χ2(n),则有
E(χ2)=n,D(χ2)=2n
由 Xi∼N(0,1),故
E(X2i)=D(Xi)=1D(X2i)=E(X4i)–[E(X2i)]2=3–1=2,i=1,2,⋯,n
于是有
E(χ2)=E(n∑i=1X2i)=n∑i=1E(X2i)=nD(χ2)=D(n∑i=1X2i)=n∑i=1D(X2i)=2n
χ2 分布的上 α 分位点 对于给定的正数 α,0<α<1 满足条件
P{χ2>χ2α(n)}=∫∞χ2α(n)f(y)dy=α
的点 χ2α(n) 就是 χ2(n) 分布的上 α 分位点。
当 n 充分大时(如 n>40),费希尔(R.A.Fisher)证明
χ2α(n)≈12(zα+√2n–1)2
其中 zα 是标准正态分布的上 α 分位点。
2. t 分布
设 X∼N(0,1),Y∼χ2(n),且 X,Y 相互独立,则称随机变量
t=X√Y/n
服从自由度为 n 的 t 分布,记为 t∼t(n)。
t 分布又称学生氏(Student)分布。t(n) 分布的概率密度函数为
h(t)=Γ[(n+1)/2]√πnΓ(n/2)(1+t2n),−∞<t<∞
h(t) 的图形关于 t=0 对称,当 n 充分大时,其图形类似于标准正态变量概率密度的图形。利用 Γ 函数的性质,有
limn→∞h(t)=1√2πe−t2/2
故当 n 足够大时,t 分布近似于 N(0,1) 分布。但对于较小的 n,t 分布与 N(0,1) 分布相差较大。
t 分布的上 α 分位点 对于给定的 α(0<α<1)满足条件
P{t>tα(n)}=∫∞tα(n)h(t)dt=α
的点 tα(n) 就是 t(n) 分布的上 α 分位点。
由 t 分布上α 分位点的定义及 h(t) 图形的对称性可知
t1–α(n)=−tα(n)
在 n>45 时,tα(n) 的值可以使用正态近似
tα(n)≈zα
3. F 分布
设 U∼χ2(n1),V∼χ2(n2),且 U,V 相互独立,则称随机变量
F=U/n1V/n2
服从自由度为 (n1,n2) 的 F 分布,记为 F∼F(n1,n2)。
F(n1,n2) 分布的概率密度为
ψ(y)={Γ[(n1+n2)/2](n1+n2)n1/2y(n1/2)–1Γ(n1/2)Γ(n2/2)[1+(n1y/n2)](n1+n2)/2y>00其他
由定义可知,若 F∼F(n1,n2),则
1F∼F(n2,n1)
F 分布的上 α 分位点 对于给定的 α(0<α<1),满足条件
P{F>Fα(n1,n2)}=∫∞Fα(n1,n2)ψ(y)dy=α
的点 Fα(n1,n2) 就是 F(n1,n2) 分布的上 α 分位点。F 分布的上 α 分位点具有如下性质:
F1–α(n1,n2)=1Fα(n2,n1)