Processing math: 100%

数理统计 Cheat Sheet 4:常用统计量的分布

  统计量的分布称为抽样分布。在使用统计量进行统计推断时,常需要知道它的分布。当总体分布函数已知时,抽样分布是确定的,但要求出统计量的精确分布一般来说是困难的。以下给三个常用统计量的分布。

1. χ2 分布

  设 X1,X2,,Xn 是来自总体 N(0,1) 的样本,则称统计量

χ2=X21+X22++X2n

服从自由度为 nχ2 分布,记为 χ2χ2(n)

  此处自由度是指式 (1) 右端包含的独立变量的个数。

  χ2(n) 分布的概率密度为

f(y)={12n/2Γ(n/2)yn/21ey/2,y>00

  χ2(1) 分布即为 Γ(12,2) 分布,现 XiN(0,1),由定义 X2iχ2(1),即 X2iΓ(12,2)i=1,2,,n。再由 X1,X2,,Xn 的独立性知 X21,X22,,X2n 也相互独立,从而由 Γ 分布的可加性知

χ2=ni=1XiΓ(n2,2)

即得 χ2 的概率密度如式 (2)

  由 Γ 分布的可加性易知 χ2 的可加性:

  χ2 分布的可加性 设 χ21χ2(n1)χ22χ2(n2),并且 χ21,χ22 相互独立,则有

χ21+χ22χ2(n1+n2)

  χ2 分布的数学期望和方差 若 χ2χ2(n),则有

E(χ2)=n,D(χ2)=2n

  由 XiN(0,1),故

E(X2i)=D(Xi)=1D(X2i)=E(X4i)[E(X2i)]2=31=2,i=1,2,,n

于是有

E(χ2)=E(ni=1X2i)=ni=1E(X2i)=nD(χ2)=D(ni=1X2i)=ni=1D(X2i)=2n

  χ2 分布的上 α 分位点 对于给定的正数 α0<α<1 满足条件

P{χ2>χ2α(n)}=χ2α(n)f(y)dy=α

的点 χ2α(n) 就是 χ2(n) 分布的上 α 分位点。

  当 n 充分大时(如 n>40),费希尔(R.A.Fisher)证明

χ2α(n)12(zα+2n1)2

其中 zα 是标准正态分布的上 α 分位点。

2. t 分布

  设 XN(0,1)Yχ2(n),且 X,Y 相互独立,则称随机变量

t=XY/n

服从自由度为 nt 分布,记为 tt(n)

  t 分布又称学生氏(Student)分布t(n) 分布的概率密度函数为

h(t)=Γ[(n+1)/2]πnΓ(n/2)(1+t2n),<t<

  h(t) 的图形关于 t=0 对称,当 n 充分大时,其图形类似于标准正态变量概率密度的图形。利用 Γ 函数的性质,有

limnh(t)=12πet2/2

故当 n 足够大时,t 分布近似于 N(0,1) 分布。但对于较小的 nt 分布与 N(0,1) 分布相差较大。

  t 分布的上 α 分位点 对于给定的 α0<α<1)满足条件

P{t>tα(n)}=tα(n)h(t)dt=α

的点 tα(n) 就是 t(n) 分布的上 α 分位点。

  由 t 分布上α 分位点的定义及 h(t) 图形的对称性可知

t1α(n)=tα(n)

  在 n>45 时,tα(n) 的值可以使用正态近似

tα(n)zα

3. F 分布

  设 Uχ2(n1)Vχ2(n2),且 U,V 相互独立,则称随机变量

F=U/n1V/n2

服从自由度为 (n1,n2)F 分布,记为 FF(n1,n2)

  F(n1,n2) 分布的概率密度为

ψ(y)={Γ[(n1+n2)/2](n1+n2)n1/2y(n1/2)1Γ(n1/2)Γ(n2/2)[1+(n1y/n2)](n1+n2)/2y>00

  由定义可知,若 FF(n1,n2),则

1FF(n2,n1)

  F 分布的上 α 分位点 对于给定的 α0<α<1),满足条件

P{F>Fα(n1,n2)}=Fα(n1,n2)ψ(y)dy=α

的点 Fα(n1,n2) 就是 F(n1,n2) 分布的上 α 分位点。F 分布的上 α 分位点具有如下性质:

F1α(n1,n2)=1Fα(n2,n1)