曲天尧
摘要:数理统计是一门以概率论为理论基础,研究随机现象统计规律性的数学学科。在经济全球化和信息化的今天,经济、管理等学科领域越来越侧重数理统计的应用,尤其是在大数据时代下,统计数据浩如烟海,数理统计的地位就更加凸显。随着社会的发展,推断统计已经取代传统的描述统计,成为现代统计的核心,而抽样分布作为统计推断的开篇内容,同时也是连结概率论与数理统计的桥梁,因此在统计推断中占据重要地位。本文主要对统计推断中常用的抽样分布及其应用作总结,并结合例题对统计量的抽样分布作出合理地判别。
关键词:简单随机抽样;正态分布;χ2分布;F分布;t分布
一、基本概念
(一)总体与个体
在数理统计中,总体就是研究对象的全体,个体即为构成总体的每个成员。对应到概率论中,总体是一个分布,总体的相关数量指标是服从这个分布的随机变量。
(二)样本
样本是对应于总体而言的。为了深入了解总体X的分布,从总体X中随机抽取的n个个体即为样本。样本具有二重性:一方面,由于样本是从总体中随机抽取的,在抽取前它们的数值是未知的,所以样本是随机变量,可以记为X1,X2,...,Xn;另一方面,样本在抽取后经观测就可以得到相应的观测值,所以样本又可以说是一组数据,用x1,x2,...,xn表示。在本文中,样本用X1,X2,...,Xn表示,而x1,x2,...,xn表示相应的样本观测值。
(三)简单随机抽样
简单随机抽样是数理统计中最常用的一种概率抽样方法。简单来讲,简单随机抽样要求在每次抽取中,所有待抽取的个体均具有相同的可能性被抽中。具体来说,简单随机抽样要求样本具有随机性和独立性。利用简单随机抽样方法所得到的样本即为简单随机样本,本文所涉及到的样本都是简单随机样本。
(四)统计量与抽样分布
假设X1,X2,...,Xn是取自总体X,容量为n的样本,若样本函数T=T(X1,X2,...,Xn)中不含有任何未知參数,那么T就是统计量。换言之,统计量就是把样本加工成函数,统计量的分布就是抽样分布。
在数理统计中,常见的统计量主要有样本均值、样本方差与标准差、样本矩、次序统计量等。本文涉及到的统计量主要是样本均值、样本方差与样本标准差,其计算公式如下:
公式
其中,X、S2、S分别表示样本均值、样本方差及样本标准差。根据无偏性的要求,本文中的样本方差指的是修正样本方差S,而并非未修正样本方差公式。
二、抽样分布的基本理论
(一)正态分布正态分布是概率论中连续型随机变量最常见的一种
分布,它也是后面三大抽样分布的理论基础。设随机变量X~N(m,s2),则其密度函数j(×)、分布函数Φ·()分别为
公式
其中,-?
对于一般的正态变量都可以通过一个线性变换,使其服从标准正态分布,即若设正态变量X~N(m,s2),则有
公式
下文中采用的是上侧a分位数。
在统计推断中,正态分布主要应用于推断正态总体的均值。对于单个正态总体而言,当样本容量n≥30时,或者当样本容量n<30但总体方差σ已知时可以利用正态分布。若设x1,x2,...,xn是来自总体X~N(m,s2)的样本,样本均值为X,且n330,则有
公式
对于两个正态总体而言,不妨设x1,x2,...,xn1,Y1,Y2,...,公式
的样本,样本均值分别为X和Y,并且n1,n2330,则有公式
(二)c分布
假设总体X~N(0,1),X1,X2,...,Xn是取自总体X,容量为n的样本,则统计量
公式
关于c2分布的定义,也可以这么理解:若设x1,x2,...,xn是取自总体X~N(0,1)的样本,令Y=X2,相应的样本函数为Y=X2,则
公式
独立且同分布,这样便可轻易求得c2分布的数字特征:
公式
当n很大时,根据中心极限定理可知
公式
x^分布是一种非负连续型随机变量的分布,具密度
函数的图形位于第一-象限,峰值向左偏,随着n的增大,峰值将会向右移动。x'分布的上侧a分位数定义如下
公式
其中,fx()表示x2分布的密度函数。
在统计推断中,x2分布主要应用于推断单个正态总体的方差,即若设.....。是来自总体x~N(μ,σ2)的样本,样本方差为S,则有
公式
(三)F分布
假设X~x*(m),Y~x2(n),并且X与Y相互独立,则统计量
公式
就是服从第--自由度为n,第二自由度为n2的F分布,记为F~F(n,m2)
F分布也是-.种非负连续型随机变量的分布,其密度函数含有两个参数n和n2,密度函数曲线的形状与x2分布相似。F分布的上侧a分位数定义如下
公式
其中,fr(:)表示F分布的密度函数。
在统计推断中,F分布主要应用于推断两个正态总体的方差之比,即若设Xi,y,是分别来自两个独立的总体X~N(A,σ)和Y~N(14,σ2)的样本,样本方差分别为
公式
其中,i12.2...,.2=..特别地,如果σ=σ:则有
公式
(四)分布
假设X~N(0,1),Y~x2(n),并且X与Y相互独立,则统计量
公式
就是服从自由度为n的t分布,记为t~t(n)。根据t分布的定义可得
公式
分布是-一种连续型随机变量的分布,其密度函数的图形关于直线x=0(y轴)对称,形状与标准正态分布曲线相类似。当自由度n足够大(n≥30)时,t分布就可以用标准正态分布近似代替。但对于较小的n,t分布与标准正态分布相差较大。t分布的,上侧a分位数定义如下
公式
其中,f,()表示t分布的密度函数。
与正态分布类似,在统计推断中,t分布主要应用于推断正态总体的均值。对于单个正态总体而言,当样本容量n<30且总体方差σ未知时便可运用t分布。。若设.2...X。是来自总体X~N(u,σ2的样本,样本均值为义,且n<30,则有
公式
对于两个正态总体而言,不妨设xX.,....川,.,.....是分别来自两个独立的总体X~N(n,σ})和Y~N(μ2,σ3)的样本,样本均值分别为x和Y,并且几,”2<30,如果o},o;未知但相等,即o?=σ3=σ2,则有
公式
其中,s:是σ和吃的合并估计量,且有
公式
如果o,σ3未知且不相等,即σ°≠σ3,则有
公式
此时的自由度D满足
公式
三、对抽样分布的总结
公式
通过对抽样分布经典模式的分析可以看出:正态分布是理论基础,x2分布、F分布以及t分布都是在正态分布的基础。上衍生而来,于是便有了如下的三个关系
公式
四、对抽样分布的判别
在实际中,除了要理解这几个抽样分布的经典模式之外,还要对统计量所服从的抽样分布作出合理地判别。
例1设x,X,X,x是来自总体x~N(,σ2)(σ>0)的简单随机样本,试判断统计量.X-X-所服从的分
|X;+X.-2|
布。
解:由题意可得
公式
例2設X,Xx,X,是来自总体X~N(0,σ2)(σ>0)的简单随机样本,试判断统计量2X,-X,
√2|x,|所服从的分布。
解:根据题意得
公式
例3设x..x(n≥2)是来自总体x~N(1,1)的简单随机样本,记x=-Zx,则下列结论中不正确的是()
公式
因此,本题应选B。
参考文献
[1]何志华.经济分析中概率与数理统计的应用评价[].现代营销(下旬刊),2017年01期.
[2]吴风庆,王艳明统计学[M]科学出版社,2016.
[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].高等教育出版社,2010.
[4]张小斐统计学[M].中国统计出版社,2013.