朱国仙
统计知识主要包括:随机抽样,用样本估计总体,变量间的相关关系这三个部分。掌握三种抽样方法,会用样本的频率分布估计总体分布,理解变量间的相关关系是学习的重点和学习目标。
一、三种抽样方法
三种抽样即简单随机抽样、系统抽样、分层抽样。统计的基本思想方法是用样本估计总体,即用局部推断整体,这就要求样本应具有很好的代表性,而样本的良好客观代表性,则完全依赖于抽样方法。
例1 某镇有4所中学,为了解该镇中学生的视力情况,用(
)抽取人数(4所中学的学生视力有一定差距)最好。
A.抽签法
B.随机数表法
C.系统抽样法 D.分层抽样法
解:因为4所中学的学生视力有一定的差距,所以应采用分层抽样的方法。选D。
二、用样本估计总体
l.用样本的数字特征估计总体的数字特征
从数字特征反映的意义来看,可以分为反映中心位置数字特征(平均数、巾位数、众数)及反映离散程度数字特征(标准差、方差)两类。(1)平均数:各数据的平均值;(2)中位数:按从小到大的顺序排列,处于中问的数(或中间两数的平均数);(3)众数:在一组数据中出现次数最多的数(非次数);(4)标准差:样本数据到平均数的平均距离;(5)方差:标准差的平方。
要理解样本数字特征的意义,还要注意两点:(1)因样本选择具有随机性,故由样本数据所得的结论有可能不准确;(2)样本数据特征具有规律性,它随样本容量的增加而稳定于总体相应的数字特征(这个是一定的,不存在随机性)。
例2 甲乙两台机床同时生产一种零件,10天中,两台机床每天生产出的次品数分别如下。
甲:0 l 0 2 2 0 3 1 2 4
乙:2 3 1 1 0 2 1 1 0 1
分别计算这两组数据的平均数与标准差,从计算结果看.哪台机床的性能较好?
解:甲机床的平均数为1.5.标准差为1.2845;乙机床的平均数为1.2.标准差为0.8718。从计算结果可知乙机床的平均数小.且标准差也小,这说明乙机床生产出的次品数少,且性能稳定,所以乙机床的性能较好。
2.用样本的频率分布估计总体的频率分布
频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律。
频率分布表的优点在于数据明显,有利于对总体相应数据的计算与说明;频率分布折线图的优点在于数据的变化趋势直观,易于观察数据分布特征,且与总体分布的密度曲线关系密切;频率分布直方图可两者兼顾,但也有不足(数据不具体等)。频率分布折线图的优点是反映了数据的变化趋势。如果样本容量足够大,分组的组距足够小,则这条折线将趋近于一条曲线,称为总体分布的密度曲线。