例谈频数分布表的分组

2016-08-19 09:27张青云
初中生世界 2016年14期
关键词:组数条形极差

张青云



例谈频数分布表的分组

张青云

在进行数据统计时,有时需要列出数据的频数分布表,或是以条形统计图直观地呈现频数分布情况,这些都涉及对数据进行分组的问题.数据分组的实质就是将数据分类,关键在于不重不漏.出于降低问题难度的目的,有时对数据已预先确定好组距及组数,但这个组距及组数是如何确定出来的,很多同学仍认识模糊.下面以苏教版教材八年级下册第24页习题第2题为例,对此进行分析说明.

问题:小丽调查了她所在班级50名同学的身高,结果如下(单位:cm):

一、分组的第一步:计算数据的极差

找出样本数据中的最大值与最小值,求它们的差.比如该问题的极差是:172-141=31.

二、第二步:决定组距与组数

组距是指各组的边界值之差.比如有一组显示为4.0≤x<4.3,则组距就是0.3.通常在研究频数分布时,采用的都是等距分组,即每一组的边界值之差相等,其原因也是为了使后面画的频数分布直方图更直观.在频数分布直方图中,每一小组对应一个长方形,并以小长方形面积的大小来表示各小组内取值的频率.容易知道,条形长方形的面积=组距×条形的高,所以,在组距相同的情况下,条形的高可以直接与小组的频数相对应.频数越大,条形越高;频数越小,条形越低.

组距如何定?组距×组数≥极差.通常一组样本容量在100左右的数据,其组数适宜在7~12.比如:如果组距定为3,31÷3,那组数就定为11组;如果组距定为4,31÷4,那组数就定为8组;如果组距定为5,31÷5,那组数就定为7.具体选哪一种,要依问题的实际要求来定.本题样本容量是50,组距可以为4或5.

三、分组确定各组的边界值

有两种确定方法:一是直接从最小(或最大)值开始,每一组以a≤x<b(或a<x≤b)的形式呈现,比如,如果组距取5,则可这样来列频数分布表.

另一种方式,是以比样本数据精确度更高一位的a<x<b形式呈现各小组.比如问题中各数据是精确到个位,那么就可以用

精确到十分位的边界值来列频数分布表.

也可以以组距为4,采用上述两种方式来列频数分布表,读者可自行完成.当频数分布表完成后,画频数分布直方图就很容易了.

在教材第28页第2题,已经给定组距为5,教材第34页第8题要求更高,需要自行决定组数与组距,通过阅读本文,大家可以再次研究这两道题目.

(作者单位:广东省东莞市东莞中学松山湖学校)

猜你喜欢
组数条形极差
各式各样的复式条形统计图
条形铁皮自动折边机构设计
二次函数极差的规律与应用
一类求不定方程正整数解的组数问题的解法及推广
在分位数回归中结构突变的经验极差检验
某沿海电厂全封闭条形煤场和圆形煤场的技术和经济性比较
无痛胃镜下取出巨大条形异物1例
方差中亟待澄清的两个错误观点
南,兼寄屈原
基于高频数据的赋权已实现极差β估计量的构建