王亮亮
(北京教育考试院 100083)
从2015年开始,北京中考数学统计试题从题型结构、考查内容、设问方式等方面进行创新与改革的探索,引起了广大师生的关注.一方面,试题对考生统计方面的基础知识、类比与归纳能力、数据推断能力和统计思想等方面具有很高的要求;另一方面,试题背景新颖、内涵丰富、思想深刻,对考生具有很好的区分功能;再一方面,试题对初中数学统计部分的教学起到了引导作用.但通过调研听课发现,由于对试题了解的不够全面与深刻,很多教师在讲解时遇到了一些问题,如在实际问题中如何利用平均数、众数、中位数等统计量的统计意义进行数据推断.本文将以2016、2017年统计综合题为例,对近几年的统计综合题进行一次理论与实践的总结,与大家分享试题背后的思想和试题对教学的引导作用,希望能给一线教师提供一点经验.
准确把握《义务教育数学课程标准(2011年版)》对统计部分内容提出的本质性要求是改革实施的必要前提,也是了解试题背后意义的必要前提.
2011版课标指出:在统计教学中,设计有效的统计活动,使学生经历完整的统计过程,包括收集数据、整理数据、展示数据、从数据中提取信息,并利用这些信息解释实际问题.上面的描述反映出应关注的几个关键词:统计过程、数据、数据分析和数据推断,以及它们之间的关系:统计的目的是统计推断,统计的基础是数据,统计的核心是数据分析,而数据的分析是在解决实际问题的统计过程中完成的,也就是说统计过程是统计目的实现的方式.
统计目的的实现方式是统计过程,则在统计过程中就需要在统计思想的引领下,运用统计方法对数据进行分析.2011版课标指出:体会抽样的必要性,通过实例了解简单随机抽样;通过表格、折线图、趋势图等,感受随机现象的变化趋势;能计算中位数、众数、加权平均数、方差;能利用频数直方图解释数据中蕴含的信息;能解释统计结果,并根据结果作出简单的判断和预测……上述描述体现了统计的思维特征——非确定性思维和统计的基本思想——统计调查的思想、随机的思想、统计推断的思想和量化的思想.
2.2.1随机思想
统计的基本思想是随机思想,研究对象是随机现象.初中阶段注重通过表格、折线图等感悟随机现象的统计规律.数据的随机性是随机现象的直观体现.对数据随机性的统计规律的描述与刻画是随机现象的本质要求.
2.2.2统计调查思想
数据的收集源于调查.初中阶段侧重于抽样调查,根据样本推断总体.其中,样本估计总体的思想是基本思想.为保证统计结果的真实性,样本需随机,保证每个个体有相等的机会被抽到.通过样本的数字特征,估计、推算总体的数字特征,对总体进行可靠性推断.除抽样方法合理外,为使样本客观反映总体,需考虑样本容量大小.
2.2.3统计推断思想
统计推断是基于数据的.初中阶段主要是基于数据的推断性统计分析——利用样本数据推测总体情况.统计推断需从数据分析入手,分析、处理数据,挖掘、提炼数据,根据实际问题选择适当统计量,推出合理的统计结论.
2.2.4量化思想
统计规律从数据中发现,统计推断结论须用数据支撑.平均数、中位数、众数、方差等统计量都是统计推断量化的基础,既可以描述调查对象的趋势,也可以对不同总体进行比较.初中阶段,统计量化是定量与定性相结合,不能单纯停留在数据计算上,而是明确统计量的统计意义,利用统计量对统计对象进行剖析,进行统计推断.
2016年调查作业:了解你所住小区家庭5月份用气量情况.
小天、小东和小芸三位同学住在同一小区.该小区共有300户家庭,每户家庭人数在2~5之间,这300户家庭的平均人数约为3.4.
小天、小东和小芸各自对该小区家庭5月份用气量情况进行了抽样调查,将收集的数据进行了整理,绘制的统计表分别为表1、表2和表3.
表1 抽样调查小区4户家庭5月份用气量统计表 (单位:m3)
表2 抽样调查小区15户家庭5月份用气量统计表 (单位:m3)
表3 抽样调查小区15户家庭5月份用气量统计表 (单位:m3)
根据以上材料回答问题:
小天、小东和小芸三人中,哪一位同学抽样调查的数据能较好地反映出该小区家庭5月份用气量情况,并简要说明其他两位同学抽样调查的不足之处.
2017年某工厂甲、乙两个部门各有员工400人,为了解这两个部门员工的生产技能情况,进行了抽样调查,过程如下,请补充完整.
收集数据从甲、乙两个部门各随机抽取20名员工,进行了生产技能测试,测试成绩(百分制)如下:
甲7886748175768770759075798170748086698377乙9373888172819483778380817081737882807040
整理、描述数据按如下分数段整理、描述这两组样本数据:
人数成绩x部门40≤x≤4950≤x≤5960≤x≤6970≤x≤7980≤x≤8990≤x≤100甲0011171乙
(说明:成绩80分及以上为生产技能优秀,70~79分为生产技能良好,60~69分为生产技能合格,60分以下为生产技能不合格)
分析数据两组样本数据的平均数、中位数、众数如下表所示:
部门平均数中位数众数甲78.377.575乙7880.581
得出结论
a.估计乙部门生产技能优秀的员工人数为;
b.可以推断出部门员工的生产技能水平较高,理由为.(至少从两个不同的角度说明推断的合理性)
2016、2017年统计试题,以统计思想为引导,通过重现统计全过程,考查样本估计总体的思想,考查统计思维.但2016、2017年试题的侧重点又有所不同.2016年试题侧重考查简单随机抽样的过程,考查样本的代表性和样本容量的适合性,考查描述数据集中趋势的统计量平均数.2017年试题侧重考查整理、描述和分析数据,考查选用恰当的统计量,进行统计推断,并解释推断结果.
感悟统计思想、培养统计思维最有效的方式是亲身经历数据统计的全过程,进行样本数据的收集,才能对“怎么抽,如何抽,抽多少”有所感悟,才能对问题作出合理的解释.下面以2016年试题为例,进行详细的阐述.
2016年的试题是评价三位同学抽样调查的过程的合理性.
调查思想的体现.三位同学都是根据样本估计总体的思想,使用简单随机抽样的方法收集数据.抽样须考虑样本容量的适合性.该小区共有300户家庭,样本容量15适合,故小天抽样调查的样本容量过小.
随机思想的体现.根据简单随机抽样的基本原则“每一个个体都有相等的机会被抽到”,结合该小区每户家庭人数在2~5之间,故所抽取的样本中家庭户数须有2,3,4,5,所以小东抽样调查的样本的代表性不好.
量化思想的体现.平均数是刻画数据集中趋势的.该小区300户家庭的平均人数约为3.4,故所抽取的样本反映的数据集中趋势须与总体的集中趋势一致.通过定性分析发现,小东所抽样本的家庭的平均数人数小于3;通过定量计算发现,小东所抽样本的家庭的平均人数为2.87,进一步反映出小东抽样调查的样本不能反映总体的情况.
推断思想的体现.小芸所取的抽样本的容量为15,所抽取的样本中家庭户数为2,3,4,5,样本中家庭的平均人数为3.4.与小天和小东抽样调查的分析因素比较,小芸的抽样调查能较好地反映出该小区家庭5月份用气量情况.
统计推断是基于数据的.根据具体问题,提取数据,发现数据中蕴含的信息,有针对性的进行分析与选择,结合数据的意义,通过对数据进行推断、预测、推理,解决问题.下面以2017年试题为例,进行详细阐述.
数据直观层面.①按试题要求,对乙部门样本数据进行分段整理,这是数据的整理层面;②在整理过程中,发现乙部门样本数据中有一个极端值40,极端值会对数据的平均数有一定影响,会把乙部门平均数拉低,对数据有了直观的认识.
数据挖掘层面.对整理后的第一张表进行数据分析:表中给出了生产技能优秀、良好、合格、不合格的划分,甲部门样本中优秀率为40%,乙部门样本中优秀率为60%,可推断出乙部门的优秀率高于甲部门的优秀率,但是乙部门样本中的极端值40会拉低乙部门样本数据的平均成绩,并且甲部门样本数据中的合格率100%,乙部门样本数据的合格率95%.上述的数据分析,对甲、乙两个部门生产技能情况都有所指向,但还无法明确的判断出甲、乙两个部门的生产技能情况.
对第二张表进行数据分析:表中给出了平均数、中位数和众数三个统计量.①甲、乙两个部门样本数据的平均数分别为78和78.3,几乎没有差距,无法进一步判断甲、乙两个部门的生产技能情况;②乙部门样本数据的中位数为80.5,落在了生产技能水平优秀的范围内,根据中位数的统计意义,可以推断出乙部门至少有50%员工的生产技能水平优秀,而甲部门样本数据的中位数为77.5,落在了生产技能水平良好范围内,无法推断优秀人数;③再分析甲、乙两部门样本数据的众数发现,甲部门样本数据中的众数75小于中位数77.5,乙部门样本数据中的众数81大于80.5,根据众数的统计意义,甲部门样本数据集中于中位数77.5的左侧,乙部门样本数据集中于中位数80的右侧,并且是优秀,故可推断出甲部门大部分员工生产技能水平情况是良好,乙部门大部分员工生产技能水平情况是优秀.
数据推断层面.对于统计结论的推断,需要数据的支撑,不是单一角度数据支撑,而是多角度综合性数据的支撑.通过对数据信息的挖掘,结合对优秀率、中位数、众数等方面的分析,可以推断出乙部门员工的生产技能水平高于甲部门员工的生产技能水平.
本文以2016、2017年中考数学(北京卷)统计综合题为例,把2011版课标中统计部分的内容要求进行了一次理论性的总结,并详细阐述了近几年统计综合题的探索与改革方向,以及试题背后蕴含的统计思想.这次把理论与实践经验进行总结的主要目的是想对教学起到一定的引导作用,让一线更加了解试题的设计初衷,更能有效的引导教学,如有不当之处请批评指正.