倪 黎 茹 凯 安黔江
(铜仁学院大数据学院 554300)
2004年开始实施的《普通高中数学课程标准(实验)》,将“发展学生的数学应用意识”作为高中数学课程的十大基本理念之一,《普通高中数学课程标准(2017年版)》更是将“数学建模”“数据分析”列在六大数学学科核心素养之中[1].
教育部考试中心针对数学科研制了数据分析题:给出一些材料背景以及相关数据,要求考生自己读懂材料,获取信息,根据材料给出的情境、原理以及猜测等,自主分析数据,得出结论,并解决问题[2].承担这一考查功能的主要是概率统计解答题,命题背景往往源于社会生活的实际问题.而数学建模正是根据实际问题来建立数学模型,对数学模型进行求解,然后根据模型结果去解决实际问题.高考试题中的解答题可以看作是高度简化的数学建模问题,对解答题进行深入思考,以问题驱动为导向,又能一探数学建模的过程.
在1999年高考试题中,便出现了考查学生数学应用意识的“轧钢问题”[3].如何从解答题中挖掘潜在的数学建模思想方法,并将数学建模教学有机地融入于数学解答题教学中?下面以2018年高考数学全国卷Ⅱ理科第18题为例,做探究性地尝试.
下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
图1 高考原题题目图
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
本题以某地区的环境基础设施投资额(以下简称“投资额”)为研究对象,来源于社会实际问题,以时间为解释变量(自变量)、以投资额为预报变量(因变量),并给出了2000到2016年的年度投资额时间序列折线图,以及两个线性回归模型.要求利用给定模型预测未知的2018年的投资额,并结合折线图评价哪个预测值更可靠.
本题主要涉及折线图和回归分析的综合知识,考查从折线图及中提取信息、对回归模型的有效利用,从而合理分析与解决问题的能力.
观察得到时间变量t与年份的关系:记年份为x,则t=x-1999.于是,2018年对应的t值为19,分别代入两个回归模型,求得该地区2018年的投资额的两个预测值,从而解答了第一问.
观察折线图可将2000到2016年间投资额的增长可以分为三个阶段.第一个阶段,2000到2009年间,投资额增长较稳定,增幅较缓;第二个阶段,2009到2010年,投资额有明显的增加;第三个阶段,2010到2016年间,投资额增长仍趋于稳定,但增幅较第一阶段偏高.比较两个估计值的增幅情况,就能合理地选择出更可靠的预测值,从而解答了第二问.关于理由的说明,是开放式的,可发散思维,合理即可.
本题的具体解答可参见文献[4].
这是一道经典的数据分析类解答题,问题和模型都已给出,数据由统计图呈现,降低了题目难度,便于入手,增加学生学习自信心,弱化了对选取变量、处理数据、建立模型等能力的考察,只需要读懂材料,通过观察和计算就能解决问题.
这类数学解答题能很好地引导并锻炼学生的数学应用能力和应用意识,是一种“面对问题→分析问题→解决问题”的培养模式.学生面对的问题通常是简化后的问题,经过锻炼,可以循序渐进地提高难度,由“面对问题”转向“提出问题”.以“提出问题→分析问题→解决问题”的培养模式,让学生提出质疑,或教师向学生提出新问题,充分启发学生,以问题为驱动,将数学解答题中蕴含的数学建模思想方法挖掘出来.
问题1为什么将年份2000,…,2016对应改为时间变量1,…,17?是否会影响原来图表数据的规律?
意图探究数据处理背后的意义和原理.
这种做法将原始数据进行了简化处理,可以化简计算.这样做会不会导致原来图表数据的规律发生改变?从而使得新的数据规律并不能用于对原来数据的预测?为了便于理解,先做投资额y与时间变量t的折线图,见图2:
图2 某地区投资额折线图
对比图2与图1可知:对时间数据简化处理后,投资额的增长规律与原来完全一致,用新数据来预测,与原来数据预测效果也一致.图2可以看作是图1向左平移了1999个单位后所得,不会改变纵坐标的趋势走向.
问题2还有其他简化数据的处理方法吗?
意图在问题1的基础上,进一步探究和推广类似的数据处理方法.
问题3为什么要用两个模型分别来预测?
意图探究题目背后的意义和理论依据.
本题要求利用已给定的两个模型计算预测值,并对预测值的可靠性进行评价.预测值可靠性是模型的合理性与好坏的体现,只要能比较出两个模型的优劣,便能从根本上解释预测值的可靠性.
前面已经通过观察折线图,说明了第二个模型预测值更可靠.此外,由于数据中途发生过突变,所以,利用相近年度平稳的短期数据进行预测,效果也会优于波动的长期数据.
人教版高二《数学》选修1-2中,提出了“如何衡量模型的拟合效果”,并提供了一种检验方法,“可以用R2来刻画回归的效果”,计算公式是:
决定系数R2越接近于1,表示回归的效果越好.
问题1如果题目没有给出模型,怎么办?
意图探究建立什么模型、怎样建立模型的问题.
表1 某地区投资额回归模型计算表
续表
还可以用Excel做回归分析[6][7],计算机代替人工计算,直接建立投资额y与年份x的线性回归模型,关于模型改进可以参考前面的思路实现.另外,也可以查阅更多资料,建立其他数学模型.
问题2如果题目没有给出折线图,怎么办?
意图探究数据的整理与显示,也即整理数据的方法.
原始数据可能杂乱无章,要进行预测的关键是从数据中找到变化的规律,这就需要对数据进行整理.常用的方法是制作统计表和统计图.统计表能够集中而有序地表现数据信息,统计图能够将数据展示得更为生动而具体,便于直观地观察,进而能够正确而深刻地理解和运用统计数据[5].
本题通过数据或表格,容易观察出投资额在逐年递增,但无法由此做出科学而合理地预测,所以还需作图进一步揭示两者的内在关系.常用的统计图有柱形图、饼图、散点图、折线图等等.柱形图一般适用于分组数据,饼图主要反映比例性的数量特征.从数据中发现的逐年递增规律引导我们去寻找这两个变量之间的相关关系,而散点图正好可以实现.见图3:
图3 散点图及趋势曲线
由图3可以发现,这些散点大致在一条直线周围,并能看出投资额与年份有着正相关关系,由此认为,可以建立投资额y与年份x的线性回归模型.
另外,折线图主要显示随时间而变化的序列数据,适用于显示在相等时间间隔下的数据发展趋势,对本题数据更为恰当,更容易观察出2010到2016年间时间与投资额的强相关性,有利于改进模型.
问题3如果题目没有给出数据,怎么办?
意图探究收集什么数据、怎样收集数据的问题.
此时,题目可以简化为:请你合理地预测一下某地区2018年的环境基础设施投资额.
假设地区已知,接下来需要确定收集哪些数据,也就是根据问题设置指标变量变.目的是预测2018年的投资额,投资额显然是最重要的变量,需要收集往年的投资额数据,自然就得到了一个投资额的时间序列.如果这些数据还不足以分析出投资额的变化规律,可以查阅资料,进一步思考哪些因素有可能会影响投资额.比如经济的增长可能会影响到投资额的增加,2010年,中国成为全球第二大经济体,2009到2010年的经济增长率也比前后几年都高,是否与投资额在这时期的明显增加有联系呢?可以考虑GDP或当地人均GDP、当地人口总数、物价指数等等因素,从中选择主要因素作为指标变量,再收集数据用于分析问题. 当然,随着变量的增加,建立模型分析数据的复杂性也会相应增加.
通常可以采用直接观察法、采访法、实验调查法、网上调查法[5]等手段来收集数据.以上所提到的数据,都适合从网上获取,在中国统计数据库里就有中国环境年鉴、统计年鉴、世界银行等网站也有大量公开数据.
通过对以上问题的探究,从后往前看,能梳理出一条可以推广的应用数学模式:以具体问题为起点,设置指标变量、收集整理数据、构造理论模型、估计模型参数、运用和评价模型.
以2018年高考数学全国卷Ⅱ理科第18题为例,从题目本身和减少已知两个角度,通过“提出问题→分析问题→解决问题”模式,以问题驱动为导向,分别构造了思辨性的问题链1和问题链2,由浅入深、层层递进地启发学生,可以形成“根据研究的目的设置指标变量→收集、整理统计数据→确定理论回归模型的数学形式→模型参数的估计→模型的检验与修改→模型的运用(比如预测)”的逻辑顺序,而这正是建立实际问题回归模型的全过程[7].
将数学建模教学有机地融入于数学解答题教学中,可以让学生在不知不觉中体会到数学知识及数学思维的应用,也可以进一步培养学生对现实问题进行数学抽象、用数学语言表达问题、用数学方法构建模型解决问题的数学素养.