黄润华
摘 要:本节课是统计思想方法在实际生活中的典型应用案例. 结合两个变量之间线性相关的具体实例,经历统计活动,理解最小二乘原理,利用计算器和Excel软件进行数据处理,建立一元线性回归模型,从而进行实际预测,解决实际问题. 了解利用回归直线刻画两个变量之间相关关系的代表性,理解回归直线必过样本点的中心,并能对统计活动结果进行反思.
关键词:线性回归;统计应用;数学建模;数据处理
一、内容和内容解析
1. 内容
结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
2. 内容解析
“一元线性回归模型”是北师大版《普通高中课程标准实验教科书·数学3(必修)》(以下统称“教材”)第一章“统计”第8节的内容,是统计思想方法在实际生活中的典型应用案例. 在此之前学生学习了数据的统计特征,在实际中经常要研究变量之间的相关关系,以最基本的一元线性回归为载体,通过画散点图描述两个变量之间关系的统计特征,用样本的情况去估计总体的情况,启发学生理解拟合思想,尝试构造函数模型去近似刻画变量之间的相关关系,有利于进一步发展学生的统计观念,培养学生的统计应用意识和能力,也为后面进一步学习独立性检验奠定基础. 本节课的教学重点为经历一次完整的统计应用活动,会画散点图直观表示两个变量之间的相关关系,理解直线拟合的思想,理解最小二乘原理,会利用计算器和Excel软件进行数据处理,会根据最小二乘法建立一元线性回归模型解决实际问题.
教材从身高与右手一拃长的相关关系研究出发,通过画散点图,观察发现所有点都在一条直线附近波动,进而判断两个变量之间线性相关,从而可以用一条直线近似刻画两个变量之间的相关关系. 引入直线拟合的概念,然后思考如何确定这条直线能更合理地近似刻画这种关系. 采取小组讨论的方式,引导学生从定性到定量,建立一种数学上的“理想”的拟合方式,即考虑如何使得所有样本点到一条直线的“整体距离”最小,从而引入最小二乘法,建立一元线性回归模型. 会利用信息技术求出两个变量之间的线性回归方程,从而对实际问题进行预判和决策.
为了创设有利于学习的实际问题情境,本节课选取中央电视台社会与法频道《见证》栏目《神眼追踪》中足迹鉴定专家神奇破案的真实案例片断导入课题,通过思考怎样根据足迹推断犯罪嫌疑人的身高引出身高与鞋码有相关关系,引导学生经历一个完整的统计活动过程,探究身高与鞋码之间的相关关系. 通过从学生中现场收集数据、整理数据,利用散点图描述数据、分析数据(直线拟合,探索回归直线方程的求法),运用最小二乘法刻画数据特征求得回归直线方程,对实际问题进行预测,对统计结果分析与反思等环节,理解统计应用的思路与过程. 在由散点图得到两个变量之间线性相关的基础上,着力探讨如何确定一条直线来更好地近似刻画这种关系,进行直线拟合. 通过小组讨论与交流,引导学生从定性分析到定量计算,建立一種数学上的“理想”的拟合方式,即考虑如何使得所有样本点到一条直线的“整体距离”最小,从而引入最小二乘法建立一元线性回归模型. 引导学生理解任一样本点[xi,yi]与直线上横坐标为[xi]的点之间的距离是刻画点到直线的远近的一种新的形式,其平方同样可以近似刻画点到直线的远近,从便于运算的角度我们选择平方,最小二乘法的基本思想即使所有样本点到直线的“距离”的平方和最小. 从而,如果能判断两个变量之间具有线性相关关系,就能利用最小二乘法求出两个变量之间的线性回归方程,从而进行预判决策.
本节课旨在建立一种统计模型来近似刻画实际问题中两个变量之间的关系,在问题解决的过程中发展学生的统计观念,理解数据分析的新思路和新方法,理解方法中蕴涵的数学思想,理解方法的目的和本质,体会统计模型的必要性和合理性. 引导学生陷入机械、烦琐的公式计算中,从数据处理的角度思考如何避免繁杂的运算,认识到根据最小二乘法的思想和公式研发程序是源于生产生活实际需要,有其必然性,把握数据处理的思路,注重与信息技术的融合,对于提高学生的信息素养、进一步发展学生的统计观念、培养学生数据分析和数学建模等核心素养都起着非常重要的作用.
二、目标和目标解析
1. 目标
以发展学生的统计观念为核心,践行“四基”、发展“四能”,在问题解决中着重培养学生数据分析和数学建模等素养,根据《普通高中数学课程标准(2017年版)》(以下简称《标准》)中“一元线性回归模型”的内容及要求,确定本节课的教学目标如下.
(1)经历完整的统计活动过程,进一步体会应用统计的思想和方法解决实际问题.
(2)会画散点图判断两个变量之间是否线性相关,理解数据分析的思路和方法.
(3)掌握用最小二乘法建立一元线性回归模型刻画两个变量之间的线性相关关系的方法.
(4)会用计算器和Excel软件求线性回归方程,并能根据一元线性回归模型进行预测.
(5)理解一元线性回归模型参数的含义和统计结果的意义,会进行反思.
2. 目标解析
目标(1)解析:本节课是统计应用案例,通过对实际问题中两个变量之间相关关系的研究,经历对两个变量间呈现一个大致的整体集中趋势的近似刻画的过程,开拓统计应用的新天地,进一步培养学生的统计应用意识.
目标(2)解析:通过画散点图,类比函数图象可以看出两个变量之间的大致关系,并判断它们之间是否线性相关,探索发现数据处理的新思路和新方法.
目标(3)解析:通过分组讨论和思考交流,了解直线拟合的思想,理解最小二乘法是一种方便可行、直观美妙的方法,从而建立一元线性回归模型.
目标(4)解析:理解运用信息技术进行数据处理的必要性,并学会利用计算器和Excel软件求线性回归方程,理解程序背后的数学思想与方法. 能根据一元线性回归模型完成计算预测,从而解决实际问题.
目标(5)解析:数学源于生活,又服务于生活. 结合实际理解一元线性回归模型的含义和统计结果的意义. 通过对统计活动各环节的反思,逐渐理解问卷的设计、样本的选取、分析方法的运用都会对统计结果产生影响,引导学生理解对统计结果保持批判性态度的必要性和重要性.
三、教学问题诊断
在义务教育阶段,学生初步建立了统计观念,了解了统计活动的全过程,学习了数据收集、整理、描述和分析的基本方法. 在高中阶段,学生通过统计的学习进一步发展了统计观念,能较好地把握数据分析的基本思路,对统计的基本思想与应用有了更加深刻的体会.
学生不知道应该怎样刻画两个变量之间的相关关系. 尽管经过初中的学习,学生已经具备了比较丰富的函数知识,知道了函数可以刻画两个变量之间的一种确定性关系,但是对不满足函数关系的两个變量要怎么处理会感到困难. 要引导学生理解相关关系的本质是一个变量可能受到其他多个变量的影响,故它的值会呈现一定的随机性或者波动性,这种波动在大量数据中往往会呈现一定的规律性,这就是回归分析要解决的问题. 对两个变量之间相关关系的刻画,本质上是利用函数模型进行近似刻画,蕴涵着转化与化归思想. 在画出散点图后,引导学生观察、刻画两个变量之间关系的统计特征.
在给出线性相关的基础上,到底用哪条直线近似刻画更好,学生感到很茫然. 故而采取分组讨论的方式,先让学生自主尝试,彼此交流想法,体会回归的含义,画出直线,然后通过小组间的交流再去归纳共性,建立一定的“理想”标准——所有样本点和直线整体上最接近.
怎么刻画所有样本点和直线整体上最接近呢?这是一个很关键的问题,要引导学生理解在横坐标一定的情况下,样本点可以理解为在平均水平上下波动,从而建立一种新的标准来刻画点到直线的远近,即用任意一点[xi,yi]与这条直线上横坐标为[xi]的点之间的距离来刻画,而不是用数学上的距离来刻画. 不仅如此,绝对值还面临一个计算上的困难,而统计上在方差里已经用了平方和表示,这里的本质其实是一样的. 教学中采用对话教学法,启发学生进行知识迁移.
学生对系数计算公式的理解存在较大的困难. 根据最小二乘法推导出来的系数计算公式比较复杂,还包括两种不同形式的表达,直接运用公式计算需要分若干步,比较麻烦. 教学时引导学生逐步认识公式,分析公式结构的特点,帮助学生更好地了解公式,并逐步渗透研发程序计算的必要性,建立自然合理的教学逻辑,了解程序背后的思想方法.
利用计算器和Excel软件求线性回归方程属于新的技能,需要教师以适当的方式传授. 虽然学生具备了一定的计算机操作与计算器使用技能,但涉及利用最小二乘原理求系数的值,这需要学会使用计算器有关的统计功能. 为了使计算器操作程序直观化、效果有引领性,教师在课前录制“利用计算器求线性回归方程”的微课,课上播放微课传授新技能. 而对于利用Excel软件求线性回归方程,则根据其操作简单易学的特点,采取教师随堂操作演示的方式传授技能,并录制微视频供学生课后上机操作时使用,以调动学生的学习热情,辅助学生学习.
本节课的教学难点是理解直线拟合的必要性与合理性,掌握建立一元线性回归模型的一般原理. 为突破难点,设计了求线性回归方程的小组讨论活动和帮助小卖部决策等问题,在探究和交流中领会思想,提升统计应用的能力.
四、教学媒体设计
本节课思想性、整体性、应用性强,决定采用情境—启发式探究教学模式,创设有利于学生学习的环境,通过小组讨论与实践应用,引导学生理解拟合思想,培养学生的自主探究能力与合作交流能力,发展学生的统计观念,提高学生的数学应用意识. 为创设情境,更好地突出重点,突破难点,本节课主要进行了如下设计.
1. 导入使用真实案例
为了创设真实的问题情境,选取了中央电视台社会与法频道《见证》栏目的真实神探破案视频导入课题,围绕神探怎样由足迹推断出犯罪嫌疑人的身高这一核心问题,根据足迹提供的有关信息,导入身高与鞋码这两个变量之间的相关关系的研究.
2. 设计了画散点图的课堂活页
为了让学生亲自体会描点画图描述身高与鞋码之间的相关关系的过程,专门设计了一份课堂活页,内容为平面直角坐标系,横轴表示鞋码,纵轴表示身高,标示了相应的数值,便于学生描点. 展示学生作图成果,并在后面的小组讨论中继续使用,在黑板上张贴画回归直线的成果,表述作法,有效揭示了学生的思维过程.
3. Excel表格一表多用,无缝衔接
在现场收集数据时,由学生负责将样本数据逐一输入Excel表格中,运用信息技术将表格数据同步到描述数据环节和学生利用计算器根据现场数据计算线性回归方程、教师操作演示利用Excel软件求线性回归方程等环节,实现了数据的同步无缝应用,体现了信息技术的实用性.
4. 自主录制微课,传授技能
经过反复研究,为了便于学生学习如何利用计算器求线性回归方程,采取了自主录制微课的形式;为了辅助学生课后上机利用Excel软件求线性回归方程,也录制了一个微课,供学生自主学习使用,课堂上不播放.
5. 课件简洁优美
整节课共六个环节,仅使用10张幻灯片,节奏明快,界面简洁优美,既呈现了主要思路和内容,又做到了不同环节之间必要的无缝对接,信息技术融合应用恰当.
6. 板书简洁有条理
板书呈现了统计活动的主要过程和一元线性回归模型的基本原理,通过学生活动和小组活动成果的展示,能够引导学生更好地理解直线拟合的背景和一元线性回归模型的含义,便于学生从整体上把握整节课的学习.
五、教学过程设计
1. 创设情境,提出问题
(1)俗话说,三百六十行,行行出状元. 各行各业都有许多楷模. 他们是公安楷模,是人民的守护神. 下面我们来看一段公安神探破案的视频.
播放《见证》栏目《神眼追踪》中神探足迹鉴定专家神奇破案的真实案例片断.
(2)思考:神探根据足迹推断出了犯罪嫌疑人的身高,足迹能给我们提供什么信息呢?
(3)提出问题:它们之间的相关关系具体是怎样的?神探又是怎样推断的呢?
(4)导入课题:一元线性回归模型.
【设计意图】以真实案件视频片断导入课题,关注社会、设置悬念,从研究身高与鞋码之间的相关关系入手,也为后面反思身高与足迹之间的相关关系埋下伏笔.
2. 统计分析,探究交流
要研究两个变量之间的相关关系,根据统计学知识,我们首先应该做什么呢?
收集数据:现场收集[8]对鞋码与身高的数据,用Excel软件同步导入如表1所示的电子表格中.
通过观察表中数据,大体上可以发现,随着鞋码的增加,身高也在增加.
【設计意图】从在座学生中现场随机收集鞋码与身高的数据,使样本数据源自学生,让学生体验样本的随机性,理解样本的代表性.
描述数据:观察表中数据,大体上看,随着鞋码的增加,身高也在增加. 你会怎样来直观表示身高与鞋码之间的这种关系呢?
类比函数图象,描点画图. 不妨设鞋码为[x],身高为[y],得到[8]个数对[x1,y1, x2,y2,…, x8,y8],将它们对应的点描出来,所得到的图称为散点图.
学生在活页上的平面直角坐标系中画出散点图. 教师展示学生作图成果,张贴到黑板上,随即分析图形特点.
【设计意图】引导学生类比函数去认识身高与鞋码两个变量之间的相关关系,并亲自画散点图直观表示它们之间的相关关系,为数据分析作准备,了解拟合的背景.
分析数据:观察散点图,你有什么发现呢?
所有点看上去都在一条直线附近波动.
线性相关:如果散点图中所有点看上去都在一条直线附近波动,称变量间线性相关. 此时,可以用一条直线来近似刻画它们之间的关系,这样近似的过程称为直线拟合.
探究:怎样确定这条直线呢?你是怎么想的?在小组内交流,并画出这条直线.
教师展示小组讨论成果,汇报各自想法,分析不同想法的共同点.
【设计意图】设计确定回归直线的小组讨论活动,自主探究、交流讨论,加深对回归含义的感知,并尝试得出确定这条直线的方法.
3. 建立模型,理解原理
各小组做法虽然不同,但其实想法是一致的,都是希望所有点和这条直线尽可能接近,也就是整体距离最小,如何用数学的方法刻画呢?
【设计意图】根据《标准》的要求和课程安排,着重把握方法背后的数学思想方法,引导学生课后探讨使[Q]最小的系数[b,a]公式的推导过程,课堂上对公式进行详实分析,充分认识公式的结构,引导学生欣赏数学美. 同时,还分析得到回归直线过样本点的中心,了解回归直线的代表性.
4. 运行程序,计算预测
设置递进式问题串:(1)有了公式,下面是否可以动手计算系数[b,a]呢?(2)是否可以用计算器?(3)用计算器肯定可以轻松很多,但是如果有成千上万个数据呢?
随着信息技术的发展,根据最小二乘法的思想和公式研发程序进行数据处理成为必然.
【设计意图】从公式的理解到引导学生认识运用公式计算系数[b,a]的困难,感受使用计算器的必要性,再考虑到统计往往面对的是大量的数据处理工作,用计算器替代公式计算也是非常繁杂且易出错的,从而认识到研发程序的必要性,培养学生优化运算的思维.
利用计算器求回归方程(播放微课),先开启计算器,然后分如下三个步骤.
① 选择模式:按MODE键,进入模式选择,按[3],选择Reg回归,再按[1],选择Lin线性.
② 输入数据:按SHIFT键 + CLR + 1[=],清空统计存储器,再逐一输入收集的数据.
③ 计算统计变量,按SHIFT键,按数字键[2],就切换到了S-VAR功能,按两次方向键,选择[1],计算[a],同样操作,选择[2],计算[b].
具体参考操作步骤如下图所示.
学生两人一组,根据刚才的数据计算[a,b]的值.
学生报告操作结果.
【设计意图】为了便于传授利用计算器求值的技能,经过反复研究,确定由教师录制微课;为了突出程序思维,将利用计算器求值的技能分为三个步骤,易懂易学、方便操作.
利用Excel软件求回归方程.
如果有很多数据,怎么导入呢?需要一个个输入吗?教师操作演示,顺便验证大家刚才的操作结果. 具体步骤如下.
① 在Excel表格中选定表示鞋码与身高关系的散点图,在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.
② 单击“类型”标签,选定“趋势预测 / 回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.
③ 双击回归直线,弹出“趋势线格式”对话框. 单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的方程.
计算结果为什么是一样的呢?
用计算器和用Excel软件求回归方程本质上没有区别,都是根据最小二乘法的思想和公式计算. 不仅如此,标准统计软件SAS和SPSS也是根据最小二乘法的思想和公式求线性回归方程.
课后,教师让学生参考视频教程在计算机上操作实践.
有了回归方程,我们就知道了身高与鞋码的具体相关关系,并且可以根据鞋码预测身高. 例如,根据[42]码的鞋印预测身高大概是多少?即当[x=42]时,[y≈175.5].
【设计意图】从计算器到Excel软件,从微课传授技能到当堂操作演示,都是以教与学的需要为出发点和落脚点,引导学生分析计算器和计算机软件求线性回归方程的区别与联系,并介绍了标准的统计软件. 加强信息技术与统计内容的融合,启发学生思考如何从机械、烦琐的数据处理中解脱出来,培养程序化思维,发展学生的统计观念和信息素养. 配套使用Excel软件求回归方程的微视频教程,供学生上机操作时参考. 分析不同软件求回归方程的本质,渗透程序思想.
5. 分析反思,实际预测
下面我们利用全国统计数据预测一下鞋码为[42]码的人对应的身高.
比较两个预测的样本与结果,你有什么发现呢?
反思1:预测结果差异大吗?哪个结果会相对可靠呢?为什么?
反思2:事实上,视频中足迹专家的推断与实际非常吻合,他怎么能推断得这么准呢?如果只根据鞋码推断可靠吗?
鞋码是一元的,足迹是多元的,专家一般都是研究多元变量的影响进行推断的.
怎么进行多元回归分析呢?教师让感兴趣的学生课后思考.
【设计意图】统计是根据样本的情况估计总体情况,回归分析是通过函数模型近似刻画相关变量关系的统计方法. 设计分析反思活动,引导学生对统计结果的合理性进行必要的批判与质疑,从数学问题的结论再回归到生活实际,呼应本节课引入的真实问题情境,身高与鞋码之间是一元线性相关,而身高与足迹之间却是多元回归分析问题,将相关关系的思考延伸到课外,重视培养学生的统计思维和应用意识.
实际预测:线性回归能够帮助我们进行实际的预判决策.
学校旁边有个小卖部卖奶茶,根据表2中收集的数据,你能帮小卖部进行决策吗?看看气温是[6]℃时大概要准备多少杯奶茶.
解析:根据最小二乘原理,利用计算器求得回归方程为[y=-2.450 5x+147.48].
当[x=6]时,[y≈133].
所以气温是[6]℃时大概要准备[133]杯奶茶.
思考:系数[-2.450 5]的含义是什么?常数[147.48]呢?
气温每增加[1]℃,要准备的奶茶杯数大约减少[2.450 5]杯.
思考交流:通过刚才的预判决策过程,你有什么体会?
教师引导学生经历根据统计知识进行预判决策的过程,认识统计的意义和作用.
【设计意图】设计为小卖部决策的活动,将问题情境生活化,让学生真正经历正确建立一元线性回归模型解决实际问题的过程,把握一元线性回归分析的知识逻辑,深刻理解最小二乘原理,即只有在两个变量之间线性相关的基础上根据最小二乘法的思想和公式求出的回归方程才有具体的实际意义,才能进行有效的预判决策,并从中体会统计的作用.
6. 课堂总结,布置作业
通过这节课的学习,你有哪些收获呢?
首先,由学生小结本节课所学的内容,并交流学习体会.
【设计意图】通过学生总结的过程,把握统计活动的过程,理解数据分析的新思路和新方法,抓住几个关键点,深化对一元线性回归模型的理解和应用,突出数学的应用价值.
这节课,我们主要通过数据分析和数学建模,理解了直线拟合的基本思想和方法,会建立一元线性回归模型进行预判和决策.
然后,我们仿照民族英雄辛弃疾的《青玉案·元夕》填词一首《青玉案·回归》来总结这节课的主要内容:预判决策找思路,最小二乘来相助. 众里寻他千百度. 驀然回首,回归线过,样本中心处.
课后作业:小组统计活动. 课后以小组为单位,分工协作,自主选取生活中感兴趣的两个相关变量进行研究.
【设计意图】通过教师再总结,把握本节课的主要思路和学习目标,并根据辛弃疾的词填词,以直观有趣的形式概括这节课的主要内容,挖掘数学的育人价值.设置小组课题研究活动,引导学生关注生活,自主选择课题研究,能进一步加强合作交流,加强统计应用意识,丰富学生的数学活动经验.
参考文献:
[1]中华人民共和国教育部制定. 普通高中数学课程标准(2017年版)[M]. 北京:人民教育出版社,2018.
[2]王爽. 对“回归分析”的再认识[J]. 数学通报,2015,54(7):33-35.