戴 婷
(湖南工程学院 理学院,湖南 湘潭 411104)
数学建模思想在回归分析中的应用
戴 婷
(湖南工程学院 理学院,湖南 湘潭 411104)
以应用回归分析课程为例,探讨了数学建模思想和统计学专业教学之间的关系.把数学建模融入统计学专业教学,是培养学生应用能力的有效途径,也是我们当前统计专业教学教改的一个方向.
回归分析;数学建模;实践
统计学是门独立的应用型学科.在我国统计学专业的发展仅有二十余年的历史,曾有过社会统计与数理统计的分歧.就统计教学来说,既要打好坚实的理论基础,也要把学科的应用特色体现出来.以往的统计学教学注重理论方法的教授,而在实际应用上略显薄弱.学生在课后只会解答简单的习题,不能应用到实际的案例当中,不能将所学知识活学活用.这违背了学校培养应用型人才的办学宗旨.近年来,我们针对这一情况将数学建模思想引入统计学专业教学,将理论方法通过实践教学的途径转化为实际应用能力.下面就以应用回归分析这门课程为例,谈谈如何把数学建模思想融入专业教学,如何提高学生的应用能力.
回归是19世纪的英国科学家高尔顿首次提出的.1870年,他在分析父代与子代的身高问题时,通过数据调查并整理,发现无论父代身高高或矮,子代身高都有趋向平均身高的趋势,他把这种现象称做回归.而后回归分析逐渐发展并成为现代统计重要的基础方法.这门课程也是统计学专业一门重要的基础课.经典回归分析的基础理论分为最小二乘法、违背假设的情况、自变量的选择和多重共线性四个部分.在课堂上,学生能够掌握回归方程的求解,却往往不清楚回归模型的建立的适用条件.在解题过程中,学生能够按照要求顺利的求解回归方程,也能够得到检验结果,但不能解释回归系数的含义,甚至在面对数据时并不知运用何种方法建模求解.对数据本身特点和结构不敏感,不能自主的提出模型并解之.
统计学一般隶属于理学院,因而统计学专业的学生经常以数学思维看待问题,也就是任何问题只有一个最优解或唯一解.但统计和数学思维不同,问题的解决方案并不唯一,任何能够解决问题的方案都是可行的.对问题有充分认识,方能在不同模型之中找到最优的解决方法.
二十世纪八十年代美国兴起的大学生数学建模比赛,让人们看到了数学与应用学科之间紧密的联系.我国也于二十世纪九十年代引入了该比赛,旨在激发我国学生对数学的热爱和兴趣,培养学生的实践应用能力.数学建模不同于课堂上学生单纯接受知识.在数学建模的过程中,学生面对出题者给出的实际问题及数据,要根据题目本身的专业背景,结合数学知识,给出基本假设,设计解决方案并解之.通常需要来自不同专业的学生相互合作才能圆满完成.整个过程对学生的知识运用能力进行考察,需要有全局意识,能够找到实际问题与所学知识的契合点,查找参考文献弄清问题本质,下手设计解决方案.建模的方法是千秋各异的,用到的知识也可能不同,只要能合理的解决问题,就视为建模成功.这也正是数学建模的魅力所在.这种方式能够开拓思维,打开视野,积极寻找解决问题的方案,是理论应用实践的好途径.这种思维模式对学生的锻炼是很有好处的,是把所学知识活学活用的好方法.
近几年来,数学建模和海量数据结合得越来越紧密.越来越多的统计学专业学生加入到建模队伍中来.例如2007年的A题,中国人口增长预测,在题中给出了大量数据,涉及到抽样技术,数据整理,数据信息提炼等基本统计方法,还可运用统计模型对其进行建模,进行预测分析.再如2008年的B题,高等教育学费标准探讨.参赛者的成功方案之一就是收集数据,对近年来的数据分析,建立指标体系,运用多元统计方法建模,并给出学费标准方案.
海量数据是现在科技发展的一种重要媒介.以往在非计算机时代,数据量较小,科学家对技术的研究偏重理论方面,构建的也是理论模型.而今随着计算机的高速发展,数据的处理变得便捷,通过对相关数据的分析找到事物发展的内在规律是一种行之有效的方法.因此数据的处理变得尤为重要.在统计教学中,不仅要抓好理论学习,数据的处理等实践方面愈显重要,而数学建模提供了这样的平台.
基本假设是统计模型和数学建模的首要问题,没有基本假设就无法将一个实际问题投射到一个理论模型上去,基本假设是建模的前提,它的合理性关乎模型的合理性.回归分析模型是成熟的模型,基本假设是课堂上首要介绍的内容,而其中最重要的就是对随机误差iε的假设.假设iε是等方差不相关的,以0为均值.但随机误差是什么?为何如此重要?下面以火灾损失为例.
表1 火灾损失表
表1是一份火灾损失的有关数据.学生见到数据,能够判断出火灾损失和据消防站距离是成正比的,却不能得出基本假设的必要性也不能理解假设和实例的关系,我们采用图形进一步展示.
图1
图1中的散点是根据表1的实际测量数据绘制的二维图.我们根据统计理论得出x和y具有线性依存关系的结论,x是因,y是果.y的大小主要由x的值控制.将这种客观的内在关系用图中的实直线来表示,这条直线目前是未知的.直线关系是客观存在的内在规律,但学生发现实际数据并不能每次恰好分布在直线上.是否弄错了它们的线性关系呢?我们可以提问,若线性关系为真,误差是如何出现的?由于各种随机的偶然误差,例如发车的快慢,风力的大小等这些条件并不相同,会出现图1中实际数据偏离直线的结果.我们把这些非决定性因素造成的偏差统称为随机误差iε,根据这些因素的概率特性,我们合理的假设它的统计性质,即等方差不相关的假设.
通过这样的分析,学生对这个问题有了深刻的认识,也了解到基本假设合理的重要性.
有了基本假设之后,是建模及其求解.从以上的分析我们假定x和y的线性关系即上图的直线是理论上客观存在的,那么这条直线y=ax+b就是我们要找的模型.问题的焦点集中在系数a和b的求解上.这时可以引导学生思考,这样的直线是唯一的吗?如何才能合理的找到最佳的一条直线?随后可简单介绍一下误差控制思想或者方差思想在统计学中的重要性,自然的我们就能得出可以以达到最小误差为控制条件来确定最优的直线方程了.再经过一些技术上的处理,最小二乘法的思想被引出来:
模型的验证在建模过程中至关重要.没有验证就无法证明模型的可靠性稳定性.统计方法和数学建模在这个问题上的认识是一致的.就上例,验证的内容分为几个方面:基本假设是否满足;数据的拟合是否理想;模型本身和两个系数是否能在实际应用中得到解释等.这些涉及到统计中的检验思想,可以以概率论中的假设检验为切入点详细叙述.
通过举例可以看到数学建模与统计方法的构建基本上程序是一致的,因为数学建模和统计方法都是知识的应用过程.数学建模是直面问题,学生自己按照问题的性质提出假设,建立模型,求解模型和检验模型.而统计方法也是这么一个过程,不过统计方法是已成的方法,我们需要的是向学生展示这个过程.因此,在统计教学上,可以预先简单介绍数学建模的思想及过程,举些简单直观的案例加强理解.有条件的话也可开设这门课程.在统计专业中,以启发式教学为主,以数学建模的思路探究统计方法,搭建一座联系理论和实际应用的桥梁.
我们在文化素质选修课中开设数学建模课程,并针对统计学专业学生进行数学建模的培训课程,激发了学生解决实际问题的兴趣和积极性.另外一方面,鼓励学生参加数学建模大赛.由于数学建模思维的自由,方法的灵活多变,学生的创新能力得到了提高,在比赛过程中得到了很好的锻炼,也取得了一些成绩.
数学建模在锻炼学生理论应用实践方面起到了启发作用,也是培养学生对统计方法理论的理解和掌握,并能自主建模解决问题的良好途径.在教学过程中,培养建模的思维方式,强化理论与实际的联系,能够学以致用,这才是我们教学的目标.
[1]方开泰.统计教育的改革与信息化[A].大学数学课程报告论坛论文集,2009
[2]谭永基.将数学建模思想融入通识教育数学核心课程[A].大学数学课程报告论坛论文集,2008
[3]肖桃凤,罗菊兰,柳 毅.应用型统计人才培养教育的新模式[J].统计与决策,2006,(7):50~51
[4]师振华.统计学案例教学研究初探[J].山西统计,2002,(5):10~11
[5]李金昌.关于统计学专业本科教学的几点思考[J].统计教育,2005,(5):4~6
The Application of Mathematical Modeling in Regression Analysis
DAI Ting
(College of Mathematics and Physics,Hunan Institute of Engineering,Xiangtan 411104,China)
Taking Applied Regression Analysis as a case,this paper researches the relationship between the idea of mathematical modeling and statistical course.It is an effective way to train students' ability to practice that let the idea of mathematical modeling integrate into statistical course,which is also a direction of teaching reform on our current statistical course.
regression analysis;mathematical modeling;practice
G642.4
A
1672-5298(2011)01-0086-03
2010-10-12
戴 婷(1983- ),女,湖南茶陵人,湖南工程学院理学院讲师.主要研究方向:应用统计