大数据背景下数学建模教学改革的思考

2018-07-29 10:33於遒郭海兵
江苏教育研究 2018年15期
关键词:数学建模数据挖掘大数据

於遒 郭海兵

摘要:大数据的五V特征对数学建模教学产生新的冲击,这表现在课程目标、课程内容、教学手段等方面。面对样本数据收集的信息化、自动化、全样本和大数据化,课程应更加侧重于发现海量数据下各种关联细节的相关分析能力的培养;在教学内容上,应增加反映兼顾大数据和信息技术特点的数据挖掘内容和环节;在教学手段上,数学软件的应用及编程能力的强化应成为数学建模必不可少的手段之一。

关键词:数学建模;大数据;全样本;数据挖掘;编程能力

中图分类号:G712 文献标志码:A 文章编号:1673-9094-(2018)05C-0074-03

随着新技术和新应用带动数据爆发式的增长,大数据正逐步走进人们生活,并对传统数学建模课程产生深刻的影响。近年来,在美国大学生数学建模大赛中,具有显著大数据特征的赛题不断涌现,以2017年A赛题为例,其关于赞比西河管理问题的解决涉及大量非结构化数据,特别是地理数据,对数学建模能力的考核已经不再表现为分析问题能力和数据执行能力的获取,而是上述两种能力的合取。2018年大赛甚至系统性地专门增加一个数据处理题以反映时代对这方面的要求。因此,在数学建模教学中,任何割裂分析问题能力与数据执行能力联系的做法已经无法应对大数据对数学建模能力提出的挑战。具体到教学改革上,需要我们分析好大数据型问题对数学建模课程的影响,对传统数学建模的课程目标、课程内容、教学手段做出相应调整。

一、构建体现大数据特点的数学建模课程目标

课程目标是教学活动的指导思想,是课程设计的出发点和依托。因此,数学建模课程目标应顺应大数据发展的要求进行相应调整,为构建与大数据处理相适应的,新的课程观、课程目标、课程内容、课程结构和课程活动方式奠定基础。

数学建模的主要目的是培养学生应用数学理论和知识解决实际问题的能力,而应用好数学解决问题的前提是建模时首先能正确地面对数据类型和关系,进行合理假设。人们在自觉和非自觉状态下创造的大量非结构化数据和半结构化大数据,它们有些表现为传统的数、表等结构化特征,有些则表现为诸如文本数据、音频数据和视频数据等现代非结构化数据和半结构化数据,多且杂乱。因此,在数学建模课程目标的设定上首先应体现数据结构的特点对调整数学建模课程目标提出的要求。

大数据具有5V特征,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。如,智能制造中设备产生的数据流实时、高速,这些高速数据通过通讯网络快速与控制系统链接,数据流数量级的计算加速大幅提升数据处理与分析的效率,使得机器硬件性能得以充分挖掘,进而提升经营与管理的效益;其他如医学扫描数据、天文数据、网站流量等,其具有低价值密度的特点。这些不同于以往数据的特征要求我们需要有新的数学建模课程目标与之匹配,这主要表现在数据观、数据刻画及数据表现等几个方面。

传统数学建模中,数据收集只能通过随机样本,利用少数的特征对总体的属性进行统计推断。在大数据时代,人们可以通过互联网、即时通讯工具以及数据库,获取各种海量数据。因此,大数据背景下,全数据或海量数据成为样本数据,即样本就是总体,样本就是大数据。

面对这样的全样本或海量数据,随机抽样有时仅表现为一种逻辑上的意义。而在大数据背景下,一方面,數据收集过分地依赖技术手段,很难进行人为的精度控制;另一方面,数据无论在空间和时间方面,来源更加复杂,格式更加多样,这就使得数据的前期清洗处理变得非常困难。由于存在系统性的偏差,很难将全部的杂质项从数据中萃取掉,在秉持“数据多比少好”的情况下,就得接受数据混乱和不确定性的代价。当然,在大数据中,忽略一部分模型的精确性,并不是说不要模型的精确性,而是指我们对于模型精确性的可控性在减弱。所以,新的数学建模分析应更加侧重于发现海量数据下的各种关联细节,这可以成为数学建模逻辑思维能力培养新的补充目标,从而使我们在知识与技能、过程与方法等维度上把握好该课程的教学。

随着数据通讯技术,尤其是移动智能设备的普及发展,人们可以在任何时间和地点发布信息和获取数据,数据的实时分析成为提高大数据分析效率的必由之路。与传统数据相比,数据不再局限于一条条记录,伴随着大量由物联网、传感器等产生的图片、视频等非结构化数据的产生,实时分析需要学生掌握新的数据挖掘技术,并以集群、分割、孤立点分析及其他算法深入数据内部挖掘价值,从而实现处理数据量和处理数据速度的统一。

此外,数据仓库、联机分析和数据挖掘技术的不断完善,推动着数据以图形和图像等可视化方式的执行,[1]展示数据、理解数据、演绎数据呼唤数据的可视化;从直方图到网状图,从三维地图到动态模拟,从动画技术到虚拟现实,枯燥乏味的数据生动形象起来,爆炸性数据压缩起来,这对于数学建模的数据输出提出新挑战。

二、构建兼顾大数据和信息技术特点的数学建模课程内容

数学建模本质上是一种数学实验,人们在实验、观察和分析的基础上,对实际问题的主要方面做出合理的假设和简化,明确变量和参数,应用数学语言和方法,形成一个明确的数学问题,然后用数学或计算的方法精确或近似地求解该数学问题,进而检验结果是否能说明实际问题的主要现象,能否进行预测。这样的过程多次反复进行,直到能较好地解决问题,这就是数学建模的全过程。

大数据的处理也有自身的步骤,一般来说可以分为6个不同阶段:(1)存储管理阶段,它实现了多维数据的联机分析;(2)数据仓库阶段,它解决数据整合集成问题;(3)联机分析阶段,它实现数据存储管理和快速组织;(4)数据挖掘阶段,它实现探索性分析,发现数据背后模式和有用信息;(5)辅助决策阶段,它综合运用数据仓库、联机分析和数据挖掘,实现结果;(6)大数据分析,它实现非结构化数据、海量数据、实时数据的分析。

因此,面對大数据,如何实现上述两者的有机融合,必然需要注意新数学建模各阶段表现出的新的特点,如在实验、观察阶段,样本数据收集的信息化与自动化,海量信息和全样本数据成为分析常态。在问题的数学刻画阶段,相关分析可以作为进行模型分析之前数据探索的一个手段,这是因为由于数据的结构复杂,变量众多,数据体量大,有时候很难用一个“普世”函数描述出变量之间的准确关系,在无法综合评价出变量之间关系的情况下,我们可以部分揭示出变量之间的关系。事实上,由于相关分析无需太多模型假设,运算成本较低等众多原因,使得相关关系的分析成为了大数据分析的基础。[2]在模型验证阶段,以数据为中心的非普世和精确化的数学模型往往可以得到海量信息和全样本数据的支撑等。

因此,在数学建模课程内容架构中,应兼顾大数据和信息技术的特点,逐渐改变数据挖掘技术在数学建模教学上辅助性的作用,将有关计算机和信息技术的教学很好地落实到课程计划、课程标准和教科书中。如在教学中,可以增加通过“网络爬虫”程序直接抓取互联网数据的内容;从传感器、云端直接获取智能制造中现实数据的方法;将并行处理数据的思想引入建模教学;加强相关分析的内容教学等。所有这些可以让计算机的数据采集能力和数据处理能力成为变量间逻辑关系探索、复杂模型构建的有力工具,推动人们对数学建模的认知。

三、强化数学建模中的软件教学

首先,强化数学软件的教学。常见的数学软件有Matlab、Mathematica,Lingo,SAS、SPSS、Eview、

R、Python等,它为计算机解决现代科学技术各领域中所提出的数学问题提供求解手段。

其次,加强数学算法的介绍。常见的数学算法包括运筹学类的算法、概率分析与随机算法、时间序列算法等,其他的如十大经典算法等。

另外,对于以往建模中的数据处理,人们更习惯运用SPSS、Eview等这类封装好的、以体验式为主的方式进行,然而,相比于机械的拖拽软件分析数据,编程分析更加灵活,因为,编程使数据处理无论在体量上,还是在方式的灵活度上,更有利于激发数据分析者的主动性和创造性,因此,能够驾驭软件编程的教学应是更高的数学建模课程的要求。

当然,大数据处理也还有其他特殊的技术,如大规模并行处理数据库、分布式文件系统、分布式数据库、虚拟化和内存计算等,其中,大规模并行数据处理运用的hadoop技术,内存计算的hana工作原理等在教学过程需要予以关注。

数学建模中软件工具部分是发展极为迅速的领域,从实际教学活动看,一般数学建模课程因为教学时数少,大数据意识薄弱,使得教学内容面临着较为陈旧的尴尬,数学软件教学明显滞后于数学软件发展的水平。这需要我们在教学过程中注意强调这部分内容的前沿性,以便更好地契合该课程建设的需要。

总而言之,大数据时代对数学建模教学的影响是多方面的,现代信息技术使得样本数据的收集实现了信息化、自动化、全样本和大数据化;面对数据结构复杂,变量众多,数据体量大的新情况,相关分析逐步取代精确模型的分析,成为模型分析之前数据探索的一个重要手段;在数据处理中,数学软件的应用及编程能力的强化应成为数学建模必不可少的手段,所有这些都改变着数学建模的课程观,使我们在未来数学建模中兼顾好数学理论和信息技术的平衡。

参考文献:

[1]裴光亚.大数据:教学研究的曙光[J].中学数学教学参考,2017(13).

[2]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.

责任编辑:陈向阳

A Reflection on the Teaching Reform of Mathematical

Modeling under the Background of Big Data

YU Qiu & GUO Haibing

(Huaihai Institute of Technology, Lianyungang 222005, Jiangsu Province)

Abstract: The five V features of big data have a new impact on the teaching of mathematical modeling, which is reflected in the aspects of curriculum objectives, curriculum contents, teaching methods and so on. In the face of information, automation, full sample and big data of sample data collection, the curriculum should focus more on the cultivation of relevant analysis ability of various related details under mass data; the data mining contents and links should be increased with the reflection of the characteristics of big data and information technology; and the application of mathematical software and the enhancement of programming ability should become one of the essential means of mathematical modeling.

Key words: mathematical modeling; big data; full sample; data mining; programming ability

猜你喜欢
数学建模数据挖掘大数据
数据挖掘综述
软件工程领域中的异常数据挖掘算法
数学建模中创造性思维的培养
树立建模意识 培养学生创新思维
最小二乘法基本思想及其应用
建模思想在数学教学中的渗透研究
基于大数据背景下的智慧城市建设研究
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书