罗冬梅
(1.安徽工业大学 数理科学与工程学院,安徽 马鞍山 243002;2.复旦大学,上海 200433)
自2012年美国奥巴马政府提出《大数据研究和发展计划》,全球的大数据产业开始如雨后春笋般蓬勃发展起来。越来越多的人们意识到,有数据就是有财富,怎么将数据中的“宝藏信息”挖掘出来,大数据产业人才是起着决定性作用。
与国际大数据领域的研究和应用发展现状相比,我国还处在起步阶段,存在着大数据产业人才储量小与企业所需人才紧缺的矛盾,供需严重不平衡。且目前大数据行业从业者中,大部分都是半路出家,较少有人受过系统化的专业培养和教育。因此,为大数据产业培养所需人才、为我国大数据产业的蓬勃发展输送新鲜血液就成为高校人才培养的一项重要任务。
随着现代科学技术尤其是计算机、网络信息、生物工程等技术的发展,大量的数据出现在不同的自然科学和人文科学领域,包括生物学、医学、信息技术、经济、金融、环境科学等,并以前所未有的速度产生和积累。大数据涵盖的数据量大,包罗万象,变化速度快,存在的形式多种多样。大数据资源已是与自然资源、人力资源一样重要的战略资源,成为促进经济增长的基本要素。因此,近年来兴起一门新的学科:数据科学。
数据科学主要以数学、统计学、计算机学与某一领域知识为理论基础,主要研究数据科学基础理论、数据处理、数据计算以及数据管理[1]。数据科学为人们决策判断提供信息服务。
信息与计算科学、数学与应用数学专业学生在大学四年里需要学习数学分析、高等代数、概率论与数理统计、常微分方程等一些数学专业基础课程,这些课程可以为数据科学的学习、为数据产业人才的培养打下扎实的数学基础;同时学习C语言、数据结构等计算机基础课程,并选修统计应用软件、数据分析、数据挖掘以及图像处理等统计应用课程,这些课程可以保证数据科学人才的计算机和应用统计方面的知识储备。因此在我校信息与计算科学、数学与应用数学两个专业开展数据科学人才培养机制的创新研究具备一定的研究条件和基础。
但由于这两个专业的专业课难度大、任务重,学生学习起来比较吃力,且数据科学相关课程要求学生具备一定的数学和计算机基础。因此在执行培养计划时会出现如下问题:
一是学生在大一大二的时候疲于应付繁重的专业课的同时,会有疑问:“学这么多,这么累,数学课程作用体现在哪里?”从而出现消极、逃避甚至转专业的想法。
二是数据分析与数据挖掘领域有很多国内国际的建模竞赛,如果等到学生大三所有课程学完再参加竞赛,那么学生参与比赛的机会将会大大减少。
三是概率论与应用统计的课程一般到大三下学期才能开设,这个时候学生已经开始关注就业和考研,很难静下心去学习。从而导致相关课程的教学效果远远比不上低年级开设的教学效果。
以上三点都说明了:数据分析相关课程越早开设对大数据产业人才的培养越有利。但是,数学、统计甚至计算机学科,它们的知识体系是层层叠加的,一门课程的开展会以几门甚至十几门课程作为基础,如果提前开设,学生的知识储备根本达不到,学习效果很不理想。这就需要采取措施消除二者之间的矛盾。
第一,利用“导师制”,使部分学生更早地接触到数据科学的相关知识。对于低年级学生,导师可以采用“以高带低”的方式让其提前了解数据科学的相关知识。比如可以让他们参与高年级同学的“大学生创业创新项目”的申请和研究,还可以开展数据科学方面的讨论班或者兴趣组。导师可以根据自己名下不同年级的学生,合理安排讨论的内容、形式、知识的递进层次等等,通过高年级同学讲解,低年级学生旁听,然后共同讨论的方式,使低年级学生提前接触到数据科学方面的理论知识。
第二,结合高校和社会相关科技活动、科技竞赛提高学生的实践能力。教师可以选择一些国内外权威的数据分析和数据挖掘科技实践活动或科技竞赛,组织学生积极参加,合理安排竞赛的时间梯度、竞赛学生的年级结构和知识分工等等。通过科技实践活动或科技竞赛可以督促学生学习新的科学知识,提高学生分析问题、解决问题的能力,激发学生的创造能力。
第三,为学生创造将理论用于实际的学习平台,加强与数据科学人才培养有经验的高校或企业交流。一是鼓励学生申请国内外高校的暑期班或者夏令营。目前国内有很多知名高校会面向在校学生举办关于“大数据”或“统计学”暑期班,以及“全国优秀大学生夏令营”之类的活动,为学生去名校的学习和交流提供了契机,教师可以积极推荐,为学生争取机会。二是与大数据产业领域的企业进行合作。教师可以联系一些大数据产业企业或相关岗位,推荐学生参与学习或实习,积极开展校企项目合作,拓宽实践平台。
第四,依据数学专业的知识层次和知识结构,因人而异、因材施教,培养出适用于大数据产业不同环节的科技人才。大数据产业不同环节需要不同的科技人才,比如软硬件开发、数据储存、数据预处理、数据分析、图像处理等各方面的人才。教师可以根据学生的兴趣和能力,分别给予不同的引导,发挥学生的自主能动性,培养出具有不同能力、适用于不同岗位的大数据产业人才。
目前,我校信息与计算科学、数学与应用数学专业的大数据人才培养已经进入实践阶段,涵盖了从学生入学到大四毕业的各个环节。
导师根据培养计划,在不同学年不同学习阶段对学生提出不同的要求。如第一学年导师会要求学生将主要的精力放在专业课的学习上,并鼓励低年级的学生参加高年级学生的数据科学讨论组,让低年级学生对数据科学的方法和内容有所了解。
第二学年,学生有了一定的计算机编程基础、高等数学基础,可以让学生接触一些当今常用的数据分析软件,如R,SPSS,SAS等,让学生试着用简单的统计学方法处理一些数据。并采取每周组会的形式,在组会里高年级学生讲方法,低年级学生讲一些统计软件的应用心得。
第三学年,学生的数学知识储备、计算机编程技术已经达到一定的水平,可以组织学生参加一些数据处理、数据分析方面的科技实践和科技竞赛,竞赛主要以高年级学生为主,低年级学生为辅的形式,这样既可以实现高年级学生提高竞赛的效果,又可以使低年级学生得到了观摩学习、积累经验的机会。
在第三学年结束的暑假里,大学里的课程都基本结束,数据分析、数据挖掘等课程也讲授完毕,学生经过前几年的耳濡目染、实践训练,已经很娴熟掌握一些常用的数据分析软件和统计方法。这时,导师可以推荐和鼓励学生去一些大数据产业公司实习或兼职,或者鼓励学生申请一些名校的“全国优秀大学生夏令营”,为学生眼界的开阔、名校研究生保送名额的争取创造机会。
第四学年,导师征集每个学生的意愿,想考研的给予足够的时间支持,想从事大数据产业相关工作的,可以根据学生暑假的实习情况,给出一些对学生未来在该行业有帮助的一些课题,使学生在做毕业设计的时候可以同时训练大数据产业工作的一些技能。
将信息与计算科学、数学与应用数学专业的培养计划与“导师制”相结合,立足于学生的知识体系的建构过程,立足于现有的教学资源,开展数据分析兴趣讨论组、组织科技竞赛活动,积极参与兄弟院校的学习交流活动,在学生全面发展的方向下,结合“导师制”注重学生的个性化发展,为我校大数据产业人才的培养开辟一条新的思路,也为信息与计算科学、数学与应用数学学生的就业拓宽新的渠道。