王琰 黄欣瑜
[摘 要] 技术的创新发展使社会建设的进程逐渐加快,基于该背景,使技术人才的培养成为当下高校教育教学重点研究的课题。鉴于此,对基于本科生团队导师制的应用技术型高校大数据人才培养模式的内容展开研究,从阐述当下对大数据人才需求的状况着手,对高校大数据技术型人才培养面临的困境予以分析,并提出几点解决的思路。此次研究的主要目的是为了更好地辅助大数据技术人才的培养,为我国科技与社会发展献上绵薄之力。
[关 键 词] 本科生团队导师制;应用技术型人才;大数据人才培养模式
[中图分类号] G647 [文献标志码] A [文章编号] 2096-0603(2017)34-0054-03
一、背景介绍
大数据的海量性、多源性、异构性、不确定性、动态性特征对大数据处理与服务提出了巨大挑战,传统的数据挖掘技术已不能满足大数据高速处理的需求。随着大数据技术的发展,存储、处理、分析大数据的解决方案都层出不穷,各种工具的出现让企业低成本处理大数据成为可能,而工具的多样化导致严重的人才短缺。
以厦门为例,根据《厦门市大数据应用与产业发展规划(2015-2020年)》预计,近几年厦门大数据产业将出现高速发展的态势。到2018年,厦门全市大数据产业实现产值规模500亿元,形成年销售收入100亿元以上企业1家,带动相关产业新增销售收入超过1000亿元。到2020年,全市大数据产业实现产值规模850亿元,带动相关产业新增销售收入超过1600亿元。而厦门目前还没有一所开设大数据专业的本科院校。
鉴于大数据产业对人才培养的迫切需求,全国一些高校开设了数据科学与大数据技术专业,培养企业所需的大数据应用技术人才。作为一家应用技术型高校,厦门理工学院也要追随这一潮流。为此,计算机与信息工程学院于2016年在软件工程专业下开设数据工程方向,并申请于2018年开设数据科学与大数据技术专业。将依托已建设的多个与大数据分析、挖掘相关的省市级科研平台,将学生纳入大数据工程项目的实施和维护中,培养本科生复杂数据工程项目的实战能力,提高学生分析问题、解决问题的能力,探索适应高水平应用技术大学定位,面向产业需求,支持阶段性迭代的大数据人才培养模式,从而推动产学研融合,构建大数据平台建设和人才培养的闭环。
二、挑战
对数据科学与大数据技术专业的建设方式和人才培养模式,各高校都处在探索中。主要的挑战包括以下三点。
(一)专业新
2011年起,美国各校开设数据科学和工程相关课程;2012年起中国设置大数据、数据科学方向的硕士学位;本科生培养则是到2014年才有学校进行初步尝试,进行这方面人才的培养;2016年国家新增数据科学与大数据技术本科专业,首批仅有3所高校;2017年开办该专业的高校增长到32所。也就是说,目前为止还没有一家学校完整培养一届数据科学与大数据技术本科专业学生。
(二)要求高
大数据技术所需人才是复合型人才,需了解多学科知识,为更好地对业务数据进行建模,除了数学知识外,还应具备特定应用领域知识,并要求掌握分析方法、分析工具,以及业务、管理及设计学知识,以便更好展示数据分析结果。
(三)针对性强
数据工程在不同应用领域有不同特色,要让学生在短短4年时间内,了解各领域相关知识,并不现实。关键是让其通过1~2个应用领域的数据工程应用,了解数据工程实现的通用性方法,培养其以不变应万变的能力,使之更好适应毕业后的岗位要求。
这三大挑战,再加上本科生学识有限,使本科层面大数据人才的培养与研究生层次的培养方向不同。不能追求理论方面的高大上,而应侧重于大数据工具的应用和数据工程的实战。数据工程师除了需要掌握一定的数学知识、分析工具、编程语言外,还要有较强的逻辑思维、协调沟通能力和快速学习能力,而且要对业务有深入理解,能通过数据可视化技术说服客户。但是,所有能力都达到高分,这超出本科生的要求。数据工程师分为初级数据分析师、高级数据分析师、数据挖掘工程师三类。本科生应按照初级数据分析师的需求进行培养,涉及的数据工程实战能力包括基于业务快速理解的问题建模能力、分析工具的使用能力和协调沟通能力。而其他方面,例如深度掌握各类编程语言进行数据处理、基于复杂数学知识的模型研发以及对分析结果的评估,则需留待研究生及更高阶段的人才处理。
三、实施过程中存在的问题及解决思路
(一)实施过程中存在的问题
基于以上分析,我们认为对本科生数据工程能力的培养而言,主要是让其具有参与实际项目的经历,通过由浅到深多个项目的训练,使其较好掌握和应用各种分析工具,更好了解类似业务的问题建模方法,从而通过项目锻炼学生的过程协调和沟通能力。然而,现有培养模式倾向于将这类实战能力的培养放置于实践性课程、课程设计或毕业设计中,从实施过程中,发现存在一些问题。
1.实践性课程、课程设计时间太短
目前的实践性课程都集中在期末的1~2周时间内,容易受期末考的影响,实际能做事的时间不长。因此,这样的实践课仅适合于开发不需要循环迭代的简单项目。而数据工程实战能力的培养关键是试错的过程,通过不断的试错、反复、迭代,逐步了解和掌握数据的特征,发现找到适合该类数据的存储、挖掘的优化方式。这需要花费很长的时间,不是1~2周就能解决的。
2.毕业设计完成质量低
毕业设计的要求覆盖了项目的定义、设计、分析、实现、测试的全过程,因此若学生能单独、扎实完成毕业设计,也能达到数据工程实战能力的要求。然而,从实际情况来看,由于实践性课程无法达到目的,学生缺乏这样全过程的训练和培养,导致毕业设计的要求对许多学生而言,難度较高。加上学生考研、考公务员、企业面试、实习对毕业设计时间的挤占,总体而言毕业设计的完成质量较低,基本就是实践性课程成果的水平,无法实现实战能力培养的效果。因此,需要增加一个培养环节,作为实践课程与毕业设计的中间环节,达到培养学生数据工程实战能力的目标。
(二)解决思路
针对现有培养模式的弊端,结合数据工程实战能力的要求,面向数据工程实战能力的人才培养模式必须满足以下需求:需求1:将数据工程实战能力培养贯穿于数据工程方向学生学习的全过程。让学生从踏入本专业起就感受到实战能力培养的氛围,改变实战能力与课程学习相脱节的局面。现有模式依靠大三下的小学期和大四上的毕业设计培养学生的实战能力,很多学生在毕业后反映,大学四年仅仅毕业设计的后两个月才真正花时间认真去开发项目。这样已经太迟,整个实战能力培养的缺环无法补全。需求2:每个学生都要经历各种数据工程实战能力的培养,以便在毕业设计的时候能独立完成数据工程项目。从目前实践性课程、课程设计的实施情况来看,由于时间较短,任务大多需要组队完成,常出现抱大腿的情况。一个队4~5个人中,主要就是1~2个学生在开发,其他学生或者不做事,或者做文档编写这类辅助事情,导致大量学生缺乏全链条的训练,特别是开发能力的培养方面存在空白。需求3:训练结果需要得到外界的认可,激发学生的积极性。目前学生基本都是“95后”,做事的目的性强,需要直接刺激来激发学习动力,缺乏长远的规划。例如,想考研的学生通常要等到大三暑假前才下定决心,想就业的学生要等到企业面试时才知道学什么。此时再努力学习也只能弥补书面知识薄弱的缺点,实战能力方面的培养已来不及。因此,实战能力的培养应该与外界挂钩,引入企业、外校的评价。例如,将企业需求(如横向项目)或学科竞赛要求转换成题目交由学生完成,提高学生的参与度。需求4:训练过程需要有技术挑战性,要与教师的科研相结合,探索教学与科研相结合的道路。由于引入企业需求和学科竞赛要求,与之前的培养方式相比,难度就有较大提高,需要教师在指导方面花费更多精力。因此,这些需求就必须与教师的科研相结合,做到一事两用,调动教师在教学方面的积极性。需求5:该模式需要是可扩展的,可覆盖大部分学生。学校向来鼓励学生参加学科竞赛和企业课题,然而效果却不尽如人意。原因之一就在于吸引学生加入学科竞赛和企业项目都是教师个人的行为,没有形成教师之间的团队合作与分工。而教师精力有限,只能照顾最有热情的少部分学生。因此,少数好学生很忙,大部分学生的实战能力却没有得到提升。这种“两极分化”局面既不利于总体教学质量的提升,也不利于专业方向的建设,无法形成方向的积累和沉淀。因此,需要基于教师的科研方向,构建教师的教研团队,引入不同年级的学生,通过团队合作,发挥教师各自的优势,形成大兵团作战。这样,除了教师自身能指导学生外,高年级学生也可以对低年级学生进行传帮带,从而降低了教师指导的成本,实现更有效的人才培养。
四、实施方案
为提高学生在数据工程方面的实施能力,将基于学生团队化、导师终身制构建本科生团队,通过对大二、大三、大四学生数据工程复杂项目实战能力的培养,探索适应高水平應用技术大学定位、面向特定产业需求、支持阶段性迭代、具有持续改善特性、可扩展的数据工程人才培养模式。
期望的人才培养模式如上图所示。自大二分方向后,学生每年都要经过教学、竞赛、科研三方面的锻炼,形成数据工程实战能力。圆圈大小表示占用时间的比重,从大二到大四,教学方面(课程设计、实践性课程、毕业设计)占用时间的比重逐步下降,而科研方面所占比重逐步提升,到大四时学生能部分承担教师横向项目课题,做到毕业设计与科研项目的融合。学科竞赛所占时间是由少变多再变少。大三时最多,是学科竞赛的主力,着重锻炼数据处理和分析过程中的编程和展示能力。大二和大四时作为辅助人员和指导人员,占用时间相对较少。具体措施如下:
(一)针对大二学生专业知识不够扎实的情况,探索一条以科研团队合作促进教学的道路
鼓励大二学生四人为一组,以优劣搭配、性别搭配为原则,组成团队,通过双向选择确定未来三年固定的指导教师。在指导教师和学长的指导下,分别承担辅助科研报告撰写、运行实验、数据平台维护等工作,提高其数据工程素养,熟悉数据存储平台和分析挖掘工具,为进一步独立担纲完整的数据工程项目做好技术储备。为提高团队之间的互动,拟基于学科竞赛题目,开设开放性实验课程,引入教师讲解和问题讨论,将教师、老生、新生结合起来,实现团队的有效互动。
(二)针对大三学生对未来方向不明确、缺乏学习动力的问题,探索以赛促学的培养方式
推动学生参与学科竞赛一直为各高校所倡导,目前学科竞赛数量众多、纷繁复杂、难度不一、缺乏整合。本项目将根据大数据技术和区域特色需求,精选与大数据技术相关且具有学术影响力和实战性考验的学科竞赛(如海峡两岸信息服务创新大赛、高校云计算应用创新大赛、CCF大数据与计算智能大赛等),构建由易到难的赛事循环,由本科生团队中的大三学生作为开发主体参与其中。同样设置四人团队,分别承担数据采集、数据融合与分析、数据可视化、总体方案规划和管理等工作,与大二的团队对接,进行一帮一的带动和指导。
(三)针对大四学生缺乏生产实践、难以独立承担项目设计与开发的问题,探索以科研带动能力提升的培养方式
对不准备考研的学生,拟从教师团队的横向科研项目(搜索引擎类、智慧医疗类、智慧交通类)、企业(如阿里巴巴、滴滴等)主办的竞赛中凝练毕业设计题目,让大四学生参与到方向教师的科研团队中,将毕业设计题目与工作方向及学弟所参与的竞赛相结合,作为学弟团队的指导者,应积极锻炼协调能力,为更快适应工作岗位奠定基础。
(四)针对应用技术型高校教师多承担应用型研究、研究不够聚焦的特点,整合教师团队
通过人员调整和课题凝练,将相关教师集中到统一的教学科研团队中,形成共同的技术平台(如基于HDFS的文件存储平台,基于Neo4J的图数据库,基于SPARK的数据挖掘平台,基于STORM的数据流处理平台,基于Python的数据展示平台),并寻找与平台技术相适应的企业项目和学科竞赛,组建教师团队,从而更好地促进产学研融合。
综上所述,为了提高本科生在大数据技术实施方面的综合能力,我们对构建本科生团队、构建本科生导师终身制等方面进行了一些探索。目前,通过教师和高年级学生的指导及从浅到深多个项目的历练,学生的学习积极性有较大提升,学风得到改善。不过,低年级学生自律性较差,其他舍友玩游戏时容易受影响,团队运行时需要教师掌控进度,下一步拟建议学工部门基于本科生团队调整宿舍,统一作息时间。