李 鹏
(江苏大学教师教育学院,江苏 镇江 212013)
随着信息技术的飞速发展,新一代信息技术“大数据”引起了产业界、学术界和政府的共同关注。国务院于2015 年发布《促进大数据发展行动纲要》和工业和信息化部于2016 年印发《大数据产业十三五发展规划(2016-2020)》,成为“全面推进我国大数据发展和应用,加快建设数据强国”的标志[1],这标志着我国已经迈入大数据发展新时代,社会的发展和国家的战略都必须紧跟时代发展的步伐,需要大批在大数据领域复合型创新型卓越的信息技术人才,对大数据人才的重视已然上升到国家的层面。
2001 年,Cleveland W S 提出了一个数据科学行动计划,指出了数据科学需要发展的重要方面(跨领域数据分析能力、数据建模和方法、数据计算能力、学科规划、工具、基础理论)[2]。数据学科本身的研究方向就广泛,另外由于大数据技术迅猛地发展,使得大数据人才供需整体数量不断增加,人才需求缺口不断扩大,岗位供需不平衡,地域供需不平衡,求职者学历错位明显等现象[3]。高校作为信息技术类人才培养的主要输出阵地,在大数据发展新时代,有必要有义务为大数据和其他相关领域输送专业型人才。面对新时代、新任务和新形势,社会对高校输送的人才的质量和需求也上升了新的层次。大数据专业是设计数学专业、信息专业、统计学专业、计算机科学专业、财经专业等多个专业复合型交叉学科,除了具备扎实的理论知识外还需要通过大量的实践训练[4]。表1 显示的是自2016 年,全国各类院校就已陆续开设大数据专业建设工作,开设大数据专业院校数量稳步增长。2018 年至2019 年,教育部根据大数据发展趋势和人才需求还新增了12 个与大数据相关的本科专业,这些新增的本科专业都为了培养复合型应用型大数据人才提供有力保障[5]。
表1 大数据相关专业各批次获批院校数量(所)
在众多院校开设大数据专业建设中,各个院校都在积极主动地探索一条大数据背景下人才培养环节需要关注的重点和难点。中国科学院计算技术研究所的王元卓等综合分析了大数据专业建设与人才培养中选用教材、课程体系设置、师资配置等现状,进而提出了一种适应大数据专业建设与人才培养的方案[6];中国农业大学的李辉以结合本校实际讨论了在农业类高校中建设大数据相关专业的必要性,梳理了部分农业类高校大数据相关专业建设的现状,提出一种基于OBE理念的农业类高校大数据专业培养方案,以及相应的教学改革措施[7];青岛大学的王晶莹等从大数据和计算社会学两个方向出发,分析了问题、现状和时代背景特征,讨论了从大数据到计算教育学涉及的概念、动因和出路等若干关键要素[8];重庆大学的冯永等针对大数据融合人才培养目标不明确、教学体系与大数据智能化行业发展要求尚不明确等问题进行体制改革[9];南京大学的刘虹等就如何培养计算机金融交叉学科领域高层次人才进行积极探索,通过对比中美两国在招生方式、课程设置、考核评价等方面为综合型人才培养提供参考和借鉴[10]。全国多所高校协同创新、采用多学科融合型培养模式,设立大数据人才培养课程体系和培养方案。
大数据目前已经形成了庞大的知识体系,对于打算学习大数据专业的学生,需要学习先修知识如Linux基础、Java/Python 语言基础、数据库基础知识,这部分基础课程的学习时长一般地会在1 年至2 年,这是一个循序渐进的过程。目前主要流行的大数据技术有三个:Hadoop、Spark 和Flink,这3 个技术也是大数据专业的核心课程。Hadoop 一般用于政府和企业数据仓库的搭建,利用分布式文件系统HDFS、分布式数据库Hbase、数据仓库工具hive 和政府企业原先用的数据库的数据搭建数据仓库;对于 Spark 生态圈,则需要讲授 SparkRDD 各种算子的使用、Spark Streaming、Spark SQL 和MLlib 的使用;对于Flink 技术,讲授其基本原理和核心API,掌握这部分核心知识,能够让学生快速构建出大型的离线或实时的应用项目[11]。因为大数据课程体系的庞大,高校缺乏专业的大数据师资力量,缺乏完善的、系统性的课程体系,制定的教学计划和教学课时无法使得学生全面、深入地掌握大数据的各项技术。
大数据因为其“4Vs”特点:容量性(volume),多样性(variety)、速度(velocity)和价值(value)[12],然而对于一般学校教学实验室并不能提供理想的实验环境,因为大数据迭代更新快,学校之前的实训课题题目不能定期更新、课题内容过时、题目数量少导致实训的教学质量和效果往往难以保障。这也导致了教师无法从实验环节充分了解学生的实操情况,最后只能依据考试成绩的高低来判断学生的学习情况。Boyd和Crawford 认为,大数据不仅数据量大,而且涉及搜索、汇集和交互引用大型数据集的能力[13],这也对实验室的硬件提出更高的要求。这些问题的存在使得应用型大数据人才的培养在数量和质量上都无法满足社会对优秀人才的需求。
大数据人才培养方案需要两步走:理论知识+实践应用。理论知识是基础,对于今后工作中遇见的问题,可以借助理论知识进行基础排查;实践应用是能力,通过不断地实践训练可以进一步提高解决问题的效率和质量。提高大数据应用型人才的培养,离不开高等院校与广大教师,离不开学院实训课程与企业实训的经验,通过推进学科与学科之间、学校与政府、学校与企业之前的深度融合,仅仅依靠学校老师所讲授的知识和技能是远远达不到预期的教学质量的,强化校企合作,学校可以根据企业定向指定人才培养计划和方案[14]。通过将企业内新的技术与学校新的科研成果融入教学内容,对大数据专业的教学进行升级改革。
根据应用专业的方向和培养目标,根据大数据就业行情、产业现状及未来发展的趋势以大数据岗位分支为导向,建立大数据技术支持、大数据应用开发、大数据运维方向,并根据培养方向和培养目标制定详细的培养计划、完善课程体系。同时根据设立方向的侧重点设置相应的大数据实训环节,逐步提高学生的综合能力。
“互联网+”和线下教学结合的方式,为大数据人才培养提供源源不断的动力,采用混合教学模式,充分利用开放式教学资源,利用数据教育平台的资源,有针对性、选择性地学习,推动线上线下教学模式的改革,大大提高了学习的灵活性和主动性,疫情防控期间各大高校借助腾讯会议、钉钉等各类交流平台的线上授课,也加速了互联网教育的渗透[15],辅助教学工作稳健落实。
因为大数据技术本身的特殊性,学生无法在短时间内充分掌握大数据全部的知识,因此可以考虑通过教学案例,引导学生掌握案例涉及的章节内容,通过模拟不同的场景,制定不同的案例任务加深学生对知识的理解,夯实大数据基础知识和技能,并采用小组轮流答辩展示的形式,提高学生们参与的积极性,促进不同案例任务学生的知识交流,让学生接触到大数据技术对于应用开发场景中的便捷和高效。
实践环节是大数据应用型人才培养中非常重要的环节,因为大数据时间对设备的硬件、数据的体量有要求,所以学校可以整合资源,根据学科特点、大数据人才培养方向积极筹建实训基地,高校还可以联合政府、事业单位和大型民营企业共同建立实训平台,信息化基础设施逐渐完善,教学资源也逐渐丰富,为人才培养质量和数量提供支持。
学校的教学质量最终会工作中得到体现,人才培养目标、专业建设、课程体系建设都离不开实际工作的评价,应用型大数据人才更是如此。因此需要建立对应的人才评价体系,按照难度的容易、级别的高低,采用开放式的试题重点考核学生的知识和技能掌握情况和解决问题的创新能力,鼓励学生考取企业级的证书和国家级的技能证书,以使人才培养真正地满足产业和企业的需要[16],弥补产业人才的缺口。
因为学校的实训课程时间有限,为了让学生进一步巩固和学习新的知识,高校教师对于专业基础扎实,动手能力强的学生,老师可以组织感兴趣的同学,组织学生参加大数据及其相关的竞赛活动。另外可以将部分相关的科研工作对大数据感兴趣的学生开放,逐步累积科研和项目经验,培养学生解决复杂问题和独立开发的能力[17]。学校也可以制定灵活、公平、公正、科学的奖励制度,加大教学实验室基础设施建设和经费投入,提高学生参加竞赛的积极性。
大数据技术与传统产业的深度融合,学校的理论教学和企业应用场景的深度结合是社会及人才培养的必然选择。面对新的机遇和挑战,高等学校需结合学校自身优势,以政府、学校和企业的大数据作为推动人才培养的平台,教师有目的性地选择合适的教学实训内容,并对学生进行理论知识的基础讲解和对应的实践教学指导,鼓励学生进入企业进行大数据实训。深化校企深度融合,把培养大数据人才的重点放在提高解决问题能力的实操上,鼓励学生参加大数据及其他相关专业的竞赛,锻炼学生的数据分析、处理能力,使学生在今后就业更优优势。应着重将课程的重点放在课程实际创造价值方面。高校对专业人才的培养模式进行改革,本身就是一项具有挑战且艰巨的任务,会受到多方面因素的影响。参与教学的各位老师需要在教学工作中,需要进行不断地归纳、分析和总结经验,不断地探索既要有科学内涵的理论支撑又要体现培养复合型创新型人才培养的新模式,这样培养出来的学生才能在今后的就业中更具优势。