王洁松,王许益,王海
(江苏航运职业技术学院,江苏南通 226010)
在我国高职教育中,大数据技术与应用专业是2016年9月正式批准增设的[1]。我校于2019年正式开始该专业的招生。在高职专业建设中,实训实验平台建设工作一直是高职院校专业建设的重点。因此大数据实训平台在高职大数据技术与应用专业教学和科研中具有非常重要的作用,是该专业实现理实一体化教学的“主战场”[2-4]。由于该专业是新建专业,缺少相应的大数据实训平台。自专业开设初,我校即组织师生参加江苏省职业院校技能大赛高职组的“大数据技术与应用”赛项,并持续参加该赛项,目前已入围国赛省队培训选拔。虽然专业建设起步晚,但能取得一定的成绩,离不开大数据实训平台的自主建设。大数据专业实训平台主要由实训环境和实训项目两方面组成。目前可以采用的大数据专业实训平台主要有两种:在线实训平台和本地虚拟机实训平台。本文将从实训环境和实训项目两个方面对比分析两种平台的特点,介绍赛教融合下大数据专业实训平台自主建设过程及初步取得的成果,供兄弟院校参考。
在大数据技术与应用专业实训平台中,底层实训环境是展开各项实训的基础。如图1所示,目前在企业实践运用及省级、国家级高职大数据技能比赛中,主要使用的是Hadoop2.0 的架构,所涉及的组成架构繁多[5]。整个架构体系的学习过程是循序渐进的,因而在不同的学习阶段,需要为实训项目提供不同层次的实训环境。在线实训平台和本地虚拟机实训平台的底层实训环境对比分析如表1所示[6-10]。
图1 Hadoop 生态系统
我校在大数据技术专业建设初期,根据表1所示的实训环境对比分析,选择采用本地虚拟机环境作为实训平台的基础。大数据技术是新兴技术,高职大数据专业应该学什么?练什么?这是该专业首要解决的问题,是本地虚拟机实训环境建设时首先需要明确的问题。高职组大数据赛项的内容,是由该领域的校企专家根据行业实际发展状况研究制定的,是高职大数据专业教学最直观的参考标准。通过分析赛项内容,可明确该专业当下所需教学的Hadoop 生态系统架构,为实训平台的环境部署建设指明方向。
表1 实训环境对比分析
笔者所在教学团队,根据目前省赛、国赛能收集到的赛项内容及赛项资料,按照自底向上、自基础到扩展的原则,组织师生整理出符合当前省赛、国赛需求的大数据实训环境及主要部署任务要求,如表2所示,其中一些组件的实训环境依赖于其他组件,如表2中的Sqoop 组件的安装部署环境是Linux 基础环境下已有Hadoop 和Hive 组件。
在选择实训平台时,上述两种实训平台的实训项目,在内容和使用效果的对比分析如表3所示[11-14]。
表3 实训项目对比分析
通过对表2所示实训环境的研究,理清组件之间的层次关系,制定各实训阶段的实训目标和实训要求,编写实训基本步骤说明。在本地虚拟机实训平台的实训项目建设中,各实训阶段的实训项目建设及实施,又分为两类情况:
表2 高职大数据实训环境及主要实训任务
(1)实训项目为组件环境部署,具有相对固定性。根据收集到的省赛、国赛赛项中相关内容,设定部署操作标准,给出实训任务步骤提示。
此类实训项目实施由学生独立完成。在完成过程中,要求学生记录操作过程,特别是操作时遇到的问题。在实训完成后,让学生汇报实训过程,并分享心得体会。
(2)实训项目为数据采集与处理、数据清洗与挖掘分析、数据可视化。这类实训内容具有多样性,但实训目标固定。根据收集到的省赛、国赛赛项内容,制定实训目标,给出实训任务样例。
此类实训项目实施时,由学生发挥主动性,自己根据实训目标设计具体的实训任务。师生互动点评学生设计的实训任务后,学生进行调整修改,然后完成各自的实训。通过让学生根据实训目标自行设计实训任务,学生能进一步理解实训目标,掌握实训的重点和难点。实训完成后,同样让学生汇报分享实训过程及心得体会。
此外,实训手册分教师版和学生版:
(1)在学生版实训手册中,只给出实训目标、实训要求及实训基本步骤提示,并不直接给出实训操作每一步具体实训命令。
(2)在教师版实训手册中,除含学生版实训手册内容外,有详细的实训操作过程命令,以及不断积累更新的学生实训时遇到的各类问题和易错点,便于日常教学和参赛培训使用。
对于我国高职教育中新增、新兴专业——大数据技术与应用专业而言,其实训平台是实现理实一体化教学的重要平台。笔者所在教学团队组织师生自主搭建了适用于日常教学和参赛实训使用的大数据专业实训平台,在专业建设初期,“低成本”地创建了该专业大数据实训平台环境,“高收益”提高师生专业技能,培养其工匠精神,同时有力地推动了该专业的教学建设。在应用过程中也遇到新的问题,如实训时教学管理效率较低。如何提高实训平台在教学管理中的效率,并实现校企合作、深度融合,是我们下一步需要继续开展的研究工作。