郑婷婷
(广东开放大学,广东广州,510091)
大数据是信息技术领域的又一创新浪潮。2013年被称为中国大数据元年,各行各业开始高度关注大数据的研究和应用[1]。随着大数据的快速发展,各行业对大数据技术人才的需求呈增长趋势,大数据从业人员的职业前景普遍看好,但掌握和应用大数据的技术技能人才却十分稀缺。因此,如何培养能在各领域中应用的、合格的大数据人才,成为大数据技术应用与推广中最紧迫的问题。
美国最早开办数据分析专业的是北卡罗莱纳州立大学(2007年)[2]。在大数据迅速发展的背景下,我国也开始加强对大数据方面的重视程度。2015年9月,国务院印发了《促进大数据发展行动纲要》,明确指出鼓励高等院校、职业院校和企业合作,积极培育大数据技术和应用创新型人才[3]。在此背景下,教育部于2016年2月首次在本科层面增设“数据科学与大数据技术专业”,截至2018年3月,全国已有283所高校获批这个本科专业[4]。在高等职业教育(专科)层次,“大数据技术与应用”专业也于2016年首次出现在教育部公布的《普通高等学校高等职业教育(专科)专业目录》中,据教育部高等职业教育备案数据,截至2018年,大数据技术与应用专业招生院校共有212所[5]。2018年,教育部又以文件的形式明确指出,要主动布局集成电路、人工智能、云计算、大数据、网络空间安全等战略性新兴产业发展[6]。
大数据技术具有显著的跨学科特点,且各高校目前对于大数据相关专业的建设和人才培养尚处于起步和摸索阶段。因此,在大数据产业迅速发展背景下,其广阔的应用前景与技术人员缺失之间的矛盾尤为凸显。结合目前高校大数据相关专业的人才培养调研情况和文献搜集总结情况可知,大数据相关专业人才培养方面主要存在三方面问题:
一是专业服务方向不明确,人才培养定位模糊,对部分课程把握不够,使得一些教学内容偏理论性,难度偏大,甚至超出本科生的平均能力,让相当部分的学生产生畏难情绪。二是受现有条件的限制,包括数据源、硬件、师资等的影响,使得实践教学难以开展或开展的效果不理想。三是受大数据技术复合型特点的影响,学生不仅要掌握数学、统计学、计算机科学、软件工程、管理科学等专业的基础知识,也要掌握与业务过程相关的一些专业领域的知识背景,这容易造成人才培养目标和方向模糊,使学生“什么都学”,却“无一精通”,无法找准其定位。
上述问题使得现有的大数据人才培养与企业岗位实际要求有所偏差,影响了高校服务社会职能的体现,造成大数据人才门槛的看似“高大上”。因此,如何让大数据技术 “落地”,转化为真正融入生活的数据思维;如何把握学科“够用、适用、实用”的原则,把大数据转换为切实生产力,并能兼顾学生的学习时间和能力,为学生进一步的发展打下基础等,既是技能型大数据人才培养的重点,也是开放教育中技能型大数据人才培养的要点。
大数据行业的就业岗位主要集中在互联网、金融等领域[7],具体情况如图1所示。大数据人才需求按领域可分为数据处理技术人才、数据管理人才、数据安全人才、数据分析人才、数据科学家[8]等;按职业角色则主要有大数据系统研发工程师、大数据应用开发工程师、大数据分析师、大数据可视化工程师、大数据运维工程师、大数据管理与安全工程师等等;从涉及的关键技术看,包括数据采集与数据管理、分布式存储和并行计算、大数据应用开发、数据分析与挖掘、大数据前端应用、数据服务和展现[9]。
图1 大数据就业岗位分布概况
因此,高校一般结合大数据的职业角色和需要掌握的关键技术来设计其人才培养体系。而课程体系组织方面则主要依据大数据的价值链来设计,包括数据采集、数据清洗和处理、数据挖掘与预测分析等过程[10]。除此之外,也可以围绕Hadoop生态圈来组织课程体系。
表1 大数据关键技术与主要职业角色分工
综上可知,大数据技术本身具有复合性特征,因此,对从业就业能力的要素也是多方面的。即要求从业者具有一定的数理统计基础和算法的基本功,能较好地理解和使用各种数据分析算法,具备海量数据获取、数据清洗、数据预处理、数据组织与存储、数据分析与挖掘及数据可视化的工程实践能力,掌握数据处理各个环节的基本技能,并对物联网、移动互联网相关理论和技术有一定的认识。
就开放大学而言,其大数据方向的学生多来自行业企业生产一线,具备一定的计算机技术基础,具备一定的行业背景知识,多从事计算机技术密切相关的工作岗位,对大数据知识与技能的需求更倾向于生产实践上的应用,更多是希望通过掌握大数据的新思维、新技术,在大数据时代的企业行业升级转型中为自己的职业生涯寻找新的机会。因此,考虑到本校学生的学习需求、基础与能力、学习时间和精力、理论基础等情况,大数据运维等职位可能更符合开放大学中技能型大数据人才培养的实际。其目标岗位主要要求与原岗位对比情况如表2所示。
表2 目标岗位与原岗位对比情况
考虑到大数据人才的巨大培养需求和人才缺口,广东开放大学于2015年在计算机应用技术专科专业设置了大数据技术应用培养方向,于2016年春开始在广东省全省范围内招生,并于2018年申报了“大数据技术与应用”专科专业,面向各行业企业的应用领域培养大数据的技能型专门人才。
大数据自生成到产生商业价值需要经过五个主要的环节:数据生成、数据获取、数据存储、数据分析、结果展现,而大数据技术人才需要掌握的技术技能主要集中在数据获取、数据存储、数据分析、结果展现这四个环节。每个环节及涉及到的技术、可使用的工具或框架等的情况如图2所示。
图2 各环节相关技术及对应的工具、框架
根据大数据技术的复合型特点可知,学生若要熟练掌握图2所示的技术、工具、框架等内容,就需要在人才培养过程中注重数理统计基础、应用程序开发、数据处理、数据管理、文档编号、系统管理、阅读表达等七方面的能力培养,如图3所示。同时,这七种能力也是大数据相关专业课程设计与建设的主要依据。
图3 技能型大数据人才能力组成
针对大数据的生产流程和价值链,结合表1和图2的分析,可将学校大数据技术与应用的课程设置划分为数据获取、数据存储、数据分析、结果展现四个阶段,每个阶段涉及到的技术技能、专业课程设置与实验实训设计等具体情况如表3所示。为避免课程体系过于臃肿和膨胀,考虑到学生的学习时间与能力,对大数据岗位所需的技术技能作了一些提炼,尽量让学生着重把握一些技术要点,理论内容够用、适用即可,注重加强数据科学与知识领域的融合,突出强调大数据的应用与技能实践。同时,及时总结近年的教学经验,紧跟技术发展的步伐,对课程和实验实训作了一些调整,如增加了主流数据分析语言Python及主流大数据管理与分析平台Hadoop相关的课程和内容。考虑到大数据在行业中的应用,我们选取了目前大数据技术应用较广、需求较多的行业——互联网和金融,在专业课中引入大数据技术在这些行业中的应用实例。
表3 主要专业课程设置
在大数据实践教学方面,广东开放大学一直在积极推进与不断完善,但目前仍存在一些问题:一是实验实训的软、硬件环境建设及实践条件存在困难。如各种大数据工具及数据源的部署、服务器的配置及搭建,尤其是各个分校或教学点的分布较为分散、条件不一,难以统一;二是各实验实训之间的联系不够紧密,内容没能形成呼应关系;三是实验实训师资较为欠缺,大数据技术所涉及知识面较广、较新,因此,亟需提升师资在实践操作技能和工程实践等方面的能力。
为解决上述问题,广东开放大学将在实践教学中大力推进云计算技术及虚拟化技术的应用,并采取了以下措施促进实践教学的开展:第一,搭建虚拟实训平台。在试点专业的核心课程中开设若干虚拟实训项目,解决了基层教学点硬件、软件及数据源难以搭建的问题。不管身处哪个教学点,学生只要通过浏览器登录虚拟实训平台,即可开展指定的实训项目,还可以随时查看相关的实验指导书和微课,这给实践教学带来了极大的便利,让全省的学生都能“看得到,摸得着”大数据。第二,组织立体式、多形式的实践教学体系。开发多样化的实践教学课程资源,包括微课、教学案例等,让学生对大数据有全面、多方位的认识,加强学生对大数据技术的应用能力。第三,考虑大数据人才的综合能力培养。切实培养学生的数据思维,综合考虑各专业课程的特点及岗位能力需求,设计若干综合性较强的实训。如图4所示,设计一个简易推荐系统,组织其从数据采集、数据预处理、数据分析到推荐结果呈现的过程,让学生理解整个大数据价值链,把握大数据的工作流程,提高其分析解决具体问题的能力。第四,加强大数据专业与行业的融合。由于全省各教学点的需求不同,可适当考虑学生来源和去向、地区特色等,加强数据科学与行业领域知识的高度融合,在具体的实践环节中落实具有扎实基础、较宽知识面、较强动手能力的创新型人才的培养特色。第五,加强校企合作。通过校企合作,尽量给学生提供真实、有效的项目实践机会,力求让学生在真实的企业环境中得到锻炼和成长。
图4 简易推荐系统综合实训设计示例
通过以上举措,开放教育大数据人才培养的定位更加明确,更凸显了开放教育的特色,力求为各行各业培养更多合格的技能型大数据人才,大力推动数据技术的普及。