冯 骥,冉瑞生,张 扬
(重庆师范大学计算机与信息科学学院,重庆401331)
在如今数据化和智能化不断深化的大数据时代,随着大数据技术和数据密集型科学的发展,数据已渗透到各个行业和业务功能中,并已成为生产和生活中的重要因素。近半个世纪的数字化社会使得各个行业都积攒下了大量的产业数据,特别是近年来,社交系统的用户数量急剧增加,数据的获取和共享变得非常容易,数据规模也在不断扩大。除了数据体量大的特点之外,大数据还具有数据结构复杂多样,数据更新速度快的特点[1]。因此,采用传统的知识分析和决策辅助手段从这些海量数据中获取隐藏和有用的知识越来越困难,整个社会迫切需要新的处理模型来从大数据中获得更准确的知识信息,进而用于决策辅助支持和流程优化等功能。
在大数据潜在价值的具体表现形式中,最重要的元素就是数据之间的相关性。近年来,越来越多的国家、政府、行业、企业和其他机构更为深刻地意识到,大数据正在成为组织最重要的资产,而数据分析能力也正在成为组织的核心竞争力。目前,国家、政府已经把大数据应用推进了人们的具体生产生活中,大数据产业的相关研究也成为了“十三五”期间的重点发展项目。大数据的发展日新月异,人们应该更深入了解大数据发展的现状和趋势,及其对经济社会发展的深远影响,分析中国大数据发展的成就和问题,推动国家大数据战略的实施,加快数字基础设施的完善,促进数据资源的整合和开放共享,确保数据安全,加快数字中国建设,更好地服务于中国经济社会发展和人民生活的改善。
根据中国信息通信研究院的调查,2016年中国大数据核心产业的市场规模约为168亿元,比2015年增长45%。随着国家政策激励和大数据应用模式的逐步成熟,中国的大数据市场将在未来几年继续快速增长。与当前各个领域在将自身数据与大数据相碰撞产生的巨大冲击相类似,大数据也对传统教育领域形成了颠覆性的影响,它一直与教育相结合,正在推动教育模式的变革[2-3]。作为信息技术产业中的核心专业之一,软件工程专业如何通过合理的专业改革和专业调整,在大数据浪潮中培养具有大数据分析技能的优秀软件人才,已经成为了当前软件工程专业的改革要点[4-7]。
因此,在大数据时代的影响下,软件工程领域对人才的需求也发生了一定的改变,企业对软件工程专业的人才要求可以归结为具有一定数据分析技术的软件开发人员。根据LinkedIn最近发布的一项研究,在过去4年中,从事数据分析的专业人员数量翻了一番。相关工作岗位数量急剧增加,反映出对高端数据分析人才的需求不断增长。这类专业人员需要掌握以下的几个基本技能:具有对数据本身及其中所蕴含知识的敏锐感知;能够使用基本数据统计和数据分析工具分析和处理数据;具有将抽象的处理结果通过图形化等方法进行形象的描述与展示的能力;并使用大数据分析结果来支持决策分析并最终创造社会价值。
因此,近年来为了应对企业对人才的需求,高等院校也在努力探索软件工程人才培养模式的改革。特别是进一步增强与各大软件公司的校企合作、校企共建实验室与特色专业、培养双师型教学人才、加强地域交流和国际交流等措施,都对当前高等学校的人才教育体系有所改良。这些针对性的措施在一定程度上缓解了企业人才需求和学校教学培养的不一致性,然而仍然无法与大数据思想与技术的蓬勃发展相同步。其中问题主要集中在以下几个方面:①当前的软件工程专业的教育模式与大数据时代快速变更的人才需求要求之间的矛盾;②面向大数据知识体系和思维方式的培养方案极度缺乏;③缺乏面向教师的系统化大数据专业知识培训;④缺少大数据软件工程实训平台,尤其是缺乏学研结合和工程化、产业化的实践体系。
针对大数据背景下软件工程创新人才培养中存在的问题,结合当前信息产业对大数据背景下软件工程人才的需求,本文以前期软件工程教学改革任务中提出的创新人才培养模式和软件工程课程体系改革为基础,针对性地调整软件工程学科的教学内容和教学方法,以提高学生面向大数据环境下创新地使用大数据工具并解决问题的实践能力为重点,培养复合大数据时代所需的创新型软件工程人才。
为适应大数据产业发展的需要和对软件人才的渴求,各个大学及学院应迅速调整和改革大数据相关技术的软件工程教学模式,并通过改革指明了软件工程专业的发展方向。
当前现代高等教育采用的教学模式一般是标准化的课堂教学,教师按照大纲规定的学时、统一的教材、相同的考核标准对所有学生进行标准化教学与标准化考试。这种标准化教学在很大程度上忽视了学生的自身特点、优势和需求。而大数据化的教学方法可以通过数据分析找到契合学生个性的教学体系,利用学校办学多年已有的往届学生信息与成绩等基础数据,通过数据清洗与数据整理后可以构成符合本校教学特色的教学分析大数据,并通过对该大数据进行数据分析和数据挖掘,利用分类与聚类分析等数据分析技术手段,结合大数据相关技术与学校自身办学特点构建合理的体系模型。在此模型基础之上,教师还可以利用已经建立完善的模型帮助在校学生结合自身的自主意识和学习特点,对其学习兴趣和学习能力进行量化的分析,并评估最适合该学生的个性化课程体系和学习规划。这种独立定制的个性化课程体系可以在更大的程度上保证学生能够更好地发挥出自身的学习能动性,激发学习兴趣和学习动力。大数据手段同样可以在教学过程中实时对课堂上的学生学习情况进行数据采集,并利用采集到的数据分析学生的学习效果,及时地进行教学方法调整。此外,每学期得到的学生数据分析结果可以作为学生期末考核的重要的组成部分进行多元评价,使得平时的成绩能够更好地反应出学生实际的学习能力,提高考试成绩所反映的考核结果的准确性。
大数据背景下的软件工程专业教育必须适应企业发展和大数据行业的需求。基于这个核心思想,教学内容的设置应与企业岗位需求接轨,并结合学院学生特点对软件工程专业的课程体系进行调整。
在理论教学部分,基础课、专业课和选修课方面都增加部分大数据相关内容:①学校在专业必选基础课程中已经设置了C语言程序设计、Linux程序设计与概率论等基础课程。因此,学生已经具有大数据课程的相关基础,可以增添大数据思想与方法概论、云计算概论、Python语言等基础课程,培养学生的大数据计算思维方式,使学生了解大数据行业基础知识与常用方法,引导学生正确的认识与了解大数据的基本理论框架和应用模式;②专业课拟设置大数据存储分析、大数据处理技术、模式识别等前沿科学技术相关课程,在掌握基础理论的同时更多的强调相关技术的应用,以满足大数据系统建设与应用的需要,培养更多企业需要的大数据管理分析软件专业人才;③选修课设置上则尝试引入多个企业的成熟开源大数据工具,让学生能够根据自己的兴趣对企业级大数据平台与开源大数据平台都有一定的了解,为学生日后从事相关大数据工作打下一定的基础。
实践教学包括校内实践和企业实训两大部分:①校内实践针对大数据基础课程设置了对应的课程实验和课程设计,利用大数据教学实验平台安排策划了一系列逐步递进的梯度学习目标,使学生熟练掌握Hadoop、HBase、Hive、Spark等大数据关键技术,使其具有独立搭建并使用大数据平台与开发环境的能力;②企业实训是在大四学年组织大部分学生到合作企业的实训基地进行实习,体验大数据企业真实的工作环境、工作流程和企业文化,学习真实的海量数据搜集、分析、存储技术及在其在实际应用中的具体方法与步骤,通过实际项目理解传统应用领域与大数据领域在思想和方法、软件与硬件等各个领域上的差异和取舍,引导学生按照软件工程的方法完成大数据背景下的实践内容,规范文档和代码的编写,培养学生的职业素养。
根据大数据专业的课程体系设计要求,建设满足日常教学需求、稍具超前意识的实训实验室是当前实验室建设的核心思想。具体建设应在满足核心思想的基础上,同时充分考虑并发数、使用频率、维护成本等众多因素,按照课程实训内容的不同,考虑建成可进行验证性实验、分组实验及集体实验的基于容器技术的一体化大数据实验平台。实验平台利用容器的独立安全特性,每个用户可以隔离使用独立的大数据集群中的部分资源,且相互间的操作互不影响。因此用户既可以手动安装自行编排集群方案,也支持使用一键部署功能,快速构筑Hadoop、Spark、Storm、Hive、Hbase等集群,更好的满足学生在实践教学阶段课程的多样性和实验室的安全性。同时由服务器提供教学所需的镜像资源,包括Hadoop、HBase、Ambari、HDFS、YARN、MapReduce、ZooKeeper、Spark、Storm、Hive、Pig、Oozie、Mahout、R语言等不同的大数据应用组件,并支持Java、R和Python等多种大数据实验中常用语言。
在大数据时代信息技术不断创新、企业需求不断变化、综合型人才需求巨大等因素的影响下,软件工程专业人才培养模式如果仍然遵循传统思维的教育方式、指导理论及实践教学,必定不能适应瞬息万变的互联网时代企业对人才的需求,因此改革软件工程专业的教学模式迫在眉睫。本文根据软件工程专业自身课程体系的特点,结合大数据技术的特征与信息技术企业对专业人才的需求情况,从人才培养模式、教学方法、个性化学习、课程配置、实训体系等各方面进行有效改革,尝试更好的培养符合大数据时代需求的软件工程专业人才。