王丽铭 黑龙江财经学院
随着大数据时代的到来,社会对大数据技术人才需求也越来越大,我国各高校开始申报数据科学与大数据技术专业,2016年,教育部发布《2015年度普通高等学校本科专业备案和审批结果》中“数据科学与大数据技术专业”,有3所大学获批,2017年,教育部批准了32所高校,2018年,有250所高校获批,数据科学与大数据技术专业得到迅猛发展,未来一片光明,同时很多高校看准市场,也对相关专业进行调整,增设出大数据方向的课程,以培养大数据与其它专业相融合的复合型人才。
我校属于地方性本科高校,目标在于服务地方,培养应用型人才。我校在学习产出的教育模式(OBE)与自身情况相结合的情况下,建设数据科学与大数据技术专业,对学生毕业岗位定位于大数据架构工程师、开发工程师、平台运维工程师、大数据分析师等,故开设包括高级语言程序设计II(Java)、数据库系统及应用、Linux操作系统、面向数据科学的编程语言(Python)、应用统计学、大数据平台及应用、Spark大数据技术、Storm流式计算等课程,其中Linux操作系统、大数据平台及应用课程是面向大数据平台运维工程师岗位的主要课程,大数据平台及应用是在LINUX操作系统的基础上讲授hadoop集群及相关组件,如何将这门课程讲好、让学生学好,将学生培养成合格的大数据平台运维工程师是本门课程建设的主要目的。
课程建设包括教育思想、教学方法、教学手段、教学过程、师资队伍、等多方面的内容,从我校的实际情况出发,结合自身学校、教师、学生特点探讨适合我校特点的本门课程建设。
一、 在新工科建设的背景下,我校一直致力于基于成果导向的(OBE)与我校专业课相结合的研究,故本课程也是以成果导向为指导,以大数据平台运维工程师岗位需求为目标,对学生知识、能力等方面进行培养及训练。
(一)大数据平台运维工程师岗位职责:
1.负责hadoop、HBase、Hive、Spark等大数据平台规划、部署、监控、系统优化等,确保高可用;2.负责公司大数据平台的运维管理工作,集群容量规划、扩容及性能优化及各类异常和故障,确保系统平台的稳定运行;3.为数据仓库、数据挖掘建模等数据应用项目提供运行环境支持。
(二)大数据平台运维工程师岗位要求:
1.掌握Linux操作系统的配置,管理及优化,能够独立排查及解决操作系统层的各类问题;2.熟练掌握Python, shell中的至少一门语言,有Python运维工具开发经验优先;3.熟悉Hadoop生态及高性能缓存相关的各种工具并有实战经验,包括但不限于 Hadoop、HBase、Hive、Spark、impala、zookeeper、kafka、Elasticsearch、oozie、yarn、Scribe、Flume、Storm 等;4. 熟 悉 大数据平台的监控以及调优,有独立分析问题和解决问题的能力。
二、针对岗位需求,在本课程中制定培养目标如下:
1.理解hadoop生态圈内的相关组件,并能熟练应用;2.理解hadoop集群架构原理及安装运维;3.理解HDFS工作原理,并能够进行编程实践;4.理解MapReduce工作原理,并能够进行编程实践。
由于本课程是一门实践性很强的课程,故对实践内容做如下设计:
1.hadoop 伪分布安装实验;2.hadoop平台安装实验;3.部署YARN集群实验;4.HDFS实验;5.MapReduce实验;6.部署Hive及应用实验;7.部署ZooKeeper实验;8.部署HBase及应用实验;9.Spark安装及应用实验;10.部署Storm实验;11.hadoop中其它组件的安装及应用。
通过本课程学习,培养学生实践动手能力、独立思考问题和解决问题的能力,达到使学生能够正确灵活地利用相关知识点来解决相关问题的目标。
三、本课程是一门理论与实践并重的课程,所以课程设计是边讲边练,讲练结合的教学方式,先理论后马上实践,再总结实践上升到理论支撑,大数据技术日新月异,进步飞速,所以让学生学会己有的知识只是最低要求,重点是让学生学会如何学习这些知识,如何运用这些知识解决实际工作中的困难。目前市场是有许多开发成熟的大数据实验系统,并且有很多公司可以针对学校具体情况进行调整及修改,但是针对我校特点及对本门课程的定位等情况,本实践环节以学生全部动手的思想为指导,进行实验设置,具体如下:
1.实验一的“hadoop伪分布安装实验”先让学生在自己机器中进行安装,以训练学生对LINUX操作系统、虚拟机等技术掌握和应用,同时在自己机器上安装hadoop相关组件,先对hadoop平台有总体认识,配合理论教学,深入理解hadoop集群及生态圈中组件的应用;2.从实验二开始,多个同学组合进行实验平台搭建,此时不再做伪分布式,而且让学生将自己机器安装LINUX操作系统,并进行hadoop集群的安装布署,在安装完成后进行测试及节点的添加等相关技术的实验,以培养学生灵活应用hadoop集群的能力;3.在基础平台搭建完成后,其它实验可以进行,将在hadoop平台上进行编程开发,组件安装,数据存储,数据分析等操作。
四、本课程设计是以学生为中心,以OBE为支撑,强调学生学习获得的最终能力及成果,为此课程整体进行反向设计,这样使教师在教学过程中目标明确,方法多样,能够抓住学生,把整个教学过程融合到一起,但是这些环节中还有一个必不可少的环节就是考核,考核既是整个教学环节的最后一环,也是第一个环节,你教成什么样子最终是否达到标准是考核的的目标,但是在OBE理念中,考核的不仅是知识,更重要的是能力,所以考核的设计至关重要,同是考核也是教学环节中的第一步,原因在于有教学目标,有考核目标,上课时的内容,过程,方法等一切手段都是为此服务,教学目标和考核也是相辅相承的,这几个环节是密不可分的。
大数据平台及应用课程不仅可以做为数据科学与大数据技术专业的一门专业课程,还可以做为计算机网络、统计学等相关专业的方向课程,更可以做从事大数据平台运维工程师的人员做为学习参考,故在课程建设过程中要进行微课、视频录像等教学资源的制作及开放。