摘要:大数据技术与应用研究方向是将大数据分析挖掘与处理、移动开发与架构、软件开发、云计算等前沿技术相结合的“互联网+”前沿科技专业。本专业旨在培养学生系统掌握数据管理及数据挖掘方法,成为具备大数据分析处理、数据仓库管理、大数据平台综合部署、大数据平台应用软件开发和数据产品的可视化展现与分析能力的高级专业大数据技术人才。
关键词:大数据技术;Hadoop大数据技术;课程教学
大数据技术与应用专业的主修专业课程分别为:面向对象程序设计、Hadoop大数据技术、数据挖掘、机器学习、数据统计分析、高等数学、Python编程、JAVA编程、数据库技术、Web开发、Linux操作系统、大数据平台搭建及运维、大数据应用开发、可视化设计与开发等。本文将介绍该专业中核心课程Hadoop大数据技术课程教学中个人的心得体会。
一、课程定位
《Hadoop大数据技术》是大数据技术与应用专业的核心课程,属于专业必修课。其前置课程主要有《Linux操作系统》、《数据库技术与应用》。本课程主要任务是通过“教、学、做”一体化教学,培养学生了解大数据的发展历史及目前发展的现状、以及它们的技术特点,从而把握大数据分析未来发展方向,全面掌握大数据的架构原理和使用场景。
二、课程学习目标
本课程要求学生了解大数据的发展现状,具有分析大数据的基本技能。通过本课程的学习,了解并掌握大数据系统的起源及系统特征、大数据系统的架构及功能设计、大数据系统程序开发、企业大数据案例分析的内容,并在学习过程中,帮助学生形成独特的思维理念。能够运用大数据理论知识,处理生活中实际遇到的问题。
课程目标1:使学生初步掌握目前流行的大数据主流技术,理解和掌握大数据技术的基本概念、基本方法和基本技巧。熟悉运用Java语言给出简单问题的解决方案,并初步建立学生的计算思维模式。
课程目标2:理解和熟练运用分布式文件系统;理解分布式资源管理器基本原理;理解和熟练运用分布式并行处理框架;理解分布式锁服务概念、读写机制、节点数据操作流程、Zookeeper选举;理解分布式数据库概念、结构、访问接口,存储机制。
课程目标3:理解数据仓库工具概念、架构,工作原理;理解内存型计算框架概念、RDD、Streaming工作原理;理解分布式消息队列概念、工作原理、核心API;理解开源日志收集系统概念、结构。
课程目标4:培育和践行社会主义核心价值观。教育引导学生把国家、社会、公民的价值要求融为一体,提高个人的爱国、敬业、诚信、友善修养,自觉把小我融入大我,不断追求国家的富强、民主、文明、和谐和社会的自由、平等、公正、法治,将社会主义核心价值观内化为精神追求、外化为自觉行动。
1.知识目标
(1)了解大数据发展历程、基本概念、主要影响、应用领域、关键技术和产业发展,并了解云计算、物联网的概念及其与大数据之间的紧密关系;
(2)熟练掌握Hadoop平台的安装和使用方法;
(3)掌握Hadoop分布式文件系统HDFS的重要概念、体系结构、存储原理和读写过程;
(4)了解分布式数据库HBase的访问接口、数据模型、实现原理和运行机制;
(5)熟悉Hive的安装及使用;
(6)熟悉分布式编程框架MapReduce的基本原理和编程方法。
2.能力目标
(1)能够认识大数据知识体系的轮廓;
(2)会搭建Hadoop大数据开发环境;
(3)能够熟练掌握分布式文件系统HDFS的使用方法;
(4)能够使用分布式数据库对数据进行存储管理;
(5)能够使用MapReduce框架处理大数据相关问题。
3.素质目标
(1)在习近平新时代中国特色社会主义思想指引下,践行社会主义核心价值观,具有深厚的爱国情感和中华民族自豪感;
(2)培养学生的创新思维和创业意识;
(3)培养学生的团队协作精神;
(4)培养学生的自主学习能力以及分析问题、解决问题的能力;
(5)培养具有良好的职业素养和勤奋工作的基本素质。
三、课程设计思路
1.设计思想
本课程的设计思路是,作为大数据的入门课程,为学生搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。在每个模块都安排了入门级的实践操作,让学生更好地学习和掌握大数据关键技术。
2.课程的重、难点
课程系统讲授大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库、分布式并行编程模型MapReduce等。在每一单元学习都安排了实践操作。
重点是大数据存储、计算。
难点是MapReduce编程。
3.教学方法设计
课程实行理实紧密结合,教师讲解理论,学生动手实践,综合应用各种教学方法。充分调动学生的学习积极性,注重学生的创新能力、迁移能力与团队合作能力的培养。
案例教学法:在一些实践性强的单元安排一些案例进行讲解。讲练结合:教师讲解基本原理,让学生实践,在实践的过程中理解和掌握知识点。
对比教学法:将HBase和关系数据库进行对比、Shell命令和Java编程进行对比,让学生更好、更全面的掌握相应知识点。
四、教师能力要求
教师必须理解课程性质,明确课程目标与任务。应知大数据基本知识,掌握大数据系统的设计与开发流程,能够掌握一定的大数据开发技术,掌握Hadoop相关组件的功能,具备良好的职业素养和严谨的工作态度、团队协作精神、创新意识。
参考文献:
[1]Tom Wbite编著,王海、华东、刘喻、吕粤海译《Hadoop权威指南(第4版)》,清华大学出版社,2017年7月,ISBN:9787302465133.
[2]Lars George编著,代志远、刘佳、蒋杰译《HBase权威指南》,人民邮电出版社,2013年10月,ISBN:9787115318893.
[3]Edward Capriolo/Dean Wanpler/Jason Rutberglen编著,曹坤译《Hive编程指南》,人民邮电出版社,2013年12月,ISBN:9787115333834.
[4]Holden Karau/Andy Konwinski/Patrick Wendell/Matei Zaharia编著,王道远译《Spark快速大数据分析》,人民邮电出版社,2015年9月,ISBN:9787115403094.
[5]林子雨.大数据基础编程、实验和案例教程[M].北京:清华大学出版社,2017.
[6]林子雨.大数据技术原理与应用[M].北京:人民邮电出版社,2016.
[7]李俊杰等.大数据技术与应用基础项目化教程[M].北京:人民邮电出版社,2017.
[8]薛志东等.大数据技术基础[M].北京:人民邮电出版社,2018.
作者简介:顾蓬蓬(1981.11-)男,汉,江苏省苏州市人,成都理工大学信息工程学院2007级硕士研究生,苏州健雄职业技术学院,讲师,主要研究方向為:软件开发技术。