罗国涛,余 红
(成都东软学院 计算机与软件学院,四川 成都 611844)
“大数据处理”是数据科学与大数据技术,以及信息工程的专业必修课程。该课程主要让学生掌握基于Hadoop技术的HDFS、MapReduce、Hive、Flume及Sqoop等组件,以解决海量数据的分布式存储、分布式查询统计分析及大数据应用等问题。该课程目前采用的是线下课堂教学,学生被动接受知识,不能很好地激发学生学习知识的主观能动性,限制其对于重要知识点的理解和掌握、师生互动较弱、学生学习积极性及动手操作解决实际问题的能力有待提高,对于其创新能力的培养也产生了一定影响。因此,对该课程进行教学改革势在必行。本校使用的教辅平台是传智教育研发的一体化教学平台,该平台主要功能包括教师线上备课、布置教学内容、签到、发布作业、考试等教学任务,学生进行在线学习、课后辅导、课外知识学习等内容。因此,本课题按照“金课”高阶性、创新性、挑战度的标准,采用基于高校教辅平台的线上线下混合式教学对该门课程进行教学改革与实践。
“大数据处理”课程通过Hadoop 安装配置、HDFS、MapReduce、Hive、Flume、Sqoop,以及大数据的处理与分析等理论学习与实验,采用理论与项目训练相结合的方式和线上线下混合式教学相结合的方法,使学生能够搭建Hadoop集群,能够采用HDFS 技术进行海量数据存储,并能够通过HDFS Shell 命令和JavaAPI 对分布式文件系统进行访问操作;能够采用MapReduce相关算法对不同大数据问题进行处理;能够利用Hive技术对海量数据进行统计分析;能够利用Flume、Sqoop 采集与迁移数据。同时,具有大数据工程师的角色责任与职业道德规范;具有较强的大数据算法设计与分析能力;运用大数据相关技术解决实际问题的能力。
2018年教育部发布《关于狠抓新时代全国高等学校本科教育工作会议精神落实的通知》,提出全面整顿本科教学秩序,淘汰“水课”、打造“金课”。“水课”是低阶、陈旧的课程,教师不用心、学生不走心。“金课”要求课程有“两性一度”,即高阶性、创新性和挑战度。其中“高阶性”要培养学生解决复杂问题的综合能力和高级思维;“创新性”是指课程内容要反映前沿性和时代性,教学形式呈现先进性和互动性,学习结果具有探究性和个性化;“挑战度”是指课程有一定难度,需要跳一跳才能够得着。本课题按照“金课”的标准对“大数据处理”课程教学内容和方法进行改革。“大数据处理”课程主要讲解基于Hadoop的分布式计算平台中,各个组件如何利用计算机集群处理海量数据问题,为了让课程具有高阶性、创新性和挑战度,课程除了让学生掌握单词统计、TopN算法及单表关联算法之外,还增加了多表关联及倒排索引等算法的应用。为了提高学生解决综合大数据问题的能力,课程引入了乘用车辆和商用车辆销售数据分析项目,以及增加Mysql和Web服务器等内容完成推荐系统项目。
在教学方法方面,线上教学采用任务驱动法。学生在教师的帮助下,紧紧围绕共同的任务活动中心,在强烈的问题动机的驱动下进行自主探索和互动协作学习。而线下课堂教学中主要采用讲授教学法、小组教学法、翻转课堂、项目教学法等多种教学方法。通过线上线下多种教学方法实施,改变学生的学习状态,使学生主动建构探究、实践、思考、运用、解决,形成高智慧学习体系。
“大数据处理”课程传统的授课方式采用大班授课、“师讲生听”的教学模式,难以实现对学生个性化培养及高阶能力培养的目标。因此,有必要采用一种新型教学模式和方法来提高本门课程的教学质量。本课程采用高校教辅平台提供的慕课堂来实现线上线下混合式教学。混合式教学的形式分为在线学习和线下课堂讲授,其中在线学习时教师主要根据学习平台在线上布置作业,对学生的学习情况和作业完成情况进行监督,并根据完成情况通过在线学习平台或者钉钉与学生交流沟通,对学生遇到的问题进行线上答疑和讨论;同时,进行单元测试检测学生阶段性学习效果,并对检测的结果进行统计分析,根据分析结果有针对性地进行辅导或者调整教学方案。而学生在在线学习阶段,可以根据教师布置的学习任务在线观看教学视频,遇到问题及时在线进行交流沟通,可以将问题发到讨论群,大家一起讨论学习;除此之外,学生在线完成教师布置的作业、进行在线测试或者在线复习课程。在线下授课中,将课程教学分为课前、课中和课后三部分。学生在课前,根据教师布置的学习任务,依托教材和慕课,进行知识点自主学习,根据学习任务要求制作PPT,为翻转课堂做好准备;同时,整理学习中遇到的问题便于课中进行讨论。而教师在线下授课前,利用系统平台的技术支持,通过了解学生在线学习进度、学生作业的完成情况及搜集整理的问题,及时调整面对面讲授重点,并优化教学设计。在课中,首先,学生以组为单位提出在线预习时遇到的问题,教师根据学生提出的问题进行重点讲解或者单独辅导答疑。其次,教师以组为单位随机抽取学生对线上所学内容进行讲解和成果展示,教师点评并对重点和难点问题进行讲解,对学生讲课情况做好记录,作为平时成绩的一部分。另外,如果课中内容是实训或者项目开发,学生需要完成实训内容和实训报告或者项目开发任务。最后,教师根据授课计划讲解新课内容。课后教师布置线下和线上学习任务,并监督学生完成。学生在课后,需要完成线上作业或者线上测试,以及完成实训报告或者项目开发,并制作项目答辩PPT进行答辩等。通过线上线下混合式教学,为学生提供主动学习机会,促进学生深入思考,真正实现以学生为中心的分层次教学、个性化教学。
在“大数据处理”课程线上线下混合式教学设计中,特别要注意学生线上学习内容和教师线下课堂讲授的内容连贯性。同时,要避免线下课堂的讲授只是简单地将线上视频内容重复讲解,要对线上学习和线下课堂讲授内容以及活动环节进行精心设计。如果线上学习内容和线下课堂教授的内容比较简单,线上和线下可以分开设计,如CentOS安装配置、Hadoop的伪分布式和完全分布式安装配置操作比较多且复杂,可以安排线上学习,学生可以反复观看视频,从而解决大数据环境配置问题;而Hadoop体系结构属于理论讲解,可以对其安排线下讲解,但在线下课堂授课之前,教师需要对线上学习情况进行点评总结,对上节课重点和难点进行回顾,解答学生提出的疑问,然后再开始讲解新课。如果有些知识点比较重要且困难,如MapReduce中的倒排索引算法,该算法的设计思路及算法的代码实现比较复杂难理解,可以将该知识点设计线上学习1学时,线下学习2学时。其中线上学习通过观看视频、完成线上作业和在线交流进行,主要目的是对该知识点有初步的了解,为线下作为“小老师”讲解该知识点做好准备。而线下课堂讲授中,授课教师将学生分组,每组4~6 名,随机抽取某一组的1 名学生讲解倒排索引算法的设计思路,该组其他学生可以补充。再随机抽取另外一组的1名学生讲解倒排索引的Mapper类中map函数、Combiner类中的reduce函数,以及Reduce类中的reduce函数的实现过程并展示成果,该组其他学生可以补充。最后再随机抽取其他小组的1名学生对前面2组学生的讲解进行点评,指出优缺点和自己需要改进的地方,学生讲解完毕后教师对该算法重点和难点进行讲解并总结。通过线上和线下相结合,线下采用小组教学法、翻转课堂、项目教学法等,以学生为中心,促进学生个性化学习。学生从知识的被动接受者转变为知识建构的主动参与者,学生可根据自身情况来安排和控制自己的学习。线下授课中,学生将线上自学过程中遇到的问题与教师和同学进行有针对性地交流讨论,这也与建构主义学习观提倡的在解决问题中学习的思想不谋而合。通过线上和线下学习,学生的自学能力和动手操作解决大数据问题的能力得到提高,同时,学生的语言表达能力、协作能力也得到提高,个性得到发展,创新精神得到培养。
教学评价需要由教得怎么样向学生学得怎么样转变。基于混合式教学的过程性评价要以促进学生发展为宗旨,采用形成性评价。形成性评价是一个动态的评价过程,该过程包括学生线上学习的态度、学习的方法、学习的效果,以及线下课堂表现、学习策略、合作精神及学生学习过程中所产生的情感。本课程过程性评价包括形成性考核和终结性考核。形成性和终结性考核各占总成绩的50%。在形成性考核中,特别是在线下授课中,既要考核学生的学习态度,也要考核学生参与课堂提问、回答问题、课堂作业、课堂讨论、团队协作交流等课堂表现;也要考查学生线下以组为单位参与综合性大数据项目的需求分析、设计、编码实现、答辩PPT制作及现场答辩等内容,从而考查学生运用大数据处理理论知识、解决大数据综合性问题的能力。学生线上学习主要考查学生的自学能力,主要考核内容包括线上视频学习、线上作业、期中测试及在线讨论等内容。在终结性考核中,主要考核学生对该课程理论知识的掌握情况。对学生线上和线下综合性评价的主要目的是激励学生主动学习,产生自信心和成就感,调动学生的学习积极性和创新性,从而形成继续学习的动力。
为了提高课堂教学效果及学生的学习效率,“大数据处理”课程采用了传智教育的高校教辅平台和钉钉在线答疑、钉钉在线直播工具。在线上线下混合式教学过程中,利用高校教辅平台在线上发表学习视频,学生根据发布视频进行线上学习,在学习过程中,如果有疑问,可以通过钉钉在线讨论和答疑,如果学生遇到的问题比较多或者对某个知识点提出问题的学生比较多,教师则通过钉钉在线直播工具对所有学生统一讲解;对于比较复杂的大数据环境配置或者较为复杂的大数据算法解决大数据问题,学生可以通过钉钉直播回放反复学习,从而提高学习效率。由于学生学习的差异性,为了满足不同学生的学习需求,按照“金课”标准,让学生从“浅层学习”走向“深层学习”,可以采用高校教辅平台提供的线上讨论功能。教师针对某个知识点发布有一定难度的主题,如学生在分布式文件系统中采用JavaAPI完成文件的上传与下载功能后,教师在线上发布主题要求学生通过HDFS JavaAPI获取分布式文件系统某个文件的节点信息、块信息及文件拷贝的份数等内容,这就要求学生自己或者团队查资料学习,并上机调试成功,随后将结果发布到讨论区。这样既锻炼了学生的自学能力,又增强了学生学习大数据的勇气和信心,同时对成绩稍微差一点的学生通过在讨论区查看发布的答案从中学习并取得进步,从而带动整体学生学习效果的提升。
TOPCARES-CDIO是成都东软学院借鉴CDIO工程教育模式,创造性地将CDIO中国化和实际化的一种工程教育模式。该模式重点培养学生的工程环境适应能力与项目实施能力。在课程教学实施中,将项目分为一级、二级、三级、四级和五级项目。其中一级项目是包含本专业主要核心课程和能力要求的综合项目;二级项目是课程群项目;三级项目是为达到该门课程能力目标而设计的项目;四级项目是该门课程两个以上单元组合而成的项目;五级项目是单元项目。在“大数据处理”课程实践教学中将项目分为三级、四级、五级项目,并在形成性考核中将四级、五级项目以实验形式进行考核,三级项目单独进行考核。通过该门课程的三级、四级、五级项目将专业知识与项目背景相结合,从而培养学生的大数据综合应用开发能力,大数据算法编程能力及团队协作能力。
本课题基于“金课”背景对“大数据处理”课程线上线下混合式教学内容和方法、教学模式、教学设计,以及过程性评价进行研究与实践。在线上线下混合式教学设计与实施中,线上学习资源准备尤为重要,如果在线平台提供了课程的慕课资源,特别是视频资源,教师需要在课前熟悉每一个视频的内容,并将线上视频内容与线下课堂教学内容进行有效衔接,从而保证学生学习的质量与效果。在线下课堂授课中,将课堂分为课前、课中和课后三个部分,教师根据“金课”标准精心设计课堂活动,既要满足普通学生基本知识的学习与掌握,又需要设计有一定高度、难度和挑战度的内容以满足优秀学生的学习需要,从而使学生能够利用所学专业知识解决大数据相关问题,提高课堂教学质量。如何进一步提高在线资源建设质量,优化线上线下课堂活动,丰富“大数据处理”课程项目案例,提升学习广度和深度,将是以后课程建设研究的重点。