谢贤芬,古万荣,王斌会
(1.暨南大学经济学院,广州 510632;2.华南农业大学数学与信息学院,广州 510642;3.暨南大学管理学院,广州 510642;4.暨南大学经济管理实验教学中心,广州 510632)
近年来,随着互联网、大数据和云计算技术的兴起,社会经济生活各领域产生了海量的数据信息,例如国家经济统计数据、社交网络数据、新闻媒体数据、金融股票数据、多媒体数据(视频、音频、图像)、工业企业数据等。海量数据蕴含着丰富而宝贵的信息,可以为国家经济决策、社会舆情分析、新闻数据挖掘、商业智能决策、预警监控等提供重要的数据支撑与决策依据。在此环境下,数据挖掘作为最常用的数据分析手段在各个领域中得到了广泛的应用。数据挖掘作为一门应用性很强的交叉学科,涉及的知识内容包括统计学、数据建模、分类、算法优化、模式识别及预测等。在数据挖掘相关课程的教学过程中,如何基于云平台和大数据处理工具,科学地讲授对多源海量数据进行有效的数据收集、数据处理及分析的过程,对提高学生利用数据挖掘技术处理各领域问题的能力具有重要的作用。
数据挖掘是一门发展前景广阔的应用型课程,可应用于众多领域,解决很多实际应用问题,因此很多高校在本科相关专业的人才培养方案中均开设了此课程,该课程的教学模式研究也得到了不少学者的关注。孙瑞娜[1]详细分析了数据挖掘课程的教学现状,认为主要有三个缺点:教学内容难,学生学习兴趣不高;教学模式及教学资源单一;实践教学较为欠缺。针对这三个问题提出了解决方案,认为需利用网络资源及相关新信息技术提高学生对该课程的兴趣,引导学生将数据挖掘方法进行应用,同时通过考核方式的改革,合理分配实践教学与理论教学的学时,使两者有机结合起来,达到更好的教学效果。同样认为数据挖掘课程实践部分欠缺的还有文献[2],该文提出应针对不同的专业和学生进行不同的应用实践设计,对不同学科的特点对课程进行定位,才能满足社会实践的具体需求。黄剑[3]提出了符合数据挖掘课程教学特点的任务驱动探究式教学模式,该教学模式以学生为主体,教师的作用主要是负责组织教学和布置任务,引导学生基于任务要求学习相关知识,从而提高学习的主动性。商俊燕[4]和高铭悦[5]都认为应采用以提高学生分析解决实际问题能力为目标的案例驱动教学模式,同样强调了实践教学的重要性,并且要基于学科特点及人才培养方案来制定案例。郭传好[6]认为数据挖掘课程的教与学应能满足社会的需求、学生的需求和学科专业的发展需求,从这三个需求出发,对该课程的教学内容、教学方法及考核方式等方面进行了深入探讨,得到了一些提高教学质量的结论,如采用多元化的考评方式、考察学生的创新能力等,以此提升课程教学质量。
除了教学模式及教学方法的研究[7-9]之外,也有不少学者引入各种新教育技术手段对数据挖掘课程进行教学改革。白妮[10]将“微课”和“雨课堂”智慧教学平台结合起来,对其从课前应用、课中应用及课后应用等多方面进行了分析。陈二阳和袁姜红[11]深入研究翻转课堂在实训课程中的应用,解决了传统课程中的教学角色单一的问题。同样在教学过程中利用各类智慧教学平台的文献有文献[12-17]。还有一些文献是对人才培养模式进行改进,对数据挖掘课程中的数据思维能力培养方法进行了探索,王建新[18]以提高人才培养质量为目标,探讨了数据挖掘课程中数据思维能力培养的特征及方式,详细介绍了相应的教学方案和教学措施,说明了实践教学效果。黄浩等人[19]从数据挖掘课程中存在的问题出发,探讨了融合案例穿透教学、能力拓展比赛等的教学方法,从而提高学生的创新能力,提升学生将所学知识合理应用于实际问题的能力。
与前面文献相比,本文的改进及创新之处在于,将混合式教学模型与MOOC、雨课堂结合起来,结合课程跨学科的特点,提出将课程教学内容与项目结合起来,形成“项目式驱动的案例教学方法”,解决实践教学不足的问题,并对课程的考核和评价方式进行改革。这种方式可使学生了解学科前沿与社会发展需求动态,在提高学生的学习兴趣及动手能力的同时,培养了学生的创造思维能力。教学改革实践方面,以暨南大学公共选修课《数据挖掘与可视化》课程为例,针对该课程的教学实际状况,尝试线上线下混合式教学模式。这种混合式教学模式的应用实践,进一步完善并推动了数据挖掘课程的教学改革,从而提高教学质量。
(1)基本概述
混合式教学(Blending Learning)的概念最早在20世纪90年代提出,经过二十多年的发展,这种教学模式得到了极大的提升及应用。混合式教学的演变过程分为三个阶段[20]:第一个阶段是从20世纪90年代到2006年,这一阶段的侧重点是信息技术的使用,主要是探讨如何利用信息技术实现线上教学,尝试将多种信息技术应用于各类课程的教学过程中;第二个阶段是从2007年到2013年,在信息技术较成熟的基础上,着重研究这种混合教学模式下的师生互动形式,主要探索了如何对教学模式进行改进,以提高学生自主学习的能力,以及加强教师与学生之间、学生与学生之间的沟通与团体协作;第三阶段是从2014年至今的互联网阶段,这一阶段的重点是将学生的亲身体验作为关注重点,整个教学理念以学生为主体,教师为主导,由教师引导学生进入学习体验之中,引导方式可以是以任务的形式,也可以是以案例、项目、实验等形式。因此,这一阶段也衍生出多种教学方式,如虚拟仿真实验教学、混合式一流课程教学,等等。
目前的混合式教学是在不摒弃传统线下教学优势的基础上,充分利用数字化线上学习的长处,充分发挥教师监控教学过程的引导作用。在整个教学过程中,要充分体现学生作为主体的主动性和创造性,其特点主要有四个:第一,学生应具有较强的主动性。根据课程的培养方案和要求,建立学习资源丰富的网络课程教学平台。学生通过该平台即可进行课程内容的自主学习。第二,学生应具有较大的学习兴趣。课程资源的设计应能激发学生学习的兴趣同时也要具有很强的应用性。第三,增加教师-学生及学生-学生之间的多元互动,良好的交流及互动是提升学生能力的一个基本条件。第四,具备监控学习过程的功能。学生在学习平台上的浏览、学习、测试、发言、提问等情况都应记录并保存下来,为进一步的教学改革提供数据支撑。
(2)线上教学方式的偏好性调查
2020年上半年由于受到新冠疫情的影响,很多高校的课程都采用线上教学的模式,并且是100%的课程内容都是线上完成,这无论是对教师还是学生无疑都是新的体验和挑战。为了了解师生对这种纯线上教学模式的真实感受,这里以问卷调查的形式对这种线上教学模式进行了调研。总共得到的有效问卷数量是151份(其中,学生完成的问卷数是104份,教师完成的问卷数是47份)。这里主要针对以下三个问题进行线上教学的偏好性分析。
问题一:您是否愿意接受线上教学方式?
A.完全接受
B.愿意接受但需改进
C.一般
D.不接受
问题二:您认为百分之几的线上教学学时数是合理的?
A.0%-10% B.10%-30%
C.30%-50% D.50%-80%
E.80%-100%
图1及图2是上述两个问题的数据统计图。从图1可以看出,教师及学生对“您是否愿意接受线上教学方式”问题的看法上,大部分都是持赞同的观点,大部分选择的是“愿意接受但需改进”,排名第二的是“一般接受”,只有部分师生选择的是“完全接受”和“不接受”。从图2可以看出,在问题二的选择上,无论是教师还是学生,绝大部分师生选择的比重是介于10%-50%之间,即:线上教学学时数所占比重不高于传统教学学时数。另外,没有教师认为应接受100%的线上教学或传统课堂教学。综上所见,无论是教师还是学生,都偏向于传统教学与线上教学相结合的混合教学模式。
图1 问卷调查问题Q1的统计柱形图
图2 问卷调查问题Q2的统计柱形图
这里,我们还收集了师生对线上教学的文字性看法,基于这些看法我们绘制了词云图,如图3所示。不难看出,“注意力”、“更难”、“课堂”、“提问”、“互动”、“集中”、“随堂”、“测试”等表达占据了词云图的绝大部分。从中可以看出,线上教学的几个常见特征:学生注意力更难集中,师生互动的要求更高,课堂的提问及测试是互动的一个重要手段。仅次于这些高频词之后的还有“听课”、“状态”、“网络”、“睡觉”、“录播”等。这也表明了线上教学也不可避免存在着一些缺点,例如相比传统教学教师更难了解学生的听课状态,无法判断学生是否在睡觉;另外,线上教学会受到网络状态的影响,如教学软件稳定性、宽带等,因此部分学生要求对线上教学过程能够进行录制,以便课后可以通过回看视频进行知识点复习。下面在进行混合式教学模式探索及实践中,也将从这些方面进行分析,提出相应的解决方案。
图3 师生对线上课程所提意见的词云图
(1)教学目标及混合式教学总框架
这里,以暨南大学公共选修课《数据挖掘与可视化》来说明整个教学改革的思路。该课程遵循学校的办学定位要求,整个教学过程以学生为中心地位,课程将根据内招生及外招生的特点,因材施教,实施分类的课程结构、教学方式及评价标准,以提高教育教学的质量为最终目的。《数据挖掘与可视化》课程是在大数据及云平台环境下,应用Python语言进行数据挖掘及实现可视化,是一门应用性极强的课程。本课程主要面向于非计算机专业,如互联网传媒相关专业、经济管理相关专业,强调应用性和实战性,也可以作为计算机专业或数据科学专业的基础应用课程。
本课程通过常见的互联网大数据应用,如新闻爬取与检索、新闻推荐等综合应用为需求,进而详细讲授基础编程语法、回归分析、决策分析、预测分析和结果可视化等应用理论模块。学生通过本课程的学习,学生能够掌握Python开发的基础知识,并基于收集到的计量或计数数据进行数据挖掘分析,并将结果进行可视化。通过本课程的学习,使得学生能够利用Python语言(开发平台、基础语法、模块化设计)可以熟练掌握基本的大数据处理和挖掘,并为进一步的大数据应用打下基础。
课程将结合慕课和各种数字化教学资源(如雨课堂),进行线上线下混合式教学应用,特别是2020年因新冠疫情的影响,线上教学方式在很大范围内得到了实施,取得了较好的教学效果。根据该课程的知识内容安排,将30%的教学时间(即12个学时)实施学生线上自主学习,与线下教学(28个学时)有机结合起来开展混合式教学,探索在线课程与本校课堂教学相融合的混合式教学模式,促进教学改革。课程改革内容包括课程教学方式的改革、课程内容的改革、互动形式的改革、考核方式的改革等,形成新型的混合式教与学模型。
该课程的混合教学模式总框架如图4所示。框架图主要包括三大模块:课程内容模块、教学模式及案例教学模块。
图4 《数据挖掘与可视化》课程混合式教学模式框架图
①课程内容模块主要包括整个课程的知识内容,一共有10个章节,图4还罗列了每个章节的学时分配数。从图中可以看到,课程的总学时数是40个学时,第十章数据挖掘综合案例的学时数最多,共10个学时数,占比为25%。这是因为案例教学是本课程的重点知识内容,目的在于提高学生应用数据挖掘方法解决实际应用问题能力。
②课程采用线上线下的混合教学模式。线下方式采用传统的面授+上机(占比70%),线上方式是利用慕课+雨课堂教学工具(占比30%)。多元统计分析理论知识部分,通过慕课MOOC来完成。而其他线上教学功能通过雨课堂来实现,具体包括:课前预习、在线语音教学、视频教学、课堂测试、课后测试、作业布置、互动交流及答疑等环节。其中,视频教学功能可以通过雨课堂在PPT中加入视频链接来实现,从而解决了第二节中提到的学生对回看教学视频有需求的问题。
③第三个模块是项目式驱动的案例教学模块。由于该课是公共选修课,选课学生可能来自不同的专业,所学领域可能相差太远。这里提出采用“项目式驱动的案例教学”方法,即学生通过与老师的科研教学项目结合起来,带领并引导学生将课程中所学的数据挖掘方法与实际应用领域的数据分析相结合,让学生能够更好地理解其适用性,提高学生动手能力,实现教学任务和项目相结合的教学方式改革。
(2)教学资源建设
混合式教学模式下的教学资源建设,不同于传统的教学模式,它既包括传统教学中涉及的电子版/纸质版教学PPT,数据资源库,还包括音频教学资源、视频教学资源、课堂测试题、课后测试题以及应用案例库等新型教学资源。其中,应用案例库的资源建设方面:除了收集相关数据之外,还要选择模型方法,对数据进行建模和评判,以及数据挖掘结果的可视化。总而言之,教学资源建设主要包括以下几个部分:
①构建多领域数据资源库。包括社会运行数据、经济金融高频数据、互联网数据、工业企业数据资源、新闻媒体数据等。
②方法模型库。包括分类分析方法、随机模拟方法、数据压缩方法、聚类分析方法、多元线性相关与回归、综合评价法、时间序列预测等方法。
③教学过程及结果分析库。对学生进行线上课程的各项结果进行分析。
④课堂测试题库。建设与课程相关的测试题,包括课堂即时测试题及课后试卷两部分,用以评价学生的课程学习效果,以及促进线上教学的师生互动。
⑤音频视频教学资源库。采用慕课+雨课堂教学技术平台,建成在线的教学资源。学生通过该平台进行线上自主学习,学生通过PPT或PDF讲义进行预习或课后复习的过程中,可以边看边听。视频教学资源的建设,学生更加可以直观了解整个数据挖掘的流程,包括数据采集、处理、方法的实现、模型的判断、预测及分析过程,极大增强学习的趣味性和学习的主动性,增进学生的创新思维、实践动手与科学研究能力。
⑥应用案例库。该资源库的建设与数据资源库的建设相对应,在与项目需求相结合的基础上,本资源库的建设既包括在社会经济领域中的应用案例(如国家经济发展的多因素分析、金融股票数据的预测),也包括工业企业数据的案例,也涉及互联网领域及新闻媒体领域中的应用案例(如新冠疫情与民众舆情的相关关系研究)、P2P网贷等,随着学生专业类别的不断增加,应用案例的范围也越来越广。
(1)学生主导的案例式教学模式
由于课程《数据挖掘与可视化》属于公共选修课,主要面向非计算机专业,如经济管理类专业(经济学、金融学、统计学、工商管理、会计学、管理学),新闻媒体类专业(新闻学、传播学、广告学)等。不同专业的学生面向的研究领域不同,而他们的最终目的都是为了能够利用课程所学的数据挖掘技术解决实际应用中的问题。因此,本课程提出采用“项目式驱动的案例教学模式”,在整个教学过程中与项目相结合,主要是指与学生专业知识领域相关的项目相结合。学生可以自主选择以个人或小组的形式进行实际案例研究,不同专业的学生将结合实际应用背景,将基于Python的数据挖掘方法应用到案例分析中。项目驱动的案例式教学模式见图5。
图5 项目式驱动的案例教学模式
具体流程如下:
①学生可根据自身专业、项目需求、项目难度或案例研究对象的不同,以1~3人的形式自由组合形成小组。
②根据案例所依赖项目的实际需求,老师跟每个小组的成员确定数据挖掘分析任务,尽量保证每个小组的案例是不同的。这些案例可具有相同的原始数据,但需采用不同的数据挖掘分析方法。
③重视解决方法的过程性。即学生在解决实际问题和案例分析的过程中,重视使用方法和实践过程的考核。
(2)案例资源“质”的提升方案
提升学生实践能力最重要的手段之一是课程的案例教学,而案例的教学过程中,最重要的是案例的选取。通过参考教学大纲和教学目标,对教学案例进行精心设计,可以提高学生的分析能力,提高学生发现问题和解决问题的能力。根据《数据挖掘与可视化》课程的特点和相关知识内容,我们将案例划分为四大类:可视化基础案例、统计方法基础案例、大数据应用案例、提升性教学案例,每一类均设计了多个专业的应用案例,具体见表1。
表1 案例资源的分类及子案例
①可视化基础案例。这部分共包含4个子案例,涉及的专业有营销学、经济学、统计学、金融学等,知识点主要是描述性统计分析及各种可视化图表的使用。
②统计方法基础案例。这部分共包含5个子案例,涉及的专业有:新闻媒体类、经济管理类、医学类等专业。知识点有:相关分析、多元线性回归分析、聚类分析、主成分分析、综合评价法、方差分析、时间序列分析等。学生通过这些子案例的学习,可以深刻理解知识点是如何应用的。例如,通过子案例3,学生可以了解如何进行多因素方差分析,通过子案例4可以知道如何对时间序列数据进行预测分析。
③大数据应用案例。由于目前无论是经济社会领域、医学统计领域、还是新闻媒体领域等,产生的各类数据往往是数量庞大的。因此我们也设计了三个专门针对大数据应用领域的案例,涉及的知识点包括如何利用Python进行数据爬取,如何基于文本类数据(舆情、评论、新闻内容等)进行文本分析,并利用词云图等进行文本挖掘结果的可视化。
④提升型教学案例。这是属于综合提高型的案例教学,包括的知识点更为丰富,是更为复杂的应用案例。往往是用到前面案例涉及的多种方法,侧重点是与项目紧密相关。
(3)考核及评价方式
本课程实践教学内容较丰富,因此传统的采用闭卷的考核方式不适用于本课程。这里结合课程教学的目的,从课堂互动、课后交流、案例研究三个方面设置考核点。考核内容包括:熟悉Python基本语法及可视化;重点掌握数据挖掘方法、模型构建及使用要点。
考核形式:
①案例分析:根据确定的案例分析任务,考核学生所学数据挖掘方法,考察学生进行案例分析及解决实际问题的能力,最终须提交案例研究报告,权重为50%。
②课堂在线测试:根据考核内容建立试题库,要求学生课堂上利用云教学平台在規定时间内进行在线测试,这里侧重于对理论方法方面的测试,同时也考察学生的课堂学习效果,权重为30%。
③课后在线讨论:利用教学平台的讨论板,教师在讨论版块开设讨论主題,学生在规定时间内自行跟帖回复,根据回复质量给予参与讨论的同学高低不同的奖励分,权重为20%。
这里,以课程第七章的第三节内容(ARIMA模型及其在Python中的构建)为例,来说明整个课程的教学设计思路及实施流程。这一节的教学目的、重点难点、内容梗概及学时分配等信息如下:
教学目的是讲授ARIMA模型及其Python实现。重点是ARIMA模型及其原理及相关时序模型的Python实现两部分。通过这章节内容的学习,应能了解时间序列数据的定义,掌握ARIMA模型的原理及其构建。总的学时分配数是4个学时(线下2学时+线上2学时)。下面将介绍其具体实施过程以及取得的教学成效。
(1)教学实施过程
该案例的目的是使学生掌握时间序列预测分析方法,使学生能够针对实际应用数据,建立预测模型及进行可视化,对模型的合理性及预测结果能进行正确的判断。
图6 教学实施过程
具体实施过程主要包括以下六个步骤:
①采用线上+线下的方式,介绍ARIMA方法的基本原理及实现。教学手段:学生通过慕课或雨课堂进行课前预习(PPT+语音教学);线下利用面授+上机的混合模式,1学时。
②以数字化、可视化展现为主要模拟场,对数据进行基本的描述性统计分析,并利用Python进行基础数据的可视化。教学手段:面授+上机、课堂测试,形成Python操作步骤的在线视频教学,2学时。
③介绍项目的背景,指导学生进行数据的收集工作。教学手段:线上指导及交流。
④建立ARIMA模型分析实际数据。教学手段:面授+上机,形成Python操作步骤的视频在线教学,1学时。
⑤对实际应用数据进行预测分析,为该案例对应的项目解决方案提供依据。
⑥最后,教师引导学生对案例进行总结,同时对案例涉及的知识点进行考核。
(2)教学成效
本章节的教与学过程中,丰富的应用案例吸引了学生的注意力,提高了学生课堂学习的兴趣。将案例融合到ARIMA时间序列算法的讲授中,增强了线上教学的效果。具体而言,利用雨课堂课前预习,课中互动,课后作业等层面的功能,极大帮助教师分析课程数据,量化分析学生的学习情况,实现了精准教学。针对线上教学的优势及缺陷,由于疫情的影响,最近一期的课程教学全是在线教学,最大的缺陷是比传统教学更难掌握学生的课堂情况,但可通过雨课堂的考勤记录、随机提问、课堂测试、弹屏等方式与学生进行互动,屏幕后的学生发言提问更为积极踊跃,通过课中及课后与同学们的交流,可以更加了解学生的学习情况,学生对应用案例教学的接受程度更高。总体而言,学生乐意接受这种新的教学模式,同时也实现了边教学边考核,教学效果较好。
本文对线上线下混合式教学的教学方法、教学手段、实践教学及考核方式等内容进行了详细介绍,从《数据挖掘与可视化》课程的实际教学改革中进行了分析。特别是以“项目式驱动的教学案例”的教学手段,提高学生的实践教学能力,达到较好的教学成效。具体而言,主要包括以下几个方面:
(1)传统教学模式与线上教学密切结合的生动化课程。在理论学习方面,在采用原有的教学模式的基础上,利用慕课+雨课堂进行知识点教学,提高学生自主学习的能力;在实际应用方面,采用“项目式驱动的案例教学”方式。通过使用多媒体设计生动的经济运行案例教学课件,包括如何在云端实现数据的输入输出、可视化、探索性分析、预测分析和数据质量管理等。通过项目式案例驱动的教学方案,激发学生的学习主动性和兴趣性,增强学生与学生之间、学生与教师之间的良性互动和沟通。
(2)将课程教学内容与项目结合起来,可使学生了解学科前沿与社会发展需求动态。课堂上通过内容丰富的多领域案例教学资源,引导学生从项目需求出发去发现问题、分析问题,从而解决问题。
(3)由于教学模式的多样化,与之相对应的考核方式也应是多样化的,案例教学的实施也促成了“边教学边考核”的目标。本文提出采用多元化考核评价,教学过程材料完整,教学数据齐全,过程可回溯,诊断改进积极有效。