基于PBL的数据分析课程实验设计与实践

2020-12-16 04:35曹高辉
实验技术与管理 2020年11期
关键词:跨学科图表教学资源

曹高辉,陈 菁,王 丹

(1. 华中师范大学 信息管理学院,湖北 武汉 430079;2. 湖北省电子商务实验教学示范中心,湖北 武汉 430079)

在大数据时代,外部环境发生了巨大的变化,高校专业教育需要顺应时代发展而做出相应调整[1]。数据分析能力是信息科学相关专业人才需要具备的重要技能之一[2-3],掌握良好的数据分析能力有助于从纷繁复杂、非结构化的大规模数据中提取出有效信息,分析其中的规律,从而辅助管理与决策。数据分析课作为很多高校信息类专业的核心课程之一[4],需做到理论教学与实验教学并重,前者旨在培养学生的数据分析思维,后者强调学生对数据分析工具的熟练运用,二者相辅相成。但这门课程内容广泛,面临着有限的学时与较多的实验内容、操作型实验的重要性与它所导致的知识分散等的矛盾,有必要尝试优化实验教学设计和创新教学方法。

1 PBL教学方法

在传统的本科生教学中,往往以内容为导向,强调用简洁的例子来帮助学生理解抽象概念,评价方式以考查学生对知识点的记忆为主。这种传统教学模式是在书本昂贵且匮乏的年代形成的,教学的目的在于“知识传递”,因而学生处于被动的学习地位,认知能力和专业技能难以得到充分锻炼[5]。随着大数据时代的来临和信息技术的发展,现代教学应当基于“知识发现”,而不是简单的“知识传递”,要致力于培养学生的跨学科思维、创新能力、解决问题能力、管理与沟通技能等软实力。PBL教学法能有效培养学生的专业技能和软实力,调动学生的积极性,是一种以学生为主体、以问题为导向的教学方法,教师在其中扮演“引导者”的角色。

PBL教学法最早由加拿大麦克马斯特大学医学院在20世纪60年代后期提出并用于教学,目的是让医学教育从单纯的课堂讲授和闭卷考试转向实践训练。从 1970年开始,PBL教学法传播到北美的几十所医学院[6]。到2000年,北美地区有超过230名教师接受了PBL教学培训,超过150门课利用PBL教学法进行了课程设计[5]。由于PBL教学法符合以学生为主体的建构主义学习理论,目前在国内多个学科专业(如计算机[7]、物理[8]、生物[9]、化学[10]、信息管理[11]、资源环境[12])得到广泛应用[13],且适用于社会科学、心理学、历史、哲学、商业、法律、教育、管理、医学、护理、临床、生物、物理、工学等众多专业教学[7]。通过文献调研,笔者总结出PBL的详细教学流程,如图1所示。

在运用PBL进行教学前,教师需要依次思考如下问题:本门课有哪些特点?教学目标是什么?运用PBL教学法为什么有效?设计什么问题?提供哪些资源将有助于实现教学目标?如何在不同的教学阶段引导学生?教学中可能出现什么问题?如何解决?如何评价学生的最终学习成果?

图1 PBL教学流程

2 数据分析课程实践教学特点

根据笔者的教学经验,数据分析课程实验教学的特点及其对应的难点如表1所示。

表1 数据分析课程实验教学的特点及其难点

根据教学特点和难点以及教育部于 2019年提出的一流本科课程的改革要求[14],教师在实践教学过程中应注意以下几点。

(1)针对实验课时有限的难点,应分清教学内容主次,在课上要引导学生独立思考、大胆质疑和小组讨论,带领学生攻克教学难点,课下要布置相应的任务,作为实验教学课上课时的补充。课上与课下的互相补充,能够有效调动学生的积极性,培养学生独立思考和解决复杂问题的能力。针对知识点分散的难点,应以问题为导向系统设计整个教学过程中的各项实验,使问题间具有紧密的逻辑关系。由不同问题有机组成的系统性的实验教学,有助于培养学生的系统性思维。

(2)针对学生对跨学科知识认知有限的难点,应在课前提供分类清晰、多种多样的教学资源,引导学生进行课前预习,汇总学生在预习过程中产生的问题,然后有针对性地在课堂上进行讨论,这样能够培养学生良好的学习习惯、自学能力和发现问题的能力。在教学时应融合多学科思维,以问题为导向来设计跨学科的实验项目。此外,还应准备充足的课外扩展资源,扩展课程内容的广度,加深学生对跨学科知识的理解。

(3)针对小数据集不符合实际的难点,应适当提供符合实际应用场景的大规模数据源,据此设计既符合学生认知、又具备挑战性的系列数据分析任务,并且设置严格的任务考核制度,从而提高学生通过刻苦学习而获取知识与能力的成就感。针对数据分析工具种类多、不易选择的难点,需要根据具体的教学目标和学生的专业背景选择合适的数据分析工具。

3 基于PBL的数据分析课程实验设计

3.1 问题选取思路

在PBL教学法中,首先要进行问题设计,这是实验教学的难点,问题设计的质量直接影响教学质量和学习效果。教师在设计问题时,应考虑教学的特点和难点,以及教学目标和教育部要求。总的来说,问题设计有以下原则:①系统性原则。针对教学的目标、内容和特点,分层次、有逻辑地构建问题,问题之间相互联系,所有问题结合在一起应能反映教学内容概貌。②现实性原则。将理论与实践紧密结合的同时,需要考虑实际场景下的科研或工作需求,做到与时俱进[15],对于跨学科性较强的学科,则应根据实际情况设计跨学科问题,培养学生的跨界思维能力。③挑战性原则。在符合学生当前认知水平的前提下,问题应具有一定的难度,学生需要通过自主学习、查阅课外资料、独立思考、小组合作等方式才能解决[14]。

笔者在“数据分析”实验教学中用到的数据分析工具包括Excel、Tableau、FineReport等。由于文字篇幅有限,表2仅展示了针对Excel教学的问题设计。

表2 针对Excel实践教学的问题设计

(1)数据分析方法论的问题设计。数据分析方法论旨在从宏观角度指导学生如何进行数据分析,是培养学生数据分析思维的第一步。该实验课中,针对某一行业(如电子商务行业)设定系列问题,能使课程内容更具系统性,因为这样可以使学生了解对同一行业不同问题的数据分析思路,有利于学生举一反三到对其他行业问题的分析。当然,不同行业特定问题的数据分析思路难免会存在差别,因此应补充其他行业数据分析的例子,作为学生的课后思考题,增强学生的跨学科思维能力。

(2)数据准备的问题设计。数据分析的第一步是数据准备,需注意的是导入前后的数据格式应保持一致。该实验课的问题设计,应注重引导学生思考与掌握数据类型、导入数据的多种方法、常见的数据导入错误、数据类型的转换方法等。

(3)数据处理的问题设计。现实生活中的数据往往含有一定程度的噪音,数据处理的目的在于将现有数据转化为高质量的数据。数据处理的方法很多,实验课的问题设计应引导学生使用 Excel中的快捷键、查找/选择/替换/条件格式/筛选功能、数据透视表功能、函数功能等。此外,最好选用一个数据质量高的大规模数据集,制造不一致、不准确、不正确、不完整、有冗余的数据,让学生运用尽可能多的数据处理方式来处理数据,加强学生对数据处理的理解和对数据处理方法的掌握。

(4)数据分析的问题设计。数据分析可以实现三个功能:现状分析、原因分析和预测分析。现状分析的方法包括对比分析法、平均分析法、综合评价法等;原因分析的方法包括分组分析法、结构分析法、交叉分析法、漏斗图分析法、矩阵关联分析法、聚类分析法等;预测分析的方法包括回归分析法、时间序列法、决策树法、神经网络法等。这部分实验课程涉及的数据分析方法很多,对于非数理统计专业的数据分析初学者来说,掌握所有方法的难度较大。在课前应布置预习任务,让学生提前建立跨学科认知的基础,并在课上辅以具体场景下的数据分析案例,做到问题设计明确,使学生有数据分析员的角色代入感。

(5)数据图表制作的问题设计。数据图表具有形象化表达、突出重点、体现分析人员专业素养的作用,能够帮助人们更好地理解数据,是一种简单有效地展现重要信息的工具。其中经济适用图表最为常见,包括表格、饼图、柱形图、折线图、条形图、散点图等。制作表格时,有一些数据展现技巧,比如突出显示单元格、数据条、色阶、图标集、迷你图等。绘制图时,还可以使用基于经济适用图表的复杂图,如平均线图、双坐标图、竖形折线图、瀑布图、旋风图、人口金字塔图、漏斗图、矩阵图等。在问题设计上,教师应引导学生通过理解数据间的关系选择合适的图表,在此基础上引导学生思考这些图表是如何画出来的、能够表达哪些丰富的信息等。

(6)数据图表优化的问题设计。对图表进行优化可以使图表具有更强的表现力、更加美观和简洁。这节实验课可以通过展示残缺或冗余的图表,让学生指出图表中存在的问题,启发学生思考图表的基本组成要素和制作图表时的注意事项,最后让学生学习专业图表的制作技巧(保存图表模板、快速制图、添加数据标签等)。同时,教师还可列举具有迷惑性、故意夸大或隐瞒事实的图表,让学生说出看到图表的第一感受,再告知学生这些图表背后的真相,启发学生避免犯同样的错误。此外,向学生展现不美观的图表,让学生进行修改,最后引出图表的美化技巧,加深学生印象。

(7)数据分析报告撰写的问题设计。数据分析报告应该呈现分析结果、验证分析质量、提供决策参考等内容。在设计问题时,应向学生展现不同类型的数据分析报告,启发学生对数据分析报告的类型、要素和结构进行分析。还应展现用不同软件制作的数据分析报告,让学生评价这些报告的展示效果,从而使学生体会不同软件的优劣势。此外,为了锻炼学生的数据分析综合能力,应将整个实验教学内容串联在一起,应设定具体场景、给定数据集(最好是之前布置给学生进行数据清洗的数据集)、明确分析目标,让学生以小组为单位进行数据分析,并完成数据分析报告,从而锻炼学生的综合能力和团队合作能力。

3.2 教学资源准备

PBL教学法的第二步是进行教学资源准备,强调学生以小组为单位的自主合作学习。本课程提供的教学资源呈现在云端一体化学习平台上,分为课内教学资源和课外教学资源。

(1)课内教学资源。包括教学大纲、课程教材、数据集、教学课件、课堂录播视频、论坛讨论、练习素材等。其中,数据集是供学生进行各种数据分析操作的重要资源,在网络上可以找到许多开源的优质数据集,例如 Tableau官网提供的开源数据集,涵盖运动、教育、商业、科技等多个方面[16],SPSS和FineReport软件里也附有自带的数据集。

(2)课外教学资源。包括与本课程相关的参考书、公众号、论坛/网站/博客、文献、经验帖、视频、应用案例、网络公开课、软件安装包/安装方法/操作手册等,具体如表3所示。

表3 数据分析实验教学的课外教学资源

续表

4 基于PBL的数据分析课程实验

笔者基于PBL方法设计了数据分析实验项目,下面以数据清洗实验教学项目为例,描述实验过程。

(1)设计问题,明确要求。为了使学生理解数据清洗思路、掌握数据清洗操作方法,笔者首先下载了一份包括约一万条销售记录的超市销售数据集,其中每条记录含24个字段。随后,笔者对数据进行了随机改动,将问题设计为“假设你是这家超市的数据分析员,拿到销售数据后,如何用Excel做数据清洗”,让学生体验数据清洗的过程。完成清洗后,每个小组需要提交一份清洗后的数据和数据清洗报告,清洗结果和原数据的误差应控制在2%以内。

(2)提供学习资源。资源内容涵盖了数据清洗的思路、内容、方法和案例。

(3)分组与合作。每个小组约5人,学生可以自由组队、自由安排角色及分工。进入数据分析员角色后,每个小组首先要定义问题,即结合问题背景,明确此次任务的要求,确定所需的知识和工具,找准解决问题的方向。由于销售属于商科范畴,学生需通过查阅相关资料了解每个字段的含义和字段间的逻辑关系。此外,学生需掌握数据处理的具体操作。首先应从英文拼写错误、重复值、空值、数据不一致、数据不合理等几方面分析该数据集中字段和记录的特点,然后各自对数据进行清洗。清洗完成后,首先要在小组内进行交流讨论,对不同的处理结果进行分析,统一认识后按照清晰思路撰写报告,并在课堂上做汇报。

(4)沟通与指导。在以上过程中,笔者与助教团队定期与学生进行沟通,了解学生的任务进展和遇到的困难,并给予适当点拨和指导。

(5)评价与反思。首先,学生要进行自评和互评。通过自评,学生可以反思自己的收获与不足,教师也可以了解学生的认知水平。通过互评,学生能从他人的角度认识到自己在团队中的表现和作用。学生普遍反映,通过这次小组作业,他们经历了从问题发现、问题解决到分析总结的全过程,体会到数据处理的复杂性,也认识到数据规范性、一致性、完整性的重要性。学生认为这次作业是具有挑战性的,主要体现在对不同学科的数据的理解上,如:数据项是什么意思?数据项间存在什么关系?如何通过数据项的关系检查数据的正确性?此外,学生认为团队合作精神、跨学科学习能力有所提高,学习信息量有所增大。最后是笔者从学生的学习态度、作业质量、团队合作等方面对学生进行综合打分,并对每个小组进行细致评价。

5 结语

数据分析课程是很多专业都开设的一门专业课程,其实验教学具有教学内容广泛、跨学科程度高、理论与实践并重等特点,同时面临实验课时有限、学生跨学科能力有限、知识点分散等问题。采用PBL教学法能通过巧妙的问题设计、系统性的资源提供、适当的引导及以学生小组为主体的学习方式较好地完成实验教学,有利于提升学生的跨学科思维能力,保证教学内容的系统性,从而有效提高人才培养质量。

猜你喜欢
跨学科图表教学资源
跨学科教学在高中生物课堂教学中的应用实践
应用型高校推进跨学科人才培养的路径探索
跨学科前沿研究生课程的教学改革探索
丰富历史教学资源 提升课堂教学质量
高校冰上教学资源社会开放的意义及管理模式
商标跨类保护的跨学科解释
双周图表
双周图表
双周图表
图表