数据挖掘课程混合式教学改革探索

2021-08-28 02:08葛晓燕
电脑与电信 2021年6期
关键词:数据挖掘案例算法

葛晓燕

(新疆财经大学统计与数据科学学院,新疆 乌鲁木齐 830012)

1 引言

随着人类科技的不断进步,移动互联技术、人工智能、物联网、云计算等新技术不断产生和发展,并逐渐深入应用到社会生活的各个领域,方便人们生活的同时也产生了海量的数据信息。大量的数据中蕴含着丰富的知识和规律,如何从海量数据中挖掘出有用的模式、规律以及社会经济需求等有用信息已成为各行各业研究的重点[1]。面对大数据时代对数据分析人才的迫切需要,数据挖掘课程应运而生,成为高校培养数据分析人才的重要课程。数据挖掘课程是一门综合性较强的多学科交叉课程,大数据的存储和管理离不开先进的数据库技术,大数据的挖掘和计算离不开高性能的计算机技术以及机器学习、数学建模、统计学原理等知识,因此,不管对于老师教学还是学生学习,数据挖掘都是一门具有高要求的课程。

目前,数据挖掘技术在金融、电信、医疗、零售、社交网络等很多领域都取得了成功的应用,因此数据挖掘课程内容涉及广泛,包含大量的原理和算法,具有课程难度系数大、学科交叉性强等特点,传统的课堂授课方式效果并不理想,由此,很多高校对于如何上好数据挖掘课程从不同角度展开了大量教学研究[2-3]。同时,随着“互联网+”思维对教育领域的影响,慕课、微课、雨课堂等教学方式逐渐应用到课堂教学中,传统的“粉笔+黑板”的教学模式正在发生着深刻的变革。因此,本文基于数据挖掘课程的教学现状,融合移动通信技术、网络教学资源、现代学习理论,探索构建适用于数据挖掘课程的混合式教学模式,使得该课程的教学中心从“以教师为中心”向“以学生为中心”的培养体系转变,形成以“课堂为主、线上为辅”的教学方式,从而激发学生的学习兴趣,增强学生对实践问题的分析与解决能力,提高学习效果。

2 教学现状与问题

数据挖掘课程目前是我院面向信息管理与信息系统专业和统计学专业开设的专业选修课,目标是以后逐渐扩大至覆盖更多专业的选修课程,授课范围将涉及不同专业,不同先修基础的班级。在现有的教学过程中,基本都是传统教学模式,学生被动学习,缺乏学习主动性,动手实践能力弱,教学过程中主要存在以下一些问题:

(1)教学内容难且学生学情不统一。数据挖掘课程内容涉及数据库技术、统计学原理、机器学习、算法设计等多学科基础知识,需要学生具备一定的逻辑思维能力,而每个专业的先修课基础都不一样,基础相关知识掌握差异较大。同时要培养学生的数据挖掘实践应用能力,必须要进行算法编程,这对于非计算机专业的学生来说都是有一定难度的。课程内容多为枯燥的算法设计和数学公式,这很容易让学生产生畏惧心理,从而失去学习兴趣和主动学习的动力。

(2)教学方法简单且教学资源贫乏。传统的课堂讲授都是老师进行数据挖掘算法和原理的引入、推导和讲解,学生被动地理解记忆;在实践课上也是老师布置实践任务并指导上机,学生缺乏合作和创新解决问题的能力锻炼,教学方法单一,互动性较少,学生缺乏主动思考和主动学习,需要进一步调动学生学习积极性,丰富教学手段。同时,授课内容基本限定在教材内容范围内,教材内容与数据挖掘技术的最新发展和应用存在一定的滞后,因此借助现在丰富的网络教学资源和教学手段是弥补现有教学模式缺点的有效途径[4]。

(3)理论学习和实践应用结合有待提高。在传统的数据挖掘授课中,基本都是以老师为中心进行算法理论讲解,学生被动学习,对算法应用缺少感性认识,实践课上会有畏难情绪,加之编程技术薄弱,算法实践课比较困难。理论学习与实践应用相脱节,所学知识得不到深刻理解,面对实践课上的数据挖掘问题会感到无从下手,不能很好地应用所学的数据挖掘知识解决问题。

(4)考核评价体系需进一步完善。传统的考核方式都是采用闭卷考试进行,以笔试成绩为最终成绩,缺少对学生学习过程的评价,同时考点主要以教材中的算法原理和知识点为主,缺少对理论知识应用能力的评价。学生即使理论掌握得不够扎实,不会数据挖掘算法的编程实践,也能通过死记硬背的方式勉强通过考试,从而导致学生的学习兴趣更加减少。

3 数据挖掘课程混合式教学改进探索

(1)修订教学计划,依据学情进行分层教学。目前越来越多的专业选修数据挖掘课程,不同专业的先修课基础差异很大,但是不同专业、不同学科对数据挖掘理论的掌握程度和实践应用能力的要求也是不一样的。数据挖掘课程内容广泛,学习难度系数大,我们可以根据不同专业的先修基础和专业要求进行分层教学,对于信息管理与信息系统专业等先修基础较好、具有编程能力的专业可以要求掌握经典算法的原理和应用,并能进行算法的设计和编程,这就要求学生通过几门学前课程的学习为基础,才能达到数据挖掘知识的深度掌握和灵活应用。而对于其他经管类专业或先修基础薄弱的专业,只要求能对相关专业的社会经济数据进行简单的挖掘分析即可,可以弱化数据挖掘算法的理论原理,强化不同算法的应用实践,同时考虑到编程基础薄弱的问题,也可以选择操作较简单、易上手的平台,比如我院统计学专业的学生大多使用R平台进行数据分析,那么数据挖掘的实践平台就可以选择R进行,不需要再花时间掌握编程基础。

(2)构建充裕的教学资源库,综合各种教学手段进行混合式教学。针对教材内容滞后和教学资源匮乏的问题,可以充分利用近几年发展起来的网络教育资源,选择和教学内容相适应的MOOC资源辅助学生课前预习和课后巩固;同时针对不同专业学生的学习目标,选择较新的应用案例形成案例库,不同专业的班级可以选择不同的案例进行理论讲解;建立最新的文献库,供学力有余的同学进行课外扩展学习[5-6]。“以老师为中心”的教学模式不能取得较好的学习效果,因此可以借助雨课堂、案例引导、文献解读、项目小组讨论、综合性试验等教学手段相互融合,取长补短,适应新时代学生的学习特点,以达到更好的学习效果。融合后的混合式教学过程如图1所示。

图1 混合式教学模式设计

首先,课前通过雨课堂和微信群等方式推送预习资料。课前向学生发送学习资料(电子教材、授课PPT、预习短视频等),也可指定某慕课视频让学生进行预先学习。

其次,课中采用多种教学方式完成教学重点、难点的掌握,注重师生互动。特别针对学生自主预先学习完成的内容,以提问、讨论的方式再次进行深入解读和解析,激发学生主动发现问题、探索问题的思维方式。根据学生对知识点的理解程度,再借助板书、多媒体、雨课堂、案例讲解、文献解读、小组讨论、上机、小组综合性项目等教学手段完成教学内容重点和难点的掌握,增加师生互动、深入交流的途径,以学生为主体,提高学生的学习主动性,注重对学生综合分析能力的培养。

最后,课后单元测验+单元作业。通过雨课堂、微信等布置单元测验与作业,学生完成相关练习和测验,巩固所学知识,同时可以帮助发现学生掌握的薄弱环节。

经过融合多种教学手段和丰富的教学资源后,混合式教学设计更加优化,综合线上线下教学优势,扬长避短。增加课堂互动、案例引导、小组讨论、课后学习交流等多种形式教学方式,采用学生课前线上自主预习、课上重点教学查漏补缺、实践加深理解和应用、课后复习巩固的混合式教学模式,教学效率得到大大提高。

(3)采用分层次、递进式实践练习任务促进数据挖掘算法原理的理解和应用。数据挖掘算法讲解晦涩枯燥,理解过程中缺少感性认知,使得学生失去学习兴趣,存在实践能力不足等问题。我们可以通过课堂的案例分析和小组实践项目设计等方法来改变理论学习与实践相脱节的现状,首先课堂中使用案例分析引导的方式教授数据挖掘算法理论的重点知识和原理,并在课堂上通过案例展示算法的实际应用,让学生对算法应用有了感性认知,激发起学生的求知欲;接着在实验课上先布置与课堂案例类似的实践任务,让同学模仿案例完成实践任务;再布置小组团队进阶任务,这部分任务需要对辐射知识进行学习,在原有算法基础上进行改进后才能完成,这部分内容实践是通过“做中学”“小组讨论”“互教互学”“马上应用”等形式完成,这样既完成了辐射知识的学习,也锻炼了动手实践能力和小组合作能力,让学生自主学习,激发成就感,向“以学生为中心”的自主学习模式转变。比如在讲解决策树生成算法ID3时,课堂主要利用案例讲解ID3 算法的原理和应用,对ID3 算法的不足和改进只是在最后进行总结;在实践课上布置的小组任务是根据一组汽车数据进行决策树生成,其中要求根据油耗(连续数据)属性进行分类预测,这就要求学生先对基于ID3算法的改进算法C4.5进行拓展学习,之后小组进行讨论如何对连续属性进行处理,然后建立决策树。通过这种案例引导、小组讨论学习的方法可以让学生在具体的实践过程中深刻理解算法原理,增强了学生理论应用于实践的能力。

(4)案例教学贯穿始终。数据挖掘课程内容较多,课时有限,如果使用传统授课方式,每个算法都由理论基础、原理讲解、算法应用等步骤来完成,课时肯定是不够的,而且学生理解掌握效果差。因此,我们根据不同专业班级的专业背景,在算法讲解时从案例库选择与专业相近的应用案例,使用案例引导讲解重要的知识点和核心知识,使学生在学习理论知识的同时也对算法应用有了一定基础;接着在上实践课时,先要求学生能够简单地重复实现案例应用,再进一步提出拓展实践任务,由学生自主完成辐射知识学习以及应用。这样既节省了课堂学时,又提高了学习效果。

(5)完善考核评价机制,实现学习的过程化管理。改变传统的考核方式,将学习过程的每个环节都纳入考核,在课前和课后,充分利用信息技术手段,推送线上预习任务和课后单元小测以及课后作业,对学生学习过程进行监管和测评。在课中,使用雨课堂平台的在线签到、随机提问、学生投票等功能,丰富授课方式;通过提问、讨论、总结等方式,对自主学习内容进行简要的复习和回顾;组织学生分组完成小项目,并进行PPT 汇报。由此将学生线上、线下的学习表现均纳入评价体系中,落实过程控制的主导思想。最后的课程成绩由期末成绩、期中成绩、平时成绩(课前预习成绩、课堂表现成绩、实验成绩、课后作业成绩)三大部分组成,实现对学生学习的过程考核,由此引导学生注重平时的日积月累以及实践能力的提高,改变平时不学习,期末几天死记硬背的学习现状。

4 结束语

顺应时代发展的要求,数据挖掘和分析能力已成为当代大学生的基本技能,很多高校不同专业都开设了数据挖掘课程,但是数据挖掘课程具有内容多、应用广、难度大等特点,因此采用传统教学方法并不能达到满意的教学效果。本文针对数据挖掘课程目前的教学现状和存在的问题,对混合式教学改革进行探索研究,考虑学情基础进行分层教学,综合应用网络教育资源和各种先进的教学技术,丰富优化教学模式,采用分层次、递进式实践练习任务促进数据挖掘算法原理的理解和应用,案例教学贯穿始终,完善考核评价体制,实现学习的过程化管理;逐步从“以教师为中心”的教学模式向“以学生为中心”的模式转变,实践证明这些改进调动了学生学习的积极性,加强了学生理论知识的掌握,提高了学生的应用实践能力。当然,随着时代发展,数据挖掘课程的教学会不断出现新的需求和问题,需要我们不断改进。

猜你喜欢
数据挖掘案例算法
改进支持向量机在特征数据挖掘中的智能应用
哪种算法简便
ORACLE CINEMA CEDIA 2020案例大赛获奖案例
TWO VILLAS IN ONE CEDIA 2020案例大赛获奖案例
Bespoke Art Deco Media Room CEDIA 2020案例大赛获奖案例
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
Travellng thg World Full—time for Rree
进位加法的两种算法
根据问题 确定算法