吴佳萍 吴冰冰 杨欢耸
数据挖掘在网络教育中的应用研究
吴佳萍 吴冰冰 杨欢耸
数据挖掘技术在商业、金融业等方面都得到了广泛的应用,但比较少地应用在教育领域。网络教育的普及发展加速了网络教育改革的需求,网络教育数据的挖掘将会对学习者的学习行为、学习特征、需求分析提供更可靠依据,从而更好地为教育服务。
数据挖掘 网络教育 网络教育资源 个性化学习
(一)数据挖掘的基本概念
大量的、不完全的、随机的数据往往让人们无法识别隐藏在其中的能够提供决策的信息,而传统的查询、报表等工具无法满足人们挖掘这些真正能对决策提供支持的信息的需求。因此,急需一种新的数据分析技术,从大量的数据中经过深层分析,获得有价值的潜在信息,数据挖掘技术也因此而得名。数据挖掘(Data Mining)与传统的数据分析(查询、报表、联机应用分析)的本质区别就是数据挖掘在没有明确假设的前提下去挖掘信息或知识,并且包括大量的不公开的大数据。数据挖掘是挖掘那些不能依赖直观的感觉发现的数据,有的时候挖掘出来的数据是违背直观感觉的。
在网络教育中,学生在网上学习过程中留下了很多模糊的、有潜在价值的数据,但这些数据并没有得到应有的重视。这些数据主要分为两个方面,一方面是静态的数据,另一方面是动态的数据。静态的数据一般包括学生的基本信息;动态的数据是根据学生的学习行为或学习特征进行随时的跟踪记录,包括学生经常浏览哪些页面;在那些页面停留的时间的长短;在论坛中的活跃程度(发帖以及回帖的数据);在线学习课程内容花费的时间;与教师互动的数据(提问、回答以及回答的准确率)等。以及利用网络进行其他活动的时间等,系统都需要讲这些数据进行定量分析并分类,这也是数据挖掘技术应用在网络教育领域的真正价值。
(二)数据挖掘常用方法
利用数据挖掘进行数据分析常用的方法主要有关联规则、数据回归、分类、预测、聚类、诊断、web数据挖掘、时间序列方法和智能优化方法等,它们分别从不同的角度对数据进行挖掘,方法的选择则依据决策的需求。
(一)网络教育资源缺乏多样性
现阶段的在线教育平台只注重资源的收集,资源的形式较为单一,资源的质量也不能保证,由于网络教育资源缺乏多样性,很少有以互动性或多媒体形式的教育资源呈现,这样也阻碍了优质的网络教育资源在网上的交流与共享。
(二)网络教育缺乏个性化
随着网络学习内容日益增多,随之而来会出现各种问题。目前的网络教育课程内容大多是以Web页面为主,学习者经常无法准确找到自己学习内容的进度,同一个用户在不同的计算机上,不管登陆多少次,每次都需要通过固定的查找路径。在这种情况下,如果能以学生为中心,为每一个学生提供相对应的个性化学习服务功能,根据学生的需求自动或者半自动的调整课程内容。这也是越来越多的学习者所期待的。
(三)网站设计有待优化
目前,大多数的教育网站的知识导航设计缺乏个性化学习指导,没有从用户视角出发,没有真实了解用户体验,部分自主学习相对较弱的学习者会产生压力,并且会对学习内容产生迷茫,不知道自己从哪儿开始学习。
(四)无法全方面监控学习过程
在网络教育模式中,师生不局限于同一空间、同一时间、同一地点,教师不能像传统的课堂模式那样,近距离接触学生,对学生的学习情况能够有良好的监控。而且网络教育受众群体广泛,学习者之间都有着鲜明的差异,教师很难全方面的了解学习者的情况以及学习者在现实中所遇到的问题。
(五)网络数据利用率低
学习者在访问网络教育平台的过程中,会产生大量的信息或数据。比如学习者的基本信息、学习情况、访问日志等,这些信息和数据都有利于进一步分析学习者的学习行为或学习特征,并帮助网络教学的开展。但是,这些信息没有被网络教育平台充分利用,造成了一定的资源浪费。并且由于网络资源没有统一规范化,学习者信息检索的结果很难对应自己的学习需求。
(一)数据挖掘在网络教育中挖掘潜在用户的应用
利用数据挖掘技术将学生浏览过的历史记录进行收集并分析,这样不仅可以预测学生的学习需求趋势和学习成果,还能提前预知学生的学习需求倾向是否改变。为提高教育网站的竞争力,还需不断地挖掘潜在的用户。潜在的用户的挖掘依据用户访问产生的信息,利用分类技术,了解真实的用户体验,识别出潜在用户与真正的用户的共同学习特征,确定潜在用户的类型,并在此基础上对潜在的用户有针对性的展示一些有吸引力的学习课程或学习页面,以此留住潜在用户,让其成为真正的用户。
通过web数据挖掘,网络教育机构将得到的分析结果有效的利用,对网页的内容进行相应的调整,尽最大的可能满足所有学习者的需求,终止真正的用户流失并吸引潜在的用户。网络教育虽然很难识别每一个潜在的用户,但是可以更好地运用数据挖掘技术,在对潜在的用户进行分析的基础上,向他们发送适合他们学习的课程内容,吸引他们进入网络教育机构。
(二)数据挖掘在网络教育中辅助教师作出正确的决策
网络教学与传统教学相比具有很大的差别,如网络教学主要靠学习者的自学,传统教学则主要依靠教师的教学;网络教学需要借助安全可靠的网络传输,教与学的活动不局限于同一时间、同一地点,学生可以随时随地的进行学习。
在网络教学中,比较注重过程性评价和总结性评价,学习者在网络学习的过程中留下了大量的数据,这些数据看似无用,也没有在网络教学评价中体现出优势,但是利用数据挖掘工具,充分的挖掘出这些具有潜在价值的数据并进行进一步的探索性分析,分析出来的结果能够有效地保证对学习者进行客观公正的评价,这样不仅避免了传统评价方式的不足,而且还能对学习者的学习过程进行监控和及时的反馈,提升学生的学习兴趣。就教师而言,充分利用数据挖掘的优势,帮助教师检查教学过程,并能及时地调整教学策略,提高教学质量,同时,数据挖掘是一种决策支持过程,它通过高度自动化的分析了师生之间教与学的活动数据,并将数据进行归纳性的推理,从中挖掘出潜在的模式,帮助教师调整教学策略,做出正确的决策。
(三)数据挖掘技术在网络教育中个性化课程推荐的作用
网站根据学习者提交的基本信息、学习需求、学习兴趣等,获取相关的数据,并进行进一步分析,系统会根据分析的结果推送适合学习者的课程内容,如果学习者对推送的学习内容感兴趣,那么系统会继续推送与该内容相关的课程或者广告,学习者经常查阅或容易遗忘的知识点会固定的显示在网站的某个显眼位置,方便学习者查找。由于网络教育受众之广,每个学习者在学习需求、学习兴趣或学习能力方面都有着较大的差异,网络教育通过基于内容的推荐、关联规则推荐等数据挖掘的方式,识别、确定、预调整学习者的学习倾向,来实现对课程内容的个性化推荐,这样不仅提高了在网络教育平台中的学习效率,学习者对网络教育平台也会有越来越深的依赖,提升了用户对网站的忠诚度。
(四)数据挖掘在网络教育中优化网络教育资源库建设
在在线教育平台中,网络教育资源库是重要的一环,作为网络教育的核心,它在人员、时间、空间、地域方面都不受局限。但就现阶段而言,我国的在线教育资源库还存在着很多的问题。第一,尽管网络教育平台和教育资源库在互联网上已经建成,但是资源极度缺乏多样性,很少有互动式、多媒体形式的网络教育资源,资源的利用率不高,资源的形式也较为简单,很多优质的网络教育资源不能进行交换或者共享。第二,就当前的网络环境背景而言,大部分的网站教育平台和教育资源库,往往只关注资源的收集,没有将资源进行分类,因此,资源的质量得不到保障。第三,没有统一的规范网络教育资源的专业术语的描述标准,这样会导致信息检索时较为困难。第四,每个学习者都存在着差异,而现阶段的网络教育资源大部分都是共享的,不能满足学生个性化学习的要求。
将数据挖掘技术应用到网络教育资源库建设中,不仅能够优化网络教育资源库,还能有效的改善以上的问题。首先,对网络教育资源库进行规范化的统一描述,这样不仅能有效地提高信息搜索的准确率,还能让网络教育资源库具有更好地共享性。其次,应用数据挖掘技术,改进资源组织结构,尽可能地满足每一个学习者的需求、学习情况和兴趣,为学习者提供个性化服务。具体来说,就是通过web数据挖掘技术,挖掘出学习者在网络教育平台上留下的学习历史记录等,并将数据进行进一步的分析,系统根据学习者的信息,推荐适合学习者的教育资源数据,并且使有关学习者的需求的页面更容易访问,也更加醒目。学习者也可以通过自己的需求和兴趣进行更改或重新设置推荐的教育资源数据。随着学习者在网络教育平台的多次访问,利用分类、关联规则等方法进行深入挖掘,帮助学习者快速地找到符合其学习兴趣及需求的资源,舍弃那些对学习者自身来说学习效果不大且没有太大价值的信息,真正地实现个性化服务的功能。
通过对数据挖掘在网络教育中的应用进行分析,笔者发现数据挖掘对网络教育有着很大的帮助。虽然数据挖掘技术在网络教育中的应用还在起步阶段,还面临着许多的理论问题和技术问题。但作为一门新兴技术,数据挖掘也会不断地发展和完善,为网络教育的个性化发展提供一条有效的途径。
[1]楼树美,李淑玉.数据挖掘在网络教育中的技能应用[J].智能城市,2016(08):332~333.
[2]谭恒,陈诗杰.中国高校网络教育现状调查[J].河南科技学院学报,2016(07):105~108.
[3]王乐俭.浅谈教育网络信息的现状与应用[J].亚太教育,2015(01):81,43.
[4]郑滟.数据挖掘在教学评价中的应用和研究[D].北京:北京化工大学,2011.
[5]刘纳.数据挖掘在网络教育中的应用研究[A].中国人工智能学会计算机辅助教育专业委员会.计算机与教育:理论、实践与创新——全国计算机辅助教育学会第十四届学术年会论文集[C].中国人工智能学会计算机辅助教育专业委员会,2010:5.
[6]汪全莉,陈代春.Web数据挖掘在网络教育中的应用[J].中国科技资源导刊,2008(02):44~47.
[7]卢永艳.数据挖掘在网络教育中的应用[J].现代计算机(专业版),2007(11):56~57,60.
[8]王长娥.数据挖掘在教学评价中的应用研究[D].济南:山东师范大学,2007.
[9]范莉莎,刘刚,刘志镜.Web数据挖掘在网络教育中的应用[J].计算机技术与发展,2006(06):68~70.
(作者单位:杭州师范大学教育大数据研究所)
本文系2016教育部产学合作协同育人项目(编号:201602034006);2016杭州师范大学智库及教改项目。
吴佳萍(1994-),女,江苏丹阳人,硕士,杭州师范大学;吴冰冰(1998-),女,浙江诸暨人,本科,杭州师范大学;通讯作者:杨欢耸(1965-),男,浙江诸暨人,教授,博士,研究方向:教育大数据。