陈秀枝,吴梨梨
(福州英华职业学院,福建 福州 350014)
网络教育的提法由来已久,但“互联网+教育”的模式无论在国内还是国外均是新鲜事物。“互联网+教育”是将当前日新月异的互联网科技发展成果与各类院校的教育教学进行深层次融合,构建大数据云平台,为教师及学习者提供专门定制的教育教学服务。与传统教育模式相比,“互联网+教育”是具有高度自主性的学习模式,学习完全依赖于学习者的学习热情和自我控制能力,这就要求学习者本身具备一定的学习素质和能力。然而目前大部分互联网自主学习者在学习过程中均表现出缺乏自主性、自我控制能力及自主学习能力的现象。通过在互联网教育中引入监控机制并建立自主学习行为监控系统,采集学习者自主学习数据进行挖掘与分析,研究其学习方式和习惯,提供基于大数据分析的互联网环境下自主学习建议,可以引导学习者摆脱被动学习,真正将自主学习付诸实际行动,做学习的主人。因此,研究并建立基于大数据的自主学习行为监控系统,具有非常重要的实践意义。
与传统的课堂教学相比,互联网环境下的自主学习行为具有以下主要特点:(1)学习环境虚拟化。随着无线互联网技术的飞跃式发展,互联网自主学习者脱离了传统的教室封闭环境限制,可以在家庭、网吧、商店、公园、街头等任何拥有无线网络信号的地方进行学习,其学习环境是完全开放式且虚拟化的。(2)学习过程自主化。与传统的被动灌输式教育不同,互联网自主学习者在选择学习方向和内容时完全凭借个人的兴趣爱好,在学习过程中也会因个人个性或外部环境影响等因素随时中断或继续,学习过程实现完全自主化。(3)学习技能深度化。互联网学习资源浩如烟海,学习者要找到适合的学习资源,需要具备一定的互联网技能,甚至可能需要进行专门的学习技能培训。与传统的课堂学习相比,互联网学习越来越呈现出学习技能深度化的特征。综合上述分析,自主学习行为监控系统应根据互联网学习的特征实现以下基本功能:
互联网自主学习行为监控系统的首要任务是记录学习者的学习情况。受学习者性格及其周围环境的影响,学习者自主学习的能力呈现出参差不齐、两极分化的现象。而互联网自主学习者的学习环境更加开放且多变,对其自主学习效果的影响因素呈几何级数增加,如果无法实现学习数据及轨迹的记录存储,则一切后续的分析、改进、提高都成为了空谈。所以,自主学习行为监控系统首先应能实现在各种不同的环境及外界因素影响下完整收集记录学习者学习数据、跟踪其学习轨迹等功能,为进一步的个性学习统计分析提供基础数据支持。
自主学习行为监控系统的最主要作用就是反馈学习效果。互联网自主学习是完全开放性且自主化的学习,学习者拥有选择是否使用自主学习行为监控系统的权利,而是否使用的决定性因素就在于系统能够在多大程度上反馈学习者的学习效果。因此,自主学习行为监控系统在实现收集并记录如点击鼠标、观看视频、浏览网页、提问发帖等学习者的学习行为轨迹后,应能根据相关数据进行统计、分析及挖掘,借此了解学习者个人的行为习惯,判断其学习的规律,确定哪些知识技能是学习者还没有掌握的、比较不易理解的、需要反复加深印象的,并将上述这些信息综合整理后反馈给学习者,向其智能推荐可能所需的相关学习资源。与课堂教学的传统模式相比,学习者将能以符合自己个性的学习模式和学习途径来进行学习,从而得到有别于以往其他任何学习模式的学习体验。
目前的互联网教育服务主要是在知识结构、课程设计、学习资源等方面下功夫,忽视了对学习者的学习行为的采集分析,因而在自主学习过程中普遍存在着教师角色介入不足、教学课程缺少针对性、学习者和授课人之间缺乏交流、学习者得不到被人尊重的感觉等等问题,这对自主学习者的学习热情产生了一定程度的影响,也是目前互联网自主学习效果不佳的一个重要原因。互联网自主学习不是一个人孤独地反复背诵记忆的过程,设计自主学习行为监控系统应充分考虑到学习者的关注重点和情感因素,应完善授课人和学习者之间、学习者相互之间建立起交互联系的沟通机制。学习者通过在开放式的网络教育平台自由发言,可以减少课堂教学时学生普遍存在的畏惧心理,改变传统教育模式中被动接受知识的限制,甚至授课人和学习者都可以在相互学习的氛围中共同进步。这样一来,就激发了学习者的学习热情,使其更有动力去了解和掌握越来越深度化的互联网学习技能,从而大幅提高自主学习效率。
由于互联网学习环境的虚拟性及开放多变,互联网自主学习行为的数据采集有一定的难度。互联网自主学习行为数据采集的关键在于确定互联网自主学习行为监控系统的数据采集内容,即正确适当地定义互联网自主学习行为的数据模型。
互联网自主学习行为数据模型的定义难点是:模型过于笼统,则可能丢失许多与学习者互联网学习相关的行为数据,缺少进一步分析的基础支持;模型过于细致,则会导致记录的数据量过于庞大,分析计算将消耗极大的资源,严重影响行为监控系统的实时运行效率。
综合以上因素分析,定义互联网自主学习行为数据模型应抓住问题的本质,即自主学习行为的主体。互联网自主学习行为的主体无疑是学习者本身,那么学习者所进行的行为活动、行为客体、行为环境就是需要记录并分析的数据要素。因此,本文将互联网自主学习行为数据模型定义为行为主体(W)、行为活动(D)、行为客体(T)。行为主体(W)即数据模型中的用户身份,是由字母及数字组成的互联网自主学习者在高校教育云平台上的唯一账号,用以辨认用户的身份,确定数据记录的归属。行为活动(D)则是由学习者访问高校互联网教育云平台期间所做的所有操作及操作所用的时间共同组成,是数据记录的主要内容,也是数据模型的核心要素。行为客体(T)也就是学习者自主学习时的对象,表明了学习者学习的目的,也是分析其喜好兴趣的最主要因素。操作对象需要在模型中进一步细化定义其属性,其中需定义的对象属性主要包括操作对象类型、名称及标识等。
互联网自主学习行为数据模型正确定义之后,下一步需要确定自主学习行为监控系统数据采集的具体方式。根据互联网自主学习行为的主要特征,本研究采用服务器Web日志加上后台数据库进行数据采集。通过服务器Web日志可以清楚地得知用户在何时、何地(IP地址信息),在何种环境下(何种操作系统、何种浏览器等信息)访问了什么网站,是否访问成功等诸多与学习者自主学习紧密相关的信息,因此,通过服务器Web日志来采集自主学习行为数据是较为便捷且容易实现的技术手段。但Web日志无法确定用户身份,且无法实时获取用户在网站所进行的操作和相关信息。为解决这些问题,需要引入后台数据库作为Web日志的有效支撑。后台数据库负责存储网站管理者及访问者注册、浏览、点击、发帖、评论等所有操作数据和信息,并建立相关数据表,方便之后的信息检索。引入后台数据库后,可有效弥补服务器Web日志的不足,有效采集互联网自主学习数据。
确立系统模型是组建自主学习行为监控系统的第一步。鉴于自主学习行为监控系统的主要作用,本研究将模型分为三大模块:一是数据收集模块,通过服务器Web日志及后台数据库收集并存储自主学习行为相关数据并建立自主学习行为数据库。二是统计分析模块,负责提取分析自主学习行为数据库中的数据,并匹配相关算法开展数据挖掘,确定学习者互联网自主学习的行为模式、学习习惯及兴趣偏好。三是反馈展示模块,向学习者提供符合其行为模式、学习习惯及兴趣偏好的个性化学习建议,并通过图形化界面向学习者展示。
图1 互联网自主学习行为监控系统模型
1.多层分布式.NET技术。本研究采用微软推出的.NET互联网开发平台进行网络应用程序的开发。采用分布式多层技术,通过多台互相连接的计算机分别执行不同的功能来解决异构数据库、不同网络语言及差异化平台协同问题。NET平台基本构架为三层:数据服务层、应用服务层、表示层。用户只要使用IE浏览器,就可以在任意地点存取、执行系统,极大地方便了自主行为监控系统的应用。
2.数据库技术。根据自主学习系统庞大的数据使用需求,本研究采用SQLServer2012数据库管理系统。SQL Server2012可提供数百TB容量的全面端到端的数据处理方案,且完全支持云平台,同时还减少了数据系统的多平台管理、分析的复杂程度。在.NET平台上,调用SQLServer2012数据库通过ADO.NET实现。
3.Web数据挖掘技术。自主学习行为监控系统采集的数据包含了系统数据和学习者自主学习行为相关数据,直接从数据的层面上看,无法得到学习者的学习习惯、行为模式及兴趣偏好,需要通过Web数据挖掘来分析归纳。学习者使用互联网自主学习平台账号登录系统后,自主学习的行为数据经过预处理后形成信息矩阵。在本研究所构想的环境中,自主学习者人数众多,但每次访问的资源页面相对不多。因此,采用稀疏矩阵的三元组表示法进行系统数据存储。其数据挖掘的具体方式如下:
(1)检索超出系统设定访问频率的频繁访问页面及访问时间;
(2)通过访问页面的频率检索出频繁访问的客户群体及相关页面集;
(3)利用遍历矩阵,配合连接强度阈值,获得访问页面的常用路径;
(4)用聚类分析方法进行数据挖掘,得到用户的学习习惯及兴趣偏好。
本研究采用K均值聚类算法。其基本算法分为四步:
①聚类中心初始化。选择K个样本点作为初始化的聚类中心。记为Z1(1),Z2(2),…,ZK(1)。
②聚类。按最大近似度原则,将每一个样本数据分配给K个聚类中心,成为K大类。在第m次循环时,若有‖X-Zj(m)‖<‖X-Zi(m)‖,i,=1,2,∧,K,i≠j则有x∈fj(m)。fj(m)为第m次循环时,第j个聚类中心Zj所代表的子集合。
④若Zi(m)=Zi(m+1),i=1,2,∧K,则算法收敛,否则转到②)继续循环。
完成计算分析后,将结果数据存入数据库。
4.OWC图表可视化技术。本研究采用微软公司推出的Office Web Component(OWC)组件进行图形化反馈。使用OWC图表组件,可以充分应用IE提供的大量交互功能,可以使互联网自主学习行为监控系统呈现图表化的反馈界面,数据更加清晰简洁,用户体验较好。
系统搭建完成后,首先在福州英华职业学院内进行试运行。试运行主要测试了系统运行基本状况、网络访问效率、自主学习行为统计及反馈效果等基本功能,对发现的系统界面不够友好、占用网络资源较高、反馈图表不够直观等问题提出改进建议,为进一步完善系统奠定基础。本系统在试运行阶段即在福州英华职业学院师生中取得了广泛的好评和较好的使用效果,今后预计在福建省内各兄弟院校扩大试运行范围,征求改进意见,以期建成真正适应当前广大高校学生及自主学习者需求的互联网自主学习行为监控系统。
本文通过研究并建立基于大数据的互联网自主学习行为监控系统,实现对自主学习数据的采集和挖掘与分析,以期提供基于大数据分析的互联网环境下自主学习建议,引导学习者摆脱被动学习,真正将自主学习付诸实际行动,做学习的主人。通过实践表明,研究并建立该系统,对于改善学习者学习积极性,提高自主学习效率具有非常重要的实践意义。