林愿
摘要 在大数据背景下,海量的网络资源的出现,使得用户在挑选学习资源时无从下手。为了帮助用户找到自己真正需要的而且是适合自身的学习资源,有必要创建有效的学习资源在线推送平台,这是当前教育技术的研究热点。当前,学习资源在线推送算法主要有基于内容的推送方法和基于协同过滤的推送方法,这两种方法都存在不足之处。本文在综合了协同过滤推送算法和基于内容的推送算法的基础上,结合学习过程中学习者的动态行为数据,提出一种混合协同过滤的、能自适应更新的智能化推送服务模型,将其应用到在线学习资源系统中,以进一步提高学习资源推送的预测精度和覆盖率,期望能对当前的数字化学习资源建设提供借鉴和参考。
关键词 大数据 学习资源 智能化 推送
中图分类号:G642 文献标识码:A DOI:10.16400/j.cnki.kjdkz.2018.02.034
0引言
当前已进入大数据时代,在线学习成为趋势。一方面,网络上形形色色的学习资源信息量很大、更新速度也很快、共享性也很高。另一方面,网络上的这些学习资源同时也存在过于分散、没有组织性、梳理起来困难等问题,使得在线学习用户在选择网络上的学习资源时,不知从何下手,迫切需要为用户创建学习资源推荐平台,以帮助用户快速有效地找到合适的学习资源。因此,资源建设中学习资源的智能化推送服务成为大数据时代实现智能型在线学习的关键。
1学习资源智能化推送机制研究现状
随着全球网络化的迅速发展,以及智能手机的普及,全球网络数据量出现爆炸式增长,即所谓的“大数据”,简单地说就是“巨量的资料”,“大数据”带来的海量、高增长率和多样化的信息资产,必须要有新的处理模式、处理方法和处理能力才有可能与之适应。所谓学习资源,通俗的来讲,就是各种支持学习的资源,可以包括教学材料、相对应的支持系统、相对应的学习环境,甚至还包括能帮助个人有效学习和操作的任何因素。在人工智能与数据库技术相结合的基础上应用人工智能、机器学习方法,可以识别和预测各种用户的兴趣或偏好,做到有针对性地、及时地、主动地推送用户所需的信息,以满足针对各种用户的个性化需求。
目前国内外较流行的学习资源推送服务模型主要有两种:基于内容的推送服务模型和基于协同过滤的推送服务模型。
具体来说,基于内容的推送服务模型,以高校课程的推送算法为例,首先是收集用户所学的专业、所从事的职业甚至是用户的个人意愿等方面的个人信息,建立起与个人信息相对应的特征模型。在完成这一步之后,再提取出所要选择的课程的关键词等特征信息,来确定这门课程所对应的学习目的。最后,系统从用户的历史访问数据合并当前的操作日志,抽取出特征向量,通过运算建立起初始推送模型,最后将当前的访问序列与初始向量间的相似程度进行阈值比较,当两者相当时,说明该用户匹配到了与其兴趣相似的课程,就可以进行相关在线学习课程的推送了。这种推送服务模型完全依赖于在线学习课程的关键词、课程简介等,因而存在以下问题:首先因为网络课程的特征有限,其模型过度依赖于用户浏览过的在线学习课程,所以很难提取到真正有效的特征项,系统很难得到最符合的用户喜好课程信息,造成推送资源局限。
基于协同过滤的推送算法则与基于内容的推送服务模型从原理到过程都不同,它主要是应用人的兴趣不是孤立的这一特点,首先根据用户间的共同兴趣而不是根据课程内容来推送。根据用户对该课程推荐项的评分值而不是课程内容提出特征值进行数据处理,通过计算当前用户与其它用户的相似度来预测并推荐用户集。这种推送算法存在以下三个方面的问题:由于该算法是依赖于用户的兴趣评估数据,会在课程评价方面存在稀疏问题;特别是一门新的课程首次在线出现时,还没有任何用户的评价,协同过滤没有办法对它进行预测和评价,因而不可能准确地推送;如果用户不了解课程的内容,可能被推荐到已学过的内容,影响推送的效果。
本文在综合了协同过滤推送算法和基于内容的推送算法的基础上,结合学习过程中学习者的动态行为数据,提出一种混合协同过滤的、并且能自适应更新的智能化推送服务模型,将其应用到在线学习资源系统中,以进一步提高学习资源推送的预测精度和覆盖率。
2采取的方案
针对大数据背景下海量网络学习资源需要组织、管理,以方便用户选择真正适合自己的资源,目前主要有基于内容的推送算法和基于协同过滤的推送算法。基于内容的推送算法依据的是课程关键词、课程简介等提取课程特征值,与学习主体完全脱离,存在推送不准确的问题。基于协同过滤的推送算法则完全不从内容提取特征值,仅仅根据用户对课程推荐项的评分值进行处理,也存在一些问题。如果能有机地将两种推送算法结合起来,并把学习者在学习过程中产生的动态行为数据考虑进来,从而构成一种能自适应更新的混合协同过滤的智能化推送服务模型,提高学习资源推送服务的预测精度和覆盖率。
本文依据社会需求,以教育信息化理论为理论依据,对大数据环境下学习资源智能化推送服务机制进行研究和改进,课题研究主要采用文献研究,实践研究等方法,从理论研究入手,首先利用数据挖掘、语义分析等技术进行基于内容的推送算法的研究;然后根据用户对课程推荐项的评分值的高低,提取特征值进行数据处理,并计算当前用户与其它用户的相似度,产生预测与推荐用户集,进行基于协同过滤推送算法的研究。再将两者与学习过程中学习者的动态行为数据有机结合,构成一种能自适应更新的混合协同过滤的智能化推送服务模型,以提高资源推送的预测精度和覆盖率。具体方案实施首先采用探索性实验,之后进行改进实验;在本校的网络教学平台上进行新模型的实证研究,首先选择“集成电路设计”这门课程试点,摸索经验,修订模型,再在整个网络教学平台上推广运行,并进一步总结经验完善推送服务模型,通过多次的师生实践不断总结和分析改正大数据环境下学习资源智能化推送服务模型的不足和缺陷。
(1)组织课题组成员广泛钻研国内外与本课题有关的文献资料,研究其新动向、新成果、新理论,准备开题论证,修改课题数据,拟立课题研究实施计划。
(2)在本校将提出的混合协同过滤算法应用于教学资料库、网络教学平台等,按照课题研究实施计划,在学生及任课老师等多个方面进行试验和探索。
(3)在继续前面试验的同时,及时掌握反馈信息,做好总结、提高工作。
(4)組织课题组成员会议,进一步修改完善智能化推荐算
80
2018年/第5期/2月r中J法,通过反复的实践不断完善算法。
3研究内容
(1)大数据环境下学习资源智能化推送服务的社会需求调查研究。
(2)大数据环境下基于混合协同过滤的学习资源推送服务的研究。
(3)随学习者的动态行为数据自适应更新的学习资源推送服务的研究。
(4)大数据环境下学习资源智能化推送服务模型构建的研究。
(5)在本校网络教学平台上进行学习资源资源智能化推送服务模型的实证研究,首先选择“集成电路设计”这门课程试点,摸索经验,修订模型,再在整个网络教学网络平台上推广运行,进一步总结经验,完善推送服务模型。
4结束语
本论文通过调查大数据环境下学习资源智能化推送服务的社会需求,将目前存在的两种主要的推送算法结合起来,扬长避短,并且与学习过程中学习者的动态行为数据有机结合,使其自适应更新,构成一种新的混合协同过滤的智能化推送服务模型,预计能显著提高学习资源推送服务的预测精度和覆盖率,能对当前的数字化学习资源建设提供借鉴和参考,从而促进智能型在线学习的发展,完善教育信息化理论和产生一定的社会效益。