李斌 孙经纬
摘要:随着我国教育信息化进程的不断推进,学习者获取学习资源的方式逐渐从主动检索转变为学习系统自动推荐。智能化的学习内容推荐行为极大地提高了用户获取个性化资源的效率,但是内容推荐在教育领域中的应用仍存在着许多方面的不足。该研究分析了推荐系统在教育领域中的应用现状,介绍了主流的推荐算法及其实现原理,并采用混合推荐模式和不同的推荐策略,设计出个性化学习资源精准推荐系统的系统模型,以期助力学习者的个性化学习。
关键词:精准推荐;个性化学习资源;推荐算法;教育大数据
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2020)02-0057-02
1 学习资源推荐系统的现状
1.1 教育领域中缺少高质量的资源推荐应用
以“淘宝”“今日头条”等商业应用为代表的个性化内容推荐软件已经广为人知,但是内容推荐在教育领域中的发展与应用则显得相对缓慢。一方面,教育应用软件的设计人员对学习者获取学习资源方式的认识不足,许多学习平台的学习资源获取仍然依靠学习者自主检索和教学者分发学习材料,教育大数据所带来的技术优势没有得到很好地发挥;另一方面,盈利机构为了抢占市场,往往通过活动推广等营销手段吸引用户。但是,这类内容推荐平台因为推荐功能不成熟、系统设计不合理而逐渐被使用者放弃。
1.2 学习资源出现“内孤岛化”现象
教育大数据时代,“信息孤岛”在一定程度上得到缓解,但是这种现象并没有得到完全的消除。学习资源的“内孤岛化”现象随着资源数量的剧增,反而呈现出加剧的状况。有学者认为,“内孤岛化”的实质是信息资源(尤其是逻辑上的)碎片化,化解信息资源的“内孤岛化”的问题在于信息资源的再整合[1]。目前国内的学习资源推荐系统,往往过于注重学习资源的网络化,而忽略了逻辑上相关的学习资源的联系建设。大量的学习资源零散地分布在系统平台里面,导致了在学习系统在进行个性化资源推荐的过程中,存在内在联系的学习内容无法形成合力,学习者获取的资源往往是零散的、碎片化的。
1.3 单一的推荐策略和推荐算法可能使用户深陷“信息茧房”
基于用户偏好的推送行为,往往更关注用户偏好的内容而非用户实际所需要的内容。凯斯·桑斯坦在《信息乌托邦:众人如何生产知识》中提出“信息茧房”的概念,指的是“信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的‘茧房里”[2]。以内容推荐算法为代表的推送方法,虽然可以实现用户偏好内容的推荐,但是无法确保用户获取到的内容是否对其个性化学习具有积极的作用。同时,推荐系统在采用单一推荐策略的情况下,一旦缺乏了教学者的监管,学习者只关注于自身偏好的学习内容,用户的学习路线越走越偏,这样“不精准”的推荐行为对学习者有害而无益。
2 推荐算法实现原理及比较
目前,在内容推荐平台应用模型比较成熟的推荐算法有基于内容推荐算法、基于用户的协同过滤算法和基于关联规则的推荐算法。三种推荐算法在内容推荐系统中的实现原理各有不同,我们应该根据情况来进行选择和使用。
基于内容推荐算法,是指推荐系统根据学习者的浏览记录和资源使用记录等用户行为数据,计算出学习者的资源使用偏好,并优先向学习者推荐符合其资源偏好特征的学习内容。
基于用户的协同过滤推荐算法,是指推荐系统把兴趣偏好相类似的用户划分到同一群体里面,当某一学习者属于该群体中的成员时,推荐系统会向该学习者推荐群体中其他用户偏好的并且该学习者没有使用过的学习资源。
基于關联规则推荐算法,该算法来源于美国沃尔玛超市的“啤酒和尿布”案例,意指表面上没有关联的两种物品,在背后存在着隐藏的相关性。在学习资源推荐系统里面,不同的用户频繁地使用了两种看似无相关的学习内容,那么这两种学习资源之间具有潜在的关联规则,推荐系统根据一定的关联规则将频繁集项(或频繁同时出现在使用列表中)的学习资源推荐给学习者。
在实际应用当中,单一的推荐算法往往无法实现学习内容的全面的、精准的推送,所以无论是商业领域还是教育领域,往往采用多种推荐算法结合的混合推送。精准在于算法,看似表现“非凡”的算法实际还不够“聪明”,目前完善的办法是多种算法组合,关联更大数据[3]。不同的推荐算法之间存在差异,本文中介绍的三种推荐算法的比较,如下表1所示:
3 个性化学习资源精准推送系统设计
个性化学习资源精准推荐的实现,离不开多种推荐算法的合力,同时也离不开学习者操作行为数据的支撑。在软件工程领域,程序常常被认为是数据结构和算法的有机结合。同样地,一个精准的学习资源推荐系统,对学习者产生的操作为行数据的处理和应用,以及对推荐算法的选择至关重要。
本研究以微信小程序平台为依托,在充分发挥微信平台“用户群体庞大”“用户活跃度高”等优势的同时,通过采用混合推荐的方法和不同推荐策略的结合,设计出基于数据驱动的个性化学习资源精准推送系统模型,详细的推荐系统模型如图1所示:
从系统架构的角度来看,该系统可以分为表现层、业务逻辑层和数据访问层。在表现层中,主要负责的是向用户呈现推荐学习资源推荐系统(微信小程序)的交互界面,如提供用户授权登录、用户数据的输入、学习资源的使用等界面;而业务逻辑层主要处理数据访问层和表现层之间的逻辑,它包括了学习行为数据的采集、学习行为分析以及学习资源的推荐;数据访问层主要负责存储数据,它包括了用户的基本数据存储、学习资源存储以及学习行为记录存储等方面。
从推荐算法的角度来看,该系统采用基于内容的推荐、基于用户的协同过滤推荐和基于关联规则推荐三种推荐算法混合推荐。一方面,多种推荐算法的组合使用既能解决用户协同过滤算法的“冷启动”问题,同时还能有效地减少学习者在使用学习资源的过程中对偏好资源的依赖。推荐系统向用户推荐的资源不仅仅有学习者偏好的,同时也有学习者“不是十分偏好的,有助于学习者进步的”学习资源,从而避免学习者深陷“信息茧房”之中;另一方面,不同推荐算法有各自的优势和劣势,通过多种推荐算法进行恰当的整合,既可以使得学习资源推荐方式的灵活多样,同时也确保了用户能够得到更加全面的学习内容。兼顾了学习者对学习资源的“用户偏好”和“切实需求”两大方面,极大地提升了资源推荐系统的精准性。
从推荐策略的角度来看,该系统包括了推荐系统自动推荐、教师引导推荐和学习者个体定制三种推荐策略。其中学习者个体定制策略的个性化学习程度最高,推荐系统自动推荐的个性化学习程度较高,教师引导推荐的个性化学习程度中等[4]。教师根据不同学习者自身的学习情况,向学习者推荐相关的学习资源,有利于发挥教师的监督作用和引导作用;推荐系统根据学习者对学习资源的使用情况,包括学习者对资源的类型偏好、学习者对章节知识点的掌握情况,为学习者提供“用户偏好”的和“确切需要”的学习内容;在学习者個体定制策略方面,推荐系统提供了不同的标签,用户可以对自己感兴趣的标签进行订阅操作,推荐系统会根据学习者的订阅情况向其推荐订阅标签相关联的学习内容。
个性化学习资源精准推荐系统的功能实现,需要推荐算法、推荐策略、用户特征数据库和学习资源数据库等组成要素的有机结合。学习者通过使用推荐系统,在授权登录和用户注册的过程中生产了最原始的用户特征数据,随着用户数量的增加和用户使用推荐系统时长的累积,用户特征数据库变得越来越完善。推荐系统既可以根据学习者对资源的“收藏”“频繁使用”等行为数据向学习者推荐“偏好资源”,也可以根据相类似的学习者群体通过用户协同过滤的方法为学习者提供学习资源,还可以根据学习者的错题情况及时地向学习者推荐补救性学习资源。在推荐方式多样化、推荐内容精准化的系统中,教师充当引导者和学习资源的建设者的角色,以学习者为中心的个性化学习得到强有力的支持,有效地促进了学习者的个性化学习。
4 结束语
本研究分析了学习资源系统的应用现状,总结了内容推荐系统应用于教育领域中存在的不足,并系统介绍了三种主流的推荐算法以及它们的优势和劣势。通过采用混合推荐的方法,结合不同的推荐策略,设计出基于数据驱动的个性化学习资源精准推荐系统。通过实现学习资源的“个性化”“精准化”推荐,促进学习者的个性化学习。
参考文献:
[1] 赵慧,刘君.以用户为中心的信息构建与网络治理——信息构建理论视野下的政府网站信息资源“去孤岛化”研究[J].公共管理学报,2013(1):128-134.
[2] 梁锋.信息茧房[J].新闻前哨,2013(1):87.
[3] 张挥,邹宇松.信息推送教育应用探析[J].中国教育信息化,2019(10):94-96.
[4] 孙众.骆力明,等.数字教材中个性化学习资源的推送策略与技术实现[J].电化教育研究,2014,35(9):64-70.
【通联编辑:光文玲】