燕彩蓉 徐光伟 潘乔 黄永锋
摘要:针对传统推荐方法中普遍存在的冷启动问题和推荐结果忽视了项目间的逻辑约束关系问题,分析用户社会属性和社交关系对用户学习行为的影响,以及学习资源之间的约束逻辑,提出面向在线学习的社会化推荐方法,为精准的学习资源推荐提供指导。
关键词:在线学习;推荐系统;社会网络;约束逻辑
中图分类号:G642.4;G250.73 文献标志码:A 文章编号:1674-9324(2018)09-0246-03
移动互联网、智能终端设备和社会网络平台为全方位海量信息的产生与收集提供了保障,促进了个性化在线教育的发展与普及[1]。个性化在线教育是一种基于互联网数据来分析用户学习状况,并满足其学习需求的平台,系统会根据用户的年龄和知识积累,甚至心理活动,判断该用户的教育水平,并在此基础上提供相应难度的课程、资料和题库等。这从根本上改变了传统教育中机械的教学体系,让教育量身定制成为可能。学习资源推荐服务是个性化在线教育平台的关键[2]。传统意义的推荐系统主要是利用电子商务网站向客户提供商品信息和建议,随着移动互联网的发展和大规模数据的产生,推荐系统也被辐射到在线教育领域,通过帮助制定个性化学习方案以及提供更多的参考资料,使得用户可以便捷地获取学习资源,打破时间和空间的限制来学习。目前在线学习推荐研究聚焦于基于用户产生的海量学习活动数据以及社会网络群,利用深度机器学习等技术手段不断优化学习模型,并依此构建自适应学习系统[3]。社会化推荐是在一般推荐方法的基础上,把用户社会关系信息作为重要影响因子引入推荐生成过程,以此提高推荐系统的性能。其优势在于能够解决用户冷启动问题。根据社会网络分析的重要研究成果[4],网络社区中相互联系的群体受社会因素的相互影响,会表现出相似的兴趣爱好及行为规范;在线社会网络的盛行,使得用户之间的活动行为表现得越来越社区化。因此,合理利用用户的社会属性信息和关系将能提高推荐系统的性能。在线教育领域与电子商务领域相比具有一定的特殊性,应用社会化推荐方法进行学习资源推荐能够解决用户冷启动的瓶颈,但是也存在一些问题需要研究。本文将面向在线学习提出相应的推荐框架并阐述其中的关键问题。
一、相关定义
社会化推荐满足了互联网中新问题和新技术发展要求,具有较高的研究价值和应用前景。在线教育领域中,研究人员利用知识建模、数据挖掘等方法,对学习资源、学习路径等方面的推荐问题进行了探索,这些研究表明了学习推荐系统能够对学习者的学习兴趣和学习效率产生积极的影响,有助于在线学习的深入推进[5]。
定义1.评分矩阵:设U为所有用户的集合,I为可以推荐给用户的所有项目的集合;m=|U|,n=|I|;每个用户对每个项目都可能产生一个评分,其值构成了用户-项目评分矩阵R。很多传统推荐方法都是根据评分矩阵提供推荐项目列表。在线教育领域,用户即参与学习的人,项目即学习资源,如书籍、课件、博文等。
定义2.稀疏矩阵:指矩阵中非零元素占全部元素的百分比很小的矩阵(通常为5%以下)。实际应用中,由于多数用户不会对其所浏览的所有项目做出显式反馈,因此评分矩阵通常是稀疏的,这将影响推荐模型的效果。对于一个新用户,与之对应的评分向量为空,所以模型很难为新用户提供服务。
定义3.社会化推荐:设G=(g)为所有用户社会关系矩阵,映射μ:U×I→R′是对推荐结果的评价效用函数,R′是一定范围内的全序非负实数集,称为推荐的效用值,U′={u|u∈U,x≠y,g≠0,g∈G}表示與用户u存在社会关系的用户集合。社会化推荐要研究的问题是:对于用户u,根据所有项目在用户群体U′中的评价情况,主动地为其推荐满足其偏好需求的、效用最大的项目集。这样既能解决新用户的冷启动问题,而且也能缓解评分矩阵的稀疏性。
社会化推荐方法具有很多优势而且被广泛应用,但是因为在线教育领域的特殊性,在使用此方法时存在以下的挑战:其一,面向学习的用户来源于一般群体,但又具有特殊性,社会网络中数据量非常大、结构复杂、数据来源多,如何在这些海量的数据中筛选面向学习的社会属性以及社会关系信息,并对它们进行量化,是首要解决的问题;其二,学习资源不同于电子商务中的商品,它们不是独立的,通常具有先后顺序性,如计算机学科中用户在没有学习C或Java语言课程的情况下对其直接推荐数据结构课程,不符合知识学习的正常途径,因此在推荐时需要考虑项目之间的依赖关系。
定义4.约束逻辑:项目i和i之间的逻辑关系体现为如下几种:
1.相似关系,表示为Sim(i,i),当项目i和i之间的相似度大于某阈值时,认为二者相似。如时尚领域中的项目相似性可能体现为两件款式颜色相近的衣服,学习领域中项目的相似性可体现为两本风格相似的图书。
2.相关关系,表示为Rel(i,i),通过分析用户日志,当选择项目i时也选择项目i的概率大于某阈值时,认为二者相关。如时尚领域中的项目相关性可能体现为款式搭配的运动裤和运动鞋,学习领域中项目的相关性可体现为GRE词汇书和GRE阅读书。
3.依赖关系,表示为Dep(i,i),在学习项目i之前必须先学习i。时尚领域中的项目没有依赖关系,只是存在季节或时尚趋势的变化,学习领域中的项目依赖性体现为知识之间的先后顺序性,如数据结构的先导课程是C语言或Java语言。
4.包含关系,表示为Inc(i,i),其含义是项目i包含i,即选择了i后没有必要再选择i。时尚领域中的项目是独立的,不存在这层关系,学习领域中的项目包含关系体现为课程或资料的包含关系,此关系通常由人工设定。
确定项目之间的约束逻辑关系是构建学习资源推荐模型的一个难点,可通过两种方式产生:一是事先定义,即在建立项目库的时候由人工指定,这种方式比较准确但是效率低下,可扩展性差;二是通过数据挖掘方法获得项目间的关联关系,即通过分析用户访问日志轨迹来发现项目之间的关系,这种方法可能会存在误差,但可扩展性好。
二、面向在线学习的社会化推荐框架
结合用户的社会网络信息以及项目的约束逻辑关系,提出面向在线学习的社会化推荐框架,框架主要由三部分组成:
1.数据收集与准备:通过数据采集模块,收集用户和项目的基本属性数据、反映用户关系的社会网络数据、反映项目关系的约束逻辑数据,以及用户-项目评分数据,并把这些数据按照设定的格式存储到系统中,便于后续的处理。
2.数据预处理及模型建立:确立用户之间的社会关系,建立社会网络,并融入到推荐模型,是社会化推荐系统有别于一般推荐系统的主要特征。在线学习领域,需要从用户的社会网络中筛选对用户学习行为和兴趣偏好有重要影响的数据,量化这些数据,建立面向学习的社会网络图。数据预处理时还需要分析项目之间的相似、相关、依赖以及包含关系,构建资源关联图,通过在推荐算法中融合资源之间的约束逻辑来提高推荐的质量。用户-项目评分矩阵是根据用户的显式反馈获得的,通常维度非常高,而且是稀疏矩阵,可以采用矩阵分解技术对高维数据进行降维,把用户的社会关系信息加权应用到矩阵优化分解过程中。用户的社会关系对推荐具有积极影响,可在一定程度上缓解新用户的冷启动问题。
3.推荐系统构建:根据推荐模型,对推荐结果进行展现和评价。目前已有的研究成果中涉及的数据集大多是小规模或模拟的数据集,当面对实际应用时,需要方法和框架能够满足大规模在线应用的并发性和实时性要求,这将成为社会化推荐系统领域新的挑战。
三、关键问题
社会化学习资源推荐框架中,其关键问题可以归结为以下几点:
1.社会属性和关系的确定和量化。社会网络中的数据包括个体的社会属性信息和社会关系信息,前者的表示比较明确,通过用户注册程序即可获得,后者的表示相对模糊,通过好友、同学、师生关系可获得部分信息。社会关系属性会影响用户个体的学习行为,用户个体的属性会体现在社会网络中,如何量化这些属性没有统一的标准。在贝叶斯概率矩阵分解模型中,这些属性因子通常体现在全局参数的设定或者模型的优化学习过程中,需要在理论推导和实验中进行调整和优化。
2.资源约束逻辑的确定和量化。资源的约束逻辑可由人工确定或者通过数据挖掘方法获得。这种约束关系存在不确定性,而且每个人的学习基础不同,其学习路径会存在差异性。人工设置效率低,如何通过数据挖掘方法来准确量化资源之间的关系,并把这些量化后的约束逻辑融合到推荐模型的评分矩阵中,对于提高推荐质量非常重要。
3.用户社会关系与项目逻辑关系的动态更新。已有的研究中,社会网络拓扑结构基本都是静态的,且来源单一化。随着用户兴趣的转移以及知识的积累,其社会关系网也在发生变化,相对而言,资源的约束逻辑比较稳定,不过新的资源会不断加入资源库中。针对用户社会关系的动态性以及资源的新增与淘汰,都将影响推荐模型中参数的学习与调整。
4.方法评价。推荐系统中常用的评价方式包括:均方根误差(root mean square error,RMSE)和平均绝对误差(mean absolute error,MAE)。两者值越小,表示算法性能越好,其定义如下:
RMSE=,MAE=
其中,T是测试集,|T|是测试集的记录数,i、j表示测试集的第i和第j条记录,r是真实值,是预测值。
RMSE和MAE主要用于评价推荐算法的精度。当数据量非常大时,还需要评价算法的可擴展性和效率。当系统并发性要求高时,推荐算法的实时性也是评价指标之一。而且,在线系统中,用户的实际体验也非常重要,通常采用用户的体验反馈来进行评价。
五、结语
通过研究在线学习中用户和学习资源的基本属性、用户之间的社会关系,以及资源之间的依赖等关系,把社会网络、知识图谱和推荐系统相结合,探索社会化的学习资源推荐方法,为个性化在线学习提供理论和实践上的指导。
参考文献:
[1]Anshari M,Alas Y,Guan L S.Developing online learning resources:Big data,social networks,and cloud computing to support pervasive knowledge[J].Education and Information Technologies,2015,(5):1-15.
[2]Dwivedi P,Bharadwaj K K.E-Learning recommender system for a group of learners based on the unified learner profile approach[J].Expert Systems,2015,32(2):264-276.
[3]Dascalu M I,Bodea C N,Moldoveanu A,et al.A recommender agent based on learning styles for better virtual collaborative learning experiences[J].Computers in Human Behavior,2015,45(4):243-253.
[4]Song K.Students as pinners:A multimodal analysis of a course activity involving curation on a social networking site[J].Internet and Higher Education,2017,33(4):33-40.
[5]吴正洋,汤庸,黄昌勤,等.社交网络下学习推荐研究与实践[J].中国电化教育,2016,(3):75-80.