基于适应性的数字学习推荐系统构建

2011-03-18 08:11刘焕
河北软件职业技术学院学报 2011年2期
关键词:资料库使用者规则

刘焕

(太原大学 外语师范学院,太原 030012)

0 前言

我们从过去学习推荐系统相关研究中发现,学习推荐系统通常是分析过去学生学习记录来为学生的未来学习推荐学习方案。但是在新生刚进入大学的时候,帮助学生选则适合学习的课程,进而提高学生学习的兴趣与信心,是一件非常重要的工作。针对学生对于课程的认知不明确以及表达意图不准确,我们设计了一个在线选课推荐系统,以支持学生进行适应性的选课。协同过滤是应用在决策支持及推荐上常用的工具,因此,本系统将运用这些技术,结合学生特点,设计在线选课的推荐系统。

1 相关技术

本系统使用LDAP的目录资料库来储存搜索资料,在搜集资料的程序中,运用JAXB来简化复杂的文字处理工作,且实作一关联规则算法,运用协同过滤以使搜索结果能更符合使用者需求。以下我们针对LDAP、JAXB、推荐系统技术做简要说明。

1.1 协同过滤推荐

协同过滤推荐(Collaborative Filtering recommendation)是信息过滤和信息系统中的一项很受欢迎的技术。与传统的基于内容过滤、直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。与传统文本过滤相比,协同过滤有下列优点:

(1)能够过滤难以进行机器自动基于内容分析的信息,如艺术品、音乐;

(2)能够基于一些复杂的、难以表达的概念(信息质量、品位)进行过滤;

(3)推荐的新颖性。

1.2 轻量目录访问协议

简单来说,LDAP是一个得到关于人或者资源的集中、静态数据的快速方式。LDAP是一个用来发布目录信息到许多不同资源的协议,通常它都作为一个集中的地址本使用,不过根据组织者的需要,可以做得更加强大。轻量目录访问协议主要由两部分组成:第一部分是目录资料库,它拥有一套完善描述资料特性的资料纲要,另一部分则是查询和处理资料库相关的存取协议。

2 系统架构

本系统的LMS是已存在的学习管理系统,在本系统中为提供教材资料的角色,算是外部实体之一,它并非主动提供资料,而是当教师通过LMS导入教材资料时,教材登录界面会将该教材的首页路径传给本系统的Web Spider程序,程序再到LMS下特定路径抓取资料,取得资料的方式是采用分析通过HTTP所传回的资料,因此只要该教材是由HTTP方式存取皆可适用本系统,最后处理完成的资料会存放于LDAP目录资料库中。

本研究所提出的智能型推荐学习服务步骤如下:首先判断登录学习者于系统中所有勾选的兴趣项目,得到该学习者的所有的兴趣。取出所有学习者点选教材的记录并筛选出与登录学习者兴趣学科相符的前N笔数据。筛选过程以兴趣学科为优先考虑,再比对其他项目。取出所有学习者点选教材之径串行。将所有的路径串行区分为登录之学习者的路径串行与其他学习者的路径串行。并以登录学习者的路径开始进行分析,并将大于此项目集之其他串行做比对。若比对出相同的路径,则将比对出相符路径的下一个项目记录下来。当下一个项目的次数超过N次,并与步骤二所得之数据进行比对。若上步骤产生大于或等于N笔的数据,以第二步为主进行优先推荐;若产生小于N笔的数据,则以上步骤进行优先推荐,再以步骤二之数据补满N笔推荐。

图1 系统架构图

2.1 检索资料收集

本系统的后端资料收集程序和其他搜索引擎类似,当教师通过LMS将教材上传的同时,也执行此模块程序,只要给定课程内容的连结,程序便会自动找出该课程的所有内容,并且分析HTML Tag概略,将所得的资料分为主题和一般内容,再将分析后的资料利用JAXB的Marshaller机制,即可将散乱的资料整理成XML文档。最后运用JAXB机制,可存取XML文档,将整理后的资料存进LDAP的目录资料库中。

2.2 协同过滤推荐

一般协同过滤都是推荐相关信息给“使用者”,而本系统则是使用协同过滤,推荐相关的关键词给“课程”。如欲找出文章关键词,最常使用的方法为文字检索,但此法牵涉到许多的算法与技术,因此本系统通过分析使用者所搜索的字串,过滤出该课程可能的关键词,主要步骤是从资料库中找出使用者搜索所使用的关键词,并统计所有关键词出现频率。从上述项目集中挑出符合门坎值的项目,储存到目录服务器中的课程关键词。过程十分浅显易懂,虽然说结果可靠性有待研究,但是利用此方法,不仅能取代原本复杂的工作,也达到系统自动化检索的目的。

3 系统实作

3.1 系统资料准备

在教师上传教材后,将LMS上的教材课程内容路径当作参数传给资料收集程序,以笔者所在学校网络教学教材内容为例,教材内容大多是Power-Point文件所转换的Html文档,程序通过事先定义好转换接口,通过该接口即可让系统符合各类教学平台的需求。搜索服务接口以网页方式呈现,因此Client端只需Web浏览器即可使用本系统,无需额外安装其他软件,除了一般搜索外,也提供像“授课教师”、“单元主题”或“关键词”等查询条件设定,让查询结果更符合使用者需求。结果呈现,除了有LDAP Server中的教材内容之外,还有通过关联规则算法所开发的相关词及协同过滤所得到的课程关键词。

本系统关联规则主要是用在搜索字串的相关词方面;而协同过滤结果则是各个课程的关键词。通过这些算法的应用所得到的结果,让使用者能更快速、更精确地搜索到所要的资料,在资料量越大的系统中,越能显现其功效。目前实作上是采用当所搜集的资料增加一定数量后就执行一次程序,并且更新之前所产生的资料,这样的做法可避免因单位时间内增加的资料太少,导致结果和前次产生的资料相近。

3.2 协同过滤推荐

如前所述,推荐操作主要是思考如何在众多的条件因素下,对相关的信息作最佳的匹配提供。整个教材推荐流程如下:首先,当使用者通过浏览器接口登录系统后,系统会判断使用者是否为第一次登录,若使用者为第一次进入本系统,则系统会自动检索是否有适合使用者的关联规则,如果有可用的规则,通过“关联规则”找出推荐教材,最后检查是否有10部教材推荐给使用者;否则假如找不到可用的规则,则直接对使用者推荐使用最多的10部教材。如果在开始时判断出使用者不是第一次进入本系统,则系统会自动检索是否有与使用者适当的关联规则,如果有可用的规则,通过“关联规则找出推荐教材”,接着会由使用者的学习记录推荐教材,如果检索规则时找不出可用的规则,则直接由使用者的学习记录推荐教材,最后检查是否共有10部教材推荐给使用者。

4 结论与未来工作

本研究提出的基于轻量目录访问协议的智能型推荐学习服务系统以目前多元化的网络学习背景为出发点,达到实时、准确的推荐学习效果。智能型推荐学习服务将学习者的显性评比资料与隐性评比资料加以运用,使学习者不局限于本身知识领域范畴内。我们以实验验证了智能型推荐学习服务系统可达到获取准确率高的教材推荐以及系统使用满意度高的结果。

[1]林霜梅,汪更生,陈弈秋.个性化推荐系统中的用户建模及特征选择[J].计算机工程,2007(17):196-198.

[2]张彤,李军怀.基于XML的Web信息系统中数据访问性能优化方法[J].西北大学学报(自然科学),2006,36(3):398-402.

[3]黎星星,黄小琴,朱庆生.电子商务推荐系统研究[J].计算机工程与科学,2004,26(5):78-82.

猜你喜欢
资料库使用者规则
撑竿跳规则的制定
基于内容与协同过滤的GitHub学习资料库推荐
数独的规则和演变
国家社科基金重大项目“‘古今字’资料库建设与相关专题研究”成果鉴定会顺利召开
施工企业技术资料库的建立与完善
新型拼插休闲椅,让人与人的距离更近
让规则不规则
实现科学教材中资料库的教育价值
TPP反腐败规则对我国的启示
抓拍神器