摘 要:个性化学生用户模型是能否顺利实施开放教育个性化网络教学的核心,随着网上教学资源及资源类型的增加,传统的向量表述方式无法准确描述学生的个人兴趣。本文提出了基于领域本体的学生模型。在开放教育网络教学领域,在本体形式化描述基础上,构建了网络教学领域本体,并据此设计了基于XML-本体的个性化学生用户模型。
关键词:本体;领域本体;XML-;个性化网络教学;平均绝对偏差
中图分类号:TP311.52 文献标志码:A 文章编号:1673-8454(2014)03-0079-05
一、引言
随着社会和科学技术特别是信息技术的发展,人们可以足不出户接受教育。而教育也从原来单纯的学历教育发展到非学历教育,教育形式越来越多样化,教育的实现手段也越来越多样化。网络教学越来越为大多数人所接受,各种网络教学平台应时而生。而对于学生用户来说,最大的问题并不是没有资源,而是无法快速准确地找到自己所需的资源,即学生用户迫切需要个性化教学服务。“个性化学习推荐服务”是当前开放教育研究的热点和重点。[1-9]
个性化学习推荐服务的核心是学生用户模型和资源的组织。[1,10,11]目前绝大多数网上教学平台采用的是基于关键词或向量模型,缺乏语义信息,从而无法实现信息的共享和重用。资源的组织主要从编者的角度,以科目、章节或知识点为主线来组织资源。学生用户模型一般是静态的,学生仅仅是系统的使用者而非参与者。在这类用户模型中,无法体现出学生、导师及资源之间的关系,从而无法实现准确有效的个性化学习推荐服务。
为解决上述问题,国内外专家提出了引入“本体”(Ontology)。本体是概念化的明确的规范说明,形式上定义了领域内相关概念之间的关系。[10,11]本体描述的都是个体(实例)、类(概念)、属性以及关系。本体具有良好的概念层次以及实现对逻辑推理的支持,因而采用本体表示学生用户的模型是可行的。[2-7,9,11]在开放教育网络教学领域中,笔者以领域本体库的构建为基础,提出了一种基于XML-本体的学生用户模型,以实现个性化学习服务推荐。
二、开放教育网络教学领域本体
领域本体(Domain Ontology或Domain-specific Ontology,即领域特异性本体)所建模的是某个特定领域,或者现实世界的一部分。领域本体所表达的是那些适合于该领域的那些术语的特殊含义。开放教育网络教学本体指的是网络教学本体结构以及对网络教学资源概念的本体知识描述。此处本体在概念层次上定义,包含了概念的所有相关知识。
1.网络教学领域资源分析
在当前的网络学习平台中主要的用户对象包括学生、教师、企业培训对象、领域专家、其他领域爱好者等。资源主要包括用户资源、基础理论知识资源、实验实训资源等,其中还应包含关系及推理规则知识库。具体的结构如图1所示:
网络学习平台结构一般分为三层:应用层、实现层和资源层。应用层主要功能是与用户交互,包括用户身份认证、资源获取、信息反馈、资源评价以及资源添加等功能。实现层实现了资源推荐和分析算法,实现了资源的提取。这是整个系统的核心算法层。资源层主要是资源的维护,保证数据库资源的安全性、可靠性和可维护性。
2.网络教学本体结构
在参考了BlackBoard、WebCT、Moodle、Sakai等众多的LMS系统后,以国家开放大学学习平台及宁波电大网上课堂平台为具体研究实例,在2.1的基础上形成了网上教学本体体系。在设计时就考虑了网络学习资源的通用性,更重要的是考虑了信息的共享性和重用性,并且最终应方便知识库处理及知识的提取。图2是网络教学本体结构。
3.网络教学本体
(1)本体的形式化定义
就现有的各种本体而言,无论其在表达上采用的究竟是何种语言,在结构上都具有许多相似性。大多数本体描述的都是个体(实例)、类(概念)、属性以及关系。
本体构成要素包括类、属性、关系、函式术语、约束(限制)、规则及公理体系等。其中类是集合(sets)、概念、对象类型或者说事物的种类,[2]属性是对象(和类)所可能具有的属性、特征、特性、特点和参数,关系是类与类之间、类与个体以及个体与个体之间的彼此关联所可能具有的方式,函式术语是在声明语句当中,可用来代替具体术语的特定关系所构成的复杂结构,约束(限制)是采取形式化方式所声明的,关于接受某项断言作为输入而必须成立的情况的描述,公理是指采取特定逻辑形式的断言(包括规则在内)所共同构成的就是其本体在相应应用领域当中所描述的整个理论。下面给出本体的形式化定义:
定义1:本体O={C,AC,R,AR,H,P},其中,C为类或对象的集合,AC为属性集,R为关系集,AR为关系属性集,每个关系对应一个自己的属性集,H为概念层次,P为公理集。
从定义知,本体可定义成一个六元组,C中既有抽象的类也有个体实例,是所有对象的集合,可以用AC(Ci)来表示对象Ci的属性集;对象Ci和Cj之间的关系可用rij(Ci,Cj)表示;关系rij的属性可以用AR(rij)来表示;P是公理集合,是对本体中类、属性及关系的约束与限制。
(2)网络教学领域本体描述
定义2:网络教学领域本体,DOnto log y={CD,AC
D,RD,AR
D,HD,PD},其中CD为网络教学的对象集合,AC
D为属性集,RD为关系集,AR
D为关系属性集,HD为网络教学中的概念层次,PD为网络教学中的公理集。
下面仅以网络教学中的几个重要概念为例进行说明:
①定义概念(或对象)集合
CD={网络教学平台,用户服务,概念资源,实验资源,用户资源,用户研究…}endprint
②定义概念的属性集
AC
D={AC
D(网络教学平台),AC
D(用户服务),AC
D(概念资源),AC
D(检索系统)…}
其中:
AC
D(网络教学平台)={性质,对象,资源类型,体系结构,软件,硬件设备…}
AC
D(检索系统)={功能,检索语言,类型,网络环境…}
③定义概念之间的关系
RD={Synonymy(检索系统,资源检索系统),partOf(用户研究,用户服务),Isa(概念资源,网络教学资源),Isa(多媒体检索系统,检索系统),InterCross(检索系统,网络环境),InterCross(资源共享,资源检索)…}
④定义关系的属性
本系统中涉及的关系的属性包括Synonymy,PartOf,Isa(KindOf),InterCross等四种属性。其中Synonymy表示同义关系,PartOf概念之间部分与整体的关系,Isa概念之间的继承关系,类的父子类关系,InterCross表示关联度。定义如下:
AR
D={Synonymy,PartOf,Isa,InterCross…}
⑤定义概念层次结构
HD={(教育事业,教育机构,开放教育,网络教学)(网络教学平台,资源获取,用户服务)(机器检索,检索系统)…}
⑥定义网络教学领域内的公理
用like(Ci,Cj,λ)表示对象Ci和Cj相关程度为λ(0<λ<1),raValue(Ci,Cj,AR
D)为对象Ci和Cj的关系rij(Ci,Cj)的属性AR
D所表示的关联度。则我们认为Synonymy关系的相关度为1,PartOf,Isa(KindOf),InterCross等关系的关联度分别为它们各自关系的属性值,定义如下:
PD={Synonymy(Ci,Cj)→like(Ci,Cj,1),PartOf(Ci,Cj)→raValue(Ci,Cj,AR
D(PartOf)},InterCross(Ci,Cj)→raValue(Ci,Cj,AR
D(nterCross)}
三、基于XML-本体的学生用户模型的创建
1.学生用户模型
学生用户模型是网络教学平台中最重要的用户模型,是实现个性化学习服务推荐的核心。图3是基于XML-本体的个性化学生模型。
系统最初会根据学生的注册信息生成初始的学生模型,但这个学生模型并不是静态的,在学生访问网络学习平台过程中,系统的学生信息收集模块会不断收集学生信息,并把这些信息提供给学生信息学习模块。学生信息学习模块通常采用基于前馈神经网络,从而不断修正学生模型。此处学生模型与网络教学本体库建立了关联,即当学生搜索某个资料,会优先考虑他的专业、授课教师或领域专家等因素。而这在传统的LMS平台中是无法做到的。
在本系统中XML标签存放在一个数据表中,包括XML标签的名称以及对该标签的说明,作用类似于数据字典,系统在需要的时候可以检索这个表或对该表进行修改。当学生信息收集系统收集到某个较为多见的信息的时候,若该信息无法用该表中的任何一个XML标签来表述的时候,在本系统中采用手工添加的方式,由领域专家或教师来添加。目前系统中采用的方式是给定时间段内的领域专家和教师用户的投票机制。这种处理机制主要是为方便信息的提取和处理,降低处理的维度和复杂度,从而使学习服务推荐算法更高效更准确。
在学生模型学习模块中,我们同时采用了显式反馈和隐式反馈机制。由于显式反馈会干扰学生用户浏览网站,容易引起学生用户的反感。因此默认设置为隐式反馈,即利用学生在本网站中的浏览时间,打开某个网页的次数和所花费的时间,这些服务器端能获取的数据,来获取学生学习的情况及兴趣点。但有时候也应显式地允许学生或其他相关人员来设置学生的一些信息,以更好地为学生服务。
2.基于XML-本体的学生用户模型举例
根据前面的介绍,我们生成了一个学生用户资源文件,下面是目前系统中较为完善的一个学生的资料:
……
……
……
需要注意的是,本模型具有可扩展性,即可以方便地添加新的属性,当然也可以删除一些属性。通常来说,用户在不同时期,兴趣点甚至关注的领域都会发生改变,因而学生的模型就需要修改。在上述模型中,我们可以清楚地看到,学生与授课教师或辅导教师之间,学生与自己所在的领域、自己所修的专业、所修的课程之间均建立了关联。在XML中这些信息是很容易抽取到的,因此学习服务推荐算法在为学生推荐资源的时候,就可以参考这些因素,从而实现较为准确的推荐。
3.实验与结果分析
在实验过程中重点关注学员实际接受的推荐文档数。这里包括每种算法都会有一个实际接受的推荐文档数以及两种算法总的接受的推荐文档数(totalAdopted)。其中totalAddopted =keyAddopted+xmlAdoppted-( keyAddopted∩xmlAdoppted), 其中 keyAddopted指基于关键词的推荐算法,xmlAdoppted指的是基于xml-本体的推荐算法。为评价算法性能设置了一个参数推荐算法的平均绝对偏差MAE,表述如下:
MAE=
其中,totalAddopted=keyAddopted+xmlAdoppted-(keyAddopted⌒xmlAdoppted)。则基于关键词的推荐算法的MAE记为:
MAEkey=
基于xml-本体的推荐算法的MAE记为:
MAExml=
课题组在宁波电大网上课堂平台和中央电大在线(国开)平台上做了5组测试,每组随机抽取25%的用户。共计做了9次这样的实验。表1是9次实验获得的平均值,图4是2种算法的比较。
从上述表中的数据可以看出,基于关键词向量的推荐算法在资源数量比较小的时候总体要优于基于xml-本体的算法,但随着资源数量的增加,基于xml-本体的算法明显优于基于关键词的算法。
以宁波电大网上课堂学习平台为例。在前面用户模型例子中李一鸣同学在2012年11月5日9:30登录了网上课堂,他之前最近一次登录的时间为2012年10月18日18:30。因此我们需要把2012年10月18日18:30分以后至2012年11月5日9:30之前更新的一些资源有选择地推荐给他。根据服务器端的统计,在此期间,共更新与上传了398篇资源。资源的格式为(资源ID,资源名称,关键词,所属领域,提供者ID)。根据后台数据库的信息,发现与李一鸣相关的资料有15篇。其中已学课程4篇,正在学的课程5篇,理财方面的1篇,组网方面的3篇,计算机网络相关考证资源2篇。采用传统的基于向量的推荐算法最终推荐的资源为15篇,采用基于XML-本体用户模型的推荐算法最终推荐的资源为9篇(除去已学课程及考级资料)。基于XML-本体用户模型的推荐算法考虑了一些内在联系,如已学课程资源不推荐、不感兴趣的计算机考证资源不推荐。而基于关键词向量的推荐算法则把凡是与其相关的所有资料都推荐给他,推荐的资料较多,但有些资料并不是学员所需要的。
四、结论
当前的很多推荐服务系统中,主要通过关键词匹配来实现推荐,从而无法发掘一些领域相关的隐性信息,本文构建了基于XML的网络学习领域本体的学生用户模型,并将其应用到现有的系统中。采用这种方法,能较为准确地为学生用户推荐资源,并能有效地发掘领域相关的隐性知识。最为明显的是我们的方法能关注学生、导师以及领域专家之间的关系。从而为学生推荐高质量、高准确性并为学生认可的资源。今后的工作主要集中在完善网络学习领域本体和学生模型学习方面。
参考文献:
[1]刘萍,胡月红.领域本体学习方法和技术研究综述[J].现代图书情报技术,2012, V28 (1):19-25.
[2]于娟.基于文本的领域本体学习方法及其应用研究[D].大连:大连理工大学, 2010.
[3]蒋秀林,谢强,丁秋林.基于领域本体的用户模型的研究[J].计算机应用研究,2012,29(2): 606-608.
[4]姜强等.基于用户模型的个性化本体学习资源推荐研究[J].中国电化教育,2010, 280:106-111.
[5]宋丽哲,詹赤兵,王胜海.基于本体的数字图书馆个性化用户模型表示[J].中文信息学报,2008,22(1): 99-103.
[6]邱百爽, 赵蔚,刘秀琴.基于语义网的自适应学习系统中用户模型的研究[J].开放教育研究, 2008,(8):106-111.
[7]张付志,李伟静,朱彩云.基于领域本体的跨系统个性化服务用户模型[J].计算机工程,2009,35(13):31-33.
[8]Yao Jung Yang, Chuni Wu. An attribute-based ant colony system for adaptive learning object recommendation[J].Expert Systems with Applications,2009(36):3034-3047.
[9]官魏,马力,王瑞.信息网络环境复杂学习模型设计与实证研究[J].中国电化教育,2013(3):12-18.
[10]Gruber, T. R.. A translation approach to portable ontologies[J]. Knowledge Acquisition. 5(2):199-220, 1993.
[11]Gómez P A, Manzano M D. A Survey of Ontology Learning Methods and Techniques[EB/OL]. [2011 - 09-23].http://www.sti-Innsbruck. at /fileadmin /documents /deliverables /Ontoweb /D1.5.pdf.
(编辑:王天鹏)endprint
……
需要注意的是,本模型具有可扩展性,即可以方便地添加新的属性,当然也可以删除一些属性。通常来说,用户在不同时期,兴趣点甚至关注的领域都会发生改变,因而学生的模型就需要修改。在上述模型中,我们可以清楚地看到,学生与授课教师或辅导教师之间,学生与自己所在的领域、自己所修的专业、所修的课程之间均建立了关联。在XML中这些信息是很容易抽取到的,因此学习服务推荐算法在为学生推荐资源的时候,就可以参考这些因素,从而实现较为准确的推荐。
3.实验与结果分析
在实验过程中重点关注学员实际接受的推荐文档数。这里包括每种算法都会有一个实际接受的推荐文档数以及两种算法总的接受的推荐文档数(totalAdopted)。其中totalAddopted =keyAddopted+xmlAdoppted-( keyAddopted∩xmlAdoppted), 其中 keyAddopted指基于关键词的推荐算法,xmlAdoppted指的是基于xml-本体的推荐算法。为评价算法性能设置了一个参数推荐算法的平均绝对偏差MAE,表述如下:
MAE=
其中,totalAddopted=keyAddopted+xmlAdoppted-(keyAddopted⌒xmlAdoppted)。则基于关键词的推荐算法的MAE记为:
MAEkey=
基于xml-本体的推荐算法的MAE记为:
MAExml=
课题组在宁波电大网上课堂平台和中央电大在线(国开)平台上做了5组测试,每组随机抽取25%的用户。共计做了9次这样的实验。表1是9次实验获得的平均值,图4是2种算法的比较。
从上述表中的数据可以看出,基于关键词向量的推荐算法在资源数量比较小的时候总体要优于基于xml-本体的算法,但随着资源数量的增加,基于xml-本体的算法明显优于基于关键词的算法。
以宁波电大网上课堂学习平台为例。在前面用户模型例子中李一鸣同学在2012年11月5日9:30登录了网上课堂,他之前最近一次登录的时间为2012年10月18日18:30。因此我们需要把2012年10月18日18:30分以后至2012年11月5日9:30之前更新的一些资源有选择地推荐给他。根据服务器端的统计,在此期间,共更新与上传了398篇资源。资源的格式为(资源ID,资源名称,关键词,所属领域,提供者ID)。根据后台数据库的信息,发现与李一鸣相关的资料有15篇。其中已学课程4篇,正在学的课程5篇,理财方面的1篇,组网方面的3篇,计算机网络相关考证资源2篇。采用传统的基于向量的推荐算法最终推荐的资源为15篇,采用基于XML-本体用户模型的推荐算法最终推荐的资源为9篇(除去已学课程及考级资料)。基于XML-本体用户模型的推荐算法考虑了一些内在联系,如已学课程资源不推荐、不感兴趣的计算机考证资源不推荐。而基于关键词向量的推荐算法则把凡是与其相关的所有资料都推荐给他,推荐的资料较多,但有些资料并不是学员所需要的。
四、结论
当前的很多推荐服务系统中,主要通过关键词匹配来实现推荐,从而无法发掘一些领域相关的隐性信息,本文构建了基于XML的网络学习领域本体的学生用户模型,并将其应用到现有的系统中。采用这种方法,能较为准确地为学生用户推荐资源,并能有效地发掘领域相关的隐性知识。最为明显的是我们的方法能关注学生、导师以及领域专家之间的关系。从而为学生推荐高质量、高准确性并为学生认可的资源。今后的工作主要集中在完善网络学习领域本体和学生模型学习方面。
参考文献:
[1]刘萍,胡月红.领域本体学习方法和技术研究综述[J].现代图书情报技术,2012, V28 (1):19-25.
[2]于娟.基于文本的领域本体学习方法及其应用研究[D].大连:大连理工大学, 2010.
[3]蒋秀林,谢强,丁秋林.基于领域本体的用户模型的研究[J].计算机应用研究,2012,29(2): 606-608.
[4]姜强等.基于用户模型的个性化本体学习资源推荐研究[J].中国电化教育,2010, 280:106-111.
[5]宋丽哲,詹赤兵,王胜海.基于本体的数字图书馆个性化用户模型表示[J].中文信息学报,2008,22(1): 99-103.
[6]邱百爽, 赵蔚,刘秀琴.基于语义网的自适应学习系统中用户模型的研究[J].开放教育研究, 2008,(8):106-111.
[7]张付志,李伟静,朱彩云.基于领域本体的跨系统个性化服务用户模型[J].计算机工程,2009,35(13):31-33.
[8]Yao Jung Yang, Chuni Wu. An attribute-based ant colony system for adaptive learning object recommendation[J].Expert Systems with Applications,2009(36):3034-3047.
[9]官魏,马力,王瑞.信息网络环境复杂学习模型设计与实证研究[J].中国电化教育,2013(3):12-18.
[10]Gruber, T. R.. A translation approach to portable ontologies[J]. Knowledge Acquisition. 5(2):199-220, 1993.
[11]Gómez P A, Manzano M D. A Survey of Ontology Learning Methods and Techniques[EB/OL]. [2011 - 09-23].http://www.sti-Innsbruck. at /fileadmin /documents /deliverables /Ontoweb /D1.5.pdf.
(编辑:王天鹏)endprint
……
需要注意的是,本模型具有可扩展性,即可以方便地添加新的属性,当然也可以删除一些属性。通常来说,用户在不同时期,兴趣点甚至关注的领域都会发生改变,因而学生的模型就需要修改。在上述模型中,我们可以清楚地看到,学生与授课教师或辅导教师之间,学生与自己所在的领域、自己所修的专业、所修的课程之间均建立了关联。在XML中这些信息是很容易抽取到的,因此学习服务推荐算法在为学生推荐资源的时候,就可以参考这些因素,从而实现较为准确的推荐。
3.实验与结果分析
在实验过程中重点关注学员实际接受的推荐文档数。这里包括每种算法都会有一个实际接受的推荐文档数以及两种算法总的接受的推荐文档数(totalAdopted)。其中totalAddopted =keyAddopted+xmlAdoppted-( keyAddopted∩xmlAdoppted), 其中 keyAddopted指基于关键词的推荐算法,xmlAdoppted指的是基于xml-本体的推荐算法。为评价算法性能设置了一个参数推荐算法的平均绝对偏差MAE,表述如下:
MAE=
其中,totalAddopted=keyAddopted+xmlAdoppted-(keyAddopted⌒xmlAdoppted)。则基于关键词的推荐算法的MAE记为:
MAEkey=
基于xml-本体的推荐算法的MAE记为:
MAExml=
课题组在宁波电大网上课堂平台和中央电大在线(国开)平台上做了5组测试,每组随机抽取25%的用户。共计做了9次这样的实验。表1是9次实验获得的平均值,图4是2种算法的比较。
从上述表中的数据可以看出,基于关键词向量的推荐算法在资源数量比较小的时候总体要优于基于xml-本体的算法,但随着资源数量的增加,基于xml-本体的算法明显优于基于关键词的算法。
以宁波电大网上课堂学习平台为例。在前面用户模型例子中李一鸣同学在2012年11月5日9:30登录了网上课堂,他之前最近一次登录的时间为2012年10月18日18:30。因此我们需要把2012年10月18日18:30分以后至2012年11月5日9:30之前更新的一些资源有选择地推荐给他。根据服务器端的统计,在此期间,共更新与上传了398篇资源。资源的格式为(资源ID,资源名称,关键词,所属领域,提供者ID)。根据后台数据库的信息,发现与李一鸣相关的资料有15篇。其中已学课程4篇,正在学的课程5篇,理财方面的1篇,组网方面的3篇,计算机网络相关考证资源2篇。采用传统的基于向量的推荐算法最终推荐的资源为15篇,采用基于XML-本体用户模型的推荐算法最终推荐的资源为9篇(除去已学课程及考级资料)。基于XML-本体用户模型的推荐算法考虑了一些内在联系,如已学课程资源不推荐、不感兴趣的计算机考证资源不推荐。而基于关键词向量的推荐算法则把凡是与其相关的所有资料都推荐给他,推荐的资料较多,但有些资料并不是学员所需要的。
四、结论
当前的很多推荐服务系统中,主要通过关键词匹配来实现推荐,从而无法发掘一些领域相关的隐性信息,本文构建了基于XML的网络学习领域本体的学生用户模型,并将其应用到现有的系统中。采用这种方法,能较为准确地为学生用户推荐资源,并能有效地发掘领域相关的隐性知识。最为明显的是我们的方法能关注学生、导师以及领域专家之间的关系。从而为学生推荐高质量、高准确性并为学生认可的资源。今后的工作主要集中在完善网络学习领域本体和学生模型学习方面。
参考文献:
[1]刘萍,胡月红.领域本体学习方法和技术研究综述[J].现代图书情报技术,2012, V28 (1):19-25.
[2]于娟.基于文本的领域本体学习方法及其应用研究[D].大连:大连理工大学, 2010.
[3]蒋秀林,谢强,丁秋林.基于领域本体的用户模型的研究[J].计算机应用研究,2012,29(2): 606-608.
[4]姜强等.基于用户模型的个性化本体学习资源推荐研究[J].中国电化教育,2010, 280:106-111.
[5]宋丽哲,詹赤兵,王胜海.基于本体的数字图书馆个性化用户模型表示[J].中文信息学报,2008,22(1): 99-103.
[6]邱百爽, 赵蔚,刘秀琴.基于语义网的自适应学习系统中用户模型的研究[J].开放教育研究, 2008,(8):106-111.
[7]张付志,李伟静,朱彩云.基于领域本体的跨系统个性化服务用户模型[J].计算机工程,2009,35(13):31-33.
[8]Yao Jung Yang, Chuni Wu. An attribute-based ant colony system for adaptive learning object recommendation[J].Expert Systems with Applications,2009(36):3034-3047.
[9]官魏,马力,王瑞.信息网络环境复杂学习模型设计与实证研究[J].中国电化教育,2013(3):12-18.
[10]Gruber, T. R.. A translation approach to portable ontologies[J]. Knowledge Acquisition. 5(2):199-220, 1993.
[11]Gómez P A, Manzano M D. A Survey of Ontology Learning Methods and Techniques[EB/OL]. [2011 - 09-23].http://www.sti-Innsbruck. at /fileadmin /documents /deliverables /Ontoweb /D1.5.pdf.
(编辑:王天鹏)endprint