林杰
摘要:现阶段,我国的信息资源库仍存在某些劣势,如可复用性、共享性、知识查询的准确率和百分率等,为了解决目前查询系统中相关属性查找困难以及同义词难以识别等问题,该文把方法论引入到信息资源库研究中,并提出了基于领域的语义智能查询系统的架构,本系统是针对特定领域知识信息的语义分析基础上,得出了相对足够的语义知识的信息查询系统。该文的重点是基于领域的信息资源的描述,建设一个特定领域知识本体及基于内容的查询的系统。
关键词:本体;检索;语义
中图分类号:TP399 文献标识码:A 文章编号:1009-3044(2014)34-8268-03
传统信息检索技术主要是基于语法的关键词匹配和全文检索技术的基础上,主要通过索引、关键词和列表的方法来实现。现有的主要缺点是:计算机文献信息检索已经不能满足信息检索的需求。计算机信息检索过程中,计算机不具有人类的思维能力。因此,搜索查询的符号输入检索系统,就不能与明确的用户信息需求相适应,和不能修改用户的搜索查询的标记。在计算机信息检索系统的检索问题的同时,搜索需求与文献标识的匹配是一个完全基于字面的匹配。那就是,计算机将两个“标志”完全当做是“字符串”的模拟计算。因此,必须要求搜索查询的标记和文献标识特征一致,才可以匹配。这种文字的组合,使检索出的文件只是在字面意义上的查询和检索标志保持不变,并在内容或概念不一定能满足用户的信息需求。
1 基于本体的信息查询的可行性
针对上述问题最新的查询工具融入了一些新的方法和技术,大幅度的提升了信息查询的效果和效率。如在对结果进行排序时,会将将引用大量的检索结果往前排,以让用户可以尽量缩短时间来处理结果。使用XML和RDF的知识,可以描述万维网的信息内容,使信息不仅是以人为本的信息,并可以使计算机可以理解信息的内涵。传统的搜索引擎依赖与关键词匹配的字符检索,简单的方法没有充分利用的潜在的信息内容。基于机器理解的内容信息,应用程序可以更智能的完成推理查询。基于语义的检索是基于知识(概念)的层面检索,描述概念和概念之间的内在联系,可以挖掘出一些模糊的概念,在检索准确率方面能更好地满足用户的要求。基于知识查询和基于关键词查询是不同的,它是由包括知识之间的类和子类,类和实例等的关系来查询,这样可以有效地控制检索范围,同时不仅可以提高搜索的准确率,而且可以大大提高查询速度。有效的使用本体和语义信息来取代传统的关键词匹配是一个重要的促进智能检索的方法。知识网格的结构是由人的本体论和认识论组成的。领域本体定义了主题词汇的基本属性和关系,以及和术语之间的关系组合规则,定义了词汇扩展的概念,以及抽象对象,关系和类,词汇。运用这些定义,可以对领域知识进行描述。结合知识查询和本体是一个在当前信息检索领域的研究热点。
2 基于本体的检索模型架构
下图为基于本体的智能化的知识检索结构模型。显示了本体技术在检索结构中的应用。该系统有以下几个模块: 查询转换模块、领域本体服务器、文档处理器、检索代理、定制处理模块。相互之间的结构关系如图1所示。
该系统由两部分组成:基于领域本体的知识预处理(包括信息库、文档处理器、领域本体服务器和数据源)和基于领域本体的智能检索(包括领域本体服务器、查询转换模块、定制处理模块、检索代理和信息库)。与传统的信息查询系统不同的地方在于,查询过程和知识处理过程中都加入了本体论的知识。
3 基于本体的教育资源库系统的设计
信息资源是网络教育的基础。现阶段,呈指数增长的网络信息资源,伴随着大量的、明显的缺点,如信息资源的复用性差,个性化和参与式教学的缺乏等,阻碍了网络在教育中的应用、发展和普及。其主要问题为:1)信息资源的智能化查询;2)信息资源的自动获取;3)个性化学习路径的动态生成;4)基于语义的互操作。经过综合考虑分析,资源库的系统设计目标如下图所示。
根据提出的问题,设计一种基于领域本体的信息资源库的系统架构,从知识层面和语义层面去表示教育资源,所以它可以被电脑所理解和处理,以达到网络教育资源的智能查询和优化整合,提高教育资源的检索准确率,从而支持教育活动,提供更加个性化、自主化的教育活动。资源库体系结构如图3所示。
4 领域本体的设计
描述知识本体是一个五元集合,可以用O=描述.其中,I是概念的集合,指收集反映事物本质的定义;P是属性的集合,用于表现对事物的本质特性;N是关系的集合,用于描述事物之间的关系的性质;E是实例的集合;R是概念集和实例集之间的映射关系,这种映射为每个实例对应到其所属的概念中去。知识本体定义描述图如下所示。圆圈代表概念,箭头指示关系。把相关概念的关系联系在一起,实例对应于查询信息的概念,在概念和实例上建立联系。
核心领域本体构建不需要盲目的完美,只要该领域内最重要的概念和关系,作为以后不断发展的种子。该文以电子政务学科为例,简单介绍领域本体的构建。电子政务学科如何进行知识的分类,确定关键的概念,是其中一个迫切需要解决的问题。在这个阶段不求大而全,电子政务领域本体的初步构建如图5所示。
定义了基本概念和知识点属性后,它们可以用来描述一些基本的信息之间的关系。例如TCP/IP和IPX/SPX都是网络协议的子类,TCP/IP的同义词是传输控制协议/因特网互联协议。知识关系描述如下图所示。在图中,椭圆型节点表示概念,如TCP/IP,IPX/SPX等。
5 主要开发工具
6 结束语
作为一个相对较新的知识表示方法,本体越来越多的广泛应用在信息检索领域中。现在本体研究中也有许多分支,该文主要根据在大规模数据资源的存储,管理,检索所遇到的许多困难,结合领域本体和语义信息检索领域中的优势,解决机器对知识点的语义理解问题的关键。因为本体的应用,计算机可以解析出类之间的层次关系的描述,并分析类和其他的相互制约关系的,进而进行智能化推理,从而有效地辅助机器理解用户输入的检索隐含的语义信息。
参考文献:
[1] 郭广军,周显光,陈代武.基于本体和Lucene的网络教育资源管理检索系统[J].计算机应用与软件,2012,29(7):115-118.
[2] 林丽姝,林珍,刘露思.基于本体与粗糙集的教育资源检索模型的关键技术研究[J].实验技术与管理,2012,29(10):123-125.
[3] 孙瑜,徐天伟,陈娟娟.民族教育资源本体构建方法及应用[J].云南师范大学学报:自然科学版,2013,33(6):6-11.
[4] 郭广军,王剑波,游新娥,等.基于本体和语义网的网络教育资源检索研究[J].华中师范大学学报:自然科学版,2011,45(4):551-556.
[5] 王志华,赵伟. 基于本体的语义网检索模型及关键技术研究[J].计算机工程与设计,2011(1):145-148.
[6] 鲍文燕,沈岑诚,刘博.云环境下的语义本体构建及其在语义检索中的应用[J].微电子学与计算机,2012(11):66-69.
[7] 吴振忠,王曼,宋婧文,等.一种基于领域本体的论文检索方法的研究与应用[J].计算机应用与软件,2013(10):177-180.
[8] 石建,石苗茜.基于Ontology的知识检索系统功能要素分析[J].情报杂志,2007(4):116-118.
[9] 栾艳,丁二玉,骆斌.基于ontology的语义检索技术[J].计算机工程与应用,2005(28):156-159.
[10] 罗伟,李陶深.一种基于本体的个性化搜索引擎模型[J].广西科学院学报,2006,22(4):256-259.
[11] 赵宁,吕鹏.基于本体的语义信息集成中的查询转换[J].科技信息,2007(24):386-387.
[12] 胡杨,万健,余日泰.一种基于本体的具有语义搜索功能的E-learning模型[J].计算机与现代化,2006(11):21-24.
[13] 王梅文.本体在元搜索引擎查询结果自动分类中的应用[J].开发研究与设计技术,2007,2(2):441-443.
[14] 高建军,吕振国,曹三省,等.基于语义本体的媒体内容搜索引擎的构建[J].中国传媒大学学报:自然科学版,2007,14(4):40-42.endprint
参考文献:
[1] 郭广军,周显光,陈代武.基于本体和Lucene的网络教育资源管理检索系统[J].计算机应用与软件,2012,29(7):115-118.
[2] 林丽姝,林珍,刘露思.基于本体与粗糙集的教育资源检索模型的关键技术研究[J].实验技术与管理,2012,29(10):123-125.
[3] 孙瑜,徐天伟,陈娟娟.民族教育资源本体构建方法及应用[J].云南师范大学学报:自然科学版,2013,33(6):6-11.
[4] 郭广军,王剑波,游新娥,等.基于本体和语义网的网络教育资源检索研究[J].华中师范大学学报:自然科学版,2011,45(4):551-556.
[5] 王志华,赵伟. 基于本体的语义网检索模型及关键技术研究[J].计算机工程与设计,2011(1):145-148.
[6] 鲍文燕,沈岑诚,刘博.云环境下的语义本体构建及其在语义检索中的应用[J].微电子学与计算机,2012(11):66-69.
[7] 吴振忠,王曼,宋婧文,等.一种基于领域本体的论文检索方法的研究与应用[J].计算机应用与软件,2013(10):177-180.
[8] 石建,石苗茜.基于Ontology的知识检索系统功能要素分析[J].情报杂志,2007(4):116-118.
[9] 栾艳,丁二玉,骆斌.基于ontology的语义检索技术[J].计算机工程与应用,2005(28):156-159.
[10] 罗伟,李陶深.一种基于本体的个性化搜索引擎模型[J].广西科学院学报,2006,22(4):256-259.
[11] 赵宁,吕鹏.基于本体的语义信息集成中的查询转换[J].科技信息,2007(24):386-387.
[12] 胡杨,万健,余日泰.一种基于本体的具有语义搜索功能的E-learning模型[J].计算机与现代化,2006(11):21-24.
[13] 王梅文.本体在元搜索引擎查询结果自动分类中的应用[J].开发研究与设计技术,2007,2(2):441-443.
[14] 高建军,吕振国,曹三省,等.基于语义本体的媒体内容搜索引擎的构建[J].中国传媒大学学报:自然科学版,2007,14(4):40-42.endprint
参考文献:
[1] 郭广军,周显光,陈代武.基于本体和Lucene的网络教育资源管理检索系统[J].计算机应用与软件,2012,29(7):115-118.
[2] 林丽姝,林珍,刘露思.基于本体与粗糙集的教育资源检索模型的关键技术研究[J].实验技术与管理,2012,29(10):123-125.
[3] 孙瑜,徐天伟,陈娟娟.民族教育资源本体构建方法及应用[J].云南师范大学学报:自然科学版,2013,33(6):6-11.
[4] 郭广军,王剑波,游新娥,等.基于本体和语义网的网络教育资源检索研究[J].华中师范大学学报:自然科学版,2011,45(4):551-556.
[5] 王志华,赵伟. 基于本体的语义网检索模型及关键技术研究[J].计算机工程与设计,2011(1):145-148.
[6] 鲍文燕,沈岑诚,刘博.云环境下的语义本体构建及其在语义检索中的应用[J].微电子学与计算机,2012(11):66-69.
[7] 吴振忠,王曼,宋婧文,等.一种基于领域本体的论文检索方法的研究与应用[J].计算机应用与软件,2013(10):177-180.
[8] 石建,石苗茜.基于Ontology的知识检索系统功能要素分析[J].情报杂志,2007(4):116-118.
[9] 栾艳,丁二玉,骆斌.基于ontology的语义检索技术[J].计算机工程与应用,2005(28):156-159.
[10] 罗伟,李陶深.一种基于本体的个性化搜索引擎模型[J].广西科学院学报,2006,22(4):256-259.
[11] 赵宁,吕鹏.基于本体的语义信息集成中的查询转换[J].科技信息,2007(24):386-387.
[12] 胡杨,万健,余日泰.一种基于本体的具有语义搜索功能的E-learning模型[J].计算机与现代化,2006(11):21-24.
[13] 王梅文.本体在元搜索引擎查询结果自动分类中的应用[J].开发研究与设计技术,2007,2(2):441-443.
[14] 高建军,吕振国,曹三省,等.基于语义本体的媒体内容搜索引擎的构建[J].中国传媒大学学报:自然科学版,2007,14(4):40-42.endprint