面向语义网的语义搜索引擎关键技术研究

2014-07-03 05:09韦丽红
电脑知识与技术 2014年12期
关键词:搜索引擎关键技术检索

韦丽红

摘要:随着计算机应用技术的不断发展和网络信息技术的进步,人们的生活和工作以及商品社会的流通和交换都进入了快速的网络信息化时代。人们只需要简单的轻触鼠标就可以了解到世界各地的信息,同世界范围的人进行交流、沟通和分享信息。之所以能够如此简单的实现信息的查找和定位,都要归功于网络搜素引擎技术。该文就面向语义网的语义搜素引擎关键技术进行详细的讨论和研究,希望为网络搜素引擎技术的提高和发展提供一些借鉴和参考。

关键词:语义搜索引擎;技术研究

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)12-2831-02

Research on Key Technologies for the Semantic Web Semantic Search Engine

WEI Li-hong

(Hulunbuir College, Hulunbuir 021008, China)

Abstract: With the advancement of computer technology continues to develop applications and network information technology, people live and work and social circulation and exchange of goods have entered the era of rapid information network. People only need a simple touch of the mouse you can learn information from around the world to communicate, communicate and share information with people worldwide. Has been able to achieve such a simple find and locate information, thanks to a network search engines technology. This paper conducted a semantic search engines for the key technologies of the Semantic Web detailed discussion and research, hoping to provide some reference for the search engines to improve network technology and development.

Key words: Technology research; semantic search engine

1 面向语义网的语义搜索引擎关键技术概况

面向语义网的语义搜索引擎可以分为三种方式:首先,是常规的基于关键词技术对网络语义数据进行重点处理的搜索引擎技术;其次,是建立在以本体为重要组成部分的中心式语义数据数据处理技术的搜索引擎;最后,是以本体作为背景,对网络中的数据信息进行分析、推理并提供相应的数据处理能力的搜索引擎技术。这三种形式的基于语义搜索引擎技术都这有各自的数据处理功能和特点,具体分析如下:

第一种关键词技术的语义搜索引擎可以对网络中的相关概念性信息、三元组以及语义标签进行分析处理,通过匹配关键词的方式来获得相应可能的语义数据,作为响应用户的查询请求,这种搜索引擎技术以google最具有代表性,此外在语义文档上通过建立倒排索引和单独建立针对本体文档的N-GRAM索引,可以使用户更加快速的查询定位到相应的语义文档。第二种搜索引擎技术则是以实体为主要的搜索引擎处理单元,并提供给用户相应的需求单元,用户获得的通常是通过关键词技术得来的实体集合。而第三种语义搜索引擎技术是包含实体,同时还可以实现语义的集成,是一种综合性的新型语义搜索引擎关键技术。

2 面向语义网的语义搜索引擎关键技术的特点

2.1 面向语义网的语义搜索引擎技术是更高层次描述方式

语义网技术集成了当前网络终端用户的情境模型和搜索引擎结构中的语义网技术应用,是对目前的WWW网络制式的进一步扩展,是促进计算机和人类之间更加紧密合作的一项新型人机智能化应用技术。语义网技术通常采用多层次形式表示框架XML,并在其中加入文档模式来表示文档结构,但就XML本身来讲,是不具有描述结构本身语义功能的,如果不对XML语义的元素解析,计算机是无法读懂信息内容的。因此,语义网技术中基于语义搜索引擎技术的更高层次的描述语言——RDF就可以定义相关元素的语义,也就是常说的具有三元组集特性,语义网中集合了XML和RDF就实现了语义网络的人工智能,可以进行相关事件的简单推理。另外,完整的语义网还需要一个标准的概念体系,也作本体(Ontology)。而本体实际上是需要RDF子集的OWL进行描述的,XML、RDF和Ontology三者之间构成了完整的计算机引擎分析系统的基础,是语义搜索引擎更具智能化的重要组分。

2.2 面向语义网的语义搜索引擎是三种引擎技术相互关联的统一整体

语义网的语义搜索引擎技术是将用户情境模型和搜索引擎技术相结合在一个系统结构中的,通过语义网和本体技术对用户情境模型收集到的信息进行处理,然后对情境信息进行结构和特征方面的形式化描述,转化成可以被计算机理解的形式,最后在搜索引擎使用终端进行呈现和使用。也就是说,面向语义网的语义搜索引擎关键技术在于实现实体之间对情境信息完成语义理解,并根据已知本体的情境信息进行推理,对搜索引擎找到的搜索结果进行过滤、选择和推荐,以满足用户的查询需求。通常情况下,用户端的搜索关键词都具有某种联系,通过语义网技术我们可以明确不同用户使用搜索引擎过程中关键词的这种内在关联,当用户进行关键词检索时,语义网中的RDF就可以描述这种关系,并采用OWL对这种关系进行解释说明,达到明确关键词之间关联的目的,再通过三元组的形式将这种关联存储在本体中,以不同的意义标识嵌入到相关网页内容中,从而实现相关关键词内容信息的快速查询和呈现。简而言之,面向语义网的语义搜索引擎关键技术实际上是包含关键词之间关联内容的统一整体。endprint

2.3 面向语义网的应用搜索引擎关键技术的精准性

在用户使用搜索引擎进行信息资料的检索过程中,系统的情境管理分配的信息链接,也就是用户检索历史信息,都可以作为扩展搜索引擎的叙词表,并根据用户选取的最终检索结果进行跟踪、定位、过滤和积累。对于检索关键词之间的关联信息,需要将一些独立的关键词信息从结果中过滤出去,只吸收和包含关键词又包含相关内容关系的信息反馈给用户,从而实现搜索引擎检索结果的精简和准确,为用户提供真正需要的信息资料。

2.4 面向语义网的应用搜索引擎中的标引技术应用

对用户使用搜索引擎的未来情境要进行一系列的复杂推理,需要通过检索历史在本体技术上建立证明树,并产生相应的可在网络中进行查询的语义标记描述,将用户的情境和对应的信息库的范围尽量放大,从而提取并贮存用户未来可能需要的情境信息,也可以在此基础上适时为用户推荐相关可能需要的信息资源。此外,还要善于管理和利用公共领域的本体资源,加强语义网的语义搜索引擎对于自然语言的解读能力,再通过本体技术和语义网技术对相关信息进行统一规范整理,建立起相似类目的使用规则和资源体系,实现信息资源库构建和搜索引擎标记技术的统一,为用户提供更好的信息资源和检索体验。

3 面向语义网的语义搜索引擎关键技术的应用

3.1 用户检索情境模型的建立与搜索引擎相结合

通过收集用户的检索爱好,包括:习惯、目标、心理、性格、行为、问题、专业、交流和文学创作以及工作内容等方面的综合信息,建立起适用于用户的个性化动态情境模型,对用户的兴趣、长期计划、目标进行动态关注,并进行相应的信息存储、描述和推荐,将搜索引擎技术同情境模型相结合既可以实现搜索引擎的个性化定制,又可以建立起以用户为中心的信息资源库,满足用户各项检索需求。

3.2 面向语义网的语义搜索引擎情境管理器模型的代理技术应用

由于搜索引擎的用户群体广泛,涉及的问题十分复杂,范围广,数据信息庞杂,每时每刻计算机都要通过交互作用来获取用户的情境信息,因此,必须加强情境管理器的配置和管理。通过应用不同的代理技术可以分摊情境管理器的压力,诸如采用情境接收器代理、情境文献知识代理、查询信息代理和集成服务代理,通过设置语义网的交互协议,可以根据用户使用的喜好提出更加合理的建议,在语义网协议管理的条件下可以实现代理的自适应性,实现搜索引擎技术的个性化定制服务和智能化集成应用。

4 结束语

综上所述,面向语义网的语义搜索引擎关键技术在于建立智能化的人机一体化系统结构,同时,还要具备动态分析和推理用户使用关键词的进一步意义,关联到用户可能同时感兴趣的信息。此外,根据用户输入的关键词进行智能化识别,并采用主体存储描述标引技术使用户在最短的时间内找到所需信息资料是面向语义网的语义搜索引擎关键技术发展的方向,也是实现搜索引擎为了智能化的重要途径。

参考文献:

[1] 吴芳.基于用户情境及语义网技术的个性化搜索引擎[J].江西图书馆学刊,2011,41(4):111-115.

[2] 袁颖,赵捧未.基于语义网的数字图书馆信息检索模型研究[J].科技情报开发与经济,2010(7):1-3.

[3] 赵夷平.传统搜索引擎与语义搜索引擎服务比较研究[J].情报科学,2010,28(2):265-270.

[4] 张益民,吕英杰,盛国军.搜索引擎服务内容的发展现状分析[J].现代情报,2008(8): 9-11.

[5] 马森,赵文,袁崇义,等.基于规则推理的语义检索若干关键技术研究[J].电子学报,2013,41(5):977-981.endprint

猜你喜欢
搜索引擎关键技术检索
小麦春季化控要掌握关键技术
棉花追肥关键技术
成功育雏的关键技术
老苹果园更新改造的关键技术
2019年第4-6期便捷检索目录
专利检索中“语义”的表现
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析