基于语义WEB的黔南民族文化资源检索与共享技术研究

2018-06-06 10:14袁军
电脑知识与技术 2018年7期
关键词:共享研究

袁军

摘要: 黔南地区是典型的少数民族地区, 不同民族在长期的生产、生活中形成了自己独特的民族文化, 在经济文化快速发展的当今世界,传统少数民族文化面临巨大的挑战。许多民族文化研究学者利用现代信息技术对民族文化进行挖掘和保护研究,建立了不少民族文化网络资源,但是,这些已建设资源,没有得到很好的共享和利用,成为了事实上的信息孤岛,造成民族文化资源的重复建设与浪费。该文从民族文化资源的利用与共享为主线,引入了语义WEB与WEB服务技术,讨论了民族文化资源如何利用语义WEB与WEB服务技术以提高分散、无序的已有民族文化网络资源在Internet上的检索效率与共享。

关键词:基于语义WEB ;黔南民族文化资源检索;共享;研究

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2018)07-0012-03

Abstract: Qiannan is a typical minority area, different nationality has formed its own unique culture in the long-term production and life in today's world, the rapid development of economy and culture, the traditional culture of ethnic minorities is facing a great challenge. Many scholars use modern information technology to mining and protection of national culture, they established many national culture cyber source, however, these resources do not share and use well, become in fact the islands of information, repeated construction and waste of resources caused by national culture. This article from the use of national culture resources and sharing as the main line, introduced the semantic WEB and WEB service technology, discussed in order to improve the retrieval efficiency of the existing scattered and disordered culture cyber source on Internet and sharing of semantic WEB and WEB service technology and how to use the resources of national culture.

Key words: based on semantic WEB; Qiannan ethnic cultural resources;retrieval; sharing; Research

1 前言

貴州的黔南地区是典型的少数民族地区,黔南地区境内生活着:布依族、苗族、水族、侗族、毛南族等36个少数民族,不同民族在长期的生产、生活中形成了自己独特的民族文化:苗族精美的银饰、布依族鲜艳的刺绣、水族奇异的水书、侗族余音绕梁的大歌,构成了绚丽的少数民族文化,是中华民族文化不可或缺的组成部分。在经济文化快速发展的当今世界,传统少数民族文化面临巨大的挑战,为了对濒危的民族文化进行保护、研究,不少民族文化研究学者利用现代信息技术建立了许多民族文化资源库,如:剪纸图案数据库、刺绣图案数据库、建筑图案数据库、民族古籍文献数据库等,但是这些民族文化资源库在共享、开发、利用方面却很不乐观,少量处于应用状态的民族文化资源的使用,也基本局限在各校、所的二级单位,没有公开在网络上发布,成为了事实上的信息孤岛,造成资源的重复建设与浪费。本文从民族文化资源的利用与共享为主线,引入了语义WEB等技术,讨论了如何将语义WEB与WEB服务技术与少数民族文化资源共享平台的建设相结合,以提高分散、无序的已有民族文化网络资源在Internet上的共享。

2 语义WEB技术

2.1 语义WEB的产生

语义WEB,即:Semantic Web,是指计算机能理解信息语义的WEB,它是现今WEB技术的发展方向,它不是一个新型、独立的WEB,而是传统WEB的延伸;语义WEB的概念由万维网发明人,蒂姆·伯纳斯·李(Berners-Lee)2000年首次提出;语义WEB通过对传统WEB信息资源进行标注,从而有利于计算机对信息语义的理解和处理以及判断和推理能力的提升[1]。XML、RDF及本体(Ontology)是构成语义WEB的三大核心技术[2]。

2.2 XML与RDF

XML:可扩展标记语言(Extensible Markup Language)。被用来实现信息的结构化、存储以及传输。XML是一种通用的结构化描述语言,它允许用户自行添加标记来标注网页内容,具有良好的灵活性和扩展性[3];常用于实现不同网络及异构数据间的信息传递与交换。下面以苗族剪纸图案《吹芦笙的男子》为例,来说明如何用XML文件来表示民族文化网络资源:

RDF(资源描述框架)是W3C(国际万维网联盟)在 XML基础上推出的,表示WEB资源的标准以及WEB资源结构与内容的规范说明。RDF可用于表示任何资源信息,RDF通过:资源-属性-属性值,三元组的形式来表示WEB上的任意资源信息;在语义WEB中,信息以RDF句子的形式统一存储,以便于计算机及计算机之间对信息的理解。

3 基于語义WEB的民族文化资源网络共享平台

少数民族文化资源是中华民族传统文化的有机组成部分,近几年,各地民族文化研究者分别建设了不少民族文化网络资源,如:剪纸图案数据库、刺绣图案数据库、建筑图案数据库等,但是,这些已建设资源,由于分布在不同地理位置的高校、院所、单位中,难以发现和利用;因此,通过建设民族文化资源共享平台,将分散的资源整合起来,利用语义WEB技术实现资源的全网语义检索、利用WEB 服务技术实现资源的全网络共享有着积极的现实意义。

3.1民族文化资源网络共享平台架构与功能概述

民族文化资源网络共享平台组织架构图如上图所示,其中各层功能叙述如下:

访问层:是用户及系统管理员与资源共享平台交互的接口,这里的用户有两类,一类是需要共享资源的A类用户;另一类是拥有资源的,希望资源被共享的B类用户;A类用户通过系统的语义检索功能快速定位、查找所需资源,再通过系统的资源共享的WEB服务功能使用资源;B类用户是指那些拥有资源的用户,通过在共享平台发布资源,来满足A类用户的共享需求。

服务本体层:接受访问层的服务请求,实现相应的检索及资源共享服务,并将服务结果返回给访问层用户;服务层要实现上述服务,需要建立民族文化资源数据和平台本体库元数据间的对应关系;资源共享采用WEB服务注册和发现机制UDDI(Universal Description Discovery and Integration即统一描述、发现和集成协议)来实现。

领域本体层:民族族文化资源本体层的核心就是建立民族文化资源的本体知识库。它是共享平台进行语义检索与共享的基础,本体知识库提供了民族文化领域相关的元数据,通过元数据的标注,民族文化资源能够表达一定的语义,这是实现语义WEB相关智能服务的前提。

资源层:是指处于不同地理位置的、网络服务器上的民族文化资源,包含文本、图像、视频、音频、PPT等基本文件与素材,它们以无序及分布式的方式散布各地,包括结构化数据、半结构化数据及非结构化数据。

3.2 民族文化资源共享平台语义检索功能流程

信息检索在当前Internet上使用非常普遍,是WEB的主要应用之一,Google搜索引擎每天执行的搜索次数大约是30亿次,百度每天执行的搜索次数大约是10亿次。但是使用过网络搜索功能的用户都有这样的印象,Internet网上的信息非常丰富,但检索反馈回来的信息却不一定都是我们想要的,因为传统的信息检索从基本原理上来讲,采用的依然是机械的关键字匹配方法,这种方法没有从语义的角度对检索信息进行处理,只是简单地将包含相同关键字的信息词条反馈给用户,所以查准率不高。例如:“公交车”与“bus”在搜索引擎中的结果是不同的。民族文化资源网络共享平台中的检索功能要实现对不同地域的无序分布的文化资源站点进行高效的智能检索,需要采用基于语义WEB的检索技术,基于语义WEB的检索技术,从语义的角度来处理用户用自然语言表达的检索请求,并将用户检索请求与基于本体的信息知识库中的内容进行语义的推理和匹配,这样可以提高检索的周全度与准确率。

民族文化资源共享平台语义检索流程如下:

1) 用户通过用户代理软件提交检索查询请求,同时用户检索请求还需按文化资源本体库中的规则转化为系统认可的格式。

2) 用户代理软件将符合要求的检索请求提交给检索代理,检索代理从民族文化资源库中检索出用户需要的资源,交由用户代理返回给用户。

3) 资源代理软件主要负责维护民族文化资源库,并从Internet中将新的资源添加到库中,充实资源库内容,满足用户检索需求。

3.3 民族文化资源共享平台资源网络共享功能流程

近些年来,民族文化数字化研究者出于研究工作的需要,分别建设了诸如:剪纸、服饰、建筑等网络数据库资源,这些分布于不同地理位置、不同组织、不同网络的民族文化资源,采用的数据组织形式不同、采用的操作系统不同,如何共享这些现有的、高度分布的民族文化网络资源?WEB服务(WebService)是解决这一问题的良好方案。WEB服务是一种跨程序设计语言和跨操作系统平台的远程调用技术。跨语言,也就是说服务端与客户端可以采用不同的语言一实现各自的程序功能,如:服务器端采用C语言来编写程序,客户端程序则可以采用JAVA、C#等其他编程语言来实现;所谓跨操作系统平台则是指服务端程序和客户端程序可以在不同的操作系统上运行,如服务器采用WIN2003客户端可以采用LINUX都不会影响WebService 功能的实现[4]。

在上图中文化资源服务注册模块提供共享资源的注册功能,便于资源的请求者了解共享平台上有哪些资源可供使用;服务提供模块提供具体的文化网络资源供请求者使用;资源请求者通过服务注册模块查找需要使用的资源,并与资源提供者绑定,使用资源。工作流程如下:

1) 民族文化资源提供者将可共享的资源通过平台服务注册模块按UDDI要求进行注册发布。UDDI是通用描述、发现与集成服务,是WEB服务注册和发现的规范。

2) 民族文化资源服务请求者向资源共享平台请求特定的资源,资源共享平台对服务注册中心进行查询,为请求者提供满足要求的服务资源。

3) 民族文化资源共享平台向请求者返回符合要求的资源信息,该信息使用WSDL(WEB服务描述语言)进行说明。

4) 资源共享平台根据WSDL生成的服务描述信息生成相应的SOAP消息,并发送给资源提供者,以实现双方的绑定操作。

5) 服务请求者通过绑定使用相应的资源。

4 结束语

分散、无序的民族文化资源阻碍了资源的共享和利用,语义WEB技术能够为民族文化网络资源提供计算机能够识别和处理语义信息,WEB服务技术能实现分散、无序民族文化资源的共享,将语义WEB与WEB服务技术与少数民族文化资源共享平台的建设相结合,将分散的资源整合起来,对于实现黔南民族文化网络资源的共享以及研究和开发利用有着积极的现实意义。

参考文献:

[1] 梁晔,周海燕. 本体论与语义WEB [J]. 北京联合大学学报,2007(3):1-6.

[2] 刘柏嵩. 基于知识的语义网:概念、技术和挑战[J].中国图书馆学报,2003(2):1-4.

[3] XML 简介[OL].http://www.w3school.com.cn/xml/xml_intro.asp

[4] Web Service工作原理及实例[OL].http://blog.csdn.net/yangwenxue_admin/article/details/51059125.

猜你喜欢
共享研究
FMS与YBT相关性的实证研究
2020年国内翻译研究述评
辽代千人邑研究述论
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
新版C-NCAP侧面碰撞假人损伤研究
谈云计算与信息资源共享管理
挂羊头卖狗肉的“共享”营销