基于关联数据的虚拟咨询网站服务模式构建*

2016-05-18 00:35:35刘爱琴何丹丹山西大学经济与管理学院太原00006华北电力大学经济与管理学院北京006
图书馆 2016年3期
关键词:咨询者咨询关联

刘爱琴 何丹丹 尚 珊(, .山西大学经济与管理学院 太原 00006;.华北电力大学经济与管理学院 北京 006)



基于关联数据的虚拟咨询网站服务模式构建*

刘爱琴1何丹丹2尚珊3
(1, 3.山西大学经济与管理学院太原030006;2.华北电力大学经济与管理学院北京102206)

〔摘要〕虚拟咨询网站的形成成功实现了知识的网上交易,但由于其各系统之间相互孤立,数据的格式和结构存在差异,无法实现信息资源的整合,导致虚拟咨询网站服务模式不能满足用户及咨询者的需求,这在一定程度上制约了虚拟咨询的发展。文章利用关联数据技术针对这一问题进行研究,提出了信息资源整合两个阶段的构想,实现了关联数据的集成应用创新,优化了虚拟咨询网站的服务模式。

〔关键词〕虚拟咨询网站关联数据模式构建

〔分类号〕G351

〔引用本文格式〕刘爱琴, 何丹丹, 尚珊.基于关联数据的虚拟咨询网站服务模式构建[J].图书馆,2016(3):67-70, 75

* 本文系国家社会科学基金青年项目(项目编号:10YJC630114)研究成果之一。

1 引言

1.1虚拟咨询服务模式现状

在数字化、网络化和知识化的信息环境下,计算机网络用户逐渐从信息的接收者转变为信息的创造者,一种新型的、基于知识服务的虚拟咨询服务模式应运而生。经过了十年的发展,虚拟咨询网站具备了一定的规模,并取得了显著成绩,但发展过程中仍存在一些问题。在此之前,众多学者对虚拟咨询网站进行了研究,并提出解决方案。韩姣红阐述了虚拟咨询网站的商业运营模式,具体涵盖提问与报价系统、检索系统、知识库系统、交易系统、订购系统五大系统,但各个系统之间是孤立的[1]。孟琦认为悬赏招标类虚拟咨询网站中存在的流标、项目简单两个问题造成了人力资源的严重浪费;针对这一问题,她提出建立内部人才库、引进各行业人才两项建议,并没有从技术方面给出建设性意见[2]。郭东升等研究了数据挖掘技术在虚拟咨询网站中的应用,从用户需求角度解决了咨询者难以找到合适的任务及用户很难找到符合要求的作品导致的人力资源浪费问题,但是并没有消除五大系统之间、各虚拟咨询网站之间的隔阂,无法实现数据的共享[3]。除上述问题外,虚拟咨询网站还存在下列问题:用户发布的多是琐碎的任务,这在一定程度上增加了咨询者寻找合适任务的难度;同样,用户发布任务后只能等待咨询者投标竞选,网站平台未对咨询者进行精准的定位,不能为任务发布者主动推送合适的咨询者,造成信息的不对称及智力资本的浪费。除此之外,虚拟咨询网站五大系统之间、各个虚拟咨询网站之间相互孤立,无法实现信息资源的共享,导致不同用户可能发布同样任务,同一任务由过多咨询者解答,造成数据的重复录入、重复建设。这些给用户及咨询者带来极大的困扰,严重阻碍着虚拟咨询网站的快速发展。关联数据技术可以实现虚拟咨询网站信息资源的精细化、结构化及语义关联化数据整合,实现信息资源的共享,消除信息孤岛,更方便地为咨询者及用户服务。虚拟咨询网站应用关联数据技术之后能够将咨询者的能力、过往成绩、过往评价、喜好等进行关联,同样能够关联用户发布的各项任务,形成知识地图,这样咨询者更加容易、方便地查找到合适的任务,用户更加准确、高效地检索到满意的产品。这在很大程度上减少了智力资源的浪费,提高了咨询者接收任务的积极性及虚拟咨询网站的服务质量,增加网站访问量及收益。因此,基于关联数据的虚拟咨询网站服务模式将成为未来发展的趋势。

1.2关联数据的提出

尽管虚拟咨询网站包含海量数据,蕴含着大量有价值的信息,但是绝大部分是半结构化或者非结构化的孤立数据,缺乏规范管理和语义关联。如何将分散的、非结构化的数据关联起来转化为对用户有用的数据,成为需要解决的关键问题。万维网创始人Tim Berners-Lee提出关联数据的概念,把没有关联的相关数据连接起来,使用户更加准确、可靠、高效地检索、使用、分享相互关联的信息资源。

由此可见,关联数据在虚拟咨询网站发展中扮演着不可或缺的角色,具体体现在以下四方面:①为虚拟咨询网站系统提供了数据存储及连接机制;②将虚拟咨询网站中原本存在的文档网络转变为数据网络,使得人机都可理解,为语义网的发展奠定基础;③将异构的、孤立的五大系统进行整合,消除信息孤岛;④关联数据连接各个虚拟咨询网站,使用户及咨询者浏览到更多相关信息资源,实现资源共享。传统信息服务系统与基于关联数据的知识服务系统进行比较,详见表1。

表1 传统信息服务系统与基于关联数据的知识服务系统的比较

2 理论基础

2.1发布关联数据的基本依据

就发布关联数据技术而言,Tim Berners-Lee在他研究的《关联数据的设计问题》中归纳出构建关联数据的基本依据[4]:

第一,互联网上各种事物或信息资源都用统一资源标识符标识,以便用户发现所需资源;第二,使用HTTP URI标识资源,数据通过HTTP内容协商协议进行访问,实现网络互联;第三,通过RDF连接提供与当前资源相关的信息,当用户访问某个标识名称时,为其提供更多有价值的信息;第四,尽可能提供相关的URI,使用户发现更多事物。

四项基本依据的设定进一步规范、限定了关联数据技术,有利于企业、组织、个人在万维网上发布关联数据。关联数据需要将分散的、非结构化数据转化为结构化的资源描述框架三元组,并用RDF连接。因此,发布关联数据的关键问题是实现数据资源RDF化和关联化,这是构建关联数据最富有挑战性的工作。

2.2发布关联数据的核心技术

为了使构建关联数据的代价最小化,关联数据延续了传统互联网中的统一资源定位符(URL)和超文本传输协议(HTTP)[5]。除此之外,关联数据的发布还需要资源描述框架(RDF)、URI和HTTP内容协商机制。其中,RDF三元组规定了描述网络信息资源的模型;URI标识网络上任意类型资源,便于用户更好的发现、利用资源;通过HTTP内容协商协议,服务器能够根据用户请求信息选择HTML或者RDF响应方式,详见图1。

图1 运作机制

结构化、非结构化数据及文本的RDF转换在关联数据的构建中占有重要地位,本文基于关联数据的虚拟咨询服务模式主要研究构建关联数据的两个重要因素,一是将任何事物统一用RDF表示,二是不同数据集间是如何通过RDF进行连接的。

2.3关联数据的构建工具

尽管关联数据的应用前景十分广阔,但是关联数据技术既没有引起国内学者的重视,也没有得到广泛应用。传统网络中的大量数据以WORD、EXCEL等格式存储在关系型数据库中,绝大部分资源并不满足发布关联数据的基本原则。因此需要一系列的实用工具将信息资源转换为符合发布关联数据的RDF格式或者将存储在关系型数据库中的数据根据映射规则转换为RDF格式。涉及到的关键技术有D2R Server、Virtuoso Universal Server、Drupal、OA I2LOD Server等。相对其他工具而言,D2R Server技术比较成熟、应用比较广泛,本文利用D2R Server工具将非结构化的信息资源转化为RDF三元组。

3 基于关联数据的虚拟咨询网站服务模式

3.1虚拟咨询网站关联数据构建流程

根据发布关联数据的基本原则,构建虚拟咨询网站关联数据的流程具体包括以下三个步骤:首先,将虚拟咨询网站中的信息资源转换为RDF三元组并用URI进行标识。其次,将虚拟咨询网站中原本存在的数据关联(例如,存储在关系型数据库中的咨询者或用户基本信息,可以通过关系型数据库中的主外键进行关联)利用D2R Server转换为RDF三元组。最后,利用HTTP内容协商机制将虚拟咨询网站关联数据发布到互联网上,再通过URI解析、SPARQL查询机制或者D2R Engine提供适用于各类应用程序的浏览及查询功能[6],详见图2。

图2 虚拟咨询网站关联数据的构建流程

3.2基于关联数据虚拟咨询网站内部信息资源整合的实现

虚拟咨询网站涉及内容十分广泛,具体包括用户信息及咨询者信息,即分为需求和服务两部分;其中服务部分包括品牌设计、网络推广、文案策划、商业装修等服务,因此虚拟咨询网站需要发布的信息内容相当复杂。虚拟咨询网站信息资源整合的第一步就是对元数据进行整合,即将复杂的网站信息资源发布为RDF三元组的形式。与此同时,关联数据能够通过RDF连接明确表示各个数据集之间的关系。假如虚拟咨询网站都以关联数据形式发布信息资源,用户就可以通过网络发现更多相关信息。下面针对单个虚拟咨询网站数据集之间的连接进行详细说明。

由于用户经常针对某一具体任务进行搜索,本文以查询“logo设计”为例详细分析。模型假设如下:对于“logo设计”类咨询者(此咨询者为某公司)而言,为吸引更多用户,尽可能多的将相关信息资源展现在虚拟咨询网站,比如公司业务、公司地点、联系方式,在虚拟咨询网站上的交易记录、好评率、评分、诚信度以及以往作品等。其中,公司业务分为动画制作、品牌设计、游戏开发、漫画设计、宣传品设计等。

现在,可以通过关联数据将这些非结构化的信息资源连接起来,形成一个“Logo设计”中心。该中心可以将分散的、不同的数据集进行连接,用户根据这个中心可以浏览到所有信息资源。假设现有咨询者A的URI标识L1,具体包括:公司名称(Name)A,公司地点(Address)山西太原,公司联系方式(Tel)1234567,评分(Grades)4.5,好评率(Feedback rate)95%,公司业务之一(Business)logo设计。咨询者B的URI标识L2,具体信息包含:公司名称(Name)B,公司地点(Address)浙江杭州,公司联系方式(Tel)1472583,评分(Grades)4.7,好评率(Feedback rate)98%,公司业务之一(Business)logo设计。咨询者C的URI标识L3,详细信息描述为:公司名称(Name)C,公司地点(Address)上海,公司联系方式(Tel)2583691,评分(Grades)4.9,好评率(Feedback rate)99%,公司业务之一(Business)企业形象设计。由于咨询者A与咨询者B均包含“logo设计”这一业务,所以咨询者A和咨询者B可以通过“logo设计”这个点进行连接。而“logo设计”属于“企业形象设计”,是企业形象设计的一部分,所以咨询者B和咨询者C可以通过“logo设计”与“企业形象设计”之间的包含关系进行连接。依据所列举信息,可以构造下列资源描述框架数据模型,如图3所示。

图3 RDF数据模型

在这个例子中,L1和L2拥有共同的数据“Logo设计”,L3通过“Logo设计”与“企业形象设计”之间的包含关系将原本孤立的L3与L1、L2连接。编写完关联代码之后,通过关联数据中的自动关联技术可知,利用OWL:sameAs关系连接两个不同的数据集。这样,当用户搜索“Logo设计”时,会浏览到咨询者A的详细信息,通过连接还可以进一步浏览到咨询者B以及咨询者C的详细信息,然后用户可以凭借好评率或者得分等信息根据需要选择相应的咨询者完成发布的任务。这在很大程度上减少了用户等待咨询者竞标及咨询者查找任务的时间,同时极大地减少了智力资源的浪费。

3.3基于关联数据的虚拟咨询网站外部信息资源整合构想

互联网技术的快速发展促使虚拟咨询网站数量不断增长,然而不同虚拟咨询网站之间并没有联系,它们采用不同的元数据规则、协议进行信息发布。这种分散的服务阻碍了信息资源的有效利用和广泛共享,导致虚拟咨询网站不能实现一站式的检索,给用户及咨询者带来不便。因此,将不同网站的信息资源进行整合,为用户提供一体化的信息资源服务成为未来虚拟咨询网站发展的必然。基于关联数据的虚拟咨询网站服务模式很容易对现有模式进行灵活地变更,也能够减少系统的重复录入与建设,但由于关联数据技术应用尚不成熟,使用时仍面临一些挑战。一方面,虚拟咨询网站外部信息资源的整合是十分困难的,需要各大虚拟咨询网站提供相应的资源库接口进行积极配合,专业领域研究者提供理论依据和技术支撑,国家政府提供专项资金来支持。另一方面,关联数据的连接是时常更新的,需要相关人员不断进行维护[7]。因此,虚拟咨询网站应在保证其利益的前提下开放相应接口,为资源整合提供便利,为用户及咨询者提供高效、便捷的服务。虚拟咨询网站外部信息资源整合涉及到的侵权问题应采取会员制度,必要时使用法律手段予以解决。

图4 基于关联数据的虚拟咨询网站信息资源整合

在Linked-Open-Data项目推动下,截止到2012年已经有130亿多条传统网络上的数据自动或半自动地转换成关联数据,构建了庞大的数据网络[8]。关联数据除连接不同的虚拟咨询网站之外,还可以连接到其他网站,使用户能够获取更加广泛、丰富的信息资源。依据关联数据的发布规则,本文列出基于关联数据的不同虚拟咨询网站信息资源关联模型,详见图4。

由图可见,基于关联数据的虚拟咨询网站外部信息资源连接从下往上共三个层次,依次是数据层、数据转换层、应用层。数据层即各个孤立的、分散的虚拟咨询网站(例如猪八戒网、虚拟咨询中国、任务中国等)中的信息资源,例如咨询者的详细信息、未中标作品、用户信息,咨询者展示的Logo设计作品、营销方案、视频制作、网页制作等。转换层是指虚拟咨询网站利用上述方法将信息资源依据“关联数据的基本原则”发布为RDF三元组,利用RDF连接进行关联,用户可以通过网络浏览关联在一起的虚拟咨询网站。例如前面所列举的“Logo设计”案例,咨询者A与咨询者B通过“Logo设计”这一中心进行连接,咨询者C通过“Logo设计”与“企业形象设计”之间的包含关系进行连接。这样,通过RDF连接用户可以浏览到大量相关信息。应用层即为用户提供的包括关联数据浏览器在内的一系列互联网应用。用户及咨询者可以通过关联数据浏览器或者SPARQL检索等工具检索所需信息,咨询者能够检索到大量与之相关的需求,并在这些需求中选择自己力所能及的任务;用户在发布需求之前,可以在知识库中检索信息资源,当发现并不是自己所需结果时,可以进一步进行搜索,同时虚拟咨询网站也会为用户推送相关咨询者。关联数据在虚拟咨询网站中的应用大大减少了咨询者及用户的检索时间,除此之外,未中标作品投入到知识库中供用户使用,这在相当程度上减少了智力资源的浪费。

4 结语

基于关联数据的虚拟咨询网站信息资源整合是互联网发展的必然趋势,针对虚拟咨询网站内容多而孤立的缺陷,文章首先提出基于关联数据技术消除了内部数据之间相互分隔的仓储,实现信息资源内部关联的方案;随后,提出了利用关联数据将多个网站资源进行关联的外部整合的设想。实现关联数据的集成应用创新,优化了虚拟咨询网站的服务模式,除了政府政策的大力支持、行业规范的制定等外部因素,加强虚拟咨询网站自身信息资源关联,尤其是不同虚拟咨询网站内外部信息资源有效关联的深入研究是至关重要的。

(来稿时间:2015年8月)

参考文献:

1.韩姣红.对威客网站运作模式的分析[J].科技情报开发与经济,2009, 19(1):108-111

2.孟琦.我国虚拟咨询网站发展现状分析[J].科技情报开发与经济,2014, 24(7):93-94

3.郭东升.基于需求的威客网站数据挖掘技术应用研究[J].电脑知识与技术,2011, 7(1):7-8

4.Christian Bizer, Tom Heath, Tim Berners—Lee.Linked data—the story so Far[J].International Journal on Semantic Web and Information Systems, 2014-08-23

5.Hitzler P, Krotzsch M and Rudolph S.Foundations of Semantic Web Technology [M].Chapman&Hall/CRC, 2014-08-20

6.Macanus R.Linked data is blooming:why you should care[EB/OL].http://readwrite.com/2009/05/17/linked_data_is_ blooming_why_you_should_care, 2014-10-25

7.李琳.关联数据在图书馆界的应用与挑战[J].图书与情报,2011(4):58-61

8.潘有能,张悦.关联数据研究与应用进展[J].情报科学,2011, 29(1):124-130

·国外图书馆·

The Construction of Virtual Consulting Service Mode Based on Linked Data

Liu Aiqin1He Dandan2Shang Shan3
( 1, 3.School of Economics and Management of Shanxi University ;2.School of Economics and Management of North China Electric Power University )

Abstract〔〕The emergence of virtual consulting website makes the online trading of knowledge succeed.However, the service mode of virtual consulting website cannot meet the needs of users and consultants for the systems are mutually isolated and there exist differences between data format and structure, which cannot achieve the integration of information resource.This severely constrains the development of virtual consulting to some degree.In order to solve this problem, this paper puts forward the idea of information resource integration in two phases basing on linked data: integrating the internal information of the virtual consulting website is the first stage; the second stage is to integrate the information between various virtual consulting website, which implements integrated application innovation of linked data and optimizes the service mode of virtual consulting website.

Keywords〔〕Witkey websiteLinked dataMode construction

〔作者简介〕刘爱琴(1974-),女,博士,硕士生导师,研究方向:信息资源;何丹丹(1991-),女,华北电力大学管理科学与工程专业研究生;尚珊(1962-),女,博士,信息管理与信息系统系主任,教授,研究方向:信息资源。

猜你喜欢
咨询者咨询关联
浅谈心理咨询中如何建立良好的关系
学习与科普(2022年2期)2022-02-23 18:33:53
“一带一路”递进,关联民生更紧
当代陕西(2019年15期)2019-09-02 01:52:00
所谓失败
意林原创版(2018年9期)2018-10-11 06:18:14
奇趣搭配
智趣
读者(2017年5期)2017-02-15 18:04:18
咨询联盟大有可为
共情在心理咨询中的运用例谈
中小学德育(2012年8期)2012-04-29 00:44:03
语言学与修辞学:关联与互动
当代修辞学(2011年2期)2011-01-23 06:39:12
健康咨询
祝您健康(1987年2期)1987-12-30 09:52:28
健康咨询
祝您健康(1986年4期)1986-12-30 09:52:18