我国联合虚拟参考咨询系统知识库现状研究*
——基于与QuestionPoint的对比
鲍计国 栾美晨
论文以访问网站作为主要调研方式,从知识库的基础构建、应用与服务、联合管理三大方面选取典型实例,对比分析国内现有主流参考咨询知识库和美国QuestionPoint的发展状况、特点以及彼此间的差异,最后进行归纳总结,以期为我国图书馆参考咨询系统知识库建设提供借鉴。
知识库联合虚拟参考咨询QuestionPoint知识挖掘元数据标准OCLC
联合虚拟参考咨询系统的知识库包括在虚拟参考咨询中用户所提的问题与相应的解答记录,它是经过分类与组织,有序化的知识集合,是在普通知识库的基础上,有目的和有针对性地从中抽取知识点,按一定的知识体系进行分析和整合而组织起来的数据库,是面向用户的有特色的专业化知识服务系统。联合虚拟参考咨询知识库的构建与运作情况在很大程度上决定了联合虚拟参考咨询服务的深度和广度。从中国科学院文献情报中心参考咨询台、CALIS的DCVRS、广东省立中山图书馆参考咨询联盟、上海图书馆网上联合知识导航站等国内主流参考咨询系统来看,基本上记录了表单咨询,并以此为资源供读者检索和浏览,但由于在构建和组织上的不完善性,加之记录本身的问题,参考咨询知识库的作用没有充分发挥出来,很大程度上凭借于参考咨询馆员自身经验积累和个人的水平。因此,我国联合参考咨询知识库的构建是一个急需加强的课题。
QP(QuestionPoint)是OCLC于2000年在CDRS(Collaborative Digital Reference Service:分布式虚拟参考咨询服务)基础上研制推出的服务项目(产品),也是目前世界公认的最成功的、辐射范围最大的联合虚拟参考咨询服务项目。QP拥有两个重要的特色资源:一个是得到欧美甚至于全球合作图书馆所组成的全球通讯架构和网络以及软件工具的大力支持,另一个是拥有由成员馆的协作网络构成的独特的集中式知识源[1]。QP参考咨询服务为全世界各地区、各国图书馆拓展参考服务提供了一种新的范式。因此以QP和我国主流参考咨询知识库进行对比研究对我国参考咨询知识库的建设具有典型的借鉴意义。
鉴于近年来联合虚拟参考咨询系统知识库的研究重点大致是参考咨询知识库的基础构建、知识库创新型服务以及知识库联合管理三个方面,本文将结合中美两国主要联合虚拟参考咨询系统的建设实例,从这三个方面,对参考咨询系统知识库的发展情况进行对照研究,以归纳总结我国参考咨询知识库与美国QP为代表的参考咨询知识库发展的异同。
2.1 知识库的架构与建设方法
同时架设中心知识库和本地知识库是国内外主要联合虚拟参考咨询系统普遍采用的模式。QP虚拟参考咨询系统设有一个唯一的全球知识库(Global Knowledge Base)和大量本地知识库(Local Knowledge Bases),各本地知识库由成员馆独立架设本地服务器,自行管理。本地知识库和中心知识库能够互通有无。全球知识库由QP总部OCLC管理,全世界所有地区成员馆可以很方便地在全球知识库进行业务查询。全球知识库的记录来源各本地知识库,全球知识库本身没有记录。各本地知识库每年至少要向全球知识库筛选一定数量的对答记录。全球知识库专家对提交的问答记录按照一定的标准进行审核,只有符合标准的、有应用价值的记录才录入全球知识库供全球各成员馆共同享用,知识库积累流程见图1。除了Global KB 本身知识库外,QP还能够利用所有OCLC其他成员的知识库如wordcat,wordshare,proquestion等,而且这些知识库都很强大,以proquestion知识库为例,截止到2014年2月,记录达到3.2 亿条[2]。
我国CALIS的分布式联合虚拟参考咨询系统(DCVRS)知识库架设方式相比QP更为丰富和完善。DCVRS不仅有QP的中心知识库和本地知识库,还考虑到各地区、省市资源分配的合理性设立了省级知识库(有的省级知识库还创建了市级的“共享域”),各省成员馆能够通过向地区或省级参考咨询系统租用知识库的方式获得联合参考咨询服务[3],大致架构如图2所示。在中心知识库建设方面,中心数据库积累了巨大的知识记录,因为中心知识库的数据信息来自于两方面:一是总咨询台的记录;二是通过OAI元数据收割各省级知识库中记录的信息,而且后者更为重要。值得提出的是,2010年CALIS的三期建设项目建立了共享的云服务平台和两级支持共建,为高校图书馆和其他两种类型图书馆的建设提供基于混合云的本地虚拟图书馆解决方案[4]。云服务的运用在一定程度上标志着我国在参考咨询知识库建设的某些领域面已经达到国际一流水平。
2.2 知识库的知识组织与分类方法
从现实情况来看,全球联合参考咨询系统知识库内的记录都不是杂乱无章的简单堆积,而是系统的知识集合,因此知识库的分类组织方法对知识库的建设与优化有着极其重要的意义。美国QP知识库分类导航按学科排列,参考的是美国国会图书馆分类法标准,这一标准在全美具有至高的权威性。与此同时,知识库会自动通过问题关键词聚类,能够进一步向馆员和读者推荐与他们关注问题有一定联系的知识记录。此外,知识库具有良好的主题分析功能,即能够根据知识库主题浏览或检索情况自动弹出若干热点和经典主题,为馆员、读者展现和提供相应的热点、经典导航和链接,便于馆员、读者较快地找到需要的知识。其实这种技术在国内其他领域已经普遍使用,知网、万方硕博论文库的搜索引擎等也采取了这种方法。我国虚拟参考咨询知识库中的问答记录方式彼此差异较大,但都是通过主题标引和自身服务对象的特点进行了单途径的分类导航。通过对国内主要虚拟参考咨询系统的实际使用,其中的浙江省联合知识导航网站设置了多种信息分类导航,既科学又人性,能够满足不同层次、不同领域读者的查询需求。
3.1 知识库的检索服务
美国联合虚拟参考咨询知识库的检索服务界面中有很多检索路径,智能检索服务、自动问答已初步应用。在检索途径上,和OCLC的其他产品类似,QP提供了两种途径:基本检索和高级检索。基本检索就是输入关键词或句子;高级检索有多关键词逻辑组配检索、模糊检索和混合检索。而在检索机制上更加科学更加人文,QP对知识库的检索主要基于关键词匹配的方式,出于兼顾查准率与查全率的考虑,QP提供了关联问题提示,这样更加方便用户决定是否查找相关问题。在我国尽管这方面的技术已经成熟,但知识库的检索途径很简单,不少咨询知识库没有提供模糊检索和多关键词的组配检索。相比之下,上海图书馆的参考咨询知识库提供的检索途径很全面,其中“浏览问题库”左侧的分类多达33种,涉及到学科分类和文献载体(如图书、期刊、报纸、古籍等),还有“房地产资讯”“中小企业服务”,满足了不同人群的查询需求。微博、微信等方式也在上海图书馆的参考咨询中得到了运用,但查询扩展和关联提示等功能尚未配备[5]。用户除使用联合虚拟咨询平台进行检索外,QP还将知识库作为一种普通的网络服务,用户不仅能通过OCLC以及OCLC合作伙伴登录,还能够从Facebook等其他网络平台访问知识库。国内的情况是通过图书馆网站可以登录其他知识性较强的网络,但是通过其他网络尤其是商业网站不能登录图书馆网站,更涉及不到参考咨询知识库。
自动问答服务目前在互联网等领域已经获得较广泛的运用。QP收到问题后先采用句子相似度的方法和知识库已有问题进行匹配,若匹配成功,即相似度达到规定的值,已有的答案将直接返回给用户;若匹配不成功,即相似度没有达到规定的值,再将问题提交给咨询馆员。这是一种较简便的自动问答方式,不仅减轻了咨询馆员的工作量,而且更充分地运用了知识库的已有资源。CALIS的DCVRS在吸收上述优点的基础上更加完善。如从北京大学图书馆咨询台入口,进入“文献信息检索”,输入问题,DCVRS便直接对问题进行匹配,匹配成功直接得到答案;不成功,问题将交给北京大学学科馆员处理。而这项技术在我国其他联合参考咨询联盟中还没有获得大面积推广运用。
3.2 知识挖掘与发现等创新型服务
除了提供日常的检索服务外,QP咨询知识库正在探索进一步发挥其专业化知识服务的特色。2005年以来,美国对基于知识挖掘与知识发现的服务特别注意,多数参考咨询系统可提供热点知识点导航。在这一点上国内的图书馆参考咨询也做了大胆的开发,如上文提到上海图书馆联合参考咨询项目就有“房地产资讯”“中小企业服务”的服务栏目。在基于知识挖掘的创新型知识服务的同时,虚拟参考咨询知识库与互联网等其他知识库的融合也有了更多的研究,并取得了一定的成果。QP的母公司OCLC与各种各样的子公司一起交流数据、连接工作流程和共享应用程序,这些合作伙伴的知识库都能为QP和世界信息网、互联网融合,使QP用户最大限度地获得更多的信息资源[6]。
4.1 知识库的知识来源与标准
知识库联合管理最基础的部分是知识的来源与标准。一般情况下,联合虚拟参考咨询系统中心知识库信息来源于各本地知识库所贡献的信息,而本地知识库的信息来源主要是其日常虚拟参考咨询服务中的读者与馆员的问答记录。目前知识来源主要有实时咨询、表单咨询、E-mail咨询等。国内参考咨询多数都采用了QQ咨询,这类咨询往往比较零散,整理起来需要大量时间。实际情况是尽管有价值,咨询员却没有整理,因此大多知识库并不能收录实时咨询的问答记录。为了便于知识的储存和利用,CALIS的分布式联合虚拟参考咨询系统(DCVRS)规定:咨询员须将咨询问题整理成标准的表单咨询形式后,方能将咨询记录存入到知识库。这一规定客观上大大减少了入库的记录。然而,美国QP知识库的记录量相比之下非常大,不但记录了基于计算机终端的实时问答情况,而且记录了手机等移动客户端设备的实时咨询(如Text a Labrarian)[7]。这看起来是个简单的问题,实质上涉及问题的标准化、知识库的标准化、人工劳动等等问题。
知识库标准一般定义为对知识库记录的语言、来源、资源描述、质量、编辑、存档和权限、利用方面的规范,旨在整合、共同享用各知识库中的资源,以保证服务质量和系统的互操作,统一所有成员图书馆在构建和丰富知识库时的行动,进而使得知识库中的记录规范化[8]。美国目前虚拟参考咨询知识库的元数据(或数据元素)标准主要有:KBit(Knowledge Bit)和元数据标准、QATP(Question/Answer Transaction Protocol)、QUIP(Question Interchange Profile)。QATP是对参考咨询进行统一的技术标准,是由美国National Information Stands Organization提出的,和QUIP相似,但是QATP定义了一种基于在不同虚拟参考咨询服务机构之间进行问题/回答交换、客户端/服务器模式,是一种帮助实现虚拟(或数字)参考咨询系统之间的问题交互过程的规范。20世纪后期虚拟参考咨询问答记录量增加比较快,Answerbase公司在2000年VRD年会上提出KBit项目。KBi对问题和答案进行了分类与格式规定,是一种参考咨询知识库内容质量标准。QP知识库要求的知识记录必备元素包括问题本身、来源、成员图书馆、提问时间、咨询馆员教育背景、答案文本、涉及的参考文献和注释、入库状态、回答问题的成员图书馆等,它将每一个原问题作为一记录来形容和描绘与之相关的问答交互情况。目前,我国CALIS的分布式联合虚拟参考咨询系统(DCVRS)知识库在充分参考QUIP的问题交换协议标准基础上做了进一步的优化,必备元素有所减少,实现了各图书馆间跨平台的问答记录共同享用、交换,而且参考了2004年美国国家信息标准协会发布的虚拟参考咨询试用标准问答处理协议,实现了与QP等参考咨询系统之间的问题互换。
4.2 知识库的维护与管理
记录的录入规范、记录的更新与清理以及隐私与知识产权保护等内容构成联合虚拟参考知识库的维护与管理的基本内容。虚拟参考咨询知识库的维护在美国已相对成熟。《QP知识库编辑指南》是QP项目开发不久后便迅速起草的文件,该书对QP知识库URL格式、问答记录格式、参考资料的标注元数据等做了较为详细严格的规定。此外,QP知识库每月更新一次,并检查知识库记录的时效性,及时修正或者删除已过时的参考资料或者链接。在知识库的管理上充分考虑到知识产权和隐私等敏感问题,问答记录入库时只录入问题或答案本身,私人信息自动删除。
我国还没有制定统一的知识库记录标准,而在入库记录的筛选流程上,多数还没有设被选问题和答案的临时知识库,对完整的问答记录采取直接入库机制,这样就出现两个极端,即录入太多质量差的或者因为要求严格录入太少。对知识库里面无用的、不合时宜的记录也未制定相应的淘汰办法,如提供知识库中记录多而杂。我国主流的参考咨询系统在用户反馈机制上,都设置反馈邮箱等途径供用户反馈情况,但多数情况下用户不能对某一具体问答结果进行评价。中国科学文献情报中心首页就设置了“用户反馈”,但点击进入之后,会发现是“网上咨询台”[9],问题可见一斑。
随着参考咨询的发展和知识库记录增加,国内知识库维护与管理的提升将提到日程上来。综合上述分析,我国以CALIS的DCVRS、上海图书馆网上联合知识导航站等为代表的参考咨询知识库在基础构建、创新型服务及联合管理三个方面虽做了大胆的探索与创新,取得了可喜的成果,并在不少方面形成了自己的特色。但美国以QP为代表的参考咨询知识库建设方面总体上领先于我国,并表现出不同的文化特征,我国在知识库建设的很多方面存在不足,需借鉴美国等国家先进的知识库运作模式,加快我国参考咨询系统知识库的成长与发展[10]。
我国参考咨询知识库间的合作,以及参考咨询知识库和其他机构、网络资源间的合作需要加大力度,实现内部融合,并和世界的图书馆链接起来。从知识库的发展来看,知识挖掘、基于知识库的智能检索、自动标引与分类、自动问答等的研究是未来参考咨询知识库发展的重点课题,将知识库作为一种搜索引擎与其他知识资源进行整合将成为我国知识库发展的必然趋势。
[1]OCLC.QuestionPoint at glance[EB/OL].[2014-05-24]. http://www.oclc.org/en-asiapacific/questionpoint/about. html.
[2]OCLC.QuestionPoint[EB/OL].[2014-05-24].http://www. oclc.org/questionpoint.en.html.
[3]王天虹,钱蔚蔚.天津高校图书馆CALIS分布式联合虚拟参考咨询服务实践与问题研究[J].图书馆论坛,2013,33(4):157-161.
[4]中国教育和科研计算机网.H3C助力CALIS系统进入“云时代”[EB/OL].(2010-12-07)[2014-05-24]. http://www.edu.cn/tsg_6497/20101207/t20101207_54 9379.shtml.
[5]方向明.联合虚拟参考咨询服务比较研究:以“三层”结构评价体系为视角[J].新世纪图书馆,2014(3):48-51.
[6]OCLC.Partnerships[EB/OL].[2014-05-24].http://www. oclc.org/en-asiapacific/partners-for-libraries.html.
[7]王猛,郑建明.1997—2012年我国数字参考咨询研究主题分析[J].新世纪图书馆,2013(10):19-23.
[8]周宁丽,张智雄,李珍.分布式参考咨询服务标准与规范研究与应用[J].现代图书情报技术,2007(4):45-48.
[9]中国科学文献情报中心网站[EB/OL].[2014-05-24]. http://www.las.ac.cn/index.jsp.
[10]洪韵佳,许鑫.联合虚拟参考咨询系统知识库的发展现状与趋势[J].现代图书情报技术,2012(9):2-9.
鲍计国辽宁对外经贸学院图书馆馆员、讲师。辽宁大连,116052。
栾美晨辽宁对外经贸学院图书馆馆长、研究员。辽宁大连,116052。
Contrast Analysis of the Main Knowledge Base of the Collaborative Digital Reference Systems in China and QuestionPoint
Bao Jiguo,Luan Meichen
By visiting website,this paper analyzes the status of research and application of the knowledge base from its foundation construction,service and collaborative management through a study of the knowledge base of the main collaborative digital reference system in China and QP.At last,it makes a generalization expecting to provide references for the construction of knowledge base at home.
Knowledge base.Collaborative digital reference.QuestionPoint.Knowledge mining.Metadata standard.OCLC.
G250.76
2014-05-13 编校:方玮)
*本文系2013年度辽宁省社会科学规划基金项目“辽宁地区图书馆合作参考咨询问题研究”(项目编号:L13DTQ016)阶段性成果。