公共图书馆智能咨询知识库构建原则的若干思考

2023-07-07 22:08胡雪环
河南图书馆学刊 2023年5期
关键词:构建原则参考咨询知识库

胡雪环

摘 要:为降低读者获取信息的成本,提升咨询服务质量,图书馆应顺应时代发展潮流,主动开展智能参考咨询服务。文章探究了智能咨询前期知识库构建的相关工作,以期为后期机器学习和各平台智能咨询系统的构建提供参考和借鉴。

关键词:参考咨询;智能咨询;知识库;构建原则;公共图书馆

中图分类号:G258.2   文献标识码:A   文章编号:1003-1588(2023)05-0018-04

1 背景

图书馆参考咨询服务是指馆员针对用户需求,以各类权威信息资源为依托,帮助或指导用户检索获取所需信息或提供相关数据资料、文献查引查证和专题内容等形式的信息服务。科技的进步正在助推图书馆朝着数字化、网络化、智能化的方向发展,参考咨询服务从最初的现场咨询扩大到以现场咨询、电话咨询、表单咨询、QQ实时咨询、网页在线咨询、电子邮件咨询、微信咨询为主的多渠道咨询,有效打破了图书馆咨询服务的时间空间限制。

随着各类移动智能终端和即时通信软件的广泛应用,读者对信息的即时获取和快速响应需求不断增多,图书馆需要以便捷、精准、高效和人性化的方式为读者提供参考咨询服务,以降低读者获取信息的时间成本,提升咨询服务效率。目前,互联网技术的成熟应用、人工智能产业的快速发展、移动智能设备的广泛普及,为参考咨询服务向智能化转变提供了支撑,智能参考咨询服务逐渐成为图书馆领域的研究热点之一。

2 图书馆智能咨询服务研究现状

近年来,部分高校图书馆和公共图书馆正在积极开展智能咨询服务的相关研究实践,如:清华大学图书馆基于核心语料库自主研发的智能客服清小图、上海图书馆与企业合作研发的智能客服图小二、东南大学图书馆基于词向量语义扩展技术的智能咨询系统、浙江工业大学图书馆基于微信公众平台和百度AI平台设计开发的智能参考咨询机器人图小学等。与传统的基于单一关键词匹配的自动问答系统相比,智能咨询系统在理解自然语言方面展现出更多的优越性。

人工智能技术在参考咨询服务领域得到广泛应用,本是一件提升服务水平、惠及读者的好事,但在实际调研及试用中发现,部分图书馆在高价购置智能机器人等硬件设备设施后,由于对数据后台和知识库建设的投入力度不足,出现智能设备沦为摆设的尴尬局面;部分图书馆虽然自主研发或与公司合作开发上线了问答系统,但仅仅是基于单一化关键词的匹配应答,内容并不涉及自然语言处理及语义扩展方面的相关工作,难以应对读者基于自然语言的多样性问答,测试中暴露出无法应答或答非所问的种种缺陷,因而并非真正意义上的智能咨询系统。不管是实体机器人,还是微信智能客服、网页智能问答,设备、系统、技术固然重要,但也不再是唯一难点,真正实现智能化咨询应答,还离不开一个关键核心——智能咨询知识库。知识库作为机器人的核心部分,是深度学习和数据挖掘的基础,虽然机器人的智能性取决于智能算法,但知识库的构建也至关重要[1]。知识库的有效构建离不开参考咨询馆员的参与,随着人工智能技术的快速发展,智能咨询知识库的构建不应被置于技术的边缘之外。

3 智能咨询知识库构建的若干原则

移动设备及各类信息搜索软件的广泛应用,使普通大众获取信息的渠道日益多样化,图书馆主要面向线上线下读者提供服务,因此,图书馆构建智能咨询知识库既无须像百科知识一样面面俱到,也不能仅仅局限于本馆服务资源。因此,合理的构建原则可为公共图书馆构建智能咨询知识库提供指导。

3.1 一个中心原则

一个中心原则是指始终坚持以图书馆业务为中心的原则。公共图书馆开展智能咨询服务变的是服务形式和手段,不变的是服务内容,即始终围绕读者证办理、馆藏文献查询借阅、各类数字资源检索利用、特色数据库及特色活动推介等核心业务逐步展开。参考咨询馆员在长期工作的过程中收集整理的常见问题解答库(FAQ)是图书馆重点咨询业务的高度总结,因此,公共图书馆在智能咨询知识库构建的初期,往往都会以FAQ为基础,但智能咨询知识库的内容丰富程度高于FAQ。FAQ以高频业务问题为主,知识覆盖面窄,对于读者来说耗时耗力且缺少互动和人文关怀。智能咨询服务需要参考咨询馆员全面收集读者日常咨询的馆情问题及相关问题,并根据长期积累的工作经验思考预判读者可能问及的问题。智能咨询知识库的构建环节比FAQ复杂,公共图书馆在构建智能咨询知识库的过程中不仅要以丰富的服务内容为基础,还要根据读者自然语言的复杂性,结合参考咨詢馆员总结的工作经验,构建咨询常用同近义词库(表)或语料库,引入知识模型与语义扩展等技术对基于自然语言提问的业务问题进行有效识别与精准回复。

3.2 多点覆盖原则

公共图书馆构建智能咨询知识库要坚持多点覆盖原则,以读者为中心,把图书馆服务和馆藏资源利用相关的高频咨询问题及读者关心或可能问到的问题纳入知识库体系,并根据读者需求不断完善知识库体系。这些问题主要包括以下内容:一是图书馆配套服务设施相关问题,如:热水在哪里、图书馆有雨伞提供吗、哪里有充电宝、有无自助售卖机、哪里可以吃午饭、有免费存包柜吗、有残疾人通道吗等。二是图书馆所在区域周边服务相关问题,如:文德路少儿馆和农讲所附近的少儿馆是同一家吗、附近有哪些地铁线路经过、这里离烈士陵园远不远、附近有没有打印店、旁边的鲁迅纪念馆是否需要单独预约等。三是文旅融合相关问题,如:广州有哪些值得去的旅游景点、图书馆附近有什么好玩的地方推荐、广东的特色美食有哪些、不同季节适合去广东哪里游玩等。

基于以上分析,广东省立中山图书馆把智能咨询知识库的业务问题分为馆情概况、入馆须知、读者证业务、借还及复印服务、数字资源及数字化服务、特殊群体服务等13个一级类目和若干二级类目,类目下的每一个问题的标准答案由参考咨询馆员进行整理提炼,并由相关部门负责人审核确认,以确保回复准确可靠,具体内容如下页表1所示。

3.3 精准化原则

公共图书馆的服务对象十分广泛,由于不同读者对同一个问题的提问方式不同,读者的咨询提问往往以较复杂的自然语言形式存在。如何确保智能咨询系统能准确识别读者意图并精准匹配到知识库中的答案,而非模糊匹配至若干个相似问题答案,是智能咨询系统体现其智能化的关键所在,也是主要难点所在。

对从问题中抽取出的关键词进行语义扩展,是提高答案匹配效果的关键[2]。因此,构建图书馆参考咨询同(近)义词库或语料库既是智能咨询知识库构建的一个重点工作,也是智能咨询系统实现精准解答的关键。同(近)义词库或语料库越完备,可组配共现的关键词组合就越多,可解答的咨询问题场景就越丰富。智能咨询系统在识别到读者的自然语言后,往往需要进行一系列的分词切词操作,对提取出的关键词进行组合匹配并映射到主问题,以实现自然语言提问与知识库答案的精准对接。

构建同(近)义词库需要参考咨询馆员结合同(近)义词字典和图书馆工作经验做具体分析。针对开馆时间,不同读者会有不同的表达方式,如:什么时候开馆、几点可以进馆、何时开放、几时开门等;有的读者甚至会问图书馆几点开始营业、营业到几点下班、几点开始上班。在其他社交场景下,开门和进馆并非同义,但在该场景下,开门和进馆二者是同义特征词。另外,“营业”一词一般出现在营利性机构的咨询问题中,从咨询员角度几乎不考虑该词的纳入,但面对读者的咨询提问,参考咨询馆员必须将“营业”一词收录到开馆时间的同(近)义词库。针对未成年人办证这一常见问题,读者可能会有几百种表达方式,关键词有主语“未成年人”、谓语动词“办”和宾语“证”,在该语境下,“未成年人”的扩展表达有小朋友、宝宝、小孩子、儿童、幼儿、少儿、小学生、初中生、高中生、未满18周岁的、18周岁以下的等,“办”的同义词有申请、办理、领取,“证”的同义词有卡、读者证、读者卡、图书证、图书卡、借阅证、借书证、借书卡等。参考咨询馆员据此对关键词进行组配,可构建出几百个问题场景组合,这些场景组合能基本覆盖读者关于该问题的提问。由此可见,构建相应的知识库是实现智能问答的重要前提[3]。构建智能问答同(近)义词库具有较强的图书馆咨询场景特征,对于智能问答系统的构建及后期机器自主训练学习来说是一项基础性工作。

3.4 人性化原则

智能咨询系统既能提供精准的主动式问答,也力求接近人工咨询服务。因此,公共图书馆在构建智能咨询知识库的过程中不仅要考虑知识层面问题体系的构建,还要考虑自动应答流程的设计,如问答内容和问答逻辑。流程设计原则以《参考咨询服务规范》中对人的要求为依据,设置礼貌解答常用语及符合人性思维的问答逻辑。以目前广东省立中山图书馆已投入使用的智能语音系统为例,主干流程主要包括:当读者电话拨通后,如何设置智能语音机器人的问候语;当智能语音机器人初次识别不了读者的提问语音时,如何回应读者;当读者无语音反馈时,如果进一步引导读者提问或结束提问;当读者提问一直不被智能语音机器人識别时,设置几次问答转入人工;当读者明显出现不满情绪,请求人工服务,应该如何快速响应;当人工线路繁忙,如何设置回复答语等。虽然语音公司针对此类主干问答一般会有逻辑问答流程,但问答内容和应答逻辑往往与图书馆馆情服务并不贴合,需要参考咨询馆员根据工作经验对主干流程问答内容进行干预更改。

为了凸显人性化的服务原则,公共图书馆应针对特色资源和特色活动设置专门的问答引导,以降低读者获取知识的时间成本。例如,针对“你悦读,我采购”活动,广东省立中山图书馆需要针对采购书店、借阅流程、适用范围等读者关心的问题设置详细具体的问答条目;针对特色数字文献库——缩微文献全文数据库,广东省立中山图书馆需要考虑到很多读者不知道数字化缩微库的存在这一问题。因此,在诸如此类多途径可选的特色资源问题设置上,广东省立中山图书馆应以最优方案优先推送为准则,并辅以其他方案回复读者。当读者提问怎么查找古籍资源时,广东省立中山图书馆应先推荐读者选择特色数字资源库,并附上详细的查找途径,再推荐读者到馆特藏部现场查找,以降低读者获取知识的时间成本。

此外,在日常咨询服务工作中,部分读者虽然得到了解决方案,但仍会在咨询台与咨询员继续交谈,为了展现图书馆的人文关怀,咨询员需要以一个倾听者或朋友的身份与读者继续交流。为了提高读者的智能咨询体验,拉近读者与智能客服的距离,公共图书馆需要设置人性化的自动应答聊天环节,以满足读者的情感交流需求。

3.5 可持续性原则

在智能咨询知识库初步构建完成后,技术人员负责知识库内容的添加工作;咨询员作为熟悉和了解读者需求的馆员,负责测试工作,并及时与技术人员沟通反馈测试中出现的各类问题。

前期测试重点围绕以下内容进行更新完善:一是针对已有知识,读者提问后,系统识别不了或答非所问,公共图书馆需要对该知识的问题场景进行同(近)义词增加或修正,以提升问题匹配的精确度。二是针对开放测试期间,已有知识的服务变更,如服务时间、活动地点等,公共图书馆需要对这些信息进行及时更新完善。三是针对测试期读者提出的新问题及馆里发布的新通知等信息,公共图书馆需要及时把这些信息添加补充到知识库。四是针对常规问候语和问答逻辑进行测试修正,以期更符合人性化问答思维。五是收集情绪关键词,针对读者的情绪反馈,优化智能机器人的情感性问答,提升读者的情感服务体验。

后期维护是一个长期过程,可有效避免工作烂尾现象的发生。公共图书馆除要做好前期维护工作外,还要做好以下工作:一是及时抓取最新活动信息,并将其添加到知识库,避免活动信息漏更。二是定期收集汇总各个平台的机器人与读者的对话记录,分析用户的问答行为,扩展同(近)义词库或语料库,持续优化智能知识库,以满足读者的真实需求。三是建立公共图书馆联合参考咨询知识组织模型,规范智能参考咨询行业词库和用语,加强与其他图书馆的交流与沟通。

4 结语

公共图书馆可把智能问答知识库嵌入多种平台,实现多平台全方位的24小时实时智能咨询。目前,广东省立中山图书馆智能咨询知识库已被成功应用于智能语音问答系统和网站在线咨询客服“智能小书童”。基于知识库的智能咨询系统可有效推动参考咨询服务工作的开展,拓宽参考咨询服务的范围,提高参考咨询服务的用户分析能力[4]。未来,图书馆智能参考咨询服务必将朝着多端平台协同、人机协同的方向发展,不论是基于网页端、微信端的智能咨询服务,还是基于电话语音端、App客户端、实体机器人设备的智能咨询服务,都需要以智能问答知识库的构建及参考咨询馆员的人工干预等为基础工作。公共图书馆参考咨询馆员应进一步提高智能参考咨询服务知识库的数据质量,探讨未来参考咨询服务的智能化发展方向。

参考文献:

[1] 陈锋平.人工智能咨询机器人在公共图书馆的应用与探索:以杭州图书馆为例[J].图书馆研究与工作,2018(11):73-76.

[2] 张乐.词向量语义扩展技术在图书馆智能咨询系统的应用与实现[J].图书情报工作,2020(18):126-136.

[3] 胡潇戈,戚越,王玉琦,等.面向智能问答的图书馆参考咨询知识库体系设计及构建[J].图书情报知识,2019(5):101-108.

[4] 杨倩.智能咨询机器人对图书馆参考咨询服务的革新[J].农业图书情报学报,2021(5):93-99.

(编校:孙新梅)

猜你喜欢
构建原则参考咨询知识库
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高职英语教学中形成性评价的构建原则及方式研究
吉林省农业生产能力评价指标构建新方向
现代化图书馆参考咨询工作的组织管理
浅谈构建中职学生综合素质多元评价模式
依托文献 整合信息
高速公路信息系统维护知识库的建立和应用
合作数字参考咨询服务发展策略研究
基于Drupal发布学者知识库关联数据的研究
位置与方向测试题