史聪慧
摘要:深度学习是学习样本数据的内在规律和表示层次,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。在图书馆的参考咨询服务中,引入智能机器人进行服务,不仅可以节约图书馆人力的投入,还可以提高服务质量和效率。
关键词:人工智能;参考咨询;深度学习;图书馆
中图分类号:G253
文献标识码:A
文章编号:1009-3044(2020)03-0205-02
随着智能化时代到来,人工智能(Artificial Intelligence,AD技术获得了突破性进展,并且逐步被运用到各个行业各个领域。人工智能技术主要包括:机器学习(ML,Machine Learning)、神经网络、自然语言的处理、聚类分析及模拟人类思维方式等。深度学习(DL,Deep Learning)是机器学习领域中一个研究方向。近年来,智慧图书馆与图书馆智能化服务成为图书馆发展的重要课题,机器学习的相关技术在图书馆的应用将会从根本上改变当前图书馆的服务方式,将会为读者提供更加便捷更加丰富的知识服务。
1 深度学习与图书馆智能参考咨询服务
1.1 深度学习概念及特点
深度学习是机器学习的一种类型,源于人工神经网络的研究,通过模拟人脑神经元对于外界刺激的感知和传导过程,即建立人工神经网络,来获取对事物的认识、解释和判断。[1]通過图像、声音与文本的组合发现最浅层的特征,经过机器的重组与记忆,形成更加抽象的深层的特征或表现形式,最后形成强大的数据组合。深度学习最后目的在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来对声音、图像以及文本信息进行解释、理解、储存,形成强大的知识库。
深度学习是发现和挖掘已有数据的内在规律和表示层次,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是机器模仿人脑进行知识记忆、数据关联、信息检索与海量存储,同时又比人脑具有更加快捷处理复杂数据的优势,使得人工智能相关技术取得了很大进步。
1.2 图书馆智能参考咨询服务的发展现状
图书馆服务中,参考咨询服务是图书馆服务中的一项重要工作,而服务的响应时间、服务的覆盖面与服务的效果也成了衡量图书馆服务效果的一个非常重要的指标。传统的参考咨询模式有人工咨询与表单式咨询,随着人力成本的提高、读者服务体验要求的提升以及人工智能技术的发展,劳动力密集型的参考咨询服务已经不能适应未来发展,传统的咨询服务出现了很多存在不足方面:例如咨询馆员的配备数量有限;人工咨询回复效率较低;咨询工作受节假日等时间限制,导致读者无法得到及时的信息答复。所以,为了弥补传统参考咨询模式的不足,图书馆开始探索智能咨询服务的模式,以实现图书馆对读者的7*24小时的无间断服务。目前,我国大部分图书馆常用的咨询工具包括:博客、微信、QQ、IM咨询与电话咨询、邮件咨询等方式,这些现代交流工具的运用大大改善了传统参考咨询模式的效率与效能。[2]
随着人工智能以及深度学习技术的引入,很多图书馆开始在咨询服务中引入机器人参与服务。智能咨询机器人通过人机互动接口接收读者的提问,用机器语言描述读者问题,然后去知识库进行检索,找到匹配答案后,返回给读者若干个与咨询问题相匹配的答案,读者点击阅读相关答案后,如若仍不能解决咨询问题,可通过点击“人工咨询”链接转介人工咨询馆员继续咨询。目前,一些高校图书馆中开始在图书馆服务中引入了机器人智能咨询,如:清华大学图书馆的“小图”、深圳图书馆的“小图丁”、上海交通大学图书馆基于MSN的智能聊天机器人、重庆文理学院图书馆基于实时虚拟参考咨询服务机器人等。[3]
尽管这些机器人服务目前还存在许多弊端,甚至有些读者因为机器人提供的答案不准确,去嘲弄机器人。但是我们必须看到,未来在图书馆智能参考咨询服务中,运用机器人参与服务是一个必然趋势,智能机器人根据FAQ数据库了解读者需求,解答部分常规读者的咨询。应用智能机器人技术可以节省图书馆人力物力的投入,减少咨询馆员的重复性劳动,提高咨询服务质量,实现图书馆的7x24小时的咨询回复。
1.3 深度学习的关键技术
深度学习是机器模拟人脑进行学习、记忆、归类、分析以及信息检索,形成比人脑更加强大的知识库,在图书馆的智能参考咨询服务中,涉及的关键技术有以下几个方面:
(1)语音转写:把音频数据转化为文本数据的过程。机器人接收到读者的提问,可以是自然语言形式的,也可以是文本形式的。如果机器人接收到的信息是语音形式的,就需要对音源进行检测,提取音频数据的关键特征,通过数字解码、音素转换、音节转换、标音转换等操作,最后转换成文字数据,目的是为了让机器人准确理解读者需求,进而去知识库中寻找匹配答案。[4]
(2)文本分析:将非结构化文本数据转换为结构化或者标准化数据的过程。从非结构化数据中检索信息,以及对输入文本进行结构化以得出模式和趋势,并对输出数据进行评估和解释的过程。包括词汇分析、分类、聚类、模式识别、标签、注释、信息提取、链接和关联分析、可视化和预测分析特征提取等。[5]
(3)文本聚类:在知识库里,按照某一个特定的标准,把相似问法或相似答案的文本数据聚集在一个集群里。目的是为了咨询机器人能够储存尽可能大量的数据,以及输出最准确的答案。[6]
(4)问答系统:建立问答系统,包括知识库扫描、问题理解、问题检索与问题解答等。克服传统搜索引擎的弊端,实现用户采用自然语言进行提问或检索,对读者问题进行语义分析与理解,准确快速定位读者的真正需求,反馈精准答案给读者。涉及的技术包括:问句分析,词向量、依存句法,同义词提取。自然语句生成等。[7]
2 基于深度学习的智能参考咨询模式的步骤
智能咨询服务的工作方式是,通过人机交互平台,接收读者对机器人的提问,咨询机器人把表达的自然语言提问进行关键词提取分析,通过对FAQ数据库检索,将最相关的答案用简洁准确的语言提供给读者,在保证实时性的同时,具有高度的精确性。本框架是通过自然智能的工作方式,实现三步平滑过渡。利用人机结合的操作模式,取代“单一自动化”的切换模式。
(1)第一阶段:大量咨询馆员坐席十少量训练馆员坐席
如图所示,第一阶段设置大量的咨询馆员坐席对读者进行服务;然后设置一部分训练馆员坐席与咨询机器人共同学习。训练馆员不参与面对读者的服务,他的任务是把咨询馆员日常服务的信息按照一定规则编辑成文本数据的形式,把读者提问的方式与咨询馆员回答问题的信息相互匹配,让咨询机器人进行学习。该阶段,咨询机器人的工作就是学习,像人脑神经元一样,通过文本分析、模式识别及聚类等步骤,大量储存信息,形成强大的知识库。
(2)第二阶段:咨询机器人坐席十训练馆员坐席+咨询馆员坐席
该阶段,由一部分咨询机器人坐席开始参与智能服务,逐渐减少咨询馆员坐席的数量。训练馆员的工作主要是验证咨询机器人服务的效果,如果有的答案不准确,训练馆员一方面反馈给智能机器人,重新去修正已储存的信息;另一方面,把不准确的服务转介给咨询馆员,重新进行服务。
这一阶段,是咨询机器人快速验证已学知识与不断更新知识库的过程。把一些关联不准确或者模糊的自然语言重新进行标记,形成新的规则,重新储存进机器人大脑中。该阶段训练馆员的工作非常重要,是验证咨询机器人知识库信息是否准确的关键时期,也是验证咨询馆员工作的重要时期。
(3)第三阶段:大量咨询馆员坐席十少量训练馆员坐席+少量咨询馆员坐席
该阶段,咨询机器人大量参与参考咨询服务,保留少量训练馆员席位与少量咨询馆员席位。对于读者的提问,咨询机器人大部分可以独立解答。在提供服务的同时,不断更新知识库,像人脑一样储存知识、建立新知识的关联、用新的知识体系覆盖旧的知识体系,不断扩充知识库的容量。另一方面,对于一些特别复杂的问题或者是一些新的业务问题,由训练馆员进行辨别,经过验证以后,转交给人工的咨询馆员进行解答。人工咨询馆员解答完毕,再把新问题与新答案反馈给训练馆员,进而去指导咨询机器人进行新一轮的学习。
该智能参考咨询模式分三步走,逐步实现由人工咨询馆员提供服务到咨询机器人服务为主,人工咨询馆员提供指导相结合的模式。既提升了图书馆参考咨询服务的效率,也保证了服务的专业性与可控性
3 总结
物联网与人工智能时代的到来推动了智能服务的向前发展,采用智能机器人进行实时参考咨询服务,是未来智慧图书馆服务的方向。图书馆在向智慧服务迈进的同时,我们也要意识到:不管科技发展到什么程度,都不能完全取代现实的咨询馆员,在大力开发智能机器人功能的同时,也要正确处理好咨询机器人与现实咨询馆员的关系,要充分发挥现实咨询馆员的主导作用与主体地位。
参考文献:
[1]深度学习.https://baikc.baidu.com/item/深度学习/3729729?fr=aladdin
[2]张文竹,邵波.智能机器人技术在图书馆信息服务中的应用与研究述评[J]图.书馆学研究,2018(12):2-7.
[3]郭山,智能机器人技术在公共图书馆实时参考咨询服务中的应用[J].图书馆学研究,2017(10):58-61.
[4]郭利敏,刘炜,吴佩娟,等,机器学习在图书馆应用初探:以Ten-sorFlow为例[J].大学图书馆学报,2017,35(6):31-40.
[5]劉婷婷,朱文东,刘广一,基于深度学习的文本分类研究进展[J].电力信息与通信技术,2018,16(3):1-7.
[6]唐晓波,李新星,基于人工智能的知识服务研究[J].图书馆学研究,2017(13):26-31.
[7]夏元昉,基于深度学习的问答系统技术研究[D].杭州:浙江大学,2017.