翟 爽
(对外经济贸易大学 图书馆,北京 100029)
随着“互联网+”的蓬勃发展,人工智能正以势不可挡的速度在各个领域实践应用,并产生重大影响。1997年,IBM的“深蓝”超级计算机战胜了国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov)。2016年3月,谷歌的阿尔法狗(AlphaGo)战胜世界围棋冠军李世石,由此掀起了人工智能的热潮。除了在棋类领域,人工智能在汽车自动驾驶、智能手机、商业购物领域的表现也可圈可点。图书馆作为承载人类信息和知识的重要载体,也不可避免地受到人工智能的冲击和影响,本文将通过文献调研方法,重点分析近五年来人工智能在国内外图书馆的应用情况,探讨人工智能对图书馆传统业务的影响以及对图书馆扩展业务的影响。
业界普遍认为,约翰·麦卡锡(John McCarthy)、马文·闵斯基(Marvin Minsky)、克劳德·香农(Claude Shannon)、艾伦·纽厄尔(Allen Newell)、赫伯特·西蒙(Herbert Simon)在1956年达特茅斯会议上首次明确提出人工智能的概念。在此次会议上科学家们讨论的主题就是如何用机器来模仿人类学习以及其他方面的智能问题。因此,1956年也被称为人工智能的元年。2016年,阿尔法狗(AlphaGo)与围棋世界冠军李世石进行围棋人机大战,以4比1的总比分获胜,掀起了人工智能的发展高潮。
我国对人工智能的发展也极为重视,并在国家战略层面对人工智能的发展做出了部署。2015年7月,国务院印发《关于积极推进“互联网+”行动的指导意见》,将人工智能作为主要的十一项行动之一[1]。2016年,国务院将智能制造和机器人列为“科技创新2030”重大工程之一[2]。2017年7月20日,国务院发布了《新一代人工智能发展规划》,将人工智能上升到国家战略规划[3]。2018年,国务院总理李克强在政府工作报告中再次强调国家人工智能战略,将加强新一代人工智能研发应用列为2018年的重点工作之一[4]。
人工智能发展到今天,已经形成了一个比较完整的技术与知识体系,其主要技术包括模式识别(Pattern Recognition)、自然语言处理(Natural Language Processing)、计算机视觉(Computer Vision,CV)、语音技术(Speech Technique)、机器学习(Machine Learning)、数据挖掘(Data Mining)、机器视觉(Machine Vision)等。在每个子范畴下面,又有细化的技术做支撑,如在模式识别领域,可细化为文字识别、图像识别、生物特征识别和语音识别等;在数据挖掘子领域下,可细分为数据预处理、关联规则学习、数据分析、数据异常检测、数据降维、数据可视化、数据仓储和信息检索等。可以说,人工智能已形成了一个较为完备的理论基础和较为完整的生态体系[5]。
截止到2019年3月20日,以“Artificial Intelligence”为标题词,在SSCI中可以检索出961条记录,涉及计算机科学、工程学等10个学科, 其中,信息科学和图书馆学下的记录有65条,占比约为6.29%。由此可见,人工智能的主要研究领域分布在计算机科学和工程学中,在政府法学和商业经济中的分布数量次之,而在社会技术、数学、心理学、信息科学和图书馆学等其他学科中的分布则较为均匀,约在6%-7%之间。
Fig.1 The analysic chart of SSCI search results图1 SSCI检索结果分析图
在对68篇信息科学和图书馆学发表论文的分析中,我们发现人工智能的研究主要集中在以下几个方面:人工智能对信息学、图书馆学的影响分析,尤其在2015年至2017年间,很多学者都对人工智能对图书馆产生的影响、图书馆在人工智能时代如何应对、人工智能带来的新变化等等趋势性问题进行分析和探讨[6];2017年后,业界对人工智能的研究聚焦在具体学科和专业图书馆中,大野町(Ohno-Machado)和秦琳(Chin Lin)等学者重点研究了人工智能在医学临床实践、NCBI数据库检索、医学诊断代码等医药卫生领域的具体应用[7-10];凯莉·希尔特(Kaile Hilt)和南希·B·塔利(Nancy B. Talley)则研究了人工智能在专业法律图书馆中的发展和应用[11][12];除此之外,还有学者研究在传统图书馆分类学中应用人工智能,耶苏斯·博巴迪利亚(Jesus Bobadilla)提出利用数据挖掘、自然语言处理、机器学习等人工智能技术来提取科学文献的主题词,并进行分类[13];李秀桑(Lee Soosang)则提出将人工智能应用在报纸文献的主题分类分析中[14]。
国内图书馆学界对人工智能的研究也很深入。从2010年1月1日到2019年5月20日,以“人工智能”和“图书馆”作为关键词,在同方知网的《中国学术期刊(网络版)》数据库上进行检索,共检索出169篇论文。从时间维度上看,图书馆学界对人工智能的研究从2016年开始逐年增加,并呈直线上升的趋势,直至今日,研究仍持续推进。在所有研究文章中,下载量超过一千次的论文有8篇。下载量最多的论文是傅平、邹小筑等人合作的论文《回顾与展望:人工智能在图书馆的应用》,文章系统地梳理了人工智能的发展进程,以及对图书馆业务流程的影响[15]。其他论文涉及的主题还包括:人工智能在图书馆的应用研究、人工智能对图书馆的影响等等。
图书馆的传统业务工作包括采访、编目、流通、参考咨询等,各个图书馆也都根据其业务流程设定其服务部门和相应基础服务工作职责。人工智能的飞速发展,正切实影响着图书馆的传统业务。
对图书馆最常见的物理实体图书来说,在人工智能影响下,书架正由普通书架逐步转换成智能书架。智能书架是指书架内置的射频识别技术(RFID,Radio Frequency Identification的缩写,俗称电子标签)读写天线,可以自动读取每本图书RFID上的信息。这实际上是一套架上图书精准定位管理系统,可实现图书的实时清点、查询定位、错架统计、读者自助上架归还等功能[16]。由此可见,如果在图书馆全面应用智能书架,可以大大节省馆员的劳动成本,节约劳动力。此外,在图书馆参考咨询工作中,常见问题的答题咨询(Frequently Asked Question,FAQ)也是一种重要的服务方式,如将FAQ与人工智能相结合,也会极大提高服务的效能,尤其是在移动互联网时代,很多高校都在其微信平台设置了自动问答机器人。这种基于自动问答技术的微信平台公众账号服务机器人以其24小时在线、快速反馈反应的优势成为办公自动化的标志性服务项目[17]。
Fig.2 The analysic chart of CNKI search results图2 同方知网数据库检索结果分析图
刘国英提出智能体(Intelligent Agent)在图书馆主要有两大应用方向:一是应用于数字图书馆,包括基于智能代理的数字图书馆项目、数字图书馆的多智能体系结构、分布式异质信息检索中的智能代理、信息检索过程中的智能代理等;二是应用于传统图书馆,包括图书馆信息系统的用户界面、自动的参考咨询系统和图书馆服务中的多智能体系[18]。智能信息检索技术分为三类:基于垂直搜索的信息检索技术、基于语料库的信息检索技术和基于语义网的信息检索技术[19]。
近些年来,对异质资源的检索一直是图书馆所面临的一个难题。为了解决这个问题,很多图书馆都将传统的目录系统转化为在线的发现系统。发现系统是将多种信息源,包括图书馆馆藏目录、订购的数字资源、免费资源、开放获取资源等整合到一个检索界面中的系统。很多经费充足的图书馆会采购一些专业的集成检索系统,如Proquest公司的Primo发现系统,Exlibris公司研发Summon发现系统以及后起之秀Alma系统等等。然而,此类发现系统经费较高且存在年度更新付费的问题。中小型图书馆由于受经费等限制,难以采购此类专业的发现系统。如果利用人工智能的技术和手段,将智能信息检索技术应用到信息检索中,则可以大大提高中小型图书馆的信息整合检索能力,实现读者便捷的知识发现,无需额外购买专门的发现系统,并无需不断付年费维持。
人工智能在对图书馆整个业务流程和工作方法进行更新和改变的同时,不可避免地影响着图书馆的运作模式。无论是高校图书馆,专业图书馆还是公共图书馆,都有不同程度的影响。曾建勋认为:AI在颠覆图书馆传统业务的同时,也在推动图书馆转型,催生图书馆新业态、新模式和新动能。AI对图书馆的传统信息组织方法、原有信息服务方式和文献资源建设方式方面正产生重大的影响和挑战[20]。张兴旺则以信息推荐为例,探讨了图书馆人工智能体系的基本运作模式,信息智能推荐业务链由信息智能获取到知识智能生产到知识智能认知到知识智能体验,最后是知识智能推送,并着重分析了在各个业务链中,人工智能所产生的重大影响[21]。
传统环境下,图书馆基于物理实体进行业务布局和整体运行。发展到数字图书馆阶段,大量虚拟的数字实体涌现。目前,图书馆是以物理实体和虚拟数字实体相结合的方式进行运行。在人工智能的发展下,一切图书馆工作都朝着智能化、知识化方向发展,新的资源采集与服务模式也不断涌现。
Fig.3 The change chart of library operation mode图3 图书馆运作模式变更图
目前图书馆外包业务已开展得较为成熟,很多高校都将编目工作和流通阅览工作外包给专业的服务公司,以减少图书馆开支和人力资源消耗。随着人工智能的发展,很多外包工作可以交给智能机器人来完成,比如在图书馆的流通工作中,可以利用机器人进行识别和上架图书操作,可以通过机器人完成图书借阅工作等。同时,图书馆也可进一步研发智能书架,减少人工上架的劳动力成本等等。美国康乃狄克州 West-port 图书馆[22]、日本山梨县创造情报馆[23]于 2016 年1 月、11 月分别引进智能机器人为读者提供智能借阅服务等。
随着信息资源和知识资源的爆炸性增长,实现资源的共建共享已成为图书馆不可避免的一种重要资源保障模式。但是目前图书馆的资源共享基本上是按照机构类型或者区域来进行划分,比如高校图书馆联盟、专业图书馆联盟或者地区图书馆联盟等。如果可以利用人工智能技术,可以实现更大范围的资源共建共享,比如可以实现图书馆与搜索引擎的资源共建共享,可以打破国家界限,实现全球范围内的资源共建共享等。2015年,Google发布了人工智能系统TensorFlow并宣布开源,使TensorFlow成为了开源社会GitHub上最受欢迎的机器学习工具。图书馆领域也可以借鉴其思路,实现各类型图书馆在一定范围的资源共建共享。
图书馆的参考咨询服务作为图书馆一项重要的服务工作,一直广受重视,但是受图书馆员工作时长和专业背景的限制,咨询服务的广度和深度可能有所偏差。在人工智能技术的影响下,可以利用机器人来实现24小时无间断的参考咨询服务等等。清华大学图书馆在2010年底开始设计智能机器人“小图”,他们将图书馆经常遇到的万余条咨询问题植入小图的汉语语料库,通过机器学习等方法,使小图可以在图书馆员下班期间,与用户进行交流,解决其在图书馆遇到的各种问题[24]。2018年年初,上海图书馆引进了第一台机器人馆员 “图小灵”,该机器人题库来自上图微信服务号的问题,回答用户问题正确率达75%[16]。目前,很多高校图书馆都开始应用人工智能技术于其参考咨询服务中,南华大学图书馆[25]、中南大学图书馆[26]等高校都启用了Worldlib人工智能在线咨询。该咨询系统是以网页和微信为载体,运用最新网络技术整合多个搜索引擎,为用户提供外文文献获取的在线服务平台。它的平台查询结果会在10秒内返回,24小时不间断提供文献获取帮助服务,同时它也具有人工客服功能。
2017年,李晨晖、张兴旺等通过对2012年至2017年Gartner发布的5份《十大战略技术趋势》报告中的战略技术趋势和特点进行对比分析,结合图书馆领域的重要技术趋势报告,提出了图书馆未来技术应用和发展的研究方向——人工智能、虚拟和增强现实、数字孪生、对话系统、数字技术平台、区块链和分布式分类账、物联网、大数据、图书馆服务平台和在线身份、智能机器人等十大战略技术将会成为图书馆未来 5-10 年内技术应用与发展的主要内容[27]。
人工智能的发展对图书馆的业务工作、人力资源、信息资源的布局和运作方式等都会产生影响。为适应人工智能的快速扩展,国内外很多图书馆都顺势而为,积极参与到人工智能的浪潮中。2018年1月,美国的罗德岛大学宣布将在其图书馆设立“人工智能实验室”(Artificial Intelligence Lab)。不同于其他专注科研的AI实验室,罗德岛大学人工智能实验室(University of Rhodes Island Artificial Intelligence Lab,URI AI Lab)向其校内师生提供一个学习新兴计算机技能的机会,并鼓励他们加深对AI的理解。为此,该实验室会开展关于机器人、自然语言处理、智慧城市、大数据等相关培训。让师生切实地理解人工智能,以及深入探究人工智能在其各个学习领域的应用[28]。还有很多国外的图书馆,比如耶鲁大学等,都新建了数据研究或者数据服务部门,以适应读者对大数据等相关技术的不断需求。
不仅仅在图书馆,其他与图书馆相关的一些商业公司也在利用人工智能的技术和手段,不断更新针对图书馆的服务。Grid公司设计了一个人工智能程序Molly,用来设计图书馆网页。Molly会预先了解用户对网页设计的要求,包括栏目、颜色、页面布局等,然后利用预制算法,自动生成网页,并可根据需求随时进行页面更新。阿德顿(Adetoun)认为,图书馆可使用这种人工智能程序来设计其网页,或者应用在图书馆的创客空间、创意角等需要网页设计的地方,以期更好地帮助读者[29]。
由此可见,在人工智能浪潮的冲击下,图书馆及其相关机构都在积极进行着改变和更新。图书馆可以利用人工智能技术为读者提供更丰富的知识信息、更精准的咨询服务和更深入的服务内容,同时,在图书馆的服务时间设置和服务地域管理方面,也将更加灵活。相信在人工智能技术的帮助下,未来图书馆将朝着智能化、知识化、便捷化的方向不断进步和发展。