人工智能在图书馆信息数字化浪潮中的新动向

2022-02-13 17:38◎卢
传播力研究 2022年32期
关键词:领域人工智能大学

◎卢 春

(山东财经大学图书馆,山东 济南 250014)

作为国家文化发展的重要标志,图书馆的现代化建设是推动全民阅读、文化强国的重要环节[1]。然而,图书馆的现代化建设必然要依托于当前已有的或是在未来中可以预见的技术条件才能推进。随着科技水平的进一步提升,信息领域已经大踏步进入人工智能大数据时代,图书馆系统也已经迎来新一轮技术革新[2]。本文将聚焦于人工智能在大学图书馆的应用现状,通过调查统计进一步阐释人工智能技术在大学图书馆领域应用的优势和可能会遇到的实际问题,对于我国大学图书馆转型和进一步提升拓展服务功能具有较强的借鉴意义。

一、人工智能的定义和范围

人工智能一直是计算机领域重要的分支之一,发展历程起起伏伏,例如在20世纪80年代随着计算机行业的迅猛发展出现了一段高潮期后便进入沉寂期,直到21世纪初,在神经网络领域的重大突破才让人工智能再次突破瓶颈而兴起。正是由于个人终端(如个人电脑、手机、数码相机、录音设备、存储设备等)和互联网云技术在近20年的迅速发展中形成了海量数据,为训练和提升人工智能的各种算法提供了基础大数据。人工智能技术已经广泛进入公众生活,以图形、声音识别为代表的一系列高新技术为民众生活带来了便利,尽管各个行业都开始关注人工智能领域,但苦于没有相关人才,导致技术转化相对缓慢。目前,人工智能领域的发展对图书馆建设将带来何种影响尚未有定论。在部分实际操作方面,人工智能毫无疑问通过优化搜索功能、人机互动、文本挖掘,已经开始改变图书馆的服务模式。

二、人工智能在图书馆领域的应用与潜在的问题

人工智能已经被公认为信息领域的重要发展方向,但在图书馆领域的应用尚处于尝试阶段。目前可以确定的是人工智能将会深度影响学者的文献搜索过程,并且人工智能的两个重要分支人机互动和数据挖掘,已经在学术图书馆领域展现出巨大的应用潜力[3]。人机对话指的是可以通过文本、声音等方式开启智能对话,即图灵检验中所指的人类无法分辨与之对话的一方究竟是人类还是机器。人机对话目前已经可以利用关键字提取等方法回答一些方向性较为明确的问题,对于提升读者的文献查询效率目前已取得了一定的效果,其优势在于可以全天候服务读者、回复结果相较于人类具有更高的一致性,利于监管和提升服务水平。但人机对话目前尚有不少局限,例如,互动过程中表现出远远低于人脑的灵活性,回复过于机械化,无法维持或者提升读者的用户体验感和亲和力。涉及语音互动的系统在方言、口语表达等方面缺少大数据积累,无法让人工智能进行大数据学习,自我提升算法的准确度和运算效率,而这一模块又是图书馆领域较为欠缺的领域,人工智能技术尤其是高效的语音识别系统,可以迅速解决这方面的发展瓶颈问题,但这一功能往往仅被年轻读者所接受,而在年龄较大或者残障读者群体中流行程度偏低[4]。数据挖掘指的是通过算法对文本、图像、声音等信息进行大规模整理、搜索和再编排,这一技术特别适用于当下的信息爆炸时代,大量学术发表迫使读者花费大量时间排除无关文献,但这一技术往往受到知识版权和相关软件的限制。对于绝大多数的出版物,仅有题目、作者。出版相关信息(地点、出版商、年份)等可以公开查询,在没有得到版权所有者许可的情况下不可以提供公开的渠道对出版物未公开内容进行查询。作为连接出版物和读者的纽带,图书馆在获取相关证书、区别不同软件等方面具有更大的发挥空间,但现在绝大多数图书馆尚未开启这方面的调研或实际应用。此外,人工智能的重要性在以大学等为代表的高等教育机构中日趋明显,主要集中于个人精细化学习方式、学习效果监督、智能导师等方向,这一趋势也开始影响图书馆的服务模式,随着人工智能技术不断深入各个领域,使用者也开始逐渐意识到其潜在的弊端。首当其冲的问题是如何保护使用者的隐私。人工智能不同于传统软件技术,其各种软件算法可以通过独立学习大量数据不断完善自身,因此获取大量数据用以学习是达到智能化的前提,但这也提出了新的挑战,如何保护个人数据不会被用于其他用途以及如何划分商业服务与公共服务之间的界限,成为法律、科技伦理、学术界所共同关注的焦点[5]。人工智能所面临的第二个主要问题是如何保证其运算结果的可信度,以及过程的透明化。人工智能的运算过程是一个变化的学习过程,取决于基础数据的不断收集和算法的更新。这就造成了整个运算过程不够透明,导致最终呈现在读者面前的搜索结果趋同化,进而影响某个领域的多样化发展,抑或是大型出版商可以通过干预基层算法的设置来直接影响读者所搜索到的出版物而从中获利。但是,这些观察基于定性分析,依然存在很大的不确定性。

三、研究方法

本文研究的对象集中于学术型大学图书馆,这些图书馆往往具有相似的管理模式和资金来源,由于学校本身的学术研究能力较强,因而其学术资源也相对更加丰富,工作人员的专业素养相对较高,对于人工智能等新型技术也更加具有开放性,具有更好的横向比较意义。本文通过这些大学或者图书馆网站对以下关键词进行搜索:人工智能、机器学习、深度学习、文本发掘。同时,通过访问图书馆工作人员或者收集这些大学图书馆近期发展总体规划白皮书(2017—2022)、研究规划、相关课程、学生团体、初创公司和企业合作等相关信息,通过定性或者定量分析,总结人工智能在大学图书馆的应用程度,进而分析人工智能技术在图书馆领域的应用前景和目前遇到的主要问题。

四、结果与讨论

统计结果中最引人注目的是没有几家大学图书馆在最近五年的总体规划中提到人工智能。大部分单位提到了数字创新技术,或者大规模数字化书籍。尽管大学图书馆在总体规划中并没有明确提及人工智能,但这些大学都在不同程度上推动了人工智能在当下的发展。最明显的例证是,全部大学均开设了大量不同形式的人工智能课程,这些课程不仅仅局限于计算机系,而是面向全校师生,并提供暑期学校、创业培训等多种学习模式。部分顶尖高校还会调拨专项资金为人工智能领域下的各种学生团体和研究小组提供场地及资金来推动创新。虽然这些大学都对人工智能领域表现出了极大的关注,但仅有极少数大学的图书馆提供相关培训,而且这些培训往往集中于已有的算法或者软件的调用,常常与计算机编程培训合并进行。在调研过程中,尚未发现有大学图书馆主导的人工智能科研项目、学术会议或者工作坊。这一现象的根本原因在于高校图书馆目前的信息管理——查询依然采用传统的文献学管理模式,主要依靠关键词(包括题目、主题、文章关键词、出版年份、作者、出版商、文献所属领域等)进行精确或者模糊匹配。图书馆的文献整理和查询往往通过图书卡片进行,互联网兴起之后则通过电脑、手机等个人终端进行操作,毫无疑问查找效率极大提高,但底层逻辑依然遵循关键信息配备,而非人工智能所提倡的动态学习模式。不过,这些高校拥有的大量优质人工智能团队是其他业界(例如出版界)所无法比拟的,高校图书馆应该更加积极地参与到人工智能的发展当中,向人工智能界充分阐释图书馆的客户需求以及客户特点,并整合提供多年来服务于学校不同专业所积累的经验,通过数据分享和算法研发,寻找最新的解决方案。

调研过程中发现,有部分大学已经开始利用手机图书馆APP、微信小程序、公众号等服务在校师生,极大地提高了图书信息搜索的便捷程度,也因此产生了大量用户数据。而这些用户数据恰好为发展个人精细化学习、终身学习,甚至是研究学校不同专业的发展趋势等提供了重要的一手资料。对于在校师生而言,实时获取最新的出版物(包括期刊、书籍等)是增强科研竞争力的关键,对于学校校图书馆而言,如何利用有限的资金进行合理分配,最大程度地满足师生科研教学的需要是重中之重。由于不同学校、不同专业的人数和研究方向不同,还要同时考虑到科研教学的动态变化,大学图书馆很难全面、实时地跟踪每一个专业领域配置的资料。人工智能的引入势必会帮助学校图书馆更加系统地提供服务。例如,通过人工智能程序监督学习某一特定专业本科生的借阅模式,辅以该专业本科教育的课程大纲,结合该专业重要期刊最新的研究成果,便可以实时根据学生的学习进度推荐相关书籍或专业文章。这一模式也可以推广到教师的科研备课过程中,例如,根据教师的专业方向和教学内容,及时推荐与之相关的最新科研成果(书籍、科研文章、专利等),教师也可以根据所推荐的内容做出相应反馈,表达相关推荐能够在何种程度上帮助自身的科研教学、项目申请完成等,这样量化反馈同样是珍贵的算法学习数据,通过自动上传并加以学习后可以进一步优化系统所推荐的科研信息,形成良性循环,在节省大量图书馆人力物力的同时,更加精确地优化图书馆的资源配置,全方位提高读者的学习效率和图书馆的服务质量。

人工智能的另一个重要数据来源是图书馆的主动采集,主要方式是三位立体扫描或者高清二维扫描。这一方法最早源自对于竹简、甲骨文等古代书籍或者近代报纸、档案、书信、地方志等重要的不可再生信息的保护,即读者不用接触实体书报便可查找信息,而这些珍贵资料也可以交付专业的文物保护机构妥善保存。再过去的十年中,许多高校十分注重对于文物古籍以及校史档案的保护,多数图书馆也采购了相关仪器进行信息电子化,为人工智能的引入奠定了重要的基础。目前这些信息往往以图片的形式保存,且很多资料以古代字体为主,无法通过关键字直接搜索,导致查询十分不便,但通过人工智能的图片识别则完全可以实现查询自动化,为人工智能在图书馆服务方面创造新的应用领域。

调研的另一个发现是大学图书馆在人工智能的外延领域,例如在大数据库的建设和公众宣传方面依然具有巨大的发展潜力。作为大学里的重要基础设施之一,图书馆肩负着保存和传承知识、全方位服务师生等多种重要使命。目前高校的人工智能团队多以项目为中心,项目负责人带头,中坚力量为博士后研究员,实行聘任制,可以集中团队力量进行攻关,但是项目一旦结束,在科研过程中搜集或者创造的大量科研数据则会面临无人监督的窘境,尽管科研成果可以通过各种形式予以发表,但是这些珍贵的元数据往往难以全部发表,而这些数据大多具有多重应用价值,如果能够整合保存起来,可以很大程度上减少未来科研人员的重复劳动。同时,这些数据也可以为人工智能的自我学习提供帮助,预测某一个领域的发展方向。图书馆在这方面有得天独厚的条件,管理人员接受过相关专业训练,对于信息的保存和管理驾轻就熟,将高校科研团队收集或者产生的大量数据加以整合,为科研提供长期数据支持,可以作为图书馆参与人工智能领域发展的重要结合点。图书馆不仅要为学校师生整合最优质便利的学术资源,同样也可以提供设施完善的会议场所。人工智能的从业者往往以年轻人为主,工作模式也非常多样化。我们发现,人工智能以编程爱好者为主,在校学生居多,运行模式即是在主要的人工智能大学、企业或者社会公益单位等现场举办编程竞赛,而这些活动往往缺少基础设施完善的大型场地,这种形式新颖且模式灵活的竞赛活动已经被人工智能界广为接受,但对于图书馆依然陌生,通过协助举办人工智能相关的学术会议、主题讲座、编程竞赛等活动,展示人工智能领域最新的研究成果等,同样可以为图书馆和人工智能领域搭建起更加多样化的沟通桥梁。

五、结语

人工智能为高校图书馆现代化提供了重要契机的同时,也提出了新的挑战,在图书馆领域拥有巨大潜力,可以帮助图书馆全面提升在大学科研教学过程中的服务效率。目前急需解决的问题是在图书馆与人工智能专业之间建立有效的沟通机制,让双方充分了解各自的优势。图书馆所属大学拥有世界一流的人工智能教学和创业环境,或可借助图书馆长期积累的用户数据和成熟的人工智能算法体系实现井喷式发展。通过长期合作实践,建立完善相关的规范和法律,从制度上实现系统开发、版权、知识分享、个人精细化学习、终身学习等一系列社会目标。这对于人工智能和整个图书馆行业今后的发展具有一定的借鉴意义,如果能在二者之间迅速架起一座沟通的桥梁,不仅可以扩展人工智能的应用领域,帮助图书馆行业加速实现现代化,同时也可以帮助我国在这一领域建立国际规范,进一步提升国际领导力。

猜你喜欢
领域人工智能大学
“留白”是个大学问
《大学》
48岁的她,跨越千里再读大学
大学求学的遗憾
2020 IT领域大事记
领域·对峙
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!