以ChatGPT为代表的大语言模型技术对图书馆社科咨询服务的启示

2024-06-24 09:49肇诚
科技资讯 2024年7期
关键词:人工智能图书馆

肇诚

摘  要:大语言模型给图书馆咨询服务带来了革命性的影响,对传统社科咨询服务既是挑战又是机遇,为图书馆社科咨询服务的发展提供了新技术路径。通过对OpenAI公司2022年底推出的ChatGPT(Chat Generative Pre-trained Transformer)智能问答工具技术功能、应用场景的分析,并结合国家图书馆社科咨询服务现状,分析ChatGPT在社科咨询服务中的应用场景及潜在风险,认为以ChatGPT技术为代表的大语言模型可以在图书馆智慧检索、智慧咨询、提升知识服务水平方面带来深远影响。

关键词:大语言模型   ChatGPT   人工智能   社科咨询   图书馆

中图分类号:G250.7

Enlightenment of Large Language Model Technology Represented by ChatGPT to the Social Science Consulting Services of Libraries

ZHAO Cheng

National Library of China,Beijing,100081 China

Abstracts:A large language model has brought a revolutionary impact to the consulting service of libraries, which is both a challenge and an opportunity for traditional social science consulting services, and provides a new technical path for the development of the social science consultation service of libraries. This paper analyses the technical functions and application scenarios of the ChatGPT(Chat Generative Pre-trained Transformer), an intelligent question-and-answer tool, launched by OpenAI at the end of 2022, and combines the current situation of the social science consulting services of the National Library of China to analyse the application scenarios and potential risks of ChatGPT in its social science consulting services, and argues that the large language model represented by ChatGPT technology can have a far-reaching impact on the intelligent retrieval, intelligent consulting and enhancement of the knowledge service level of libraries.

Key Words:Large language model; ChatGPT; Artificial intelligence; Social science consultation; Library

中国通信院发布的《可信人工智能白皮书》和《人工智能生成内容(AIGC)白皮书(2022 年》预示着大语言模型正在重塑传统的内容生产方式和消费方式[1]。2022年11月人工智能研究实验室OpenAI推出了ChatGPT(Chat Generative Pre-trained Transformer),一经推出,便成为用户数增速最快的消费级应用,给传统产业带来巨大冲击和发展机遇。大语言模型特别是ChatGPT被认为是通用人工智能的早期版本,具有自适应学习、多模态输入、上下文感知、高质量生成、跨学科学习的特点[2]。图书馆社科咨询工作是指针对个人用户和群体用户的个性化信息需求,围绕社科某一专题,将分散在各种载体中非系统的信息提取出来进行筛选、综合、分析、归纳,提供有针对性信息的知识服务[3]。基于生成式自然语言处理模型的ChatGPT具有文本生成、信息筛选、语义理解、语义判别等技术特点,这些技术特点正是社科咨询工作的应用场景。本文对以ChatGPT为代表的大型语言模型的基本情况、应用、风险等进行分析,并结合图书馆社科咨询服务现状,探讨大语言模型对建设智慧图书馆背景下的社科咨询服务的启示。

1 大语言模型发展现状及应用场景

1.1  发展现状

近年来,自然语言处理领域涌现出一批大规模预训练模型,如生成式预训练(Generative Pre-Train,GPT)、基于Transformer的双向编码器表达(Bidirectional Encoder Representation from Transformers,BERT)、GPT-3、DALL-E、Switch Transformer、华为盘古、智源悟道、ERINE、M6等[4]。在此背景下,由GPT技术发展来的ChatGPT在自然语言处理领域展现出了惊人的能力。GPT全称为“GenerativePre-trainedTransformer”,它是一种机器学习模型,使用无监督和自监督的学习技术来理解和生成类人语言,而大规模预训练语言模型是GPT类技术所依赖的核心模型。ChatGPT可以利用其广泛的数据存储和高效的设计来理解和解释用户请求,然后用近乎自然的人类语言响应用户,ChatGPT生成类似人类自然语言和完成复杂任务的能力使其成为自然语言处理(Natural Language Processing,NLP)和人工智能(Arti?cial Intelligence,AI)领域的重要创新。

1.2  技术功能及应用场景

OpenAI公司在2023年初上线GPT-4,作为多模态大模型,具备了神经网络(Neurl network)、大量数据集、人工顾问干预的交互式深度强化学习(Human—ideepRL)等技术,ChatGPT主要技术应用表现在以下几个方面。

1.2.1 会话问答

ChatGPT可以对用户输入的问话进行语义判断,识别问话关键特征,搜索相关数据,通过算法筛选内容,再以符合要求的语言回复用户。随着自然语言技术的发展,采用文本嵌入技术的ChatGPT可以有效捕捉分散的文本信息,对长文本内容有着更准确的理解,对于多次间隔输入的文本,具有多轮对话记忆能力。

1.2.2 文本写作

基于海量的自然语言文本数据,ChatGPT通过深度学习可以识别用户输入的自然语言,识别并提取文本主题,并可按要求输出多风格、多语种文本。ChatGPT可按用户提出的要求,围绕主题或提纲撰写文章、简历、信件、绘制表格、试卷等各类文本。

1.2.3 信息检索、筛选

语义搜索技术是指在搜索过程中,利用自然语言处理技术分析查询文本和文档的语义信息,实现查询意图与文档语义内容之间的语义匹配,从而返回更加相关和符合查询意图的搜索结果[5]。基于语义搜索技术,ChatGPT抽取信息关键词,识别主题,在海量信息源中筛选符合条件的内容,按要求进行内容组合,以自然语言输出。借助高质量的文本信息筛选功能,ChatGPT在文献信息检索、文献分类、文献聚类、文献综述等文献梳理工作方面应用前景巨大。

1.2.4 文本翻译

有别于以往的机器翻译,基于自然语言的ChatGPT 可以实现多语种翻译,互译,并且按用户要求翻译为不同风格的内容。ChatGPT具备语法纠错能力,对翻译的文本可以自我纠错,可按用户指令改写、扩写。

2 国家图书馆社科咨询服务现状

在图书馆发展的各个时期,咨询服务都是图书馆业务的核心构成。国家图书馆社科咨询室始创于1928年,当时国家图书馆的前身之一北海图书馆在阅览部增设参考科,后改称为参考组,负责为公众咨询、搜检资料并代为编写相关书目等工作[6]。作为连接参考咨询工作三要素的纽带,按咨询问题的特征可将咨询业务划分为两级,第一级是对用户提出的一般性、事实性问题的解答,主要包括服务指引类咨询、辅导用户检索馆藏文献、数字资源检索辅导、图书馆其他服务的指导与利用;第二级是对用户提出的研究性咨询的解答服务,主要包括事实查询、专题检索、文献综述、科技查新、文献提供等服务。社科咨询服务便属于研究性咨询服务范畴。时至今日,按社科咨询业务内容可划分为6个主要板块,具体业务内容见社科咨询业务表(见表1)。

通过社科咨询服务6个业务模块可以看出,社科咨询业务的特点就是围绕用户信息需求,开展信息检索、信息筛选、信息组织、信息加工,向用户提供信息产品。

3 ChatGPT在社科咨询业务的应用场景及潜在风险

3.1 应用场景

社科咨询工作的本质即是围绕信息的检索、筛选、组织、加工而展开的。ChatGPT在文本处理上所展现的技术特点,恰好满足图书馆社科咨询业务的工作需求。无论是专题咨询、定题跟踪业务,还是事实查询、文献综述等业务,在业务开始阶段,第一步都是围绕用户需求主题的信息检索,ChatGPT可以帮助咨询馆员检索信息的范围更大、检索层次更密、精度更高、效率更高;ChatGPT在信息筛选分类方面有着强大的运算能力,这会让咨询馆员在面对大量文献时可以有条理地进行信息分类汇总工作,尤其是在文献综述类业务中的应用会更为明显;事实查询业务指查询文献中的事件、人物、图片、语句等具体信息。图片搜索业务属于事实查询业务的一种,近年来图片搜索业务增加较多,ChatGPT虽然不具备图片搜索功能,但可以通过用户输入的信息进行语义理解,并且具备了识别图片内容并转换为文本的功能。或者通过调用第三方搜索引擎来搜索图片,并提供相关的图片结果。ChatGPT的文本生成能力让咨询馆员在编写文献资料汇编业务时,可以更有条理地组织语言、更准确地使用专业词汇。基于海量数据训练集的ChatGPT可以按命令对信息内容筛选、组织、加工修饰后以自然语言输出,显然深度机器学习在这方面远超人工对信息的处理能力。

3.2 潜在风险

3.2.1信息安全风险

潜在信息安全风险集中在两个方面,一方面是对国家信息安全的潜在威胁;另一方面是无法辨别信息真伪而导致的信息误判。作为西方国家开发的ChatGPT如果接入国内互联网络,有可能造成政府或商业信息泄露,其母公司为外国机构,易受外国势力控制,成为攻击我国信息安全的渠道;并且使用ChatGPT的国内用户易被西方价值观所影响,造成价值观偏离。ChatGPT对一些简单的知识问题回答出现了明显的错误,那么对复杂问题的回答也可能存在类似情况,这需要引起用户的关注,ChatGPT所呈现的自然语言组织能力会让答案真假难辨,从而让用户无法判别信息的真伪,一旦错误信息被采纳,易造成严重后果。

3.2.2知识产权风险

ChatGPT会对接入大模型的资源进行无差别学习,其生成的文本内容虽经过ChatGPT的编译加工,但也会侵害知识产权,并且机器学习产生的文本不被国际重要学术机构、期刊等认可,《Nature》《Science》等期刊明确表示不接受ChatGPT生成的文章或ChatGPT作为作者的投稿。

3.2.3学术道德风险

由于ChatGPT在文献搜索、文献分类、文献综述、根据主题筛选、文献摘要、文献写作等方面的优秀能力,因此在社科咨询工作中使用ChatGPT撰写文献综述将会极大地提高工作效率和工作质量,但是需要对引用文献做出规范明确的注释,以保障原著者权利。

4 ChatGPT赋能图书馆社科咨询服务前景

作为人工智能自然语言处理模型工具,ChatGPT在智能问答、资源搜索、文献索引、文献筛选与写作等文本处理方面展示了强大的技术应用前景,而这些方面恰好是图书馆社科咨询服务开展的基础。现代图书馆社科咨询服务的核心内容即是通过不同方式满足用户信息需求,而ChatGPT的出现将有效提升社科咨询服务的质量和效率。结合ChatGPT的技术特点,会在以下几方面影响图书馆社科咨询服务。

4.1 提升图书馆智慧检索质量水平

图书馆资源检索系统主要由馆藏书目检索系统、各类商业数据库检索系统和自建数据库组成,各检索系统之间独立,不互通互联。不同类型检索系统检索方式差异较大,且需相当大的时间成本进行学习。用户通过图书馆检索系统只能获取到初级文献资源,而需要大量时间、精力对文献内容进行深层阅读、筛选、分类、加工等工作。咨询馆员使用ChatGPT可以采用自然语言输入,围绕特定主题按要求搜索、组织、加工信息后输出,获得的是ChatGPT智能生成的文本内容;并且ChatGPT可以实现跨数据库、跨资源类型的内容检索,通过一站式的信息检索即可得到相关答案。以ChatGPT为代表的自然语言处理技术给拥有众多检索系统的图书馆带来了变革的机遇,图书馆可以考虑引入ChatGPT类人工智能技术,接入图书馆各类数据库、文献库、资源库,提高图书馆检索系统的准确性和有效性,提升资源检索的效率、广度、深度。

4.2 助力图书馆社科咨询服务建设

智慧咨询服务是构建智慧图书馆的重要部分,是用户最直观体验图书馆智慧服务的窗口。传统社科咨询服务的信息源主要来自馆藏资源,需要咨询馆员依据用户需求围绕特定主题开展信息检索、信息筛选、信息组织、信息加工等工作,提供的信息精度、维度、深度都有一定局限性,并且耗时较长。同时,用户对文献服务与信息服务的需求并未降低,以事实查询、专题检索、文献综述等服务为代表的研究性咨询服务始终是用户的需求热点。现代图书馆资源多样,实体文献与数字资源并重,但各资源库之间相互独立,给跨库检索,深入挖掘资源带来难以逾越的鸿沟。采用神经网络技术和海量文本数据训练的ChatGPT人工智能工具的出现,可以帮助咨询馆员获得图书馆馆内和馆外资源,回答内容的时效性、广度、深度、准确度都会产生质的飞跃,并且大大降低咨询馆员的工作强度,交由机器深度学习来辅助完成咨询工作。ChatGPT在自然语言处理方面显示出来的巨大优势,让咨询馆员可以随心随意输入文本,交由ChatGPT智能判断用户问题,搜索信息,组织信息并回复。

4.3 助推图书馆研究性咨询服务发展

用户到图书馆查询与利用各种文献资源的本质目的是获取知识,因此,知识服务是图书馆的核心能力与重要趋势,是直接面向用户需求与用户过程的服务,具备知识性、创造性的增值服务统称为“图书馆知识服务”[7]。现代图书馆发展至今,经历了文献服务、信息服务、知识服务3个阶段[8]。知识服务阶段,图书馆提供基于“知识流”的服务,以用户的知识需求为中心提供知识获取、知识挖掘与组织、知识应用与知识创新服务,服务内容以专题研究、学科服务为主。用户想要开展深层次的研究性咨询服务需要借助参考咨询馆员的力量,但参考馆员的知识储备、学科背景、能力毕竟是有限的,因此能够提供给用户的也是以文献索引,文献筛选、分类为主的服务,难以提供深层次的知识内容挖掘、知识组织、知识生成等知识服务。ChatGPT人工智能工具的出现,给图书馆知识服务带来了曙光。以图书馆各类高质量资源库为数据训练集,ChatGPT可以深度学习,智能判断用户需求,对知识智能筛选、智能组织,智能生成结果。借助ChatGPT,图书馆可以开展知识内容深层次、多角度、颗粒化的深度挖掘,构建图书馆高质量知识库。借助ChatGPT工具,参考馆员面对不同学科的研究型咨询会游刃有余,可以迅速获得专业名词、术语、概念的解释,搭建知识图谱,以更高效、高质量地完成工作。

5 结语

以ChatGPT为代表的大语言模型出现时间虽短,但其在文本处理领域所展现出来的功能特点,已引起图书馆行业的关注。虽然大语言模型目前还存在一些技术局限,但其在智能问答、辅助资源检索、辅助文本阅读与写作、编程等方面显示了卓越的应用前景。图书馆社科咨询服务承担着面向全社会各行业提供信息服务的重要职能。因此,社科咨询服务要积极探索人工智能技术与传统咨询服务融合的方法,助力智慧图书馆建设,向用户提供更智能、更高效的信息服务。

参考文献

[1] 中国信息通信研究院,京东探索研究院.人工智能生成内容(AIGC)白皮书(2022 年 )[EB/OL]. [2023-07-26]. http://www.caict.ac.cn/kxyj/qwfb/bps/202209/t20220902_408420.htm

[2] 张宏玲,沈立力,韩春磊等.大语言模型对图书馆数字人文工作的挑战及应对思考[J].图书馆杂志,2023,42(11):31-39,61.

[3] 唐晶,葛艳聪,高延智.浅谈国家图书馆社科咨询工作[J].情报杂志,2010,29(S2):209-210,228.

[4] 赵朝阳,朱贵波,王金桥.ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路[J].数据分析与知识发现,2023,7(3):26-35.

[5] MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[C]//Proceedings of the 26th International Conference on Neural Information Processing Systems - Volume 2 (NIPS'13). Curran Associates Inc.,Red Hook, NY, USA, 2013:3111–3119.

[6] 钱铖.基于国家图书馆社科咨询服务的用户需求分析[J].河南图书馆学刊,2021,41(8):77-79.

[7] 初景利,任娇菡,王珏.图书馆知识服务与出版知识服务的比较分析[J].图书情报知识,2021,38(6)110-122.

[8] 魏大威,王菲,肖慧琛.Web 3.0背景下的智慧图书馆知识服务研究[J].图书馆理论与实践, 2023(1):54-60,76.

猜你喜欢
人工智能图书馆
2019:人工智能
人工智能与就业
图书馆
数读人工智能
飞跃图书馆
下一幕,人工智能!
去图书馆