桑海风,高彦静
(北京化工大学图书馆,北京 100029)
2022年11月30日,美国人工智能研究实验室OpenAI发布聊天机器人程序Chat Generative Pre-trained Transformer(ChatGPT)。作为由人工智能技术驱动的自然语言处理工具,ChatGPT目前已更新到GPT-4。ChatGPT具有自然语言理解功能、对话交互功能、问题回答功能、生成文本功能、文本转换功能、信息检索功能以及智能助手功能。
ChatGPT专注于在对话中表现更强的语境理解和生成能力,通过对大量对话型数据进行训练,使模型能够在对话中更自然、更具上下文理解能力,并在广泛的应用场景中展现其语言模型的强大功能。ChatGPT的核心是机器学习,基于“巨量语料+预训练”模式实现人机互动,根据聊天上下文完成撰写邮件、编辑视频、策划文案、多语言翻译、编写代码等任务,可应用于自然语言处理、图像识别、智能推荐等领域。ChatGPT上线后仅2个月用户数就突破了1亿,影响了众多行业,也引发图书馆界的广泛关注和热议。笔者尝试对ChatGPT给图书馆行业带来的影响进行梳理与分析,以探寻高校图书馆在人工智能时代的发展机遇与对策,为高校图书馆抓住机遇提升知识服务的智能化水平提供助力。
笔者以中国知网(CNKI)为数据来源,以“ChatGPT”“图书馆”为关键词进行检索,检索时间截至2023年9月30日,共检索到45篇相关文献,梳理后发现图书馆界针对ChatGPT的研究主要集中在宏观和微观层面。
学者们分析了ChatGPT的技术特征、应用场景、实现路径、局限与安全风险以及其给图书馆行业带来的影响。例如,吴若航、茆意宏提出了ChatGPT赋能图书馆服务的五个核心理念,即个性服务、高效服务、精准服务、多元服务、平等服务,认为ChatGPT能够帮助图书馆智能咨询系统扩大用户的咨询范围,满足用户的个性化、多元化需求[1];施志唐认为ChatGPT能够增强图书馆的信息检索和知识发现能力、自动化编目和馆藏开发能力,提升无障碍服务能力,促使参考咨询业务更加自动化、智能化和个性化,同时提出应注意道德、偏差与隐私问题[2];沈奎林认为ChatGPT会对图书馆行业产生颠覆性影响,并从参考咨询、编目分类、阅读推广、图书推荐等方面进行了论证[3];江丽则主张图书馆应积极拥抱人工智能技术,本着“拿来主义”态度让类ChatGPT等AGI技术为图书馆所用,主张发挥图书馆人的主观能动性,思考如何让AGI技术落实到具体应用中并与图书馆协同发展[4]。
微观层面的ChatGPT研究涉及技术、人员、服务等领域。例如,郭亚军、庞义伟等就ChatGPT为虚拟数字人在图书馆的应用进行了技术与原理分析,提出了ChatGPT赋能图书馆虚拟数字人的主要应用场景,并探索了实践路径[5];张海、刘畅等以信息资源管理领域的科研人员为研究对象,运用解释现象学方法就科研人员对ChatGPT的态度和认知进行了调研与分析,认为科研人员高度认可ChatGPT技术及其价值但担心ChatGPT带来的风险,提出相关部门和机构需制定应对策略[6];潘雪峰、王超探讨了ChatGPT对图书馆智能咨询业务产生的影响[7];田野、陈光华以“图情招聘”微信公众号为例,从平台构建背景、运营架构、主题板块、传播效果等方面梳理了学术运营规律,在人工智能发展背景下结合开放知识库建设、学术评价范式转换、学术内容策展、全球学术资讯融合等要素,探索了构建生成式AI驱动的学术知识服务新模式[8];宋小康、赵宇翔等认为ChatGPT的出现将替代信息搜索,或将成为未来用户信息获取的主导模式,在分析替代信息搜索发展历程及技术系统范式的基础上,提出了未来人工智能替代信息搜索的理论框架[9]。
此外,还有学者从高校图书馆的视角分析了ChatGPT对高校图书馆知识服务模式和应用场景的影响,如:叶莉、凌征强从虚拟环境、虚拟馆藏、虚拟馆员等维度揭示了高校图书馆联盟引入ChatGPT后突破时空界限,创设个性化场景,消除技术鸿沟,打造共创、共享、共治的元宇宙空间,建立统一元宇宙联盟平台,共享联盟AI生态[10];张颖认为ChatGPT能够在自然语言学术问答系统、智能检索系统、学术文献自动分类和推荐系统等方面为高校图书馆提供更广阔、更多元化的服务空间[11]。
3.1.1 助力技术升级。有学者认为,生成式AI支持下的GPT类技术会对以图书馆为中心的信息管理与传播业产生颠覆性影响[12]。传统智慧图书馆大多通过摄像头、传感器、移动终端等设备采集用户的行业数据和环境数据,而GPT-4等大模型通过云平台、超算中心等能够实现多模态数据的实时采集与分析,从而更深入、更全面地挖掘用户行为规律和需求特征,进一步优化智慧服务模式。随着信息技术的进一步发展,能够自主学习的图书馆机器人也将被广泛应用于图书馆,给用户带来交互式服务体验,ChatGPT可以生成语言与人类进行交互,其实质是实现了一个语言的元宇宙,既机器人与人之间可以进行对话。基于此,图书馆用户既可以通过自然语言与虚拟人物和智能体进行交互,也可以通过虚拟场景体验图书馆内部的景观、文化氛围等,用户在此能够感受到被关注和被重视,从而增强忠诚度和满意度[13]。此外,技术升级还体现为帮助高校图书馆技术人员编程、改进应用软件,提升馆员技术服务水平;为高校图书馆的智能化办公提供技术支持,如帮助馆员更好地撰写工作计划、策划活动方案以及进行人事管理等。
3.1.2 助力馆藏资源建设。高校图书馆可基于ChatGPT的文本分析功能进行数据分析,为优化馆藏、服务和资源配置提供决策支持。在ChatGPT支持下,高校图书馆可以通过采访、编目等工作环节对馆藏藏书结构、借阅信息、专业设置等进行精细分级分类管理,既能据此生成书目数据使图书采购更加快捷、省力、科学,还可为不同层次和专业的用户提供精准的图书荐购信息。此外,ChatGPT的语料库除采购资源外,还有一部分是与用户互动交流产生的新的知识信息,这些信息共同组成了高校图书馆的内部知识图谱,能够被再次利用。有学者认为,图书馆利用生成式人工智能技术对馆藏资源和线上线下多模态资源进行聚类、融合与重组,能够丰富资源类型和数据形态,创新特色馆藏资源,提升用户资源浏览、检索和利用的效率,在资源整理与数据收集方面具备自主、高效与精准等特性[14]。由此可见,高校图书馆利用ChatGPT可以提高资源建设的智能化水平,如利用成熟的类GPT的大语言模型与技术开发特色馆藏资源,基于ChatGPT的自然语言处理能力以及学习和推理能力构建个性化的图书推荐系统等,不断优化藏书结构,提升用户体验和资源利用率。
3.1.3 提升智能知识服务。ChatGPT提升高校图书馆智能知识服务主要涵盖以下几点:一是智能知识服务场景多元化。ChatGPT的出现与应用给高校图书馆的知识服务带来了新机遇,其体量巨大、更新迅速的海量知识丰富了阅读场景,使线上展览、研讨以及与机器实时对话交流等多元化服务场景成为现实,智能管家、智能会话的应用使高校图书馆的景观、文化氛围得以通过虚实相生的方式呈现,使读者可沉浸式体验线上线下相结合的虚拟场景。二是智能咨询服务更加智慧高效、便捷个性。ChatGPT主要利用强大的自然语言处理能力与用户进行交互,并以语言为基础执行各种任务,通过对话分析判断用户的年龄、学历、专业、阅读习惯、知识结构后整合数字图书馆、电子期刊、在线数据等资源信息,快速生成用户所需的内容,进行精准的个性化资源推荐与推广,还可生成读书笔记并提供多语种服务,跨越了语言障碍。三是更加智能地提供查收查引、科技查新服务。科技查新是高校开展科研开发活动的一项基础工作,ChatGPT巨量的语料库拓宽了查新的范围与文献的载体类型,能够更深入、全面地了解事物本身,提高用户在文献筛选、数据挖掘、竞争情报分析等方面的工作效率;ChatGPT能够进行智能对话,使用户就科技领域的问题展开更深入的讨论,从而促进思考和交流;ChatGPT通过人机交流对话,以人类自然语言的搜索方式为用户提供文字总结或相关网页链接,实现精准推送,服务形式也更加个性化,使用户可以更加直观地获取信息。
ChatGPT应用于高校图书馆的风险和问题主要体现在以下几个方面:一是技术难题。众所周知,高校图书馆自管理层到普通馆员多是图情学科专业背景,具有信息技术专业背景的人才少之又少,缺乏技术自主研发能力,将ChatGPT引入图书馆业务存在明显的技术短板。二是资金困境。ChatGPT技术本身需要巨大的财力、物力、人力及技术成本作支撑,而高校图书馆的经费主要来源于高校,经费不足是长期困扰其发展的一个主要问题。三是ChatGPT技术在数据来源可靠性、完整性等方面存在一定局限。一方面,ChatGPT生成的信息受限于其训练数据存在偏见或不准确的可能;另一方面,ChatGPT生成的内容通常是基于表面级别的模式匹配,而非真正的理解,回答专业领域的问题时会比较浅显。四是ChatGPT生成与创作的内容往往缺乏人类的情感认同,人智协同难,可信度受质疑。五是ChatGPT生成内容的质量评价标准未建立,有输出虚假信息的现象,需要对信息来源的可靠性、真实性、安全性进行辨析和评估,信息溯源无疑会加重用户与图书馆的负担。六是ChatGPT生成内容的知识产权不明晰,面临著作权侵权风险、用户隐私泄露风险和伦理风险,一些机构和组织为获取高敏感、高利用价值的数据资源会出现“数据污染”“数据攻击”等情况,从而引发信息泄露。
高校图书馆要加强信息安全管理,一方面要做好安全架构设计,在保护好用户隐私与数据安全的同时,加强对员工数据安全风险意识的培训;另一方面要构建科学完善的管理机制和评价标准,定期对ChatGPT进行准确性、可靠性测试、评估和监督,确保ChatGPT不被滥用或产生错误答案。此外,高校图书馆还要积极推动高校图书馆联盟的发展和建设,从数据安全、技术安全、人员安全、管理安全、服务安全等方面建立全面的信息安全屏障。
高校图书馆引入ChatGPT需做好前期研究与投入工作:一是搭建技术平台,加强科研攻关及技术交流。二是加快完成数字化转型,通过整合、挖掘馆藏资源生成新的语料库。三是加快开发基于通用大模型的高校智慧图书馆模型工具,如开发图书荐购编目平台,利用馆藏数据、出版数据、图书销售平台数据、馆藏借阅数据等配置相应的AI算法,根据不同用户的年龄、学科、专业等设置形成相应的荐书书目,以满足不同层次用户的需求。清华大学图书馆的“小图”、南京大学图书馆的“图宝”等都是基于人工智能的智慧问答服务机器人,除提供智能问答外,ChatGPT还可作为虚拟讲解员提供智能社会教育服务,以及充当学习助手协助用户制订学习计划,并对学习效果进行评价,同时作为辅助工具还可嵌入移动设备或可穿戴装备,提升交互效率,增强用户体验感。此外,高校图书馆还可通过ChatGPT的集成语音识别、语音朗读、盲文显示等技术为特殊群体提供无障碍服务,其易操作、主动智能等优势将为图书馆服务的个性化、高效化、多元化、平等化带来新的生机[15]。
高校图书馆要积极转变服务理念,通过ChatGPT创新服务方式、增设服务内容,开展各类特色服务,构建集知识内容生成、特色馆藏开发、多模态内容整合于一体的知识服务体系,形成多场景应用生态;积极推动智能办公,借助ChatGPT制订管理方案、工作计划、阅读活动策划等,利用图像、音频与视频转换技术生成宣传海报、有声读物、短视频等,形成智能推荐。同时,高校图书馆还要搭建图书推荐系统平台,利用ChatGPT对学科、专业、借阅数据、资源数据等进行深度挖掘和整理,构建用户图谱,发现用户阅读规律,制定合理的阅读推广策略,全面提升智能知识服务质量。
人工智能给文献情报信息处理带来了颠覆性变革,ChatGPT赋能图书馆智慧服务具有“4T”特征,即Translation(交互性语言翻译)、Transformation(个性化场景转移)、Transmission(立体式信息传播)、Treatment(即时型任务处理)[16]。高校图书馆一方面要通过ChatGPT强化建设大规模语料库,整合关联数据成为语料资源,创新知识组织方法,最大限度地挖掘、提取馆藏数据中的高价值信息,将馆藏文献资源库转换为学科知识库,为学科建设服务;另一方面可通过ChatGPT整合数字素养教育内容数据,构建数字素养教育平台,引入虚拟数字人,通过视频课程与课件为有需求的用户进行授课和讲解,并实时回答用户提问,同时为用户提供数字信息来源真实性、安全性评估以及信息歧视分析等能力培训,并跟踪培训学习效果,持续为用户的教学、科研、学习提供助力。