潘瑜
(中共太原市委党校,山西 太原 030000)
近年来,图书馆的数字化技术已经日趋发展完善,不论是从技术上还是概念上,已经达到了饱和状态,各种数字图书馆层出不穷,而各个数字图书馆之间的差距,大多为藏书量的差距,人工智能AI 的数字图书馆已经进入人们的视野。ChatGPT 作为AI 的一项重要产物,自2022-11-30 上线起,仅两个月活跃用户数就已经突破1 亿,震惊世界。伴随着ChatGPT 的兴起,ChatGPT 在图书管理方面的应用前景广阔,尤其是在建立智慧图书馆方面有着不可替代的作用。
ChatGPT 是由美国OpenAI 公司自主研发诞生的一款聊天机器人。ChatGPT 是人工智能技术驱动的自然语言处理工具,使用了Transformer 神经网络架构。其能够理解和学习人类语言,并能够根据学习语言的情况和人类进行对话,根据聊天的上下文进行互动,就好像和真人在对话一样。经过扩展功能的ChatGPT甚至能完成编写邮件、编写视频脚本、编写文案、翻译文献、编写代码等工作。目前ChatGPT 在生活中的运用,除日常聊天助手外,也被广泛用于在线教育、新闻生成、代码辅助编写等多个领域。
ChatGPT 特有的优势,使其受到人类的青睐和喜爱:①自然语言处理能力。ChatGPT 可以理解和生成接近人类水平的文本,使其能够与用户进行流畅的交互。在某些测试情境下,ChatGPT 在教育场景、考试场景等方面的回答结果比一般人类都要好。②多任务适应性。由于其庞大的训练数据和强大的模型结构,使其可以应对多种任务,从简单问答到复杂的文本生成。③实时交互能力。与传统搜索引擎不同,ChatGPT可以实时响应用户请求,提供即时反馈。可以说,ChatGPT 的出现极大地满足了人类对于人工智能的期待,为包括图书馆在内的许多场所和产业催生内动力。一方面,可以强化用户的学习欲望,进一步丰富展现内容,并且增强知识的动态性和可交互性,最终使得图书馆业务更加信息化和个性化。另一方面,ChatGPT的智能化可以弥补人类在图书管理工作中的缺失,从而帮助图书馆服务更加全面化。
ChatGPT 作为一款人工智能技术驱动的自然语言处理工具,其本身具有强大的对话功能,可以直接实现与人类的对话、体会人类的思维,可以在底层上与人类实现基本对话。在基本对话的基础上,可以衍生出图书机器人,帮助人类完成图书借阅、归还、查询、预定等功能,这样相当于多了一个能够自主对话的机器人客服。其不仅可以处理日常的咨询和投诉,还可以为用户提供图书的相关帮助。例如,当用户不确定如何使用图书编码等专业内容来查询书籍时,ChatGPT可以为用户提供指导和建议。除以上基本方面外,由于ChatGPT 具有人工智能及自主学习功能,加之其强大的底层数据库,其中会包含海量的图书数据,因此在图书借阅方面,ChatGPT 可以通过查询强大的底层数据库,锁定目标图书,并尽快呈现在读者面前。ChatGPT 作为一项新兴技术,可以有效地将图书馆的业务层级式推进,最终实现智能化[1]。
一本图书如何发挥最大用处,就是让读者能够看到内心最需要的内容。一方面,ChatGPT 拥有所有书籍的全部内容,其可以通过AI 智能,自我学习书籍的全部内容,并且能够通过人工智能技术,将图书内容标签化,同时抓取图书内容的侧重点,最终提取出该图书较为完全的特征。这些特征可以使其在与人类对话过程中被程序所加以使用,尽快找到用户所需要的内容。
作为一款能够对话的人工智能机器,用户可以直接与ChatGPT 进行对话。在工作中,用户可以直接将自己想要学习的内容与ChatGPT 进行对话,即使是通过模糊查询对话,ChatGPT 也能通过与用户对话中所表达的需求和细微差别,推荐更为适合读者的书籍。随着个人学习进度的推进,ChatGPT 还可以根据读者对知识的理解程度,及时调整阅读书籍,所以在某种程度上,ChatGPT 能够根据读者的需要及掌握程度,将藏书内容作用发挥到最大化,以助于人们进一步理解和掌握知识。例如,许多读者在查找资料或书籍时,可能不清楚具体的书名或作者,但可以描述其想要查找的具体内容,ChatGPT 可以根据读者的描述,甚至结合读者的喜好、年龄、文化水平及所涉及书籍的难易程度,快速地为其提供相关书籍或资料建议,这样有助于节约时间,提高图书利用率,进而使图书馆更加高效化、便捷化。
作为图书管理员,图书的编码分类是确保图书馆书籍有序排列的关键。传统上,这一任务需要图书管理员依靠人工完成。但是利用ChatGPT 结合计算机技术,特别是深度学习算法,可以自动识别书籍内容,并为其分配适当的分类编码。具体功能如下:①快速推荐目标书籍。ChatGPT 能够根据阅读历史、浏览历史等数据,自动识别用户的兴趣爱好、行为方式、潜在需求等,在最短的时间内,向用户提供更为适合的图书和文献资源。②自动摘要与分类。ChatGPT 可以通过处理数据,自动生成书籍、文章和其他资源的文摘,方便用户更快捷地找到所需要的资源。同时,能够根据内容等不同类别,对新进入图书馆库藏的书籍进行分类,提高图书馆的信息管理效率。当新录入图书时,ChatGPT 可以自动分析书籍内容,尽快对图书进行分类,为图书打上合适的标签及检索关键词,从而帮助图书管理员更加高效地进行书籍管理。③强大的纠错功能。ChatGPT 可以用来自动检测并纠正错误或过时的图书编码。例如,如果二月河的小说《康熙大帝》在不知情的情况下,很容易被编入历史文献这一类别从而造成错误,而ChatGPT 可以通过分析书籍的内容、标题和作者等信息来自动修正这一错误,确保分类科学无误。同时,当书籍出现多次印刷及不同版本时,ChatGPT 可以自动获取内容上的不同,并且根据人工学习推荐给读者更贴合实际的版本,从而避免一些错误知识。④智能翻译。尤其是对外国文献,可以通过ChatGPT 实现较为准确的翻译,打破语言壁垒和障碍,强化图书的可利用性[2]。
ChatGPT 拥有强大的语言模型,这种语言模型可以有效运用于图书管理工作中。把现有的图书馆数字资源整合到ChatGPT 的语言模型之中,为数字图书馆时代提供了丰富的想象力。丰富的馆藏资源和计算机技术的融合以及人机交互,需要一个长久的训练,而ChatGPT 语言模型把这种人机交互漫长而复杂的训练过程变得更短,以往需要很多数据去不断地进行训练,现在运用人工智能技术进行机器训练,可以进一步解放图书管理员,让人工智能来处理各个环节,既能提高效率,又能降低错误率。例如,利用AI 完成对馆内藏书的自动清点,可有助于用户对所需资源的信息进行实时快速查找,使馆藏资源的检索效率得以大幅增强。
数据体量较大。由于ChatGPT 需要的数据较为详细,加之现有的数据分析处理后,新生成的数据也会占有一定体量的存储体积。因此,使用ChatGPT 需要有海量的存储空间。所以在这个方面,ChatGPT 对于现有的书籍数据量来说,需要在存储技术上运用更为先进的技术,例如云存储。
算法复杂。ChatGPT 能够有如此出众的表现,少不了人工智能算法模型。近些年来,人工智能生成算法主要涉及生成对抗网络(Generative Adversarial Networks,GAN)、扩散模型(Diffusion Model)、神经网络模型(Transformer)、跨模态深度学习模型(Contrastive Language-Image Pre-Training,CLIP)等。其中,GAN 模型主要通过对真假数据的反复对抗训练,从而使机器变得更为智能,这种算法主要在图像、视频和语音生成方面应用较多。Diffusion Model 模型主要能够让AI 图像生成质量更高、速度更快,例如现在ChatGPT 生成的AI 绘图就是运用这种技术。Transformer 模型的出现使得生成算法模型可扩展性更强,并更加适应并发运算。CLIP 模型主要运用于文本、图像、视频之间的互相转换,使得ChatGPT 有着更为丰富的应用场景。大多数模型都是应用了以上算法,使得ChatGPT 技术能力产生了质的飞跃,可以运用于多种场景。当然,在语言交流方面,自然语言处理技术(NLP)是ChatGPT 能够与人类正常交流对话的重要技术。在这项技术出现之前,人类必须通过计算机指令和语言同计算机进行交流,且交流内容较为简单,对语法要求也较为苛刻。而随着NLP 的应用发展,计算机具有了人类语言理解能力,能够通过识别、认知、理解,呈现出人类可以理解的生成结果。目前NLP 主要应用于聊天机器人、语音识别、机器翻译等。以上功能的实现,完全离不开算法和语言处理模式。当前这些算法和语言处理还有很多需要完善的地方,例如对于人类底层感情的捕捉等,这就导致这个工具虽然拥有了一定的智能化,但距完全智能化仍有一定差距。这些都是目前ChatGPT 应用在图书馆领域存在的不足[3]。
隐私容易泄露。由于ChatGPT 的特性,会存在一系列潜在的隐私方面的问题。例如,在银行业已暴露出跨境数据泄露等风险。同样,在图书馆管理中,使用人员的隐私,包括爱好、习惯等方面,可能也会被ChatGPT 搜集,如果不加以保护,很容易被不法分子所利用。
复杂查询任务处理能力不强。尽管ChatGPT 可以处理大多数的查询任务,但由于机器语言仍然处在一个弱人工智能阶段,即使是ChatGPT,也是依赖于强大的数据库及长时间训练的机器运算。因此,在一些特定情况下,其也可能会提供不准确的信息。例如,在借阅者使用中文与英文时,可能出现的结果并不相同,存在一定差别。同时,对于一个问题的描述,使用不同的语言习惯、对于所需要的书籍描述的复杂和详细程度,也会导致结果不同。甚至如果输入的语言中存在一些错误或语法问题,也有可能会导致生成错误答案。
数据同步更新能力弱。随着新书籍的加入和旧书籍的淘汰,图书馆的数据库会不断更新。但是,ChatGPT只是会根据人类的指令及数据库的内容进行回答,并不会自动更新数据库并进行学习,所以ChatGPT 可能无法实时同步更新数据,导致查询结果出现偏差。
服务对象有特定性。ChatGPT 初期针对的人群,是一些具有较高电脑技术和操作水平的人员,对于那些不具备强大电脑操作能力的人群来说,这种方式很难融入到他们正常的图书阅读生活中,其可能更倾向于采用人工方式进行图书借阅和管理,对于这部分使用人群,ChatGPT 的功能并不友好。
根据上述存在的问题,需要通过以下手段进行解决。
定期更新ChatGPT 的模型。随着人类研究的不断深入,语言模型、计算模型等将会进一步进行优化,使其更加准确和高效。例如ChatGPT 从3.5 版本演化到4.0 版本,就是模型的飞跃。同时,ChatGPT 在进行训练和编写时,更加考虑符合中文表达习惯,从而使其对中文信息内容有更好的理解。
人工审核加以辅助。弱人工智能需要通过不断学习进行提升,但受训练次数、数据源的影响,其学习效能受限。因此人们不能完全依赖于ChatGPT 的结果,部分较为重要的查询内容,还需要通过人工审核,定期对ChatGPT 人工对话的内容进行抽样检查,从而确保其准确性。由此可见,在强人工智能时代没有到来之前,对于ChatGPT 所生成的内容进行人工审核非常必要。
深度学习训练。认真利用读者提供的反馈,不断完善ChatGPT 在图书管理工作中的应用及学习,通过对ChatGPT 进行不断深度学习训练,同时对反馈的问题也进行多次学习,确保其能够准确理解并处理后续对话。
数据库保持与实际数据实时同步。通过计算机技术,可以设置自动同步机制,及时更新ChatGPT 的数据库,确保ChatGPT 的数据库始终与图书馆的实际数据保持一致。
采用ChatGPT 辅助并行模式。对于图书管理服务来说,不能单一采用ChatGPT 或单纯的人工模式。采用混合模式,既能够提升图书的管理效率,还能有效弥补服务对象特定性的问题。
综上,以ChatGPT 为标志的AI 技术将为图书馆注入新的活力。本文从技术创新层面探讨了ChatGPT在图书馆中的应用,分析了其优势和不足,并提出了解决措施,力求为图书管理工作带来创新和提升,使其能够更好地为图书馆和读者服务。未来,基于ChatGPT 技术应用于图书馆,用户一定会获得更佳体验,从而进一步提升图书馆的使用效率,为其发展注入新活力。