摘 要:人工智能正在飞速发展,影响着各行各业。生成式人工智能基于大模型和多模态,具有精确性、高效性、多样性和可扩展性等特征,提高了人工智能的效率和准确性,并能融合多种信息类型。经调查传统图书馆的人工智能应用存在智慧化不足的问题,图书馆可以通过利用生成式人工智能,实现图书馆业务流程、 阅读推广、信息素养教育、文献内容加工、信息服务的高度智慧化。而这还需要解决内容生存质量、数据偏见、监管、成本以及人才问题。
关键词: 图书馆 生成式人工智能 大模型 多模态
中图分类号: G25
Research on the Application of AIGCBased on the Large Model and Multimodality AIGC in Libraries
HUANG Haobo
Library of Guangxi Medical University,Nanning, Guangxi Zhuang Autonomous Region,530021 China
Abstract:Artificial intelligence is rapidly developing and, affecting various industries. Artificial Intelligence Generated Content(AIGC) is based on the large models and multimodality, with features such as accuracy, efficiency, diversity, and scalability, which improves the efficiency and accuracy of artificial intelligence and can integrate multiple types of information. After theinvestigation, there is a problem of insufficient intelligence in the application of artificial intelligence in traditional libraries., soLlibraries can achieve high intelligence in library their business processes, reading promotion, information literacy education, literature content processing, and information services by utilizing AIGC. And this, which also requires addressing the issues such asofthe content quality of life, data bias, regulation, cost,s and talents.
Key Words:Library ;Artificial intelligence generated contentAIGC;Large model;Multimodality
自1956年人工智能概念被提出以来,经过数代的发展,因其智能化水平的不足,导致其普及受到限制。然而,2022年11月,Open AI推出的聊天机器人程序ChatGPT打破了这一局面。ChatGPT凭借其与真人无异的交流能力和多样化的办公能力(如撰写邮件、视频脚本、文案、翻译、代码等),迅速在全球范围内获得广泛应用。这一突破引领人工智能进入了生成式人工智能(Artificial Intelligence Generated Content,AIGC)的新时代[1]。在GPT-4和谷歌的Gemini推出之后,人工智能技术的快速发展进一步推动了这一趋势。与此同时,各个领域都在探索如何利用AIGC技术促进行业创新发展,展现出巨大的潜力和价值。图书馆作为传统的信息服务机构,一直以来不断积极利用人工智能建设智慧图书馆,AICG的发展将会给图书馆带来巨大的冲击和改变,如何应用AIGC促进图书馆的创新与发展,成为了图书馆界面临的重要问题。
1 AIGC的内涵及特征
1.1 AIGC的内涵
AIGC,即生成式人工智能,是一种前沿应用,利用人工智能技术自主创造内容。其核心在于内容生成方式的创新[2]。与AIGC相对应的是专业生产内容(Professional Generated Content,PGC)和用户生成内容(User Generated Content,UGC)。PGC的优势在于其由专业人士创作,因此内容质量较高。然而,由于其专业性的限制,PGC生成的内容数量相对较少,且生产效率较低。相反,UGC则由广大用户生成,因此内容数量庞大且多样化。但这也意味着其质量参差不齐,难以保证内容的整体质量[3]。而AIGC则有望通过人工智能技术实现高效生成海量高质量内容的目标,从而弥补PGC和UGC之间的弊端,推动内容创作领域的进步。
1.2 AIGC的技术特征
AIGC的显著突破主要归因于其两大技术特征:大模型与多模态。大模型,指的是基于海量数据构建的人工神经网络机器学习模型,它能够实现广泛且深入的自主学习,进而显著提升人工智能的效率和准确性。而多模态技术则是指将不同类型的数据和信息进行有效融合,使人工智能能够分析处理更为复杂的信息,从而极大地拓展了其应用范围[4]。
1.3 AIGC的应用特征
相较于传统的人工智能技术,AIGC展现出显著的优势,包括精确性、高效性、多样性和可扩展性。首先,其精确性体现在能够深入、准确地理解、表达和分析各种事物,这为其在各种应用场景中提供了强大的分析能力。其次,高效性则体现在AIGC能够迅速处理庞大的数据集,并快速生成大量内容,大大提高了工作效率。此外,AIGC的多样性特点使其能够生成包括文字、图片、语音、视频和代码在内的多种类型内容,从而满足了多样化的需求。最后,AIGC的可扩展性使其能够根据数据量和模态的增加,持续提升生成内容的质量和多样性,进一步拓宽了更多应用场景的可能性[5]。
2 AIGC应用于图书馆的必要性和可行性
2.1 AIGC应用于图书馆的必要性
图书馆人工智能应用尚乏深度和广度。当前,无论是高校图书馆还是公共图书馆,其人工智能应用场景主要局限于智能管理、自助服务、智能机器人、智能场馆和VR虚拟体验等方面。在这些应用中,物联网、移动互联网和云计算等技术仍占据重要地位[6]。例如:大多数图书馆最成熟的人工智能应用仍然是基于RFID技术的图书馆管理及自助借阅系统。而聊天机器人的学习能力尚显薄弱,仅能实现基础问题的交流。更深层次的文献挖掘仍处于起步阶段,同时依靠文献资源进行的信息服务大多停留在个性化推荐层面,在定题服务、科技查新、学科服务等信息服务上,人工智能还未能体现足够的价值。总体而言,图书馆在人工智能技术应用方面仍显薄弱,缺乏深层次的信息服务应用场景。
2.2 AIGC应用于图书馆的可行性
图书馆作为传统信息行业,其核心优势在于其海量的资源优势。这些资源不仅涵盖了珍贵的纸质文献和丰富的电子资源,还囊括了信息服务过程中积累的庞大数据。然而,受限于以往的人工智能技术水平,这些资源的深层开发与高效利用一直未能实现。而随着AIGC技术的不断进步,大模型和多模态为图书馆资源的全面开发提供了强有力的技术支撑。大模型通过训练数量解决了智能化深度问题,多模态解决了智能化的广度及多样化问题。与此同时,AIGC技术的发展依托于大型模型与多模态技术的融合和发展不断进步,而图书馆所持有的资源多样性与海量性恰好为AIGC的发展提供了不可或缺的养分。因此,图书馆与AIGC技术之间可以呈现一种相互促进、共同发展的良好态势,具有广阔前景。
3 加强AGIC在图书馆的深层次应用
3.1 AIGC应用于业务流程
AIGC的引入将推动图书馆在采购、编目和管理方面实现更高层次的智能化。在图书采购环节,AIGC超越了传统的读者荐购移动化以及基于用户画像的个性化推荐方式。借TOl9RRnzRvLyGxbd0zFU4FyCtbtPs69S4nOvyQdA6do=助图书馆协会或联盟、书店等海量用户的阅读和采购行为数据,人工智能大模型能够训练出更精准的图书推荐系统,从而更好地满足读者的真实需求。在图书编目方面,大模型使得编目系统更能精准判断文章内容主题,多模态则会提升对图片、音频、视频的识别、分析能力进而高效编目。在图书管理方面,类似于AIGC促进了机器人的发展并逐步加强在物流仓储的应用,这些技术也可以应用于强化图书的智能分拣、搬运、上架、盘点、典藏等流程[7]。
3.2 AIGC应用于阅读推广
AIGC在图书馆阅读推广方面的应用前景广阔。首先,图书馆馆员将广泛运用AIGC工具,高效完成文案策划推荐、撰写及推广材料的制作,从而显著提升工作效率。其次,AIGC能够以高效且经济的方式,利用文字、图片、视频等多种媒介形式,深刻揭示文献主题,有效吸引读者的注意力。再次,AIGC具备创建阅读推广虚拟场景的能力,能够构建虚拟阅读社区,为阅读推广活动增添更多元化的形式[8]。最后,AIGC还能推动无障碍阅读的进程,例如:将文字内容转化为有声读物,为视力障碍者提供便捷的阅读体验。
3.3 AIGC应用于信息素养教育
应用于教育是AIGC目前取得突破的重要方向之一,尤其在图书馆的信息素养教育领域具有显著潜力。首先,AIGC可以用于智能辅助教学。通过大模型的训练,人工智能在信息素养技术上的掌握能力已超越人类。无论是在信息检索教学课堂还是图书馆的虚拟与实体空间中,虚拟教学助手或机器人都能有效地回答学生问题并进行深入讲解,同时还能对实习过程进行精准评价[9]。其次,AIGC能够辅助教师创建个性化的教学实习材料。根据学生的专业特点和检索水平,AIGC能够生成针对性的检索实习题,从而满足学生的个性化学习需求。此外,AIGC通过构建虚拟实习场景,利用虚拟现实等技术模拟真实的信息咨询场景,为学生提供了一个沉浸式的学习体验。最后,AIGC能够自主学习最新的前沿信息检索技术,并不断更新教学知识体系和素材库。
3.4 AIGC应用于文献内容深加工
AIGC可以对文献进行深加工,从而提供更加丰富的阅读内容和方式。首先,通过多模态AIGC应用,可以进行文生图、图生文、文生音频、文生视频,能让读者能根据自己的兴趣进行选择,并从多维度对内容进行理解。其次,AIGC可以对内容进行分析、提炼并结合其他文献信息内容根据读者需求加以呈现。例如:对文献根据知识图谱、主题、时间、人物、事件、地理等各个角度进行提炼归纳,让读者能从任何角度进行阅读。如深圳图书馆的小程序“方志里的深圳”,点击地名标签,可以对该地名相关信息进行扩展[10]。此外,AIGC还能提供阅读机器人,作为阅读伴侣回答读者问题,与读者分享、交流阅读感受,与读者一起完成阅读过程。
3.5 AIGC应用于信息服务
图书馆信息服务将通过AIGC真正实现智慧化。首先,在个性化服务方面。目前主要是根据用户画像进行文献以及相关信息推荐,用户需要获取文献并阅读。而利用AIGC可以实现搜集用户需要的信息,并分析总结将结果及其来源链接直接提供给用户,用户可以直接阅读分析结果,需要时才获取原文献。在定题服务及科技查新方面,AIGC可以实现对相关信息进行检索、对检索结果进行分析形成报告,图书馆员则需要对其进行审核、修正。在查引方面,AIGC可以对多数据来源进行搜集、查重,并对得出的查引结果进行二次分析,分析其引证文献的被引率、影响因子、JCR分区等,大大提高了服务效率和质量。
3.6 与AI公司合作,融入AIGC发展
图书馆可以凭借资源优势加入AIGC创新发展进程。除了拥有海量的中外文文字、图片、视频资源,图书馆联盟通过多年的定题咨询、科技查新、学科服务等信息服务积累了巨量的信息检索案例数据,图书馆联盟通过与AI公司合作,提供数据进行大模型训练,既可以促进AI的发展又可以对图书馆资源进行开发。此外,高校图书馆可以建立AI创客中心,扶持校内AI创新团队,对AI团队提供空间、物资、训练数据等帮助。
4 图书馆应用AIGC存在的问题和解决途径
4.1 生成内容质量需再提高
当前,AIGC的应用准确性还需再提升。首先,受限于训练的时间性,存在一定信息滞后问题。其次,虽然很多结果已经可以媲美甚至超越人类,但还存在一些错误问题,还需要人工纠错。此外,得出的结果主题较单一,在创新性和多样化等方面存在不足。最后,当前的中文大模型还有待提高。图书馆作为信息服务机构,如信息质量不高则影响服务效果。解决这些问题,需要人们投入更多的研究,不断改进算法,加大模型训练数据。
4.2 数据偏见问题
AIGC还存在着数据偏见问题。这主要因为文化背景引起道德规范不同,法律道德不同引起某些具体法律规定形成较大不同,政治背景不同引起政治正确角度及看法不同[11]。而大模型所采用的训练数据来源则会影响AIGC的观点从而形成数据偏见。同时AI设计者的倾向也在影响AIGC的数据公正性。图书馆具有教育职能,尤其学校图书馆对学生思想道德教育起到重要作用。如信息存在偏见则会造成不良影响。因此,首先AIGC必须加强训练数据来源的多样性和质量。其次,要加强算法的修正。此外,AIGC加强与专家的合作加强审核的技术。同时要增加透明度,扩大投诉、建议渠道。
4.3 监管问题
AIGC目前的监管问题在于,在具体应用上是否监管、如何监管、监管尺度如何把控没有形成共识。同时,AIGC给社会各行各业带来了巨变,且还处于飞速发展,未来带来的影响如何也还是未知数。在图书馆相关行业,AIGC在监管方面存在的最大问题是版权问题。因此,首先必须对AIGC保持开放性和自律性。其次,图书馆行业要积极开展探讨,共同商讨监管问题,争取达成行业标准。同时,要加强监管技术的开发。此外,要尽快制定AIGC监管法规,让监管有法可依[12]。最后,要注意监察监管技术、行规、法律的运行,并根据AIGC的发展紧跟改进。
4.4 成本和人才问题
成本和技术力量或者是制约图书馆利用AIGC的最大问题。虽然一些AIGC应用提供了部分免费使用,业务流程、文献加工、信息服务等应用需要采购的功能也可通过加大财政投入解决,但图书馆要自建大模型,创建更适合图书馆的AIGC应用,则更需要更大的成本投入。图书馆应该通过协会、联盟,依靠集体的优势与AIGC公司合作,实现双赢。此外,图书馆需注重馆员AI素质教育,同时积极加大AI人才的引进,加强图书馆的AI应用能力。
5 结语
人工智能如今飞速发展,对人们的生产、生活产生了巨大影响,深刻的改变着各行各业,这对图书馆既是挑战也是机遇。作为传统的信息服务机构,图书馆必须改变思想,加快调整步伐,拥抱人工智能,利用人工智能进行改变和提高。图书馆必须将人工智能应用到信息资源的采购、加工、管理、开发及服务等各个环节,提高信息管理与信息服务的智慧化水平,从而提升图书馆的服务质量。
参考文献
[1] 朱光辉,王喜文.ChatGPT的运行模式、关键技术及未来图景[J].新疆师范大学学报(哲学社会科学版),2023,44(4):113-122.
[2] 赵杨,张雪,范圣悦.AIGC驱动的智慧图书馆转型:框架、路径与挑战[J].情报理论与实践,2023,46(7):9-16.
[3] 张乐资,李雅筝,孔正毅.从OGC到AIGC:媒体内容生产模式的变革与展望[J].传播与版权,2024(2):1-4.
[4]詹希旎,李白杨,孙建军.数智融合环境下AIGC的场景化应用与发展机遇[J].图书情报知识,2023,40(1):75-85,55.
[5] 蔡子凡,蔚海燕.人工智能生成内容(AIGC)的演进历程及其图书馆智慧服务应用场景[J].图书馆杂志,2023,42(4):34-43,135-136.
[6] 闫二开,杨鲜艳,曾宪玉,等.“双一流”高校图书馆人工智能发展现状研究[J].图书情报导刊,2023,8(1):16-23.
[7] 张炜,高馨.公共图书馆人工智能应用现状与发展策略研究[J].国家图书馆学刊,2023,32(5):75-83.
[8] 吴若航,茆意宏.生成式人工智能变革图书馆阅读推广研究[J].图书与情报,2023(6):62-69.
[9] 朱永新,杨帆.ChatGPT/生成式人工智能与教育创新:机遇、挑战以及未来[J].华东师范大学学报(教育科学版),2023,41(7):1-14.
[10] 刘聪,张久珍.国际图联视域下图书馆人工智能应用的战略对策研究[J].图书与情报,2023(6):55-61.
[11] 王俊秀.ChatGPT与人工智能时代:突破、风险与治理[J].东北师大学报(哲学社会科学版),2023(4):19-28.
[12] 张春春,孙瑞英.如何走出AIGC的“科林格里奇困境”:全流程动态数据合规治理[J/OL].图书情报知识:1-12[2024-04-01]. http://kns.cnki.net/kcms/ detail/42.1085.G2.20240305.1852.006.html.