AIGC背景下AI绘画赋能图书馆发展浅析

2024-12-31 00:00:00王沁
参花(下) 2024年11期
关键词:馆员绘画笔者

AIGC技术的兴起对图书馆发展带来了影响,其中,以AI绘画为代表的生成式技术赋予了图书馆业务发展更多的可能性。然而目前,图书馆行业虽积极关注AIGC技术的发展机遇,但对AI绘画的应用却很少涉及。基于此,本文将以AIGC与图书馆的关系作为背景,阐述AI绘画技术的发展概况,并对当前三大主流AI绘画模型工具进行分析,探讨AI绘画在图书馆管理与服务中的实践应用及作用,以期为相关工作提供一定的理论指导。

一、Al绘画与图书馆

人工智能(AI)是新一轮科技革命和产业变革的重要驱动力量,当前,我国已出台《中国制造2025》《机器人产业发展规划(2016~2020年)》《“互联网+”人工智能三年行动实施方案》等规划,旨在加速我国AI技术的研发和应用,促进AI与各个领域的深度融合,推动社会经济高质量发展。在图书馆领域,学者吴建中连续三年提到AI,图书馆应紧跟技术潮流并通过新技术提升图书馆管理与服务的能级。上海图书馆馆长陈超也提出,传统图书馆应该逐步引入AI技术,并借助AI技术赋能效应,逐渐转型成为智慧复合型图书馆。智慧图书馆和图书馆3.0代表了图书馆领域在数字化和人工智能发展方面的演进,智慧化的图书馆需要AI辅助馆员解决众多业务需求,但我们也要认识到,智慧图书馆需要结合一定的应用场景,进行精心的服务设计,才能应用这类技术为图书馆管理提供更好的智慧服务。

2022年是人工智能生成内容(AIGC)的元年。AIGC是指利用人工智能技术,通过分析和挖掘海量数据的规律和模式,生成丰富多样的内容,如文字、图像和音频等,从而使机器实现从理解到创作的跃迁。其中,AI绘图是AIGC技术的一个重要应用领域,它能根据文本描述生成图像。随着AI绘图的发展与成熟,以往通常由人们完成的设计绘图工作被人工智能所取代,因此,将AI绘图引入图书馆业务,将给图书馆服务带来创新性发展,馆员的工作方式也将被重塑。

二、AI绘画模型

(一)概况

目前实际应用最多的文本生成图像模型工具主要有SD(Stable Diffusion)、MJ(Midjourney)和DALL·E3。SD模型基于潜在扩散模型将建模过程引向隐向量空间,可进行本地私有化部署,操作空间极高,可以根据输入的参数生成高质量的图像,可微调模型,生成特定形象部署后可API调用,该模型目前论文和代码都已开源;MJ模型与SD的区别是MJ付费服务且不开源,因此在可控制性和延展性上会稍低一些。此外,虽然MJ生成的图像艺术性最高,但对提示词的写法有一定的要求,而且提示词对于出图的质量影响较大,并且MJ操作空间较小,而且无法微调模型,也无法API调用。DALL·E3是OpenAI在2023年9月份发布的一个文生图模型,其可以与ChatGPT结合,因此DALL.E3有着更低的使用门槛,通过简单的自然语言描述,就能生成效果不错的图像,对于不擅长编写提示的普通用户来说,这一改进大大提高了使用效率,减少了提示词的编写。

(二)对比

三大模型各有优缺点,SD的优势是开源,开源意味着免费,本地化使用不受账号限制,但是自行部署不仅对网络有极高的要求,对算力也需很强的显卡才能支撑。另外SD参数设置较为复杂,生成图像质量依赖模型,虽可以利用丰富的插件训练模型、定制形象,如与LoRA等微调结合,经过不断调试,能够生成特定风格的图片,但操作起来需要一定的技术背景和编程能力,上手难度极高。在简单提示词下,MJ生成的图像艺术效果最好,可以用于设计等专业领域,适用于对审美要求较高的场景,但使用MJ需要有一定的创意头脑。此外,MJ目前只有付费用户才能使用,也存在提示词的编写门槛,只是难度比SD稍微低一些。DALL.E3虽然在生成复杂场景以及个性化定制场景上,生成效果稍逊于SD和MJ,但其与ChatGPT搭配使用,拉低了AI绘画的使用门槛,拥有了广泛的受众群体。此外,DALL·E3具有语言理解上的优势,对文本描述的细节表现也最为准确。

三、Al绘画在图书馆发展中的具体应用实践

随着AI绘画技术的不断成熟,AI文生图的应用空间得以扩展,AI绘画可以代替设计出图中的重复环节并提高出图效率,它使得没有美术基础的普通用户也可以享受到便捷有效的绘画体验。将AI绘画赋能图书馆业务,可以极大增强馆员的内容创造能力,提高工作效率,创新业务发展。在具体实践中,馆员可以根据活动需求利用AI绘画生成活动宣传图,在做阅读推广的时候生成插图,提高读者的阅读体验,还可以生成各种活动的道具图等。馆员需根据不同的业务需求以及自身的知识背景来选择不同的AI绘图模型。由于考虑到经费和技术门槛,笔者选择从DALL·E3入手。首先因为DALL·E3嵌入了ChatGPT.可以直接输入自然语言,而且还支持中文,并不像其他模型使用起来那样复杂。其次是图书馆大部分业务活动图对艺术效果要求并不是很高,适用于一般场景,因此可以说,DALL.E3生成的图片质量已经可以满足图书馆的大部分业务场景。

下面笔者将以业务实践案例做展示,测试AI绘画如何赋能图书馆业务活动,提高活动策划效率。以“中图民乐夜·中秋阅”主题活动为例,使用AI绘画绘制活动推送插图、设计文创产品印章、海报等。

(一)推送插图

首先是活动策划环节,要为活动推送文章配一个简单的氛围插图,因为主题是中秋,可以考虑设计一个嫦娥奔月的卡通形象,笔者直接输入“画一个嫦娥奔月,卡通可爱风格”进行创作,AI生成结果如图1所示。

可以看出,当使用AI画一些简单的活动插图时,用户可以直接使用简单的自然语言便可得到符合活动需求的绘画作品,而且出图速度非常快。

(二)Logo设计

为配合活动宣传,笔者需要设计一个印章来为活动引流,笔者输入“设计一个印章图,以兔子、中国民族乐器为基本元素,能表现中秋氛围的印章造型”进行创作,经过三次尝试,生成的设计图都过于复杂,与笔者想要的印章风格不符,于是笔者改用英文简单的词汇进行描述,输入“logo,round seal shape。rabbit”进行创作,生成结果如图2所示。

生成图与笔者的预期风格相符,于是笔者尝试加入“中国民族乐器”元素,输入“logo,round seal shape, rabbit, Chinese national musicalinstruments”进行创作,生成结果如图3所示。

(三)海报设计

以宣传海报设计为例,笔者首先直接输入“我想组织一场以中秋为主题的音乐会,名字叫‘乐尔中秋’,音乐会内容为‘奏中国民族乐器,唱中国古典诗词’,请为这场音乐会设计一个主题海报。”AI生成的图像虽具有一定的美学价值,但元素过于杂糅,且绘画风格与笔者实际需求存在出入,于是笔者采用关键词写法来撰写提示词,经过几轮尝试发现,即使使用中文作为关键词,但AI生成海报中的文字也并不是中文。另外,笔者根据活动需求继续增加细节描述,如增加时间、主办方、地点等,AI均无法达到笔者的预期要求。

四、AI绘画在图书馆应用中的困境

AI绘画的出现无疑为图书馆应用AIGC提供了有力的现实途径。然而在实际操作中,结合笔者实践,在图书馆业务中应用AI绘画还面临以下困境。

(一)智能程度依赖于人的介入

由于技术的限制,AI绘画并未实现完全的人工智能,这就意味着AI绘画在赋能图书馆业务发展的过程中,仍需馆员的介入,馆员对活动的认知、对自我的需求以及对文本的理解程度都会影响图像的生成效果。由于各种因素影响,AI绘画存在随机性,在生成的过程中往往需要人机多次沟通与互动才能达到理想的效果,甚至会存在不成功的情况。因此,馆员自身对提示词的掌握是图像生成是否符合活动要求的重要因素之一。另外,在海报设计中可以看出,现阶段AI无法一次性完成对复杂海报的设计,还需要馆员借助其他工具进行进一步加工,如在AI设计的图片上增加字体、调整图像结构,增减图像元素等。

(二)特定元素生成效果不佳

三大模型中,即使是对中文理解能力较强的DALL·E3,在面对中文的专有名词、成语的情况下,也难以施展技术魅力。在辅助推广经典名著阅读的实践中,当笔者输入“桃园结义”(Oath of the Peach Garden)作为文字提示时,创作出来的图像是失败的。大模型对具备中国元素的图片需求生成效果不佳,由于大模型的生成能力是基于对数据的归纳和分析,中国元素数据库在这些模型训练中是缺失的,大模型无法对文本背后的内涵作出深度学习,只能对文字作浅层化理解。这意味着,当国外这些大模型面对具有特定文化背景的主题时,生成能力仍极其有限。

(三)技术和资金门槛制约

AI绘画虽然在很多方面展现了它的优越性,但对于图书馆领域来说,使用AI绘画工具需要考虑馆员的技术能力和技术应用成本。虽然随着技术推广,如Stable Diffusion已经开源,但其对馆员的技术要求较高,除了需要熟悉AIGC等相关人工智能方面的专业知识,以及不同模型的指令和参数的用法,还需熟练掌握英语表达。此外,在AI绘画工具的获取上,除了有收费门槛,文中提到的三个模型都需要海外服务,登录有所限制,而且对技术和硬件仍然有很高要求。

五、结语

AI绘画赋能图书馆业务符合图书馆发展趋势,新一代馆员应积极寻求将AI绘画技术融入图书馆日常业务场景中的可能性,利用AI绘画优化图书馆业务流程,实现业务升级。与此同时,新技术的应用要从需求、成本以及能力等各方面考虑。本文只是结合笔者日常的读者活动推广业务进行的AI绘图应用尝试,希望这次创作实践能为馆员利用AIGC赋能图书馆业务提供一定的参考,促进更多馆员能够发挥所长参与到AIGC赋能探索中来,从而推动智慧图书馆的发展与融合。

(作者简介:王沁,女,硕士研究生,广东省立中山图书馆,馆员,研究方向:阅读推广、新媒体、AI)

(责任编辑 苏静静)

猜你喜欢
馆员绘画笔者
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
青海政报(2018年1期)2018-07-09 05:50:56
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
青海政报(2017年7期)2017-07-24 14:14:41
欢乐绘画秀
欢乐绘画秀
下一代英才(2014年1期)2014-08-16 15:57:49
欢乐绘画秀
下一代英才(2014年3期)2014-08-16 09:02:22
欢乐绘画秀
下一代英才(2014年5期)2014-08-16 02:33:53
浅谈图书馆青年馆员职业生涯规划
河南科技(2014年19期)2014-02-27 14:15:53
论图书馆馆员领导及其角色
图书馆界(2013年6期)2013-03-11 18:50:34
两个插件,让Chrome变身iPhone
Google Reader订阅按需读