AI训练出南审专属风

2024-05-21 11:27邱野
大学生 2024年5期
关键词:校园创作图像

邱野

2023年年初,读研一下的我选修了一门叫“图像处理与机器学习”的课程,课上,老师为我们展示了AI在图像处理方面的惊人能力。其中有一项应用是图像修复。

AI的惊人能力

老师找来一张破旧不堪的老照片,图上不仅有一块明显的损坏区域,其颜色也因年代久远变得泛黄又失真。他先用传统方法进行了图像修复:采用图像编辑软件的手动工具对图片的破损处一点点进行填补、克隆或修饰。大约过了半个多小时,图片才基本修复好,即便是经过老师的专业处理,对于如此大面积的损坏,其效果也不尽如人意,放大图片后,我们仍看到了不少瑕疵。

之后,老师切换到了AI图像修复技术的演示。他打开Photoshop软件,加载了同一张老照片,但与我们熟悉的PS版本不同,此时软件中添加了一项AI创作生成按钮。只见他简单地点击了几个按钮,软件便开始了自动修复过程。不到1分钟,屏幕上就跳出了一张令人惊艳的照片:所有损坏部位和色彩都被完美地修复,且与周围背景完美融合,仿佛从未受损过一样。

看到我们全都惊得张大了嘴巴,老师笑着解释,这是AI模型经过大量训练后学习到的能力。它们能够快速理解图像中的复杂模式和结构,并生成与周围内容相协调的新内容来填充损坏部分。所以,无论是老照片中的损坏,还是照片中的不必要元素,AI图像修复技术都能够应对自如。

我没想到,曾经需要耗费大量时间和精力的复杂任务,在AI的助力下竟变得如此轻而易举。虽然,课上主要介绍的是AI如何进行图像处理,但我不由对AI在绘画领域的潜力展开了遐想:或许,它不仅能解决技术问题,也能成为实现想象力的重要工具,为人类提供一种全新的创作方式。

随着课程的深入,我对AI处理图像和机器学习的基础知识掌握得越来越多。2024年3月的一天,我无意间在《人民日报》官微上看到了一段视频,它用一种全新的AI视角让网友欣赏到祖国壮美的山河。看着屏幕上绚丽的画面,我的心再一次被AI拨动:是时候付诸行动了。

南审专属的风格模型

来南京审计大学读书的这两年里,我对校园产生了深厚的感情,校园里许多熟悉的场景总能让我想到和同学相处的温馨瞬间。一个想法在我心中闪过:何不将AI技术与校园风景相结合,或许能形成一种独特的艺术风格。

查看了众多学习平台,又参照网友们的测评意见,我选定了Stable Diffusion軟件作为这次创作的主要工具。不光因为它能免费供用户使用,还因为它的技术是一种潜在扩散模型,通俗来说,就是只要基于深度学习,它就能生成高像素、高逼真的图像。

那怎样才能创作出专属南审的模型呢?翻阅了相关资料后,得知我校的主要建筑是由2010年上海世博会中国馆总设计师何镜堂院士设计完成。学校的设计高度重视山水气韵的营造,总体布局为山水相依,树石相融。围绕“对自然的神往与亲近”,我从自己喜爱的艺术家作品中汲取灵感。比如,借鉴后印象派大师梵高的向日葵、星空等元素;融合日本动画师宫崎骏清新浪漫的绘图风格;再比如,中国传统水墨山水画的意境似乎也与学校的设计风格很契合。

我清楚,只有尽可能选择具有多样性、代表性的图片,才能确保模型学习到更广泛的视觉信息。于是,我走遍校园的每一个角落,用镜头捕捉校园最具独特性的风景。从个人拍摄和多方搜集来的上百张原图中,我挑选了20张最有代表性的照片作为这次AI绘图的原片,通过输入引导词,引导模型创作出符合我想法的艺术图。

为了达到理想的创作效果,我不断地尝试各种组合和搭配,基本上每张原片都尝试了近30种不同的风格。

俏皮的玩笑

每尝试一种风格,除了输入不同的引导词,我还需要调整模型的各种设定,比如模型的学习速度、迭代步数等,以期望得到更好的效果。

调参数的过程堪比在烹饪食物的过程中添加调料,每改变一个参数,都要等待几分钟甚至更长的时间才能查看效果。训练模型的过程中充满了各种不确定性,就像做菜,哪怕你完全按照食谱操作,也可能做不出美味佳肴。有时我信心满满地调整了参数,生成的效果却令人大跌眼镜,有一次,我想绘制一幅和梵高向日葵风格相融合的校园艺术图,明明引导词中没有和人物有关的词,可生成的图片中虽然也有向日葵元素,却莫名其妙多出了一个可爱的卡通男孩,仿佛AI和我开了个俏皮的玩笑,真叫人又好气又好笑。可转念一想,或许正因为这些“玩笑”,才让AI训练的过程没那么枯燥乏味,这大概就是AI的魅力所在吧!

经过一个星期的努力,我终于在生成的500多张样稿中挑选出十几张最具独特性和表现力的成稿。这些以全新方式呈现的学校美景的图片,经过编辑后,被发布在学校的官方微信公众号平台,后又被其他媒体转载,获得了不错的社会影响。

这次独特的创作体验不仅让我收获了在论文写作和研究算法之外的乐趣,更让我发现人工智能在艺术和设计领域潜藏着巨大潜力,还给我未来的职业规划提供了参考。比如,我发现在音乐创作中,AI可以分析大量的音乐数据,生成新的旋律和节奏,它能为创作提供全新的灵感来源。还有在虚拟现实和增强现实领域,多模态学习技术的应用,能使用户通过视觉、听觉和触觉等多种感官融入到虚拟世界中,为沉浸式体验带来更多可能性。

责任编辑:刁雅琴

猜你喜欢
校园创作图像
改进的LapSRN遥感图像超分辨重建
有趣的图像诗
《一墙之隔》创作谈
校园的早晨
春满校园
创作随笔
开心校园
创作心得
遥感图像几何纠正中GCP选取
趣味数独等4则