周天辰 吴智慧
摘要:本文基于最新的Stable Diffusion人工智能绘画模型,探讨了其在家具设计领域应用的可行性。通过设计一个孔雀风格的沙发效果图,总结了该模型在家具设计中的优缺点。研究认为,Stable Diffusion模型可以为设计师提供丰富的创意元素和效果图,从而大大提高了家具设计的效率和多样性。然而,该模型生成的效果图目前还比较粗糙,细节处理不足,并且具有较高的随机性。未来随着模型功能的日益完善和结合其他技术,人工智能绘画模型将成为家具设计领域重要的创意来源和设计辅助工具。
关键词:人工智能;家具设计;绘画;椅类家具;稳定扩散
中图分类号:TS664 文献标识码:A文章编号:1003-0069(2024)11-0094-04
Abstract:Based on the latest Stable Diffusion artificial intelligence painting model,this paper discusses the feasibility of its application in the field of furniture design. By designing a peacock-style sofa rendering,the advantages and disadvantages of this model in furniture design are summarized. The study believes that the Stable Diffusion model can provide designers with rich creative elements and renderings,thereby greatly improving the efficiency and diversity of furniture design. However,the renderings generated by this model are currently relatively rough,with insufficient details and high randomness. In the future,with the increasing improvement of model functions and the combination of other technologies,artificial intelligence painting models will become an important source of creativity and design aids in the field of furniture design.
Keywords:Artificial intelligence;Furniture design;Painting;Chair furniture;Stable diffusion
近年来,随着人工智能技术的兴起,诸多人工智能相关的技术开始逐渐进入大众的视野。人工智能已经在诸多领域展现出惊人的能力和潜力,其中之一就是在创造性领域的应用。绘画是一门源远流长的艺术形式,而人工智能在绘画方面的应用,正逐渐引起设计师和艺术家们的兴趣。然而,虽然人工智能能够创造出优秀的绘画作品,但在家具的设计领域,其应用仍然相对较少。通过本研究,我们旨在进一步推动人工智能与家具设计的结合,探索人工智能在家具设计领域的潜力。我们相信,借助人工智能的力量,我们可以创造出更加智能、人性化和美观的椅类家具,为人们的生活环境带来更多的舒适和便利。本文的研究成果将为家具设计师和研究者们提供新的思路和启示,为未来的家具设计探索开辟一条创新的道路。
(一)人工智能绘画的定义:人工智能绘画是指利用人工智能技术进行绘画创作的过程和结果。通过机器学习算法和大量的训练数据,计算机系统可以学习和模仿现有的艺术风格和技巧,并生成新的艺术作品。它结合了计算机科学和艺术创作的领域,旨在让计算机系统具备创造和表达的能力,为艺术家和观众带来新的视觉体验和艺术形式。
(二)人工智能绘画的原理:人工智能绘画的原理基于机器学习和生成对抗网络(GAN)等技术,其主要步骤包括数据收集、模型训练和生成艺术作品。
首先,模型的训练者需要收集大量的艺术作品作为绘画模型的训练数据。这些数据可以包括绘画、插图、摄影等各种形式的艺术作品。数据的多样性和丰富性对于提高生成作品的质量和多样性至关重要。接下来,使用机器学习算法,如卷积神经网络(CNN)或循环神经网络(RNN),对训练数据进行训练。通过反复迭代的过程,机器学习算法能够学习到艺术作品的特征和模式,并生成类似的作品。在生成对抗网络(GAN)中,有两个主要的组件:生成器和判别器。生成器负责生成艺术作品,而判别器负责评估生成的作品与真实作品之间的相似度。在训练过程中,生成器和判别器相互竞争和协作,不断改进自己的能力。生成器通过尝试生成更加逼真和艺术性的作品来欺骗判别器,而判别器通过分辨真实作品和生成作品来提高自己的判断能力。
通过反复的迭代训练,生成器逐渐改进其生成的作品,使其更加符合真实作品的风格和特征。这样,人工智能系统就能够生成出与艺术家作品相似的新作品,展示出独特的艺术风格和创意。
(三)市面上常用的人工智能绘画模型对比:在目前的人工智能绘画领域,有3个最为常用的模型,即DALL·E2、Midjourney和Stable Diffusion。如表1所示,这些模型都是基于文本到图像生成的原理,但在开发者、使用方法、分辨率和格式、使用费用、商业用途、原理、使用难度和图形质量等方面存在一些差异。
DALL·E 2由OpenAI公司开发,提供了用户友好的界面,只需输入文本提示即可生成图像。支持固定的1024x1024分辨率,并可以用于商业用途。
Midjourney是由Midjourney实验室开发的模型,使用方法是通过Midjourney Discord服务器进行操作。支持生成文本提示作图、图像变体和高分辨率图像,分辨率可高达2048x2048。Midjourney允许付费会员将生成的图像用于商业用途,并提供一定数量的免费GPU时间。
Stable Diffusion是由CompVis、Stability AI和LAION开发的模型。可以通过Dream Studio Web应用程序进行操作,也可以在本地运行,但本地运行需要一定的编程知识和计算资源。Stable Diffusion可以生成各种格式的图像,分辨率为1024x1024,并可以在商业上使用。
总而言之,用户可以根据自身的需求和个人偏好,选择适合自己的人工智能绘画模型。本文考虑到模型的开源性以及可扩展性,选择采用Stable Diffusion模型进行椅类家具设计。
(四)人工智能绘画模型的主要应用:当前,人工智能绘图模型的应用已经极为广泛,但是各类用途之间依旧存在热度的不同,热度最高的主要是以下领域:
1.各类风格人类及动植物的形象绘制:当前的人工智能绘画模型在人类及动植物的形象绘制领域应用最为广泛。这类模型已经能够模拟并生成各种风格的人类及动植物形象,包括写实风格、卡通风格、油画风格等,有些图片甚至已经能够达到以假乱真的效果。如图1是使用人工智能绘画模型生成的一幅图片,其内容是美国企业家义隆马斯克在中国农村的场景,该图片已经达到了接近真实照片的效果。
2.工业及产品设计效果图绘制:人工智能绘画模型可以协助工业设计师和产品设计师绘制产品的效果图,包括外观设计、色彩搭配和材质展示等。能够通过学习大量的产品样本和设计理念,提供设计灵感和快速的效果图生成,有助于设计师们更好地展示产品概念和吸引客户。图2是基于人工智能绘图模型设计出的概念摩托车效果图,其质感和精细度已十分接近3D建模的效果。
3.建筑及室内效果图绘制:在建筑和室内设计领域,人工智能绘画模型可以生成逼真的建筑和室内场景效果图。能够根据设计师提供的草图和要求,快速绘制出具有真实光影效果的建筑模型和内部空间图,帮助客户更好地理解和预览设计方案。图3为人工智能模型生成的高迪风格的建筑效果图。
4.各类游戏开发相关的模型绘制:人工智能绘画模型在游戏开发领域中具有重要应用。能够生成游戏中的角色模型、场景模型和特效动画等,提供丰富多样的游戏元素。通过人工智能的支持,游戏开发者可以快速创建出高质量的游戏素材,提升游戏的视觉效果和用户体验。图4为人工智能模型绘制出的青花瓷图案外壳的钢铁侠效果图。
综上所述我们可以发现,人工智能绘画模型的功能已经极为强大,对于在家具设计领域的应用探索极为必要。
(一)国内研究现状:作为一个近年来的新兴产业,国内针对人工智能绘画的相关研究并不算多。在CNKI中国知网上以“人工智能绘画”为关键词进行检索,共检索出223条相关内容,其中学术期刊论文91篇,学位论文69篇,这些文献中真正涉及人工智能主题的文献仅有100余篇。不仅如此,由于人工智能技术近两年的技术更新极快,许多发表于2020、2021年的相关文献已经失去其应有的时效性以及实用性。
在这些文献中,绘画艺术领域,笔者仅仅检索到十篇相关文献,以概述性文献为主。理论层面,许晚晴、马依然等学者就人工智能绘画对艺术创作的影响进行了分析。探讨了人工智能绘画的创作过程、艺术的意义,并思考艺术家和观者如何从中获益,提高审美素质。此外还指出人工智能在绘画、文学、音乐等艺术领域发挥着重要作用,认为人机协同是未来发展的方向之一[1-2]。实际应用方面,徐雄庆、胡春瀛、陈洪娟等学者[3-5]研究了人工智能技术在艺术创作中的应用。分析了人工智能技术在艺术创作中的优势,并探讨了应用现状和改革方向,其中胡春瀛还提出利用人工智能推动绘画艺术发展的观点。叶丁莹、王晨薇、张睿琳等学者[6-8]则关注人工智能介入艺术对身份、自我和未来的影响。思考了艺术家在人工智能时代的身份定义和价值实现。王晨薇从创作论的视角对比研究了人工智能绘画和艺术家绘画,探讨了两者融合发展的模式,张睿琳则强调了人工智能无法复制人类的情感和自我反思能力。哲学领域,范慧敏 、林婷婷等学者[9-10]研究了人工智能艺术创作的哲学问题,探讨了人工智能技术的发展历程和在艺术创作中的应用,对人工智能与绘画创作关系进行了辩证思考,并论证了人工智能在艺术创作中的本体论地位和未来发展的可能性。
(二)国外研究现状:国外方面,在Web Of Science中以“AI Painting”为关键词进行检索,共检索出相关文献275条,使用“AI furniture design”为关键词进行搜索,共检索出文献29条。
其中,孙义康[11]等学者通过比较人类和人工智能绘画作品的研究,认为尽管神经网络的发展缩小了人工智能创作与传统方式创作之间的差距,但在审美欣赏方面和人类仍存在根本差异。G?ring[12]等研究人员通过分析人工智能生成的图像在真实性和吸引力方面的吸引力,以及用户对其感知的角度,评估了几个先进的AI生成器的效果,说明了所使用的方法和文本提示对于图像生成的重要性。Beyan[13]等学者的研究结果指出,人工智能图像生成器可以提供高质量的设计替代方案,拓展设计想象力,但挑战在于用户如何提供符合人工智能程序要求的文本命令。Mao[14]等研究人员提出了一种基于草图结构向量的条件扩散模型(SketchFFusion),用于草图引导图像编辑,以解决传统方法中存在的图像失真、训练成本高和草图细节丢失等问题,并通过评估其生成性能证明了该模型优于现有方法。Jadav和Shchyhelska[15]讨论了人工智能绘画领域的发展和演变,文章指出,人工智能艺术经历了显著的变化,展现出更强大的创作潜力,但是否将AI绘画视为真正的艺术仍有待讨论。
(三)文献综述:综合来看,国内外研究现状在人工智能绘画模型方面具有不同的特点。国内研究注重人工智能绘画对艺术创作的影响和意义,关注艺术家与观者的互动,以及人工智能在艺术创作中的整体应用。这种研究有助于提高审美素质,推动艺术领域与人工智能的融合。然而,国内研究在算法和技术创新方面相对不足,缺乏与国际先进技术的对接,需要加强相关研究的深度和广度。
相比之下,国外研究在人工智能绘画模型方面具有更多的优势。国外相关研究数量较多,涵盖了广泛的领域和技术应用,特别是在图像生成的真实性、吸引力和用户感知等方面有较深入的探索。同时,国外的研究注重技术创新,提出了多种先进的生成器和模型,为人工智能绘画领域的发展做出了重要贡献。然而,部分研究过于注重技术性,缺乏对艺术创作和社会影响的深入讨论,还需要进一步加强实证验证和应用实践。
综上所述,国内外研究现状在人工智能绘画模型方面各有优势和局限。国内研究需要加强技术创新和实践验证,并与国外研究成果进行交流与合作,以推动人工智能绘画模型的发展。同时,国外或国内针对人工智能模型在家具设计领域的应用研究均较为缺乏,因此进行相关内容的深入研究十分必要。
(一)Stable Diffusion模型的概念与原理:Stable Diffusion是一种深度学习的文本到图像模型,于2022年发布,由慕尼黑路德维希·马克西米利安大学的CompVis小组开发。主要用于根据文本描述生成详细的图像,尽管也可以应用于其他任务,如修复图像,扩展图像,以及根据文本提示生成图像到图像的转换。这个模型由初创公司Stability AI与一些学术研究者和非营利组织合作开发。原理上,扩散模型的目标是去除在训练图像上连续应用的高斯噪声,可以被视为一系列的去噪自动编码器。Stable Diffusion由3部分组成:变分自动编码器(VAE)、U-Net和一个可选的文本编码器。VAE编码器将图像从像素空间压缩到一个更小的维度的潜在空间,捕获图像的更基本的语义含义。在前向扩散过程中,高斯噪声被迭代地应用到压缩的潜在表示上。U-Net块,由ResNet主干组成,将前向扩散的输出向后去噪以获得潜在表示。最后,VAE解码器通过将表示转换回像素空间来生成最终的图像。
(二)使用Stable Diffusion进行设计的一般流程:在使用Stable Diffusion进行设计时,主要包括以下5个步骤:明确设计目标、确定基础与扩展模型、选择参数及关键词、调节整体效果以及后期图片处理。
首先,明确设计目标是设计过程的起点。确定设计的产品类型(如沙发或椅子)以及产品包含的元素等,以此来指导后续步骤。其次,根据设计目标选择适合的基础模型,可以是预训练的图像分类模型或生成对抗网络模型。同时,考虑是否需要引入针对设计目标进行专门训练的扩展模型,以增强设计效果。然后,选择合适的图片参数和关键词,并进行初步调试。图片参数包括学习率、噪声水平和迭代次数等,关键词则可以与设计目标相关,如“现代”“自然”等。这些选择会影响模型生成图像的风格和特征,使其更符合设计要求。接下来,进行图片试生成,评估生成样本是否符合设计目标,并记录有用的结果。根据试生成的效果,综合调节整体效果,包括图像的风格特点、细节处理和整体概念等。通过实验、参数调整以及尝试不同的扩展模型或关键词,逐步接近预期的设计效果。最后,如果多次生成的图片仍未达到理想效果,可以使用专业的图像处理软件(如Photoshop等)对生成的图像进行后期处理,提升设计的质量。
通过以上流程,使用Stable Diffusion能够逐步改进和优化图像生成结果,实现设计目标的达成。
(一)设计目标的确定:项目拟定的设计目标为一款结合了孔雀风格与特点的沙发,该沙发需要体现自然界中的孔雀这一动物元素,并具有一定的创新性。同时,该沙发需要具有一定结构稳定性,以满足一个成年人的正常使用需求。
(二)基础及扩展模型的确定:目前,笔者暂未找到专门应用于家具设计的Stable Diffusion基础模型,将选择市面上较为常用的且符合家具效果图绘制需求的基础模型进行家具设计。当前市面上主流的Stable Diffusion基础模型依照其出图的风格主要可以分为写实基础模型、虚拟基础模型以及万能基础模型这3个大类。其中虚拟绘画基础模型出图的效果较为抽象,相对于家具的设计表现更加适合创意性绘画和艺术表达。与虚拟绘画基础模型不同,写实基础模型更加注重图像的真实性和细节表现,这类模型通过学习真实世界的照片和绘画作品,能够以高度精细的方式还原图像中的细微纹理和光影效果。这类模型的输出图片通常更加接近真实的绘画作品,更加适用于家具设计表现。万能基础模型所生成的图像虽真实性高于虚拟基础模型所生成图像,却无法与写实基础模型生成的图相媲美,因此也不在基础模型的选择范围。
根据以上推理以及实际操作的反复对比,笔者最终选择了目前市面上最为常用的写实基础模型“realisticVisionV20_v20”,进行沙发效果图的绘制。扩展模型方面,笔者依据大多数作者的方法设置了自动选择外挂 VAE 模型的参数。
(三)关键词及相关参数的选择:经过网络上相关内容的参考及经过反复调试,笔者以“孔雀羽毛,靠背图案,复杂的色彩,沙发,古典,对称,女人味,精致,柔软”为正向提示词,无反向提示词,迭代步数为20,采样方法选择Euler a,宽度与高度均为512像素,总批次数为1,单批次数量为1,提示词引导系数为7,随机数种子为-1进行图像生成,最终生成孔雀风格的沙发效果图,如图7。
诚然,人工智能绘画模型依旧有许多不成熟不完善的地方,但是参考人工智能文字生成模型Chatgpt的迅速发展历程,笔者相信在不久的将来,成熟的人工智能绘画模型将会对家具设计行业进行一次颠覆性的技术革命。然而,无论人工智能技术如何发展,真正独特和有价值的设计仍需要具有强大创造力的设计师的智慧和经验。因此,设计师应将人工智能绘画模型作为辅助工具,与人类创造力相结合,发挥双方的优势,进行专属于自己的设计创造。
综上所述,人工智能绘画模型作为一种创新的设计工具,正在为家具设计行业带来新的机遇和挑战。对此,我们应该持开放的态度,积极探索和应用这些模型,以推动家具设计的发展,创造更美好的家居生活。
参考文献
[1]许晚晴.人工智能绘画对艺术创作的影响[J].新美域,2022(10):24-26.
[2]马依然.艺术创作领域中人工智能的应用探讨[J].传媒论坛,2021,4(06):125-126.
[3]徐雄庆.人工智能技术在艺术创作中的应用探究[J].大观(论坛),2021(10):5-6.
[4]胡春瀛,张雯.人工智能背景下绘画艺术的困境探究[J].艺术教育,2021(03):163-166.
[5]陈洪娟.文艺新生态语境下人工智能绘画的创作场域及其价值分析[J].重庆社会科学,2020(08):45-52.
[6]叶丁莹. 身份、自我与未来[D].深圳大学,2020.
[7]王晨薇. 创作论视角下的“人工智能绘画”与艺术家绘画比较研究[D].南京航空航天大学,2020.
[8]张睿琳.人工智能技术在艺术创作上的应用[J].技术与市场,2019,26(05):176.
[9]范慧敏. 人工智能艺术创作的哲学研究[D].天津大学,2019.
[10]林婷婷.人工智能下的绘画艺术[J].艺术品鉴,2019(12):324-325.
[11]Sun Y,Yang C H,Lyu Y,et al. From Pigments to Pixels:A Comparison of Human and AI Painting[J]. Applied Sciences,2022,12(8):3724.
[12]G?ring S,Rao R R R,Merten R,et al. Analysis of Appeal for realistic AI-generated Photos[J].IEEE Access,2023.
[13]Beyan E V P,Rossy A G C. A Review of AI Image Generator:Influences,Challenges,and Future Prospects for Architectural Field[J]. Journal of Artificial Intelligence in Architecture,2023,2(1):53-65.
[14]Mao W,Han B,Wang Z. SketchFFusion:Sketch-guided image editing with diffusion model[J]. arXiv preprint arXiv:2304.03174,2023.