王艺贤
(上海视觉艺术学院,上海 201620)
本文运用具体的案例,分析将人工智能中的深度学习算法运用到玻璃与陶瓷造型设计中的可行性。通过具体的模型建设,分析出作品的缺陷所在,使学生在没有老师、专家等人的指导下亦能通过人工智能方法开发出能识别作品优劣的程序,并能精确定位到作品待改善的地方,使设计师提高设计的效率,不再为造型的好坏花费较长的时间。与此同时,传统造型设计的鉴赏通过专家识别,依靠的是专家经年累月的见识与洞察力,其经验难以复制,但如果将已鉴定的作品交给深度学习模型进行训练,也可使得模型具有分辨作品优劣真伪等功能,以实现对新的作品进行识别分类的目的。将人的经验传给人工智能模型,使其具备专家在某个领域的能力,继而用人工智能取代人为判断,大幅度提高效率。
造型设计是所有设计中重要的环节,没有造型设计便缺少了灵魂。优秀的设计中可以捕捉到优秀的造型设计,如何正确地认识自然,深入生活,反映和创作出适合社会主义物质生活和人民大众审美要求的新造型是当今设计师所要考虑的重点之一 。因此,设计是复杂的,而如何在复杂化的设计流程中产生更快的效率呢?让我们不得不针对当下的时代模式进行思考。
处于信息时代下的设计师们,大量信息的涌入使得大家拥有了丰富的大数据资源。人工智能技术能够自动地筛选数据信息,构建密集型的信息网格。将人工智能技术应用于造型设计领域,能够为设计创作提供更加高效便捷的信息载体。人工智能技术可自动分析海量的数据,运算速度快、精度高,这是人脑所不能比拟的。因此,可以利用人工智能技术来处理各种有着复杂构造的玻璃、陶瓷造型艺术产品,并对其进行分析识别、局部改进,从而创作出辨识度更高、艺术性更强的造型作品,提高设计效率,这成了智能时代下一个新的思考方向。
通过分析与调研,在众多的人工智能技术领域中,研究并选择适合造型视觉设计的卷积神经网络模型建立并运用于玻璃、陶瓷造型设计中。
艺术领域使用人工智能方法已不是首创,AI 已经可以完成人类手绘艺术的一部分,但是如何在绘画成品中进行快速的评判和修改还要进一步的研究。因此,需要研究更为精准的算法去分类。卷积神经网络等方法已应用到医疗上的疾病识别,商场的无人售货机,工业上的自动分拣等多个领域,在艺术的领域中的挖掘更为深入。
卷积神经网络(Convolutional Neural Networks,简称CNN)是深度学习当中一个非常重要的神经网络结构。它更多用在图像处理、视频处理、音频处理以及自然语言处理等。早在20 世纪80 年代,卷积神经网络的概念就已经被提出来了。但其真正的崛起却是在21 世纪之后,随着深度学习理论的不断完善,同时,由于硬件性能的爆炸式提升,算力的不断增长等因素的促进,给卷积神经网络这种算法提供了大放异彩的空间。Yann LeCun[1]等在1998 年提出LeNet 卷积神经网路模型,设计之初只是用于手写数字的识别,到如今已成为卷积神经网络的 HelloWorld。受限于计算机的算力不足,加之支持向量机 (核学习方法) 的兴起,CNN 方法并未成为当时学术界认可的主流方法。
如果说LeNet 奠定了卷积神经网络的一个基础,那么Krizhevsky Alex[2]等在2012年提出的AlexNet 就是飞跃了一大步。现在神经网络当中应用的许多技术,在AlexNet当中都有所体现,比如说:使用了ReLU 函数,避免梯度的消失问题;正则化(如Batch Norm)在AlexNet 当中大量使用,加快了运算效率,引入Dropout 技术,极大地避免的过拟合,从结构上看,AlexNet 也有独有的特点:我们知道,综合来看,GPU的运行速度要远快于CPU,于是AlexNet 当中采用了双CPU 运行;卷积层、池化层的交替使用,全连接层的应用被完美地继承了下来。Simonyan,Karen 与Zisserman,Andrew[3]在2014 年提出VGG Net 模型,这个神经网络探索了卷积神经网络的深度和其性能之间的关系,通过反复堆叠33 的小型卷积核和22 的采用了Max Pooling 的池化层,成功地构建了16~19 层深的卷积神经网络。由于它的间接性和实用性,马上成为了当时最流行的神经网络模型。它在图像分类和目标检测任务中都表现出非常好的效果。He,Kaiming 等在2015 年使用ResNet 模型获得了当年ImageNet 竞赛中分类、目标检测等多个项目的第一名,该模型具有超深的网络结构(突破1000 层)、提出了残差模块,使用Batch Normalization(一种标准化处理)加速训练(丢弃Dropout)。
1.根据玻璃、陶瓷造型设计,建立模型需要解决的问题
1)学生的造型设计,不能及时得到老师的反馈,老师或专家无法在短时间内对作品进行分析,所以教学效果不能以最高效的方式反馈给学生,导致学生设计的效率低下,用算法介入进行数据分析与提炼。
2)设计师通常花费较长的时间去反复斟酌线条的比例以及与制作工艺结合中的合理性,导致效率低下,生产率低。用数据模型介入快捷的输出所要的结果。
2.卷积神经网络模型更新换代的过程
卷积神经网络(CNN,Convolutional Neural Network)在图像领域的应用非常广泛,一般一个CNN 网络主要包含卷积层,池化层(pooling),全连接层,损失层等。
1)神经元
神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后,最开始只是简单的线性加权,后来给每个神经元加上了非线性的激活函数,从而进行非线性变换后输出。每两个神经元之间的连接代表加权值,称之为权重(weight)。不同的权重和激活函数,则会导致神经网络不同的输出。
2)神经网络
图1 的单个神经元模型智能解决极简单的分类问题,但随着问题变得复杂,决定物体类别的特征变得很多的时候,简单模型便不能准备识别物体类型。因此,将多个神经元组织在一起,且加上一个或多个隐藏层,就形成了神经网络,如图2。
大海子水库新建涵洞、闸井工程总投资284.92万元,其中建筑工程、临时工程、独立费用所占比重较大。经过经济评价,本工程在经济上合理可行,且项目投入使用后各受益方需要分摊费用,农业灌溉作为最大的受益方完全可以承受新水价,因此该项目实施有较好的社会和经济效益。
图2 神经网络
常用的非线性激活函数有sigmoid、tanh、relu 等等,前两者sigmoid/tanh 比较常见于全连接层,后者relu 常见于卷积层。
3)研究出适用于玻璃、陶瓷造型设计的卷积神经网络
图2 神经网络属于全连接的结构,但因实际问题复杂,图像作为输入层的特征量大,需要较多的隐藏层等特性,全连接的神经网络模型会过于复杂,计算量过大,且有过拟合的风险,因此本文采用具有局部感知机制的CNN 算法。
根据陶瓷、造型研究出适用的卷积神经网络,卷积流程示意图如图3,输入的二维图像,先经过三次卷积层、池化层和Batchnorm,再经过全连接层,最后使用softmax 分类作为输出层。
图3 CNN 流程图
如图3,输入32×32 的图像,3 通道RGB 彩色图像。卷积函数的卷积核shape为5×5×3,depth 表示卷积核的个数,取值为2,stride 表示移动步长,取值为1。激活函数使用Relu,保证输出结果不小于0,池化函数采用最大池化。对结果进行softmax 处理。
确立了适用的卷积神经网络的架构后,开始从以下步骤建立模型。
1.Step1:准备数据
2.Step2:模型设计
使用百度旗下的paddle框架,定义一个卷积神经网络函数,内含经过3层卷积过程,函数的输入参数为一张图片,第一层的卷积结果作为第二层卷积的输入,第二层卷积的结果作为第三层的卷积输入,最后以softmax 为激活函数的全连接作为输出层。(表1)
表1 参数设定表
然后,使用交叉商损失函数、Adam 优化方法,同时指定学习率为0.001,对模型机型验证和优化。
3.Step3:根据研究出的算法进行模型训练
利用paddle 框架的fluid 模块创建用于模型训练的Executor,并设定它的运算场所为CPU 或GPU [place=fluid.CUDAPlace(0) if use_cuda else fluid.CPUPlace()],然后对Executor 应用fluid.default_startup_program()进行初始化,最后进行训练过程,训练过程需要3 个参数分别是program、feed、fetch_list。Program 选用fluid提供的default_main_program(),feed 即用600 张图片的数据集,fetch_list 取损失函数avg_cost 和准确度acc,提供好参数后,将Executor run 起来,即得到了训练模型。训练过程中,随迭代的次数,模型的损失值cost 和准确率acc 如图4 所示。随着迭代次数的增加,准确率逐步提升,当迭代次数趋近于1000000 次时,准确率收敛于100%。
图4 zcost 和acc
4.Step4:模型预测中进行玻璃、陶瓷造型线条的识别
通过算法模型的建立,直接可以用视觉图片的方式输入,通过模型运算直接输出想要的结果,直接可得到造型的具体描述,通过造型的具体描述,设计师可以在设计过程中选择采用以及不采用该造型。
根据算法模型,如图5 所示的陶瓷作品在53.28%的概率上被认为是high level 造型设计作品,46.72%的概率上被认为是norma 造型设计作品。设计师或者学生在创作中可以根据作品的描述自行修改造型。该算法的研究只适用于对玻璃、陶瓷造型的线条以及比例关系进行分类,但是在具体数据参数的输出中还需要进一步研究和完善。在算法模型的建立研究中,后期还需根据大量的数据,增加算法模型对造型数据的具体描述,例如直接输出:比例关系、线条尺度等多方面的细节,方便设计师以及学生对造型细节的再次修改与完善,得出最优解。
图5 陶瓷造型的线条识别
通过算法模型的研究发现,选择人工智能中的卷积神经网络运用到玻璃与陶瓷造型设计中,运用具体模型的建立,再到用具体的玻璃、陶瓷造型案例进行测试,得出此算法运用在玻璃陶瓷造型设计中的可行性。此算法,在帮助设计师以及学生减轻设计工作压力的同时,解决相当大的时间浪费的问题,有效缩短时间,将其运用到工艺美术以及多维度的造型设计的教学中,对艺术教育的发展起到了一定的推动作用,通过人工智能技术,有效地帮助学生更好更高效地进行造型设计。在往后的研究与模型调试中,还可进一步对算法模型进行深入的调整,使其数据更加具体化,更加细化。
但在人工智能应用于艺术设计中,人工智能目前只能够辅助人们完成部分设计工作,没办法与人类的思想以及审美达成一定的共鸣,设计中人类的思想和审美境界无法被人工智能所取代,这也是人类在设计工作中的重要价值。人工智能算法虽然能够高效率地完成大量的数据分析,但是人类的思想情感共鸣在机器中并不能够很好地体现出来,机器无法识别人类的精神思想。人工机器以及智能算法,在造型设计以及艺术设计运用中都是有一定程度的程序化、智能化和公式化,无法像人脑一样,有一定审美意识的产生艺术灵感,并根据灵感进行一系列的创作。所以艺术设计的未来发展中,在运用人工智能导入的同时,需要研发人工智能感性的思维领域,加入审美思维的算法研究,在思想领域共通互融、形成艺术智能发展的有机整体,这也是未来人类在人工智能领域中需要思考和发展的。