裴卉宁,谭昭芸,张金勇,赵芳华,黄雪芹
(河北工业大学 建筑与艺术设计学院,天津 300401)
工业设计作为一种包含造型美学、外观设计、用户体验等多方面知识的综合性学科,其产品造型特征及其表现形式一直是工业设计研究领域的热点和难点[1]。设计师通过理性的知识分析以及感性的创造手法完成最终的产品设计方案[2],然而设计师往往很难摆脱设计思维的固化性及疲劳性,容易拘泥于已有的、大众化的产品造型,这不仅会导致当前市场产品外观千变一律,还会直接影响企业的市场竞争力以及其长远的发展[3]。
针对这一问题,有关学者通过将计算机及智能算法引入产品设计过程中,生成更多新颖、奇特、富有灵感的创意设计方案,以此来激发设计师的创造性思维,并提高设计人员的工作效率[4]。苏建宁等[5]通过非支配排序遗传算法建立了产品多意向造型进化设计系统,研究证明可以解决消费者对于产品造型的多意向需求。王亚辉等[6]提出了一种应用深度学习ResNet算法的人工智能设计决策模型。近年来,生成对抗网络(Generative adversarial network,GAN)被广泛的应用于智能设计相关研究领域,例如,丁满等[7]提出了一种基于GAN的产品色彩智能设计方法。唐贤伦等[8]认为与GAN相比,深度卷积生成对抗网络(DCGAN)在数据集上的识别方面具有较高的正确率,在机器训练方面具有优良的可控性和稳定性。并且,DCGAN无论是在对象个体还是场景方面都可以学习到丰富的层次表达,因此,在实现生成符合产品设计特点的造型设计方案方面具有天然的优越性[9]。
当前,汽车造型设计在一定程度上影响着消费者对汽车产品购买的选择[10]。调查表明,在我国有超过77.2%的用户将汽车的外观造型作为首要决定性因素[11]。对于设计师而言,早期的汽车外观造型设计早已在脑海中根深蒂固,因此全新的汽车外观造型设计成为了当今各汽车企业生产商探索的重中之重[12]。国内外学者在汽车造型设计方面已进行了诸多研究。郭磊等[13]提出了一种拼接多张带形状参数的双三次Q-Bézier曲面技术构造曲面的方法,并通过多张双三次Q-Bézier曲面拼接汽车车身曲面。卢兆麟等[14]提出了一种基于自然语言处理的汽车造型风格推导与评价的方法。王波等[15]通过判定、提取汽车形体表面的关键造型线,提出了针对产品造型设计的线-型分析法。胡伟峰等[16]提出了一种基于遗传算法的用户期望意向驱动的汽车造型基因进化设计方法。McCormack等[17]提出了一种形状文法,以此生成与品牌一致的产品造型方案。姚干勤等[18]通过自然语言处理的方法和主成分分析法提取造型风格关键语义特征并将其量化,提出了一种以风格意象认知需求驱动造型设计特征的推理方法。
但是,现有研究尚存在以下不足:1)汽车造型设计风格语言的描述或用户期望意向形容词的获取依旧存在主观描述及感性倾向,设计决策者对于设计风格的确定存在个体差异性及偏好,从根本上来说,这些评价语言及其设计风格确定方向是对主观性现象的描述,缺乏统一的客观标准。2)上述针对汽车造型的研究,多是针对某一角度或某一部分各自独立展开,用户对于各汽车造型要素的评价只是简单的累加,然而汽车的造型设计各要素之间是相互关联的,需要考虑整体而全面的造型设计,因而对于整体汽车造型的设计指导不够系统和充分。
综上所述,针对以上发现的汽车造型设计存在主观倾向及整体考虑不足的问题,本研究以汽车产品造型图片作为研究对象,提出一种基于深度学习DCGAN算法的汽车造型设计模型,该方法充分考虑了汽车造型设计的系统性和整体性,避免了汽车造型设计设计决策者存在个体偏好的缺点,从而得到可以真正启发设计师的全新造型设计方案。
生成对抗网络(GAN)[19]是一种能够在无监督学习上取得很好效果的深度学习模型。GAN在对抗过程中估计并生成模型的新框架,其主要构成分为两部分:生成模型(G)和判别模型(D)[20]。
生成模型G通过分析真实数据样本的潜在数据分布,生成尽可能接近真实样本的新样本。判别模型D通过输出一个概率值判断一个样本是否来自于训练数据,当概率值大于0.5则为真,否则为假。该模型框架通过不断地训练找到一个平衡点,使得两者都能得到提升和改进,此时判别器D则不能区别出数据是否来自于真实数据。
模块化设计是在工业生产不断发展过程中逐步形成的一种设计方法[21]。模块化设计的基本思想是以产品或系统的总功能为划分对象,将整个产品结构分解为若干特定模块,然后通过不同模块化组合得到不同品种或功能的产品[22]。汽车作为一种大批量定制生产的工业产品,其模块化设计已成为汽车制造业的重要发展趋势[23]。
国内的很多学者在这方面进行过研究。单春来等[24]提出了一种基于图分解算法的车身装配结构设计方法,用以解决以厚度为设计变量进行优化时存在的收敛问题。宋守许等[25]通过确定产品各模块对于产品的重要程度,建立了一种模块级和产品级的模块度评价方法。单泉等[26]提出了一种综合考虑产品定制度和用户满意度的评价方法。
但模块化设计在汽车产品中应用较少,大多是针对结构布局、传动关节以及系统功能等方面进行设计,在对汽车的外形造型上进行模块化设计还仍然存在巨大的空白。本文根据Chen等[27]提出的一种考虑产品适应性和模块多样性的开放产品结构模块配置的最佳设计方法,及Li等[28]提出的对最佳设计方案进行模块推理(Module-based reasoning,MBR)以检索最相似的模块(Most similar modules,MSMs)的方法,提出在对汽车的外形造型空间上进行模块化设计需要考虑的因素如下:
1)模块划分需尽可能以少的模块组合形成更多不同外形空间风格的产品。
2)模块的外形结构需具备一定的独立性和完整性。
3)相同的模块之间需具备一定的可互换性。
4)不同的模块之间需具备一定的可组合性。
下面以一张普通家用汽车侧视图线稿为例,依据Torstenfelt等[29]将车身功能结构模块划分为全局共享模块、部分共享模块和唯一模块的基础,考虑到汽车造型设计的统一性,将车前轮部分汽车前脸区域划分为一个模块,其造型对汽车侧面视觉效果有较大影响;车顶线及侧窗玻璃区域划分为一个模块,其造型设计能够在一定程度上体现汽车的体量感;前后车门区域划分为一个模块,其联系着前后两个造型分区;车后轮部分车尾区域划分为一个模块,其造型设计可作为另一个视觉焦点。4个主要功能结构模块构成整体汽车造型设计,对设计师和消费者的汽车造型设计感知的影响是四者统一配合产生作用,而不是单纯的叠加。通过粗线条对整体车型进行简单的功能结构模块划分,作为数据集输入网络,方便计算机辨别汽车图片模块,如图1所示。
图1 汽车功能结构模块划分
鉴于GAN能够在计算机视觉环境下实现生成全新图像样本的特点,本文认为以大量特定产品的已知图像作为训练数据时,GAN及其变体DCGAN、1D-GAN、3D-GAN等深度学习算法可以从大批量无标记的产品图像中,学习到良好的中间特征,生成与已知的产品图像具有相似特征的、有效的、相对自然的图像,从而生成新的造型方案。
根据提前给定的汽车图像作为输入,为使汽车产品造型设计系统能够按照目标产品语意进行方案的创造性设计,建立了如图2所示的系统框架,整个系统框架包括设计方案生成和图像设计评价两个部分。
图2 产品造型设计系统框架
对于设计方案生成部分,需要收集足够的设计效果图图像数据,通过图像识别,对图像数据信息进行预处理,抽取与选择,构建可用数据集,然后将图片输入DCGAN模型,通过DCGAN算法对数据集进行训练后,从生成器中提取设计方案图片。
对于图像设计评价部分,由专家对于生成器生成图像设计方案以及专家方案进行评判打分,验证DCGAN造型设计模型的有效性和满意度。
2.2.1 数据构建
数据集是由一组数据组成的集合,在设计领域中,算法效果如何的难度在于基础数据集的积累,较少的训练数据往往会导致后期算法的有效性和准确性较差。以汽车产品造型图片为例,样本收集的研究对象为斯坦福车型数据库[30],斯坦福车型数据库中包括16 185张图片,这些图片来自于196种不同车型。通过对数据集的所有车型进行统一分类,最终收集了数据库中资源较为丰富的两个类型汽车造型样本图片:家用汽车8 565张、SUV2 771张。另一方面,通过网络爬虫的方式爬取汽车的图像用以增大样本量。
图3 斯坦福汽车样本
图4 网络爬虫汽车样本
2.2.2 图像识别与特征提取
图像识别技术作为智能技术的重要领域之一,在当今计算机技术和信息技术快速发展的背景下,其也得到了愈发广泛的使用[31-32]。
以斯坦福车型数据库中某种典型家用汽车及SUV图片为例,根据1.2节中提出的汽车功能结构模块对汽车图片进行划分,由于通过网络爬虫爬取的图像数据量较大,则通过UC Berkeley团队提出Fully convolutional networks(FCN)的开源代码用于图像分割及轮廓提取,计算机通过图像识别后用不同颜色分割出不同结构模块,通过粗线条加强模块分割,方便生成模型在进行图片生成时辨别汽车图片模块,以此作为数据集输入至DCGAN中(如图5所示)。
图5 汽车模块分割举例
深度卷积生成对抗网络(DCGAN)首次将卷积网络引入GAN的结构,利用卷积层强大的特征提取能力来提高GAN的学习效果。
DCGAN在实践中证明具有一定的健壮性和稳定性[33],生成模型的结构如图6所示。输入层包括100维的高斯噪声z和经过One-hot编码的产品意象y,接着是矩阵变维层以及4个卷积层。输入层通过矩阵变维层后输出的维度大小是4×4×1 024,再输入到后面的4个分数步长卷积层中,其中卷积核大小为5×5,步长(Stride)为2,4个分数步长卷积层conv1、conv2、conv3、conv4使输出维度的长度和宽度增加,同时深度减小,分别是8×8×512、16×16×256、32×32×128、64×64×3,最后由分数步长卷积层conv4输出的就是生成产品的设计方案。
图6 生成模型结构图
y的维度是由不同产品意象数量所决定的,比如说针对家用汽车车型、SUV车型的产品意象,y的维度是2,One-hot编码结果如表1所示。
表1 One-hot编码结果
判别模型的结构如图7所示。判别模型中的输入层包含3个部分:经过One-hot编码的产品意象、真实数据产品图片和生成模型输出的生成设计方案样本图片;4个卷积层conv1、conv2、conv3、conv4使输出的维度长度和宽度减小,同时深度增大,分别是32×32×64、16×16×128、8×8×256、4×4×512;通过sigmoid函数的一个全连接层输出概率值,判断图片是否为满足设定产品意象的真实样本。
图7 判别模型网络结构图
DCGAN 实验细节需注意以下几点步骤,如表2所示。
表2 训练注意细节
第2.2.1节的数据中,由于从斯坦福汽车数据集中提取的家用汽车和SUV两种车型的图片数量差距较大,为了平衡两种车型的数据集数量,将家用汽车车型网络爬虫方法得到的图片以及SUV车型原始数据集图片,分别通过4种传统数据增强方法进行扩充∶水平翻转、随机裁剪、随机颜色以及高斯噪声。分别以两种车型总计的图像作为基础数据集,导入基础数据集时设定训练集与测试集的比例为4∶1,计算机将基础数据集按照比例随机分为训练集和测试集,最终得到的数据集组成如表3所示。
表3 数据集组成数量
本文运用SONY的Neural network console深度学习框架来验证DCGAN模型在设计上的性能。
如图8所示,经过多次实验证明,迭代次数大约在220次左右时学习曲线的代价值(Cost)与训练错误值(Training error)会迅速提高,导致生成大量错误结果,因此本实验选择迭代次数为200次。蓝色为代价值,红色为训练错误值。
图8 不同实验总迭代次数
采用随机梯度下降算法对整个模型进行优化,批大小设定为16,生成实验的数据集需要迭代训练200次。初始化时设定生成器和判别器中的所有参数均值为0,标准差为0.02的高斯分布。整个模型的损失函数为
Ez~pz(z)[lg(1-D(G(z/y)))]
(1)
式中:D为判别模型;G为生成模型;E为期望;x为图像数据;y为产品意象;z为高斯噪声。
其中,x服从于真实数据分布pdata(x),随机噪声z服从于先验分布pz(z),例如说高斯分布。
使用Adam[34]优化器可以加速模型的训练进行参数更新,更新公式为:
(2)
式中:wi为权重;α为学习率;β1为调节变量;β2为调节变量。
设判别器中LeakyReLU的斜率为0.2,计算公式为
LeakyReLU(x)=max(0.2x,x)
(3)
生成实验的训练过程是在Neural network console上完成的。整个模型训练过程的伪代码如下。采用随机梯度下降算法对整个网络进行训练,超参数k取值为2。
for训练迭代次数do
fork步do
• 从先验分布pz(z)中采样m个噪声样本{z(1),…,zm};
• 从真实数据分布pdata(x)中采样m个样本{x(1),…,x(m)};
• 增加更新判别器的随机梯度:
(4)
end for
• 从先验分布pz(z)中采样m个噪声样本{z(1),…,zm};
• 增加更新判别器的随机梯度:
(5)
end for
如图9、图10所示为2组不同车型不同迭代次数DCGAN生成网络的输出结果,从左到右依次为迭代次数50次,100次,150次和200次,可以看出生成的图片随着迭代次数的增加越来越清晰,表明DCGAN算法从训练数据集中获得了更多的汽车造型图片信息,从而提高了图像的生成能力。
图9 家用汽车不同迭代次数的输出结果
图10 SUV不同迭代次数的输出结果
在实验过程中,由于汽车作为一个大型复杂产品,因此需要在其设计迭代过程中进行多次评估决策,并由5位设计专家以设计综合满意率曲线作为最终评估指标共同参与汽车产品造型设计方案的评估决策,以进一步证实DCGAN设计模型性能的有效性。
针对决策标准权重信息不完全确定的设计综合满意率曲线权重分配的问题,采用一种将概率犹豫模糊集(Probabilistic hesitant fuzzy set)和直觉模糊集(Intuitionistic fuzzy set)[35]相结合的方法。假设D为方案集,D={D1,D2,…,Dm},A为决策标准集A={A1,A2,…,An},则设计专家给出的决策值可表示为
kij=〈aij,hk(aij)(pa),υk(aij),πk(aij)〉
(6)
(7)
最终得到决策矩阵K=[kij]m×n。得到决策标准aj的犹豫熵为
(8)
决策标准aj的直觉模糊熵为
(9)
确定决策标准aj的概率犹豫直觉模糊熵为
(10)
进而确定决策标准aj的权重为
(11)
最终获得A1实用性、A2美观性、A3精致度、A4可实现性4个决策标准权重,即
ω={ω1,ω2,ω3,ω4}={0.34,0.28,0.25,0.13}
(12)
将家用汽车、SUV分为2组,每组从DCGAN模型生成器生成的图片中筛选出3个方案,并分别与2组的3个专家设计的设计方案作对比,如图11所示。
图11 专家设计方案
由5位设计专家针对各设计方案给出4个决策标准评估得分,根据4个决策标准权重可得到3组设计综合满意率曲线,满意度越高则说明所测试模型的性能越好。设计综合满意率曲线可以用来判断模型生成图片的好坏,连接各点即可得到设计综合满意率曲线,2组不同车型的汽车设计综合满意率结果如图12所示。
图12 家用汽车车型造型设计综合满意率对比
从图12可以看出:随着迭代次数的增加,DCGAN设计模型生成的图片的满意率逐渐上升;当迭代次数在140次左右时,设计综合满意率曲线趋于稳定;当达到总迭代次数200次时,3个DCGAN设计模型生成的图片的满意率分别为84%、79%、71%,除第2个专家设计方案满意率为76%,且略低于DCGAN设计方案外,其他两个设计方案满意率分别为87%、73%,且略高于DCGAN设计方案。
图13表示SUV车型造型设计综合满意率曲线对比图。当迭代次数在200次时,3个方案的满意率分别为77%、72%、67%,3个专家设计方案满意率分别为81%、74%、71%,3个方案中DCGAN设计模型满意率均略低于专家设计方案满意率。
图13 SUV车型造型设计综合满意率对比
根据模型满意度对比图可得出以下结论:
1)随着迭代次数的增加,DCGAN设计模型的设计综合满意率在逐渐上升,当迭代次数在140次左右的时候,设计满意率趋于稳定,在进行完总迭代次数200次时,2组设计方案DCGAN设计模型的最高满意率分别为84%、79%;
2)由设计综合满意率变化曲线可以看出,当设计满意率趋于稳定时,DCGAN设计模型生成方案满意率均能够达到接近专家设计方案分数的评分,同时可以减少人类劳动,实现计算机自动设计;
3)在2种不同车型的汽车造型设计中,家用汽车造型设计的满意率高于SUV造型设计的满意率,原因可能是由于:(1)家用汽车车型相对SUV车型简单流畅;(2)家用汽车原始数据集相对较多,图片质量较好。
此外,通过对专家设计方案与生成设计方案进行多维度设计对比分析,发现在轮廓设计中,生成设计方案优于专家设计方案,能够为设计师提供新的轮廓线条参考;在细节设计中,生成设计方案表现一般;在整体设计中,生成设计方案可以提供全新的设计比例和造型,为设计师提供新的思路和灵感。
以家用汽车造型设计为例,本文选取CGAN(Conditional generative adversarial networks)[36]、BEGAN(Boundary equilibrium generative adversarial networks)[37]、WGAN(Wasserstein GAN)[38]方法生成模型的结果进行对比,结果如图14。
图14 不同模型结果对比
从图14中可以看出,当迭代次数达到200次时,CGAN、BEGAN和WGAN的设计综合满意率分别为76%、67%、71%,均低于DCGAN设计方案设计综合满意率84%。
本文提出了一种运用DCGAN特性构建的汽车造型设计模型,通过对汽车图像数据集进行学习,使用DCGAN算法达到快速生成创新造型设计方案的目的,进而将DCGAN设计模型生成的两种不同车型的汽车造型设计方案与专家设计方案做满意度对比,最后以家用汽车造型设计为例,将DCGAN与CGAN、BEGAN、WGAN模型进行满意度对比。实验结果表明,该模型能够有效实现汽车产品的造型创新设计,解决了传统汽车造型外观设计方法存在主观倾向以及缺乏整体考虑的问题,为造型方案的创新设计提供了新思路。后续研究主要集中在以下几个方面:在对汽车车型做到两种不同车型区分的同时,扩展其他分类方法的汽车造型设计;进一步优化、改进DCGAN设计模型,并尝试应用到其他领域的产品造型设计。