季曹婷,马伟锋,陈 喆,马来宾,楼 姣
(浙江科技学院 信息与电子工程学院,杭州 310023)
2015年,中国发布了以智能制造为主攻方向的《中国制造2025》,提出着力发展智能装备和智能产品,推动生产过程智能化的理念[1]。汽车制造业作为智能制造的应用行业,对智能制造技术的发展起到了推动作用。中国汽车产业发展报告的调查结果表明,汽车外观造型是影响汽车销量的重要因素之一[2]。随着智能制造的发展,个性化定制等新模式不断涌现,汽车外观造型的个性化定制成为未来汽车造型设计发展的趋势[3]。因此,设计工作者如何让汽车外观造型传达的信息与消费者的主观感性意象最大限度地匹配,是个性化定制汽车造型设计成败的关键。围绕这一问题,研究人员提出了很多设计方法,如黄琦等[4-6]利用眼动仪对汽车造型的感兴趣区域进行跟踪试验,通过特定的数据处理方法将感性的用户认知转化为理性的用户认知数据,为汽车造型开发提供了新思路;王黎静等[7]通过产品造型特征的提取与分析,构建了基于BP(back propagation,反向传播)神经网络的模型,作为预测产品造型效果的评价参考,为确保产品造型设计元素的质量提供了依据;王波等[8]对汽车关键部位的造型线条进行特征提取,提出汽车造型线条分析法,为汽车设计者提供了可行的车型分析方法,使其能准确把握车型风格设计的核心。卢兆麟等[9]基于传统汽车造型设计方法,提出利用自然语言的处理方法,通过关键词提取、聚类分析等技术分析用户的消费心理,并设计出符合消费者心理的草图。Gatys等[10]提出基于卷积神经网络的图像风格迁移算法,该算法可以应用于汽车造型图像设计,实现了汽车造型从草图设计到图像设计的转变。
总体而言,现阶段个性化定制汽车外观造型的研究尚存在一些不足,如在用户需求分析时注重用户的主观臆想,忽略了个人属性特征,且多从造型的某一视角(前脸、侧身或尾部等)进行研究分析,缺乏整体性和系统性;另外,传统汽车造型设计依然采用草图设计的方式,这种方式不仅消耗了设计者大量的时间成本,且无法直接生成真实效果图。虽然Gatys等[10]解决了传统草图设计无法生成真实效果图的问题,但依然需要人工参与用户需求分析和车型特征匹配,且生成的真实效果图稳定性较差。
针对以上不足,我们提出一种个性需求驱动的汽车造型风格智能设计方法。首先,构造面向智能设计的汽车造型库;然后,通过经典自然语言处理方法对用户需求进行语义表征,并将用户需求特征与造型库中潜在造型特征进行匹配,选定最适合的造型图像;最后,将造型图像的特征迁移到目标汽车图像,依靠神经网络风格迁移算法智能生成高质量的汽车造型风格效果图。
个性需求驱动的汽车造型风格智能设计方法分为需求提取、特征匹配和特征迁移3个阶段。首先,设计者从用户需求出发,利用自然语言的方式表征出需求特征向量;然后,在建立的汽车造型库中利用特征匹配的方法得到符合用户需求特征的潜在造型图像;最后,将目标汽车图像作为产品设计的基础造型,利用图像风格迁移算法将潜在造型特征迁移到目标汽车造型中,最终得到汽车造型设计的效果图。汽车造型风格智能设计方法的框架如图1所示。
图1 汽车造型风格智能设计方法的框架Fig.1 Framework of intelligent design methodfor automobile modeling style
意象与情景是彰显品牌风格的重要表现方式,也是与其他同类产品相区别的重要因素之一[11]。商务、越野、都市等情景描述和运动感、现代感、科技感等意象词语描述,都会对汽车造型产生重要影响。为了描述汽车外观造型的风格特征和目标人群的定位特征,收集了汽车造型图像数据,并根据汽车企业对自产品牌的车型定位,构造了多层次的标签化汽车造型图像库。汽车造型图像库的标签结构如图2、图3所示。
图2 汽车造型用户标签结构图Fig.2 Structure diagram of automobile modeling user label
图3 汽车造型汽车标签结构图Fig.3 Structure diagram of automobile modeling car label
根据汽车品牌的车型定位将汽车造型标签库分为用户标签和汽车标签。用户标签描述了目标人群定位特征的年龄段属性、性别属性和职业属性。汽车标签描述了某一车型的品牌属性、车型属性和风格属性。
在产品设计过程中,设计师不仅要考虑用户当前需求,而且要挖掘用户潜在需求并预测用户未来需求,从而设计出符合用户需求的产品[12]。用户需求的文本描述是一段完整的表述文本信息,隐含用户对汽车造型的期望意象和个人属性特征,可以利用自然语言处理技术实现用户需求特征提取。用户需求文本特征提取流程如图4所示。首先基于中文分词技术进行文本分词,将用户需求文本描述分为单独的词语,然后利用关键词提取技术建立关键词候选集,最后根据自行设置的阈值确定用户需求特征向量。
图4 用户需求文本特征提取流程图 Fig.4 Flowchart of user demandtext feature extraction
自动关键词提取技术是文本处理的重要环节,该技术主要分为有监督、半监督和无监督3种机器学习方式。其中,无监督提取关键词因无须人工标注语料而被广泛应用和不断创新,成为近年来自动关键词提取技术研究领域的重点和难点[13]。本研究利用经典的词频-逆文本频率[14](term frequency-in verse document frequency,TF-IDF)进行用户需求文本特征提取,核心思想是提取某一文档中内容的关键词候选集及对应的权重。如果某关键词出现在某一文档中的频率越高,同时出现在其他文档中的频率越低,则表明该关键词具备区别本文档于其他文档的能力。TF-IDF算法的具体定义如下:
(1)
用户需求文本特征提取的具体步骤如下。
1)对已有的用户需求描述性文本信息进行分词,并载入外部汽车行业语料库和无效词汇库,按照一定顺序排列得到包含N个实词的词汇集C。
2)根据划分好的词汇集C,利用TF-IDF计算方法得出该用户需求的特征关键词候选集K,具体定义如下:
K={k1:w1,k2:w2,…,kn:wn},1≤i≤n。
(2)
式(2)中:候选集K以字典形式存储;ki为键名;wi为键名对应的权重。
3)关键词候选集K按权重wi从大到小依次排序。
Q={u1,u2,…,um}。
(3)
根据获取的用户需求向量确定设计目标后,需要将设计目标转化为汽车造型的主题意象。采用需求特征与车型特征匹配的方式,以汽车造型风格图像为载体表达产品的主题意象。需求特征与车型特征匹配的流程如图5所示。
图5 需求特征与车型特征匹配的流程图Fig.5 Flowchart of matching demand characteristics with vehicle model characteristics
需求特征与车型特征匹配的具体步骤如下。
1)采用余弦相似度的计算方法对用户需求文本特征集合Q和标签集合L进行计算,得到相似度集合Isim,并以字典形式存储,其中字典中的键名为汽车车型,键值为相似度数值。具体定义如下:
(4)
Isim={c1:s1,c2:s2,…,cz:sz}。
(5)
式(4)~(5)中:q为Q中元素在T中出现的频次向量;l为L的元素在T中出现的频次向量。
2)相似度集合Isim按权重sx(1≤x≤z)从大到小依次排序。
根据汽车造型设计理念,设计方案生成是在原产品造型特征的基础上进行优化的结果。因此基于目标汽车造型,利用风格迁移算法将潜在汽车造型风格图像的特征迁移到目标汽车造型上,得到最终的设计方案。基于风格迁移的造型生成流程如图6所示。
图6 基于风格迁移的造型生成流程图Fig.6 Flowchart of modeling generation based on style transfer
2.4.1 汽车图像预处理
由于匹配完成后的汽车外观造型图像存在环境背景或汽车网站平台标志等干扰,会影响设计效果,所以需要采取相应的处理方法对汽车造型库的汽车图像进行预处理。由于前脸、侧身和尾部是影响汽车造型风格的重要因素,故采用针对汽车不同视角的手工分割方法对这3种视图分别进行图像预处理。预处理前后的汽车前脸、侧身、尾部图像如图7所示。
图7 预处理前后的汽车前脸、侧身、尾部图像Fig.7 Unprocessed and pre-processed images of car’s front face, sideways and tail
2.4.2 汽车造型风格迁移算法
经过预处理后,需要将潜在造型特征迁移到目标汽车造型中。文献[15]提出的真实照片图像合成方法,将汽车风格图像Is的外观造型特征细节迁移到设计师选择的目标图像Ic,具体算法步骤如下。
1)将Is和Ic分别输入到预训练模型VGG-NET19[16]网络,提取Is的汽车外观风格特征φ(Is)和Ic的汽车外观结构特征φ(Ic)。
2)为了后续优化工作方便且不陷入局部最小值,将待优化图像Ic*初始化为Ic,计算Ic*与Is和Ic的损失值,损失函数定义如下:
Lloss=argminEs(φ(Ic*),φ(Is))+α1Ec(φ(Ic*),φ(Ic))+α2γ(Ic*)。
(6)
由式(6)可知,损失函数由风格损失Es、结构损失Ec和正则化损失γ(Ic*)组成,其中结构损失Ec定义如下:
(7)
式(7)中:φi(φ(Ic*))为从特征层φ(Ic*)提取出来的m个局部图像块;φN(i)(φ(Ic))为Ic特征层中与第i个待优化特征块φN(i)(φ(Ic*))的最佳匹配特征块。最佳匹配特征块的计算公式如下:
(8)
3)根据损失值,利用反向传播算法迭代优化汽车造型图像Ic*,最终得到特征迁移完成后的汽车造型效果图。
为了验证个性需求驱动的汽车造型风格智能设计方法的有效性,我们以实例的方式进行汽车造型设计。
根据某用户需求:职业女性,上班族,代步,偏好具备运动感和时尚感且车身小巧的汽车造型,以大众品牌旗下的桑塔纳车型为目标车型,将用户需求特征迁移到该目标车型上,获取个性化汽车造型风格效果图。
根据英国品牌评估机构品牌金融(Brand Finace)发布的“2019全球最有价值的100个汽车品牌”排行榜,选取前五名汽车品牌,利用爬虫技术爬取汽车之家、爱车网、懂车帝汽车网的数据,构建了汽车造型数据集。其中包含奥迪、宝马、奔驰、大众、丰田5个汽车品牌,118种车型,每款车型收集前脸、侧身和尾部视角的3张图像,每款车型至少5个标签,共计354个图像数据,596个图像库标签。
根据该用户需求文本描述,利用2.2节中的用户需求文本特征提取方法进行用户需求分析,参数配置见表1,得到的用户需求文本特征见表2。
表1 用户需求文本特征提取方法参数表Table 1 Parameter table of extraction methods of user demand text feature
表2 用户需求文本特征提取结果Table 2 Extraction results of user demand text feature
表2中的权重反映了用户需求特征在需求文本描述中所占的比重,为了去除与用户需求无关的关键词,基于汽车无效词汇库,根据权重试验数据确定阈值f1=0.8,选取权重大于阈值的文本特征,可得到汽车造型外观设计的用户需求文本特征向量R=(职业女性,运动感,代步,小巧,时尚感,上班族),其中每个元素代表一个特征属性。
利用2.3节提出的特征匹配算法,将3.3节提取的用户需求特征向量与汽车造型库中的标签向量进行特征匹配,得到需求特征向量与汽车造型库标签向量之间匹配相似度,匹配结果见表3。
表3 汽车外观造型匹配结果Table 3 Matching results of car appearance
根据匹配试验数据,选取分数较高的前3种车型,设定阈值f2=0.7,从而匹配出潜在汽车造型。根据匹配结果可知,高尔夫、甲壳虫、尚酷这3款车型的造型特点符合用户需求。
基于设计者提供的目标汽车图像(桑塔纳),利用2.4节提出的汽车造型生成方法,将3种潜在造型特征的汽车风格图像分别迁移到桑塔纳车型中,算法参数选择见表4。高尔夫造型特征迁移到桑塔纳造型的效果图见图8,最终得到3种迁移效果图(图9)。
表4 基于风格迁移的造型生成算法模型参数表Table 4 Parameters table of modeling generation algorithm model based on style transfer
图8 高尔夫造型特征迁移到桑塔纳造型的效果图Fig.8 Effect diagram of Golf modeling characteristics transferred to Santana
图9 3种方案造型特征迁移的效果图Fig.9 Effect diagram of three scheme modeling characteristics transfer
为了验证方法的有效性,将我们提出的智能设计方法与传统的智能生成汽车造型图像方法(Gatys style transfer,GST)[10]进行图像质量与方法性能两方面的对比,并对3.5节中得到的3种汽车造型方案进行用户评价。
为了衡量图像生成质量,以一组试验效果图为例,从定性与定量两个方面进行对比分析。智能设计方法与GST方法效果图如图10所示,从左到右依次为汽车造型风格图像、目标汽车图像、使用GST方法生成的效果图和使用我们提出的智能设计方法生成的效果图。智能设计方法与GST方法的图像评估数据见表5。定量分析采用均方误差(mean squared error,MSE)[17]、峰值信噪比(peak signal to noise ratio,PSNR)[18]、结构相似性(structural similarity,SSIM)[19]3种图像质量评估指标进行评估。MSE与PSNR用来衡量图像生成质量,MSE越小且PSNR越大表明图像质量越高;SSIM用来衡量图像与目标图像之间的结构相似性,数值越大表明图像与目标图像具有的相似度越高。
图10 智能设计方法与GST方法效果图Fig.10 Comparison of effect diagram between intelligent design method and GST method
表5 智能设计方法与GST方法的图像评估数据Table 5 Comparison of image evaluation data between intelligent design method and GST method
由图10可知,GST方法生成的汽车前脸部位风格化不明显且汽车侧身和尾部的部位迁移图像表面纹理扭曲不平,而智能设计方法没有出现以上问题。由表5可知,智能设计方法生成图像的PSNR分数与SSIM分数都大于GST方法的图像,MSE指标小于GST方法,这说明智能设计方法生成的图像质量比GST方法生成图像的质量高,且效果图像与目标图像具有更高的相似性。
为了对比这两种方法的性能,再从运行时间与显存消耗两个方面进行对比分析,以像素为256 pixel×256 pixel大小的图像作为测试数据,对比结果见表6。
表6 智能设计方法与GST方法性能对比Table 6 Performance comparison between intelligent design method and GST method
由表6可知,智能设计方法的运行时间与显存消耗小于GST方法,表明该方法比GST方法性能更佳,能够快速生成汽车造型效果图。
为了获取用户对3.5节得到的汽车造型设计方案的满意程度,采用5点Likert量表[20]对方案的风格特征进行分值为1~5分的打分。受测者被要求指出对问题所陈述的认同度,如强烈同意、同意、中立、反对、强烈反对。以问卷调查的形式获取量表数据,邀请100个用户进行打分。对量表数据进行统计并计算每个方案风格特征的平均分值,评价结果见表7。由表7可知,每个方案各项风格特征的平均分值都在3.5分以上,表明用户对方案效果图普遍认可,智能设计方法能有效提取用户需求,并智能设计符合用户需求的汽车造型效果图。
表7 3种方案风格特征的评价结果表Table 7 Evaluation results of three scheme style characteristics
针对现阶段汽车造型设计方案的问题,提出个性需求驱动的汽车造型风格智能设计方法。将用户个人属性特征作为用户需求分析的重要因素,并基于自然语言处理的方法有效地获取用户需求特征;根据自行建立的汽车造型库完成用户期望意象和潜在汽车造型图像的匹配工作;利用图形学中风格迁移算法生成真实有效的汽车造型设计效果图,为设计者提供辅助设计参考。本汽车造型设计方法作为一种计算机辅助设计方法,能为汽车造型设计者提供理性的设计思路和素材参考,并满足个性化定制的要求。但本研究尚存在一些不足,如本方案作为一种辅助技术并不能完全替代设计师的工作,用户需求特征提取技术还需进一步优化,需要丰富汽车造型数据库以满足设计需求,这些都有待深入研究。