王静静 陈敏之
摘 要:为提高青年女性胸部体型分类的准确率,从而为个性化女装的结构设计提供依据,以满足服装个性化发展要求,构建了一种基于长短记忆神经网络(LSTM)的青年女性胸部体型识别模型。运用三维测量技术获取230名女青年人体数据,采用聚类分析提取了5项反映胸部形态的典型指标,根据典型指标将胸部体型细分为3类;在此基础上构建了基于LSTM组合全连接层的胸部体型识别模型,将5项典型指标作为特征参数输入,采用小批量亚当优化算法训练模型避免陷入局部最优,使用dropout降低过拟合,输出结果运用Softmax回归分类器实现胸部体型分类。结果表明,该模型能有效对胸部体型进行识别分类,分类准确率为94.6%,与传统的BP网络和PNN网络对比,该模型的拟合效果和预测精度更高。
关键词:胸部体型;三维测量;聚类分析;长短记忆神经网络;识别模型
Abstract:In order to improve the classification accuracy rate of young females breast shapes, provide a basis for the structural design of personalized female clothing and meet the requirements of personalized clothing development, a recognition model of young females breast shapes based on long and short-term memory neural network (LSTM) was constructed. 3D measurement technology was used to obtain the human body data of 230 young females. Five typical indicators reflecting the breast shapes were extracted by cluster analysis. According to the typical indicators, the breast shapes were subdivided into three categories. On this basis, breast shape recognition model based on LSTM fully connected layer was constructed. 5 typical indexes were taken as characteristic parameters to input. Small-batch Adam optimization algorithm was adopted to train the model to avoid falling into local optimum. Dropout was applied to reduce overfitting. Softmax regression classifier was used to realize breast shape classification. Experimental results show that this model can effectively recognize and classify the breast types, with a classification accuracy rate of 94.6%. Compared with the traditional BP network and RNN network, this model has a higher fitting effect and prediction accuracy.
Key words:breast shape; 3-D measurement; cluster analysis; long and short-term memory neural network; recognition model
為满足服装方面的消费需求和服装市场的发展,个性化服装定制将成为服装业今后的发展趋势[1]。现行的服装号型规格设置了Y、A、B、C 4种体型,在体型的分类上,尤其是对女性局部体型的分类上不够细化,因此在服装制版过程中对于服装胸部放松量及胸省的分配,往往依据样板师的经验进行设置,导致女装结构设计达不到理想的效果。在个性化女装结构设计过程中,如何合理区分胸部形态的差异,提高胸部体型识别的准确性,为个性化服装制版提供依据,对服装行业具有重要的现实意义和市场应用前景[2]。
目前,许多学者对人体局部体型的划分进行了研究,应用较多的方法有数理统计法,如聚类法[3-4]、回归分析法[5],但随着人工智能技术的发展,神经网络、随机森林等技术因具有先进的数据挖掘和学习能力,成为当前体型识别的主要研究方法。张苏豫等[6]引入了支持向量机方法进行体型分类,金娟凤等[7-8]构建了概率神经网络识别模型对女性臀部进行分类,尹玲等[9]以随机森林理论算法为基础,建立了女性体型分类判别模型。由于人体体型分类的标准和界限具有较强的模糊性,因此需要不断寻求更好的分类判别方法来提高体型分类的准确率。
本研究运用三维测量技术获取反映青年女性胸部形态的19项指标,通过R型聚类提取5项胸部典型指标,利用均值聚类和方差分析对胸部体型进行细分,在此基础上构建基于长短记忆神经网络(LSTM)的胸部体型识别模型,对实验数据进行训练和测试,提高对人体胸部体型分类的准确率,为女装个性化结构设计提供依据。
1 实 验
1.1 实验对象
由于人体的体型受到年龄、地域等各种因素的影响,为使体型划分具有针对性,选取230名籍贯为江浙沪地区的在校青年女性,年龄为18~28周岁,该年龄段的女性体型发育基本完全,能体现青年女性的体型特征,具有典型的体型代表性。
1.2 仪器与条件
实验测量选用美国TC2三维人体测量仪,测量环境温度为(27±3)℃,相对湿度为60%±10%,符合裸体测量的环境要求。
1.3 测量要求
测量室封闭无照明,参照GB/T 23698—2009《三维扫描人体测量方法的一般要求》进行人体测量。测试者要求穿着高弹无插片运动背心,主要面料为聚酯纤维和氨纶,后背含搭扣可调节围度尺寸,头戴黑色泳帽,不佩戴首饰、手表等。为减少仪器测量误差,对同一测试者进行3次重复测量,取3次扫描结果平均值。
1.4 测量项目
根据女装样板研究的需要,参考企业女装制版时人体胸部测量项目和GB/T 5703—1999《用于技术设计的人体测量基础变量》,确定能够反应女性胸部形态的15个基本测量项目和需要计算的4个派生指标,如表1所示。
2 数据处理与分析
2.1 聚类分析
聚类分析是指将物理或抽象对象的集合分组为由相似的对象组成的多个类的分析过程[10]。在聚类分析中,根据分类对象的不同可分为Q型聚类分析和R型聚类分析两大类。R型聚类可以通过对指标或变量进行分类。
应用SPSS19.0软件对数据进行预处理,剔除无效样本后确定本研究的有效样本容量为221个,将221组有效人体数据作为最终的实验样本。应用SPSS19.0软件对19个胸部测量项目及指标进行R型聚类分析,选择最远距离法作为聚类方法,Pearson相关性作为测度变量间相似性的方法进行聚类,图1为胸部测量项目的聚类树形图。
为使聚类后组间有明显的差异并且使各组反应人体形态的指标具有更高的代表性,结合聚类树形图,将19个胸部有关的测量项目划分为6类。第一类:胸围高(BH)、下胸围高(UBH),为反应人体胸部位置高度的变量;第二类:胸围横矢径比(BW/BT)、下胸围横矢径比(UBW/UBT),为反应胸部丰满度的变量;第三类:后胸围(BBG)、后下胸围(UBBG)、下胸围(UBG)、下胸围横长(UBW)、胸宽(BW),为反应胸部相对宽度的变量;第四类:下胸围矢径长(UBT)、前下胸围(UFBG)、胸围(BG)、前胸围(FBG)、胸厚(BT)、乳间距(BTBH),为反应胸部维度方向的变量;第五类:乳深(BF_X-UBF_X)、胸凸量(BF_X-WF_X),为反应乳房相对高度的变量;第六类:上下胸围差(BG-UBG)、胸腰差(BG-WG),為反应胸部相对立体程度的变量。
2.2 典型指标的选择
为判别每类中变量间的相关程度,并在各类中选取具有代表性的典型指标。通过计算其中某一变量与同类中其他指标的相关指数,并结合专业知识确定典型指标,具体计算见式(1):
由于在进行胸部形态细分时,人体胸部高度方面的指标与胸部细部尺寸间相关度不高,对胸部形态细分基本无影响,因此将第一类高度项剔除,在其余5类指标中进行特征指标提取。
由上述变量间相关指标的公式,计算每类中各个变量的2j值,提取每类中2j值最大的变量作为胸部典型指标,各类变量的2j值计算结果如表2所示。比较5类各个参数的相关指数,分别提取胸围(BG)、下胸围(UBG)、胸围横矢径比(BW/BT)、乳深(BF_X-UBF_X)、上下胸围差(BG-UBG)为胸部典型指标。
2.3 胸部体型分析
为实现青年女性胸部体型的细分,基于获取的5项胸部典型指标运用聚类分析中K-means聚类的方法对221组人体的胸部数据进行分类,将聚类数范围确定为3~5类,并获取每类中典型指标的方差分析结果如表3所示。观察表3数据可知,将实验样本分为3类时,胸部相关变量的F检验值均小于0.05,因此胸部细分的聚类选择3类为最佳。
根据最终聚类中心结果可知221个研究样本细分为3类胸部体型,每类人体分别有24个、174个、23个,并且可由最终聚类中心结果得到各类中胸部体型典型指标的具体数据,并能够找出代表各类别胸部体型的中间体,图2为各类别中间体胸部的图片。表4为胸部各变量的最终聚类中心值和各类样本占总样本的比例。
由图2的胸部图可以较为直观的看出,每类胸部存在明显的区别。
第1类:乳房前凸不明显,胸部厚度较薄,宽度相对较宽,表现为扁平胸;
第2类:乳房前凸较丰满,胸部宽度厚度相对适中,表现为普通胸;
第3类:乳房饱满且前凸明显,乳沟凹陷明显,胸部厚度较厚,表现为丰满胸。
3 基于LSTM的胸部体型识别模型的构建
长短记忆神经网络(LSTM)在循环神经网络(RNN)的基础上,在隐藏层各神经单元中增加记忆单元,从而使时间序列上的记忆信息可控[11]。每次在隐藏层各单元间传递时通过三个可控门(遗忘门、输入门、输出门),可以控制之前信息和当前信息的记忆和遗忘程度,从而使LSTM网络具备长期记忆功能。
长短记忆神经网络算法简单,训练简洁,具有更好的泛化性能和模拟数据间依赖关系的优势,因此能够模拟与人体胸部相关的不同特征数据之间的依赖关系,实现对胸部的细分。在目前常见的适用于识别分类的神经网络模型中,概率神经网络(PNN)由于每个训练样本需对应一个隐含层神经元,随着样本的扩大将导致网络结构过于复杂;反向传播神经网络(BP)存在算法收敛速度慢,局部极小化,易陷入局部极值使训练失败等问题。与PNN和BP相比,LSTM还可以分批训练数据保存模型参数并能够优化复杂的目标函数[12]。因此,本研究基于LSTM构建人体胸部识别模型,图3为LSTM块结构图。
基于LSTM神经网络的模型具有记忆功能,该功能是通过网络中的LSTM块提供的。由t-1时刻传递过来的单元状态ct-1、输出ht-1和t时刻的输入xt共同构成LSTM块的输入数据,输出数据为t时刻的单元状态ct和输出ht。其中,LSTM中的遗忘门决定t-1时的状态单元ct-1影响ct的程度,输入门决定t时刻的输入xt保留多少进入ct,而输出门决定t时刻的状态单元ct保留多少进入输出门,ct和ht在参与t+1时的LSTM计算。
3.1 实验数据与参数
将聚类结果中提取的5项特征指标胸围(BG)、下胸围(UBG)、胸围横矢径比(BW/BT)、乳深(BF_X-UBF_X)、上下胸围差(BG-UBG)作为LSTM模型的输入特征向量,把胸部体型3个类别作为网络模型的输出向量,并选择样本数的3/4共165个作为训练样本,剩余的1/4共56个作为测试样本。
3.2 模型框架与构建
在服装制版过程中,人体局部部位的形态对服装制版的效果影响很大,因此在青年女性胸部聚类分类结果基础上,通过构建基于LSTM的神经网络结构,对实验数据进行训练和测试,实现对人体胸部的识别分类,以便更好地预测人体胸部体型所属类别。
由于输入的特征数据的度量标准不统一,采用最大最小标准化对原始数据进行线性变换,变换公式为:
将归一化处理后的胸部数据按时间序列的形式,输入到LSTM模型中进行训练。基于LSTM的胸部体型分类模型如图4所示。其中输入层中[X1,X2,…,Xn]为选取的人体特征胸部特征向量,n为选取特征向量的个数,对于输入特征对应的类别标签进行单热编码。为避免该神经网络模型陷入局部最优,采用小批量亚当优化算法来训练模型,为获得理想参数,设置每批训练样本数为10个。经过LSTM训练,其中LSTM的隐藏层的节点数确定为64,得到n×64的输出矩阵。再将输出的矩阵放入全连接层(FC),全连接层的节点数为32,得到最后的输出向量。
另外,由于学习率过小将导致训练迟缓,需要更多的训练次数,学习率过大将导致训练无法收敛,学习率一般设置为(0,1)范围内[13]。该网络模型采用小批量学习,学习速率应较小设置为0.001,训练次数为100次。为降低过拟合带来的风险,通过dropout随机隐藏全连接的某些节点并设置为0.2。最后,使用Softmax作为分类函数计算输出向量得到胸部的分类结果。
3.3 结果与分析
采用LSTM-全连接层的神经网络模型对青年女性胸部体型分类的准确率如表5所示,可知每类胸部体型分类的准确率都在90%以上,模型总体识别准确率为94.6%。
为验证基于LSTM的神经网络和FC组合模型对人体胸部分类的优势,采用基于LSTM神经网络、BP神经网络、PNN神经网络进行对比,分别构建LSTM模型、BP模型和PNN模型对实验数据进行训练和测试,得出3种模型的胸部体型分类准确率,如表6所示。可以看出,采用基于LSTM网络、传统的BP网络或PNN网络对青年女性胸部分类的总体识别准确率分别为92.9%、85.7%和91.1%,对比表6可知,采用LSTM神經网络和FC组合模型分类效果最为理想。
4 结 论
a)运用三维测量技术获取人体数据,通过R型聚类分析提取出5项反映青年女性胸部形态的典型指标;
b)利用提取得到的典型指标,通过均值聚类和方差分析将胸部体型划分为3类,得出典型指标的聚类中心和人数占比;
c)构建LSTM全连接神经网络模型对青年女性胸部体型进行识别分类,将5项典型指标作为输入的特征参数,将胸部体型分类结果作为输出,对模型进行训练和测试,最终识别总体准确率为94.6%。
参考文献:
[1] 邹奇芝,谢红,彭磊.女装量身定制系统中的适体原型研究[J].青岛大学学报(工程技术版),2012,27(4):51-60.
[2] 吴秋英.论人体形态与服装结构的关系[J].天津纺织科技,2005,43(4):41-44.
[3] SONG H K, KIM S M , ASHDOWN S P, et al. Categorization of lower body shapes for adult females based on multiple view analysis[J]. Textile Research Journal,2011,81(9):914-931.
[4] 陈慧蓉,张欣,陶娜.基于三维人体测量的青年女性胸部形态特征分析[J].西安工程大学学报,2008(2):147-152.
[5] YOON M K,NAM Y J,KIM W et al. Classifying male upper lateral somatotypes using space vectors[J]. International Journal of Clothing Science and Technology,2016,28(1):115-129.
[6] 张苏豫,邹奉元,丁笑君,等.基于SVM的青年女子体型分类研究[J].浙江理工大学学报,2008,25(1):41-45.
[7] 金娟凤,孙洁,倪世明,等.基于三维人体测量的青年女性臀部体型细分[J].纺织学报,2013,9(34):109-122.
[8] 金娟凤,杨允出,夏馨,等.基于三维测量的青年女性臀部体型概率神经网络识别模型构建[J].纺织学报,2014,35(4):100-104.
[9] 尹玲,夏蕾,许才国.基于随机森林的女性体型判别[J].纺织学报,2014,35(5):114-116.
[10] 刘爱玉,田志鹏.SPSS数据分析教程[M].北京:北京大学出版社,2017.
[11] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation,1997,9(8):1735-1780.
[12] GRAVES A. Long short-term memory[M]. Berlin:Springer,2012:1735-1780.
[13] HAM F M, KOSTANIC I. Principles of neurocomputing for science & engineering[M]. Beijing: China Ma-chine Press and Mc Graw-Hill Education (Asia) Co.,2003.