杨亚丽 王革辉
摘 要:为解决网购鞋码选择问题,提高鞋码选择正确率,减少退换货率,现对女性脚型进行分类研究,根据脚型分类结果进行有关鞋子号型的设置,便于网购时鞋号的正确选择。本文利用足部三维扫描仪获取青年女性足部三维图像和数据,结合三维软件共获取155名女性脚部25个测量部位数据。借助主成分分析(PCA)对测量数据进行降维处理,得到表征女性脚型特征的5个主成分(因子),分别是脚围因子、脚长因子、脚厚因子、脚跟形态因子和脚趾形态因子。根据对脚型或着鞋合脚性影响的大小,通过特征选择定义表征女性脚型突出特征的指标:脚宽指数、脚厚指数。根据脚宽指数、脚厚指数对女性脚型数据进行H-K聚类分析,最终将女性脚型分成3个类别。
关键词:三维脚型测量;主成分分析;H-K聚类分析;女性脚型细分
中图分类号:TS943.1 文献标识码:B 文章编号:1674-2346(2019)04-0025-10
1 引言
隨着经济增长与消费能力提高,人们越来越多地关注鞋的舒适性及合脚性。但即使在高度工业化的当今社会,消费者要买到一双完全合脚的鞋仍存在一定难度。已有相关研究表明[1],消费者购买鞋子时,尺码的选择经常是错误的,因为消费者按照传统鞋号选购方式在网上购买鞋子的精准度小于70%。此外,鞋企鞋楦标准混乱使用,消费者偏好不同,脚型千差万别,使得现今鞋子提供的尺寸不能覆盖很大一部分消费者,可能使得多达26%的顾客无法穿着任何型号的鞋子。再者全国脚型测量工作距今已有时段,人们脚型受各种因素影响,易发生变化,现有鞋号与鞋楦系列可能已经不能满足人体脚型需求。
回顾之前的研究,对脚型分类的研究方法主要基于脚型测量值。国内外对脚型数据的研究大多依托于脚型测量普查数据,李仁[2]和孙慜倩[3]将人体脚型测量数据根据每人的脚宽/脚长的比值把人体脚型按照不同肥瘦程度划分为3个类别。此方法虽然可以将女性脚型进行分类,但其分类指标过于单一,不能体现脚型在其他特征上的差异(如足弓、脚跟形态等)。Jung等[4]通过马丁测量仪和人体足迹图采集252名韩国老年人足部49个特征参数,根据FI(脚指数)和MPA(第一拇指侧角度)对老年人脚的形态进行分类,经自由组合将男女脚型划分为6类。此方法先根据两个单一指标分别对脚型进行分类,然后经自由组合划分脚型类型。理论上可以把脚型划分为6个类别,这个方法是正确的,但却忽略在日常生活中,经自由组合得到的这6种脚型并不一定每一个类别都是实际存在的。Lee等[5]、Wang等[6]、Mauch等[7]和Krauss等[8]通过三维扫描采集人体脚型数据,借助主成分分析获取对人体脚型影响较大的主元因子,根据主元因子借助聚类分析将人体脚型划分类别,此分类方法虽然可以将脚型进行分类,但由于其分类的指标为降维得到的主元因子,每一个主元表征脚型在某一方面的特征,其是一个综合的指标,使得脚型分类特征不够突出。此外,若主元因子中存在脚长度方向特征,则不能避免其对脚型分类的影响。
通过查阅文献可知,现存的针对脚型数据进行分类的研究指标过于单一,不能体现脚型在其他特征方面的差异,再者对于一种理想的足型分类方法并没有普遍的共识。因此,本文提出了一种较为合理的脚型分类方法,利用足部三维扫描仪获取女性脚型特征部位测量值,通过主成分分析将有限样本变量的多维脚型特征指标降维到只需少量维度就可覆盖大部分脚型特征。然后根据不同特征变量对脚型的影响,选择可以代表女性脚型突出特征的指标。最后通过H-K聚类分析将女性脚型进行类别划分。根据不同的脚型,设置不同型号配置的号型标准,使其满足更多人的脚型,使消费者可以轻松、易懂的选择适合自己的鞋号,减小鞋类产品网购消费的困难,创建广泛适合个人的鞋型。
2 实验
2.1 样本含量的确定
数理统计中,样本含量的大小通常由研究课题所允许的误差大小所决定。在科学研究和工业生产中一般采用95%置信水平,即要求在总体的估计范围内至少覆盖95%的观测值[9]。根据人类学标准化理论原理,各部位系数调整数值需小于该特征部位标准差的1/8,也即算术平均值之间的差值小于总体标准差的1/8,此时将存在5%以下的误差。在人类学标准化理论中,该误差是可被接受的(允许误差)[10]。通过查阅《中国鞋号及鞋楦设计》[11]可知全国女性部分脚特征部位的标准差。表1是全国女性部分部位特征的标准差及允许误差。
已知标准差和允许误差,在置信水平为95%的情况下,全国女性脚型测量最小样本量为:
=(1.96€?
式中:N―样本容量;S―样本的标准差; ―样本允许误差
由计算可知全国女性脚型测量样本容量为 250人,由于经费限制,本文测量了155名上海长宁区青年女性脚部数据,占全国测量样本的62%,足以表明现居该地区的青年女性脚型分类情况。
2.2 测量状态的确定
人脚是一个松软的有机体,在不同生命活动下,尺寸变化很大。即使是同一部位,在不同姿态下(运动、站立、抬脚和静坐)其测量尺寸亦存在差异。表2是实测不同姿势下,脚部主要尺寸的变化。
表2 不同姿势下脚部主要尺寸的变化[12] 单位(mm)
此外,李晓芸等[13]测量50名青年女性脚部26个特征部位,在3种不同负重情况下的脚型数据变化,分析不同负重情况下同一只脚的脚型数据变化规律,以及相同负重状态下左右脚间的脚型数据差异。试验结果表明,半负重状态与全负重状态的尺寸值之间无显著规律,无负重状态下,表现为长度向上的尺寸值普遍较小。所以,选择半负重站立姿势下进行脚型测量,这样测量的尺寸,较稳定,便于操作和管理。
2.3 测量参数的确定
根据《人体测量学手册》中有关脚型测量特征参数及参照国内外相关研究中所采用的测量部位。本研究共选取25个女性脚型特征参数。如图1所示。
3 测量结果与分析
3.1 测量结果
借助足部三维扫描仪测量女性在站立姿势下半负重状态时的足部三维图像和数据,并做记录。实验受测人员160人,有效数据为155人。表3是女性脚型测量结果的基本统计数据。
3.2 主成分分析(PCA)
主成分分析是一种常用的对数据集降维的统计方法,旨在通过降维处理,将高维数据投影到较低维的数据空间中,目的是从原始样本变量中輸出少数几个主成分,使其尽可能多地保留原始样本变量信息,并互不相关。表4为女性脚型样本数据进行主成分分析的总方差分解表。
不同科学研究领域对成分元件累积所包含的样本全部特征百分比要求不同,一般在社会科学研究活动中累积量达到60%,即认为合理。一般特征值大于1的都会被提取为该数据降维后的“成分”,即有几个特征值大于1的元件就有几个主元。但考虑到实际研究活动,可根据实际需求确定主元数。本研究取5个主元。为清楚地认识每一个主元成分所描述的样本特征,需要对元件矩阵进行因子旋转。因子旋转采用最大方差法,使得公因子荷载向更大或更小方向变化,可使公因子更容易解释和命名。表5为旋转后的元件矩阵,脚型特征参数在元件中数值越大,其载荷数越大,越能描述脚型某一方面的特征。同一元件内特征参数值需要大于0.5(即这些变量间具有较强的相关性),可用来描述同一脚部形态特征。
通过表5分析得:
主元1:对跖趾围长、脚宽、跗骨围长、踵心全宽、兜跟围长、第一跖趾关节高、脚腕围长有较大的载荷数,这些指标主要描述脚的肥瘦,所以把它定义为人体脚围因子;
主元2:对前脚掌长、脚背长、脚长、踵心部位长、脚趾长度、第五跖趾点到脚后跟的长度、腰窝部位长有较大的载荷数,这些指标主要反映的是脚长度方向的特征,所以把它定义为脚长因子;
主元3:对足弓高、舟上弯点高、前跗骨高、第一跖趾关节高有较大的载荷数,这些指标主要描述脚厚度方向的特征,所以把它定义为脚厚因子;
主元4:对外踝骨高、后跟凸点高有较大的载荷数,这些指标主要描述脚跟的形状特征,所以把它定义为脚跟形态因子;
主元5:对第一跖趾与水平面的夹角、第五趾侧角度有较大的载荷数,这些指标主要描述脚前趾特征,所以把它定义为脚趾形态因子。
3.3 脚型分类特征指标的选取
对女性脚型特征进行描述,需要追踪女性脚型中具有最突出视觉特征的部位。根据主成分分析,青年女性脚部25个特征部位可以降维为脚围因子、脚长因子、脚厚因子、脚跟形态因子和脚趾形态因子5个主元成分。脚围长的大小受到脚宽和脚厚大小的影响,即使同一脚围长的脚型亦存在很大差别,可以表现为脚又宽又扁、脚又宽又厚、脚宽和脚厚均中等、脚宽中等但脚扁、脚又窄又厚等不同的视觉特征。因此我们选择脚宽指数和脚厚指数来表征女性脚型在脚长度方向和脚围度方向的特征。此外,考虑到正常无畸形的脚趾形态因子和脚跟形态因子对着鞋合脚性及选购鞋子无较大的影响,所以仅选择脚宽指数和脚厚指数作为描述女性脚型的主要特征。
脚宽指数=脚宽/脚长。脚宽指数的物理意义为单位长度的脚长所对应的脚宽,无量纲。该值越小,脚越窄;该值越大,脚越宽。
脚厚指数=足弓高/脚长。脚厚指数的物理意义为单位长度的脚长所对应的脚厚,无量纲。该值越小,脚越薄;该值越大,脚越厚。
3.4 基于H-K聚类算法的女性脚型细分
在众多的聚类算法中,层次聚类和K-means聚类最为常见。K-means算法具有简单、计算速度快的优点,但是由于受初始簇中心的影响,增加了其聚类结果的不确定性。层次聚类算法的聚类质量好,但其计算时间长,且无法应对较高纬度和较大范围的数据集。因此,采用H-K聚类算法(Hierarchical K-means Clustering)对女性脚型进行分类。首先对脚型数据进行层次聚类分析并计算其簇中心值,然后将层次聚类的簇中心作为K-means算法的初始簇中心,进行聚类[14]。具体步骤如下所示:
1)根据脚宽指数、脚厚指数的定义公式和脚部测量数据计算得到155名受测者的脚宽指数、脚厚指数的数据集,表6为脚宽指数和脚厚指数数据分布情况。
2)根据脚宽指数,利用层次聚类分析,把女性脚型分为3个类别,结果见图2。
3)根据层次聚类效果,分别求出3个类别下脚型特征指标所对应的簇中心,表7为层次聚类簇中心。
4)将脚宽指数的层次聚类簇中心作为K-Means聚类的初始聚类簇中心进行聚类。
5)得到脚宽指数聚类结果。K-Means聚类分析的最终簇中心数值的大小揭示每一类女性脚型的特征,根据簇中心的数值可得到各簇的取值范围、各类脚型包含样本量和各类脚型所占百分比,结果见表8。
由表8可知,女性脚型按脚宽指数进行分类,可分为3个类别:类别1的簇中心为0.333,分类范围为(0~0.336],其特点是脚宽较窄,定义为A型脚,占比11%;类别2的簇中心为0.358,分类范围为(0.336~0.372],其特点是脚宽适中,定义为B型脚,占比51.6%;类别3的簇中心为0.3846,分类范围为(0.372~1),其特点是脚宽较大,定义为C型脚,占比37.4%。
6)将脚宽指数聚类得到的3个类别(A类、B类、C类)分别进行有关脚厚指数的H-K聚类分析,先对其进行层次聚类分析,并计算得到其簇中心,结果见图3所示。
7)得到女性脚型分类结果。通过H-K聚类分析可得到脚厚指数的层次聚类和K-Means聚类的簇中心数值,根据簇中心数值可得到各簇取值范围、各类脚型包含样本量和各类脚型所占百分比,结果见表9。
利用H-K聚类算法,先对脚宽指数进行分类,在此条件下对每一类别的脚厚指数进行H-K聚类分析,得到女性脚型分类结果。综合表8和表9可知,青年女性的脚型可划分为8个类别,见表10。
如图4(a)是根据脚宽指数和脚厚指数对青年女性脚型进行分类的8个类别。图4(b)是从每一种类别中任意选择的女性脚型三维图像,用来直观的展示各种女性脚型的特征。
最后为了便于在生产和销售中实际应用,将8种脚型适当整合。将A1、A2和B1归为一类,定义为瘦型脚,占比25.2%;将B2、B3和C1归为一类,定义为中间型脚,占比41.9%;将C2和C3归为一类,定义为胖型脚,占比32.9%。
4 结论
1)测量了155名青年女性的脚部数据,采用主成分分析把25个观测变量降维到5个主成分(因子),分别是脚围因子、脚长因子、脚厚因子、脚跟形态因子和脚趾形态因子。
2)根据主成分分析所得结果,借助特征选择确定用来描述女性脚型突出特征的指标脚宽指数和脚厚指数,并将其作为鞋子选购依据。
3)根据脚宽指数和脚厚指数,借助H-K聚类算法,最终把女性脚型划分为3个类别。其中中间型脚型占比41.9%,其次是胖型占比32.9%,瘦型占25.2%。
4)已经得到女性脚型分类的3个类别(瘦型、中间型、胖型),配置不同的脚长即可形成不同的号型系列,根据所属号型,便可选择适脚的鞋子。
参考文献
[1]Huang S,Wang Z,Jiang Y.Guess your size:A hybrid model for footwear size recommendation[J]. Advanced Engineering In- vormatics,2018,36:64-75.
[2]李仁,刘树元,叶平.青少年足型的研究[J].解剖学杂志,1995(01):80-83.
[3]孙慜倩.基于三维扫描与逆向工程的鞋楦设计及选配的研究[D].无锡:江南大学,2013.
[4]Jung S,Lee S, Boo J,et al.A classification of foot types for designing footwear of the Korean elderly[C]//Proceedings of the 5th Symposium on Footwear Biomechanics,Zurich, Switzerland.2001:48-49.
[5]Lee Y C,Chao W Y,Wang M J.Foot shape classification using 3D scanning data[C]//Network of Ergonomics Societies Confer- ence.IEEE,2012.
[6]Wang M J.Taiwanese adult foot shape classification using 3D scanning data[J].Ergonomics, 2015,58(3):513-523.
[7]Mauch M,Grau S,Krauss I,et al.A new approach to children’s footwear based on foot type classification[J].Ergonomics,2009,52 (8):999-1008.
[8]Krauss,S.Grau,M. Mauch,et al.Sex-related differences in foot shape[J].Ergonomics,2008, 51(11):1693-1709.
[9]王花娥.基于MTM的女性形體细分及类别原型研究[D].上海:东华大学,2004.
[10]林登云.泉州市儿童脚型测量及特征值分析[J].中国皮革,2014(4):104-107.
[11]轻工业部制鞋工业科学研究所.中国鞋号及鞋楦设计[M].北京:中国轻工业出版社,1984.
[12]丘理,张利国,张哲,等.鞋楦设计教程(第2版)[M].北京:中国轻工业出版社,2014.
[13]李晓芸,冉诗雅,杨璐铭,陈学灿,等.三种负重状态下青年女性的三维脚型数据对比分析[J].皮革科学与工程,2016,26 (05):48-54.
[14]何莹.基于集成学习的H-K聚类算法研究[D].南宁:广西大学,2012.
Study on the Foot-type Subdivision of Young Women
YANG Ya-li WANG Ge-hui
(Fashion and Art Design Institute,Dong-Hua University,Shanghai 200051,China)
Abstract: In order to solve the problem of shoe size selection in online shopping,to reduce the return and exchange rate and improve the accuracy of shoe size selection,this paper classifies the female foot type and sets the shoe sizes according to the result of the classification.The foot images and data of young women were obtained by using 3D foot scanner and the data of 25 measured parts of 155 women’s feet were obtained by combining 3D software.With the help of principal component analysis (PCA), dimensionality reduction processing was carried out on the measured data to obtain 5 principal components (factors) representing the characteristics of female foot shape,namely foot circumference,foot length,foot thickness,heel shape and toe shape. According to the influence on foot shape or shoe fit,the indexes of prominent female foot shape was defined through feature selection,i.e.,foot width and foot thickness.According to the indexes of foot width and foot thickness,h-k clustering analysis was conducted on the data of female foot type,which was finally divided into 3 categories.
Key wards: 3D foot measurement;PCA(Principal component analysis);H-K cluster analysis;female foot subdivision