线上虚拟试衣平台服务质量主题挖掘及指标构建

2022-08-03 08:30仇惠玲刘雅玲

现代纺织技术 2022年4期

仇惠玲，刘雅玲,b

(河北科技大学,a.纺织服装学院；b.河北省纺织服装技术创新中心，石家庄 050018)

试衣过程是影响服装购买决策的核心因素之一，是服装营销中不可忽视的环节[1]。近年来，实体店销售模式逐步升级为“线上+线下”全渠道营销模式，使消费者越来越关注线上服装购买的适体性问题[2]。然而，线上服装销售平台因试衣过程的不便，频繁出现因尺码不符而退货、换货的现象，对品牌商来说无形中加大了成本支出。对此，优衣库开发了一款可以线上进行三维立体试衣的虚拟试衣软件，通过扫描条形码、分类检索找到服装，调整身材参数设置虚拟模特，即可利用和自己体型相仿的虚拟模特进行三维立体试衣；上海试衣间信息科技公司也开发了一款名叫好搭盒子的App，与优衣库虚拟试衣软件不同的是，这是一款可以在线试穿ZARA、UR、H&M等各类品牌服装的虚拟试衣软件。伴随着虚拟试衣的热潮，淘宝也推出了“试搭间”二维虚拟试衣模块，可以在线搭配服装、实现换装特效；可见，虚拟试衣技术逐步进入线上店铺是未来不可阻挡的趋势[3]。

然而，现阶段对于虚拟试衣的研究主要集中在虚拟系统实现方式、虚拟技术应用等技术方面。对于虚拟试衣系统实现方式主要有：基于Kinect的虚拟试衣系统、基于Android平台的虚拟试衣系统、基于草图的虚拟试衣系统[4-5]。针对虚拟试衣技术应用研究主要围绕样板结构、着装效果、性能模拟三方面为主。诸如郭美林等[6]通过CLO3D三维试衣软件研究了结合面料、结构、款式、色彩等特点进行快速结构设计；田丙强等[7]借助CLO3D虚拟试衣技术研究了着装状态下各关键部位合体性评估，模拟了服装着装效果的真实性；云畅等[8]利用CLO3D服装性能模拟技术，研究了经纬异性织物的悬垂性。然而，针对线上虚拟试衣终端消费者体验服务的研究较少。因此，本文从用户感知角度出发，借助虚拟试衣平台用户体验，分析了线上虚拟试衣服务用户满意度以及影响用户认可度、满意度的主题分布特征，并据此构建线上虚拟试衣平台服务质量评价指标，以期提升线上消费者购物体验。

1 虚拟试衣平台用户评论文本的采集与分析

1.1 用户评论数据的采集

在线用户评论是已体验过虚拟试衣服务的消费者依据主观感受进行的真实服务质量反馈[9]。为增加研究结果的普适性，本研究数据以华为手机应用市场、苹果手机App store、小米手机应用市场的虚拟试衣App用户评论为研究样本的数据源进行内容分析。在虚拟试衣平台的选择上，根据虚拟试衣系统关键词排名，发现目前中国主流的线上虚拟试衣软件App主要有好搭盒子App、优衣库数字搭配师、每日新款App、虚拟试衣间App。

本文借助Python软件，共自动爬取了6482条用户评论数据，经过简单人工筛选得到6293条有效用户评论数据，如图1所示，好搭盒子App软件用户评论数据2312条，优衣库数字搭配师软件用户评论数据1956条，每日新款App用户评论数据994条，虚拟试衣间App用户评论数据1031条。爬取内容包括用户评论内容、手机应用版本，并整合成文本文档做下一步数据处理使用。

图1 四个虚拟试衣平台评论数分布Fig.1 Distribution of comments on four virtual fitting platforms

1.2 用户评论数据的规范化处理

在建立初始文本数据库时，发现用户评论涉及版本使用、后台运行、使用体验等多方面的感受，也说明用户在对虚拟试衣软件服务质量进行评价时，是受多方面因素共同影响的。同时，在采集用户评论数据过程中发现评论者普遍存在用词不规范的情况。因此，需要对用户评论文本进行规范化处理。评论数据处理流程如图2所示，最终获取规范评论数据共5200条，词汇表长度为60100，词语总数共2051，并存储规范化处理后的用户评论文本数据。

图2 评论数据处理流程Fig.2 Comment data processing flow

1.3 用户评论文本的情感倾向性分析

1.3.1 评论内容情感分析

为获得用户对虚拟试衣平台服务质量的情感态度，对文本数据库的情感态度和观点表达词汇进行提取分析，共提取具有情感关键词的评论2143条，随之利用ROST CM6软件情感分析功能对评论数据进行正负面标注，通过评论数据与系统的情感词典进行逐个匹配，并记录匹配到的情感词分值，最终统计汇总每一条评论情感分值的得分结果，将得分结果小于0的评论定义为消极情感，如含“打不开、不精准”等否定性评论；将大于0的评论定义为积极情感，如含“棒极了、好用”等肯定性评论；得分为0的评论定义为中性情感，如含“还行、一般”等无明显态度评论。为进一步获取各类情感的轻重程度，将评论情感得分结果进行划档比较。因整体分值区间位于-20分至20分且呈中间多、两端少的形态，故按照整数原则划10分一档，对应的积极情感分档结果为一般(0～10)、中度(10～20)、高度(20以上)三档，对应的消极情感分档结果为一般(0～-10)、中度(-10～-20)、高度(-20以下)，各类情感轻重程度评论条数统计结果如图3所示。可以看出：第一，用户对于线上虚拟试衣服务的体验主要呈积极情感即线上虚拟试衣体验服务整体得到用户支持；第二，积极情感程度轻重上，积极情感得分多数在10分以上，即中度及以上，说明线上虚拟试衣服务能够满足消费者需求，用户支持度高。

图3 各类情感一般、中度、高度评论条数情况统计Fig.3 Statistics on the number of general, moderate and high comments of various emotions

1.3.2 评论内容潜在关联度分析

情感分析仅能判定用户满意与否，但对于具体满意在何处、不满意在何处以及用户最关心的内容，还需要借助语义网络结构作进一步分析。为掌握用户在体验线上虚拟试衣过程中最关注的服务质量内容维度，通过不同评论中词汇的共现关系来判定词汇连接关系，诸如在不同评论者描述“软件”时，用不同的内容反应“软件”的服务体验，如“图片”“加载”“速度”等方面反应软件体验；通过共现频率高低来判定词汇连接中心度高低，诸如评论中“软件”的共现频率高，如软件中的图片体验、加载速度体验等，那么词汇“软件”的中心度高。利用ROST CM6软件科学找寻高频词汇间的共现关系，找到高频词中词汇与词汇之间的潜在联系，并进行中心关联度高低排序，结果如图4所示：a)“软件”“衣服”“虚拟”“功能”“形象”五项是中心度最高的高频词汇，说明这些内容是用户体验服务中最为关注的，也是潜在影响用户服务体验满意度的主要因素之一。b)将中心度高的词汇按照属性划分，发现用户关注的服务内容主要是系统属性、功能属性，诸如“软件”“打开”“改进”“系统”“创建”等词汇均是与系统运行特征相关，“衣服”“虚拟”“人物”“数据”“造型”等均是与功能使用特征相关；c)最值得关注的是情感词之间的共现关系，诸如“改进”与“形象”“功能”“虚拟”“衣服”“软件”等词汇连接度较高，说明在用户评论中集中反映了虚拟形象、服装款式、软件性能等方面存在一定的问题，需要进一步改进。

图4 高频词汇共现网络图谱Fig.4 High-frequency vocabulary co-occurrence network map

2 基于LDA模型的用户评论主题分布

2.1 LDA主题模型

语义网络分析能够深层次挖掘出词项与词项之间的语义共现程度和关联程度，然而对于大量的文本数据分析，节点间的关联程度和虚拟试衣平台服务特征之间便难以区分。因而，需要进一步构建文本主题模型，对大量文本内容进行建模分析，从而获取虚拟试衣平台服务过程的主题分布。本文选择Python软件中的topicmodels包中的LDA_Gibbs模型进行主题建模分析[10]。LDA主题模型拓扑结构表示如图5所示，假设虚拟试衣用户在线评论中的每个词以一定的概率选择某个主题，基于此原理，则虚拟试衣用户在线评论具备多个主题，而每个主题又对应着不同的词语，以此反向推演，可获取用户评论文本潜在的主题分布。

图5 LDA主题模型拓扑结构表示Fig.5 LDA topic model topology representation

LDA主题模型结构如图6所示，其中θ表示的是M×K阶文档-主题分布矩阵，φ表示的是K×V阶主题-词语分布矩阵，z表示的是主题，w表示的是词语，N表示的一个文档中的词语数量，M表示的是文档集的文档数，K表示的是文档集的主题数，α是主题分布θ的先验分布(即Dirichlet分布)的参数，β是词语分布的先验分布(即Dirichlet分布)的参数。

图6 LDA主题模型结构Fig.6 LDA topic model structure

LDA主题模型中生成某一文档中每个词语的概率的公式可以表示为[11]：

(1)

LDA主题模型主题关键词生成过程如图7所示：

图7 主题关键词生成过程Fig.7 Topic keyword generation process

2.2 基于LDA模型的主题分布提取

2.2.1 确定最优主题数目

文本主题数目的确定在一定程度上会影响主题建模的效果，因而在正式构建主题模型之前，需要确定一个最优的主题数目。本文依据文本内容特征选择复杂度(Perplexity)作为指标体系的主题数目确定。

利用复杂度(Perplexity)计算，如式(2)：

(2)

式中：M为文档数目，Nd为词语的数目，P(Wd)为文档中词语Wd出现的概率。

2.2.2 主题建模及主题词提取

在LDA主题模型文档生成过程中，经过基于变分期望的EM求解和Gibbs采样的对比发现，Gibbs采样更易推导且效果较好，因而本文选择Gibbs采样方式[12]。

通过LDA()函数，以Gibbs采样为基础对10到50之间的各个主题数的复杂度进行循环，迭代次数为50次，重复采样直到收敛，比较不同主题个数的结果，发现最优主题数目为15，故将提取的主题个数设定为15个。针对每个主题，利用LDA()函数提取前9个概率最高的词语作为反映主题内容的关键词，结果如表1所示。

表1 15个主题提取前9个关键词的结果Tab.1 Results of extracting the top nine keywords for 15 topics

3 构建虚拟试衣服务质量指标体系

通过分析市场上主流的线上虚拟试衣平台用户评论，挖掘了用户在进行线上虚拟试衣体验时的主题分布，如表1主题分布结果所示，可以发现：从提取的主题分布结果来看，15个主题之间存在共性。因此，依据虚拟试衣平台特征属性、服务过程属性将主题作进一步分类归纳：a)主题9、13中的关键词，诸如“隐私”“支付”“认证”等均与安全性、隐私性等有关的关键词，故而定义为系统安全；b)主题10、14中的关键词，诸如“清晰”“系统”“注册”“兼容”等均与系统技术开发有关的关键词，故而定义为系统设计；c)主题5、8中的关键词，诸如“加载”“分钟”“小时”“反应”等多为描述系统反应速度相关关键词，故定义为响应速度；d)主题11、15中的关键词，诸如“风格”“有趣”“创意”等均与形容虚拟试衣服务特色有关的关键词，故而定义为服务品质；e)主题2、3、7中的关键词，诸如“虚拟”“自拍”“功能”“打扮”等多为描述试衣基本操作行为属性，故而定义为试衣功能；f)主题1和4中的关键词，诸如“客服”“分享”“接近”“互动”等多为描述用户与平台之间交互体验的关键词，故而定义为交互品质；g)主题6、12中的关键词，诸如“衣服”“款式”“虚拟形象”“性别”等多为组成虚拟试衣平台主要内容模块的关键词，故而定义为内容信息。

通过上述主题词归纳分析发现，用户最关注服务内容是系统安全、系统设计、响应速度、服务品质、试衣功能、交互品质、内容信息7个维度。因此在构建虚拟试衣服务质量评价指标时，遵循用户为中心原则，将提炼出的系统安全、系统设计、响应速度、服务品质、试衣功能、交互品质、内容信息7个主题作为一级指标；对于更加细化的二级指标内容，依据一级指标中的关键词属性，参考现有经过前人验证且具备较高适用度的相关量表的服务质量指标作为二级指标，保证指标体系内容的有效性。根据问卷调查，通过信效度检验，进一步确保了指标体系的结构有效性。最终构建了包含7个一级指标，25个二级指标的虚拟试衣服务质量评价指标体系，如表2所示。

表2 服务质量评价指标主题关键词及指标说明Tab.2 Service quality evaluation index subject keywords and index description

4 结论

通过爬取市场上主流的虚拟试衣平台的用户在线评论，借助情感倾向性分析，掌握了用户对于线上虚拟试衣服务体验态度，结果显示绝大多数用户对虚拟试衣提供的服务持积极情感态度，少量用户对虚拟试衣服务持消极情感态度。其次，利用语义网络共现分析，掌握用户对线上虚拟试衣服务的具体关注内容。结果发现：用户最为关注的是线上虚拟试衣的系统属性、功能属性，另外，用户认为虚拟试衣模特形象、试衣款式、系统软件升级方面存在问题，亟待改进。最后，结合LDA主题模型，获取影响用户体验认可度、满意度的15个主题分布，并结合现有服务质量相关量表，最终构建了以系统安全、系统设计、响应速度、服务品质、试衣功能、交互品质、内容信息为一级指标，以平台安全性、用户隐私性、信息安全性、安全预防性、界面简洁性、界面友好性、开发价值性、响应及时性、操作灵敏性、试衣关联度、服务主动性、服务一体性、服务特色性、功能完整性、功能延伸性、导航清晰性、功能从众性、交互友好性、交互流畅性、交互易用性、交互有效性、内容多样性、内容价值性、内容系统性、内容有效性为二级指标的服务质量评价体系，以期增强消费者线上服装购物体验感。