胡觉亮,王正方,韩曙光
(浙江理工大学,a.理学院;b.服装学院,杭州310018)
随着网络的普及,电子商务近年来发展迅猛。据中商情报网报道,截至2016年,淘宝平台商品已超过10亿件,其中服装占比最高,是淘宝平台第一大类目①数据来源于http://www.askci.com/news/chanye/2015/12/25/14020ku4k.shtm。。随着商品种类和数量不断攀升,在为用户提供更多选择和服务的同时,也带来信息超载的问题。经济文化的发展和生活节奏的加快,让消费者在追求高效购物的同时,也更加注重服装穿着的个性化和品味。传统的搜索引擎技术,在一定程度上提高了信息筛选的效率,但难以满足消费者对服装个性化的需求。相比之下,个性化推荐系统在解决信息超载问题和消费者个性化需求方面展现了巨大的潜力,引起专家和企业的广泛关注[1-2]。
个性化推荐系统包括三个重要模块:用户模型、商品模型、推荐算法[3]。其中,推荐算法的研究是推荐系统研究最为成熟的部分,大量的论文和著作都对此进行研究,形成了多种推荐方法,目前比较成熟的推荐算法主要包括以下几种:基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于知识的推荐以及混合推荐。
各种推荐方法各有优缺点:基于关联规则的推荐算法得到的结果比较容易理解,但运算耗时,无法快速反应实时推荐;协同过滤是推荐算法中最成功的算法,可以推荐复杂的非结构化的对象,但随着用户增多,推荐性能不断提升,对数据的依赖性增强,存在冷启动问题;基于内容的推荐算法可以很好地解决冷启动问题,但缺点是会受到推荐对象特征提取能力的限制[3]。
用户模型能反映用户多方面、动态变化的兴趣偏好,对推荐系统和推荐质量有着至关重要的作用。国外对于用户兴趣模型问题的研究较早,成果较多。Fragoudis[4]通过对几个典型的推荐系统进行综述和分析,指出用户兴趣建模在个性化服务中具有重要地位。Claypool[5]采取显式评估和隐式挖掘相结合的方法,来预测用户的兴趣和需求。Adomavicius[6]采用数据挖掘的方法分析用户浏览记录,通过关联规则和用户个人信息构成用户模型。Wei[7]通过语义概念层次法合并用户短期兴趣和长期兴趣创建用户模型,并通过反馈机制进行模型更新。国内对于个性化推荐建模问题研究较晚,主要集中在用户兴趣模型表示和兴趣度量方面。兰杨[8]使用粗粒度法结合加权关键词法表示用户兴趣模型,并从访问时间的维度把用户模型分为长期兴趣模型和短期兴趣模型。杨继萍等[9]用分级向量表示用户兴趣模型,分级向量分别表示用户兴趣主题及兴趣度。用户的浏览行为和购买行为能够很好的体现用户的兴趣偏好,很多学者对于兴趣度的研究往往基于用户浏览行为的量化[10]。邵秀丽等[11]基于用户浏览内容及实际操作的时间使用加权平均的方法量化用户的兴趣度。张玉连等[12]引入“时间兴趣度”的概念来区别不同时间被浏览的意义和差别,对用户的浏览行为进行分类。
个性化推荐系统现已运用到众多领域,目前在用户偏好较稳定的图书、电影方面的推荐比较成熟,服装类的推荐整体仍处于起步阶段,现有的研究主要有下面几个方面:Kudo等[13]通过对消费者的分析数据制定用户对服装属性的决策信息表,并将粗糙集理论应用到服装推荐中。齐扬等[14]在对服装特征要素分类的基础上,采用BDEU决策树算法,构建用户类别偏好模型。王雪等[15]利用顾客的历史购买记录,采用决策树和协同过滤混合推荐算法,给顾客进行个性化推荐。Lin等[16]在原有研究的基础上,提出了用户模型除了用户偏好之外的需求因素。潘璐[17]把AHP层次分析法加入到服装个性化推荐中,为简化推荐算法计算问题提供了新思路。
目前关于服装个性化推荐的研究大部分仍着眼于算法的优化,而忽视了用户模型和服装模型的科学性对推荐系统的重要作用,特别是用户模型和服装模型的匹配,在一定程度上可以弥补推荐算法的不足。鉴于以上分析,本文通过用户调研和专家评审的方法获取服装属性,提供了确定服装属性的科学依据,并以层次空间向量模型构建服装模型和用户模型,解决了服装模型和用户模型的匹配问题,降低了运算复杂度。最后,通过模拟实验从预测准确度和排序准确度两项指标进行评估,证明该模型的有效性。
服装个性化推荐模型的核心是根据消费者的偏好向用户推荐其感兴趣的服装,主要由服装模型、用户模型及推荐算法组成。为了实现服装模型和用户模型之间更好的匹配,本文把服装模型作为用户模型的一部分,围绕用户服装属性偏好进行研究。
服装由颜色、款式、面料三要素构成,其中款式主要通过领型和廓形影响。服装三要素通过不同的组合方式展现出不同的服装风格特征。消费者行为学研究证明个人会形成长期稳定的穿衣风格[18-19],且不同年龄和收入水平的人对于服装的选购有着较大的区别[20]。
为了更好地理解消费者的服装购买行为,对30名资深网购者进行了深度访谈。参与访谈的用户均表示在特定时间内会有明确的需要选购的服装品类,主要关注服装的颜色、款式、面料、价格等要素。
本文综合消费者深度访谈、文献研究以及专家评审三种方式,最终确定服装属性及对应取值,并根据作用做了分类,服装属性及属性值见表1。
表1 服装属性及属性值
服装集合中的每一件服装都可用式(1)的形式表示:
其中x1表示分类1的取值;x2表示分类2的取值;x3表示价格分类的取值;x4表示适用年龄分类的取值;x5表示服装风格的取值;x6表示颜色的取值;x7表示领型的取值;x8表示廓形的取值;x9表示面料的取值。如式i030=(1,4,2,1,2,0,1,0,0)表示编号为030,价格在50~300元之间,适合18~24岁年龄用户,属于淑女风格的连衣裙。具体的属性特征为:暖色系、V领、A型、棉织物。
用户模型是个性化推荐的核心和关键,尤其是用户兴趣的全面获取及合理描述,直接决定个性化推荐的效率和质量[21]。针对服装商品,本文提出了基于用户偏好和用户需求的用户模型,如图1所示。其中用户信息获取主要包括显式和隐式两种方式。显式获取的数据一般包括消费者注册时提供的如性别、年龄等用户基本信息。隐式数据包括用户在网站中的历史行为数据,包括检索、浏览、收藏及购买等信息。
图1 用户模型架构
1.用户需求模型
不同性别、年龄、消费水平的用户在服装选择时有着明显的区别,且用户在特定时间内有明确的服装品类选购意愿。为了简化计算,提升用户模型的有效性和可计算能力,本文构建用户需求模型S作服装推荐的初步筛选:
S=(性别,目标品类,消费水平,年龄),
其中:性别和年龄来自用户注册信息,目标品类和消费水平由用户行为数据确定。提取用户行为数据构建数据集合I1,I2。
其中:I1是用户从上一次订单完成到目前所有浏览过的服装的集合;I2是用户购买过的服装集合;集合中的每一个元素ik代表一条服装记录,以式(1)的形式表示。分别计算I1集合中服装的分类项和I2集合中服装的价格项各取值出现的频率,频率最高的值即为用户需求模型中目标品类和消费水平的取值。
2.基于层次向量空间模型的用户偏好模型
层次向量空间模型采用树型结构对服装属性进行分类,并以空间向量形式表示用户兴趣偏好,可以很好地表示复杂属性之间的相关关系,降低运算维度。本文采用三层树状结构表示用户偏好模型。第一层表示用户;第二层表示用户感兴趣的服装属性,一个服装属性可以有多个属性值;第三层节点表示某个服装属性下面的属性取值。服装不同类目之间,服装的属性和取值存在差异,以连衣裙为例,构建用户偏好模型,如图2所示。
图2 基于向量空间模型的用户连衣裙偏好模型
如果用户有m个不同影响服装选购的服装属性,那么用户偏好模型可以表示为如下特征向量:
其中:Ti为第i个服装属性;Wi为该服装属性在用户心中的权重;ti为第i个服装属性所对应的属性值;wi为属性值对应的权重,即兴趣度。
3.基于兴趣度的服装推荐
兴趣度代表了消费者对于服装的偏好程度,兴趣度越高则用户对于服装的喜好程度越高,购买的可能性也就越高。浏览和购买行为能够很好的体现用户兴趣。运用到服装领域,属性值在用户购买和浏览行为中频率越高,则用户对该属性越感兴趣[22]。
目标用户对目标服装集合中服装兴趣度计算步骤如下:
Step 1:根据用户的浏览记录和购买记录,转化为0-1评判矩阵。其中每一行都表示一条服装记录,矩阵的列表示该品类服装所有属性的属性值的对应情况,若有则取1,没有取0。可由式(3)表示。
Step 2:计算各属性值对应的权重,获取权向量w=(w1,w2,…,wm),其中:
Step 3:类似Step 1把目标服装推荐集合转化为0-1评判矩阵,并将矩阵依据属性分块,以连衣裙为例,得到分块矩阵式B。其中第1到第5列分别代表颜色、领型、廓形、面料、服装风格(参考图(2)连衣裙模型)。每一行代表一件服装,矩阵的行数表示目标服装集合的服装数量。
Step 4:根据式(5)计算目标用户对目标推荐集合中各服装的综合兴趣度degr。其
中Wi通过用户调研确定;wi由Step 2计算得到的第i个属性的属性值对应的兴趣度向量。
Step 5:根据step 4计算的服装综合兴趣度值,并按照目标集合中服装兴趣度值的高低进行排序,进行TOPN推荐。
为了验证推荐模型的有效性,考虑到线上用户行为数据难以获取,本文通过模拟实验实进行验证。
我国女性服装网购者主要是年龄在19~35岁,月收入低于3000元的大学生和职员[23]。以80名在校女大学生作为实验者进行模拟实验,获取实验者的近期浏览数据,输入需求模型中,得到用户对应的目标分类,并对目标分类为连衣裙的29位实验者,进行进一步检验。
获取的实验者数据存储为3张表:用户近期浏览记录表、用户历史购买记录表和基于式3的评判矩阵。以编号为1的实验者为例,评判矩阵为:
本文主要是基于电子商务平台进行服装推荐,为了模拟实验的准确性,利用网页数据采集软件神箭手对淘宝网服装进行采集,通过数据处理,通过服装预处理按比例选取1000件有代表性的服装构建目标服装集合I,将目标集合内的服装对用户进行推荐。
根据前文用户需求模型的构建规则,1号试验者的需求模型为S1=(1,4,1,1),依次进行初次服装筛选,得到目标推荐服装43件。根据式(5),利用Matlab编码计算每件服装的兴趣度,并从高到低进行排序,结果见表2所示。
其中,各服装属性权重W=(0.30,0.25,0.25,0.20)由用户深度调研数据得到。按照式(4)计算得到各属性的权向量为:
表2 服装兴趣度计算结果
表2续
准确度是推荐系统最重要的评价指标,主要可通过预测准确率和排序准确度来衡量[24]。
1.预测准确率
预测准确率是指在系统的推荐列表中,用户喜欢的商品所占的比率[25]。
由于现有的电子商务平台主要根据商品排名和消费者浏览过的商品进行推荐[26],与本模型的数据结构不一致,没有可比较的显存模型。因此,随机抽取连衣裙热销榜中的10件服装与模型计算服装兴趣度排名前10的服装打乱顺序让实验者评分。其中高于6分为喜欢,低于6分为不喜欢。同时计算每个实验者针对模型推荐服装和随机推荐的服装评分的平均值。
实验结果显示:根据模型结果推荐的290款服装中,有238件评分高于6分,准确率为82.06%,而热销榜随机推荐的290款服装中,有87件是评分高于6分的,准确率仅为30.00%。模型推荐的服装与随机推荐服装的评分平均值也存在明显差异,见图3所示。
图3 不同方式下推荐结果的评分数据
2.排序准确度
排序准确度用于度量推荐模型得到的服装兴趣度跟用户心中评分的符合程度,可以通过斯皮尔曼等级相关系数来衡量。
斯皮尔曼等级相关系数(Spearman rank correlation coefficient,SRCC)用于计算推荐系统推荐物品的排名顺序与真实的排名顺序之间的皮尔逊相关系数[25],其定义可用式(6)表示:
其中:r1(i)与r2(i)分别为推荐系统中的排名与真实排名,μ为排名的均值。如果推荐系统中物品的排名与真实的排名相同,则SRCC的值为1[25]。根据29位实验者的评分反馈计算斯皮尔曼等级相关系数,如图4所示,总的斯皮尔曼系数的均值约为0.884481,排序准确度良好。
图4 模型推荐结果的斯皮尔曼等级相关系数
实验结果显示,本文所采用的服装个性化推荐模型推荐效果良好,有一定的实用价值。
本文把条件筛选和层次向量空间模型的思想运用到推荐模型中,能够很好的降低运算复杂度,为后续推荐算法的优化提供了新思路,在多维度产品推荐中具有一定指导意义。把服装模型作为用户模型的一部分,提高了服装模型和用户模型之间的匹配程度,从而增加了推荐的准确度。经模拟实验验证,本文提出的服装个性化推荐模型具有良好的推荐效果。通过该模型,可以更好的帮助商家了解用户偏好,充分挖掘消费者的潜在需求,提高推荐转化率。另外,准确把握消费者需求,可以优化用户购物体验,提升消费者满意度。
由于受到时间和客观条件的限制,本文重点研究了消费者对服装属性的偏好,而忽略了不同服装属性组合对消费者选择服装的影响。另外,推荐模型只是通过模拟实验进行验证,尽管该实验很大程度上还原了推荐过程,但用户评分仍存在一定的主观性。因此,笔者认为后续可以重点研究不同服装属性组合对消费者选择服装的影响,并考虑与电子商务合作,根据大量用户行为数据和客观反馈进行模型的验证和优化。
参考文献:
[1]范福军,陈畅足,陈方明.中小服装企业的电子商务转型模式[J].纺织学报,2014,35(3):145-150.
[2]李秋艳.服装个性化推荐方法研究[D].苏州:苏州大学,2014.
[3]王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7):66-76.
[4]Fragoudis D,Likothanassis S D.User modeling in information discovery:An overview[J].Proceedings of Advanced Course on Artificial Intelligence,1999(s1):17-43.
[5]Claypool M.Implicit interest indicators[J].Computer Society,2001,32(1):33-40.
[6]Adomavicius G,Tuzhilin A.Using data Mining Methods to Build Customer Profiles[M].Computer,2001,34(2):74-82.
[7]Wei C,Huang C,Tan H.A personalized model for ontology-driven user profiles mining[C]//2009International Symposium on Intelligent Ubiquitous Computing and Education.IEEE,2009:484-487.
[8]兰杨.移动个性化信息服务中用户兴趣建模的研究[D].四川:电子科技大学,2009.
[9]杨继萍,王跃,高雪松.个性化流媒体服务中基于行为分析的用户兴趣建模[J].计算机应用与软件,2011,28(8):247-250.
[10]孙雨生,刘伟,仇蓉蓉,等.国内用户兴趣建模研究进展[J].情报杂志,2013,32(5):145-149.
[11]邵秀丽,乜聚科,侯乐彩,等.基于综合用户信息的用户兴趣建模研究[J].南开大学学报(自然科学版),2009,42(3):8-15.
[12]张玉连,王权.基于浏览行为和浏览内容的用户兴趣建模[J].现代图书情报技术,2007,27(6):52-55.
[13]Kudo Y,Amano S,Seino T,et al.A simple recommendation system based on rough set theory [J]. Kansei Engineering International,2006,6(3):19-24.
[14]齐扬,朱欣娟.基于数据挖掘的服装推荐系统研究[J].西安工程大学学报,2010,24(4):438-443.
[15]王雪,董爱华,吴怡之.基于RFID技术的智能服装推荐系统设计[C]//王雪.2011年全国电子信息技术与应用学术会议论文集.西安:东华大学信息科学与技术学院,2011:4.
[16]Lin Y C,Kawakita Y,Suzuki E,et al.Personalized clothing-recommendation system based on a modified Bayesian network[C]//2012IEEE/IPSJ 12th International Symposium on Applications and the Internet.IEEE,2012:414-417.
[17]潘璐.基于层次分析法的服装推荐专家系统[D].上海:东华大学,2016.
[18]王坤良.大学生服装购买行为研究[J].纺织报告,2006,27(8):54-57.
[19]梁建芳,李筱胜.电子商务环境下女性服装消费行为分析[J].浙江理工大学学报,2011,28(5):728–733.
[20]陆鑫,刘国联.中小城市居民服装消费行为(倾向)的调查分析[J].大连工业大学学报,2002,21(3):232-234.
[21]冯子威.用户兴趣建模的研究[D].哈尔滨:哈尔滨工业大学,2010.
[22]邢玲,宋章浩,马强.基于混合行为兴趣度的用户兴趣模型[J].计算机应用研究,2016,33(3):661-664.
[23]刘建国,周涛,郭强,等.个性化推荐系统评价方法综述[J].复杂系统与复杂性科学,2009,6(3):1-10.
[24]Ricci F, Rokach L, Shapira B.Introduction to Recommender Systems Handbook[M]//Recommender Systems Handbook.Springer US,2011:1-35.
[25]吴良涛,李涛,张霞,等.基于商品属性与用户聚类的个性化服装推荐研究[J].现代情报,2015,35(9):165-167.
[26]潘颖.基于融合目标偏好的群组推荐研究[D].南京:南京财经大学,2016.