基于协同过滤算法的服装个性化推荐研究

2019-03-07 05:22蒋文娟苏佳陆娜李富芸
电脑知识与技术 2019年35期
关键词:推荐算法相似度个性化推荐

蒋文娟 苏佳 陆娜 李富芸

摘要:个性化推荐系统可以帮助电子商务网站为用户提供快速有效的商品搜索服务,满足用户的需求,提高用户的购物效率。服装是电子商务平台的重要类目,但是由于用户对服装的偏好因素多,且用户对服装商品同时有趋同性和求异性,对服装个性化推荐的研究有很有必要。基于协同过滤算法,对用户收藏夹的信息进行了分析,计算出相似度最高的用户,并将该用户的收藏夹信息中目标用户还未关注到的信息推荐给目标用户,实现了一个简单电子商务网站的个性化推荐系统。

关键词:协同过滤;个性化推荐;推荐算法;相似度;电子商务

中图分类号:TP391 文献标识码:A

文章编号:1009-3044(2019)35-0194-03

1 概述

随着互联网的高速发展和物流产业的日益成熟,电子商务已经成为互联网的重要应用之一,我国电子商务行业的市场规模也发生了翻天覆地的变化。电子商务对二十一世纪人类的生活起到的作用和带来的改变是不可预估的,网络已是人们重要的购物途径。据国家统计局数据显示,2018年全国电子商务交易额达31.63万亿元,同比增长8.5%。其中,商品、服务类电子商务交易额30.61万亿元,增长14.5%。2018年全国网上零售额达9.01万亿元,如图1所示,其中实物商品网上零售额为7.02万亿元。从品类来看,服装鞋帽针纺织品、日用品、家用电器及音响器材占前三,分别占实物商品网络零售额的25.2%、14.4%和10.6%。[1]

服装作为日常消费品,消费者的需求比较大,消费者频次高,密度大。2018年“双十一”全天成交额达到2315亿元,其中服装服饰占比达到了20.3%。随着商品种类和数量的呈现指数级的增长,对于消费者来说,从众多商品中搜索到心仪的商品并非易事。服装是一种个性化需求特点比较强的商品,普通的搜索引擎并不适用于消费者快速有效地选择到自己心仪的服装,个性化推荐系统可以帮助解决以上的问题。

2 个性化推荐系统

个性化推荐系统是通过分析消费者的历史消费数据以及商品信息,预测消费者的喜好,然后在电子商务网站上为消费者展示其可能感兴趣的商品。个性化推荐系统可以帮助销售服装的商家及网站迅速而有效地为消费者推荐感兴趣的服装,满足消费者的需求,提高消费者的购物效率,提升消费者的购物体验。个性化推荐系统在B2C(Business-to-Customer)电子商务领域的应用,有着良好的发展与应用前景。当前,几乎所有大型B2C电商系统,如亚马逊、京东、当当等,都在不同程度上有推荐系统的应用。国内的京东网站在浏览商品时会弹出“猜你喜欢”“为你推荐”等关键词;当当网站上为用户进行私人定制的“专属商城”,“当当为您推荐”等推荐功能;网易云的音乐个性化调频推荐,微博、知乎和百度贴吧论坛的内容推荐都是典型的个性化推荐技术的应用。

服装个性化推荐系统在原理上与其他商品的推荐系统类似,但因为服装本身不易建立用户模型,服装推荐通同时具有趋同心理和求异心理等原因,服装推荐系统本身有其特殊性。

2.1研究现状

1987年Malonedeng等研究者最早提出了推荐系统(Recom-mender System)的概念,它是通过评分来进行推荐的,且只在电子商务领域有运用。直到20世纪90年代,Resnick和Varian等[2]研究者在推荐系统的基础上提出个性化推荐系统的新概念。1998年亚马逊(Amazon.com)上线了基于物品的协同过滤算法,将推荐系统推向服务千万级用户和处理百万级商品的规模,并能产生质量良好的推荐。2005年Adomavicius等人将推荐系统分为3个主要类别,并提出了未来可能的主要研究方向。2007年第一届ACM推荐系统大会在美国举行。2016年,YouTube发表论文[3],将深度神经网络应用推荐系统中,实现了从大规模可选的推荐内容中找到最有可能的推荐结果。

与国外相比,国内的个性化推荐技术和互联网发展比较晚,但经过学习国外的技术并结合自己的研发后,发展非常迅速,已经取得了一定的成功。

2.2组成和分类

个性化推荐系统主要由三部分组成:一是收集数据并分析以获取用户偏好;二是选择推荐算法;三是实现推荐。其中推荐算法是整个系统的关键。

目前,系统推荐算法主要分为三类[4]:

2.2.1协同过滤推荐

协同过滤算法是最早应用到推荐系统中的,也是目前最常用的推荐算法之一。协同过滤推荐首先基于用户一评分矩阵来分析目标用户的兴趣爱好,然后检索与目标用户有类似兴趣爱好的用户群体,根据类似用户群体的商品评价信息,将评分高的商品推荐给目标用户。协同过滤推荐对多媒体内容能够达到较好的推荐效果,也可以发现用户新的偏好信息;但是协同过滤推荐对于新的产品和多兴趣用户存在评价系数和冷启动等问题。

2.2.2基于内容的推荐

基于内容的推荐是协同过滤推荐的延续与发展。该算法首先通过用户的评价、分享、收藏夹等历史行为信息来建立用户偏好模型,还要通过分析和提取推荐商品中的内容信息建立推荐商品模型;再计算推荐商品模型和用户偏好模型的相似度,最后將相似度最大的商品推荐给用户。基于内容的推荐简单且高效,可以很好地解决冷启动问题;但是该算法只能推荐用户已有兴趣类似的商品,另外对于如音频视频等多媒体内容的特征不好提取因此也难以达到满意的推荐效果。

2.2.3混合推荐

每种算法都有其优点和缺点。混合推荐是综合利用几种推荐算法的优点,可以产生由于独立推荐算法的推荐效果。采用最多的混合方法是基于内容和协同过滤的推荐。

3 基于协同过滤的服装个性化推荐

3.1协同过滤算法

协同过滤算法不需要预先获得用户或物品的特征数据,仅依赖于用户的历史行为数据对用户进行建模,从而为用户进行推荐。协同过滤以健壮性与优异的速度,在互联网领域得到了广泛应用。协同过滤推荐算法正迅速成为信息过滤与信息系统中的流行技术。与传统的推荐方法不同,协同过滤是用来分析用户兴趣的方法。通过综合这些用户对某一信息的评估,从而形成了一个系统来预测用户对该信息的偏好程度。[5]

协同过滤算法分为以用户为基础(User-based)的协同过滤和以商品为基础(Item-based)的协同过滤两种算法[6],通过比较,本设计采用基于用户的协同过滤。

3.2基于用户的协同过滤算法

基于用户协同过滤的推荐算法包括三个步骤,如图2所示:

3.2.1收集数据

此数据指的是用户的历史行为数据,如用户的关注、购买历史、收藏行为,或给某个商品的评分等,这些都可以作为数据供推荐算法使用。本文是将用户的收藏行为作为数据来收集的。

3.2.2找到相似用户

计算用户间的相似度的方法有如下几种:

本文用公式(2)余弦相似度来计算用户间的相似度[7],其中N(u)为用户u喜欢的物品集合,N(v)为用户v喜欢的物品集合。可以根据用户的收藏夹的内容来获得N(u)和N(v)。

3.2.3进行推荐

本文使用用户的收藏夹来计算用户相似度。如下图3所示,对于用户A只能计算得到一个相似用户C,然后将用户C收藏的服装D推荐给用户A。可用图4说明基于用户的协同过滤推荐原理。

图5给出的是系统具体实现中对用户vape1和其他用户的相似度的计算结果。根据此结果,可看出用户vape1和vape2、vape3的相似度较高,因此会给用户vape1推荐用户vape2和用户vape3的收藏夹中的物品。

4 总结

本文通过运用协同过滤算法对服装个性化推荐系统进行了研究,仅通过采集用户的收藏夹内容,根据收藏夹内容进行用户相似度的比较,寻找相似用户,为用户在购买服装前提供个性推荐,从而提高用户网购服装的效率以及更好的购物体验。本系统仅以收藏夹内容作为基础数据,考虑并不全面,在后续的系统完善中,可以考虑将消费者购物数据以及其他相关信息纳入系统基础数据,从而使推荐更为精准、有效。

参考文献:

[1]商务部电子商务和信息化司.中国电子商务报告2018[R].北京:中国商务出版社,2018.

[2]Resnick P,Iacovou N,Suchak M,et al.GroupLens: an open ar-chitecture for collaborativefiltering of netnews[C]. USA: Pro-ceedings of the 1994 ACM Conference on Computer Support-ed Cooperative Work,1994:175-186.

[3]Cremonesi P,Tripodi A,Turrin R.Cross-DomainRecommend-er Systems.[C] IEEE, International Conference on Data Mining-Workshops, 2012:496-503.

[4]刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19(1):1-15.

[5]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003(9):1621-1628.

[6]趙亮,胡乃静,张守志.个性化推荐算法设计[J].计算机研究与发展,2002(8):986-991.

[7]单毓馥,李丙洋.电子商务推荐系统中服装推荐问题研究[J].毛纺科技,2016,44(5):66-69.

[8]王宁,何震.改进协同过滤算法在服装个性化推荐的研究[J].湖南工程学院学报,2019,29(1):34-36.

[9]胡觉亮,王正方.基于用户偏好的个性化服装推荐模式研究[J].浙江理工大学学报,2018,40(2):136-143.

【通联编辑:代影】

收稿日期:2019-11-12

基金项目:海南省自然科学基金项目(617119);国家自然科学基金项目(61562023);海南省自然科学基金(617124);海南省高等学校科学研究项目(Hnky2017-17)

作者简介:蒋文娟(1975-),女,甘肃人,副教授,硕士,主要研究方向为计算机应用、图像处理;苏佳,学士;陆娜,副教授,硕士;李富芸,副教授,硕士。

猜你喜欢
推荐算法相似度个性化推荐
改进的协同过滤推荐算法
模糊Petri网在油田开发设计领域的应用研究