郭琪 潘旭伟
摘要:互联网的高速发展,让信息化、数字化深入到了家家户户,这促使了电子商务的发展。人们面对各种各样的商品,不知道如何抉择,此时个性化推荐给人们带来了希望。它根据用户的需求和偏好为用户推荐,帮助用户解决信息过载的问题。本文对电子商务中的推荐进行了研究。
关键词:推荐,电子商务,个性化
引言
互联网的高速发展,促进了各行各业的发展也为电子商务的生成提供了非常好的条件。电子商务让企业的销售行为从线下实体店销售搬到了在线销售,人们不需要出门就可以在网上购买他们喜欢的东西,给人们提供了很大的便捷,提高了人们的生活品质。但是随着信息的增加,物品品牌和种类爆炸性增长,使得人们在面临多种选择的时候变得难以抉择。因为这样的背景所以有了推荐系统,它使得这个让人们不知所措的问题的解决变得容易起来。推荐系统使人们不用再去主动的搜索大量物品,而是可以被动地接受信息,并且这些信息还都是人们喜欢的内容。用户行为和商品信息的数字化加倍促进了推荐系统在电子商务的运用。
1、电子商务个性化推荐概述及研究现状
1.1 电子商务个性化推荐概述
Renick给出了电子商务个性化推荐的定义:电子商务个性化推荐是指利用电子商务网站向用户提供商品信息和建议,帮助用户决定购买什么产品[1]。电子商务个性化推荐主要有三部分构成:输入、推荐方法模块和输出。
输入主要是将用户的各种信息收集起来以作后续的运用。这些用户信息包含了用户自己的个人信息,例如年龄、工作、居住地等,还有用户的历史记录,例如评分,购买,加购,点赞,评论等。根据这些历史记录信息可以判断出用户的兴趣爱好,之后再采用各种先进的推荐算法根据这些信息找到与用户喜欢的商品类似的商品给用户做推荐,最后给用户呈现出一个可视化的推荐结果。这就是一个完整的推荐过程。
1.2 电子商务个性化推荐研究现状
优秀的服务和技术,可以吸引大量的用户并且还可以使他们变为电子商务网站的忠实用户,这两个也是成功的重要因素。个性化推荐技术可以根据用户个人的需求和兴趣给出意见,帮助用户解决信息过载带来的困扰同时提高其决定的质量;也可以通过将潜在用户变成真正的购买者从而帮助网站提高收入;还能在提高销售数量的同时提高用户对电子商务网站的忠诚和喜爱度。目前,有非常多的电子商务企业已经认识到个性化推荐带来的价值,并在他们的网站中引入了这项技术。例如亚马逊网上书店,淘宝、京东也都会给出如类似产品推荐、流行产品推荐、猜你喜欢和购买此商品的用户还购买了B商品的形式。
2、电子商务个性化推荐技术研究
2.1 协同过滤推薦
推荐算法中最成功就是协同过滤推荐,并且它也是相比较其他算法准确率表现较好的算法。协同过滤方法主要是根据评分来为用户进行推荐,所以需要大量的评分数据。具体的分为user-based和item-based。User-based方法,是找到与给定用户拥有相似评分的用户,然后根据这些相似用户来预估给定用户对这个候选物品的评分。例如,用户A对电影a的评分为4,电影b的评分为5,用户B对A的评分为5,对B的评分也为5,那么用户A和B就可以认为是相似用户,按照这种方法可以找到所有相似用户,综合这些所有相似用户的评分得出目标用户对候选物品的大概评分。Item-based协同过滤算法思想是利用物品间分数的相似度,而不是利用用户间相似度来计算预测值。为了推荐给定物品A,对于一个候选物品集S,找到集合种与A相似度最高的物品。为了预测物品A的评分,需要确定A对集合S中物品的评分,通过对这些评分的加权平均值来计算物品A的可能分值。
2.2 基于内容的过滤
协同过滤算法虽然效果很好,然而因为评分矩阵十分稀疏,且还存在冷启动方面问题,所以有时候也表现不佳。然而基于内容的方法不用大量的评分数据,只需要用户个人的历史记录就可以给用户做推荐。一般情况分为以下三个步骤:
(1)物品表示。物品表示就是用这个物品的一些特征来表示此物品。物品特征向量是实现该方法的关键所在。通过特征提取,能从项目中获取项目特征向量。所谓特征提取,就是从项目的各种不同特征中提取出最具有说服力的特征子集。对于文本,可以采取TF-IDF或LDA主题模型等方式将文本转换为特征向量表示。
(2)用户偏好表示。根据用户以往浏览或者购买的物品,将这些物品的特征作为用户的偏好。例如用户曾经看过标签为喜剧,爱情类的电影,那么这些特征就可以用来表示这个用户的偏好。
(3)生成推荐。构造出物品的特征表示和用户偏好矩阵之后,就可以计算物品之间的相似度然后把那些用户可能喜欢且无操作记录的物品推荐给用户。
基于内容的方法虽然不需要大量的数据,但是它的准确率没有其他方法好,而且推荐的东西经常会很相似,这对用户来说是不好的体验。
2.3 基于关联规则的推荐
关联规则技术在电子商务领域被成功的应用到购物篮数据中。应用该技术,可以发现一些不为人知的规律,在销售的时候哪些商品具有相关性,知道了这种联系后,可以增加商品的组合销售能力,也可以用来设计布局。基于关联规则的方法是依据用户的以往信息提取出隐性规律,通过这些规则可以获得一些有意义的关联组合,例如用户买商品A的时候还买了B,然后就可以利用这些组合为用户产生推荐内容,这种方法产生的结果会更有效果。最经典的案例是啤酒-尿布,我们在生活中也会发现这些关联的规则,例如,你去超市就会发现打折的商品会和你平常需要的日用品放在一起。
2.4 基于网络结构的推荐
基于网络结构的推荐通过二部网络结构分析用户和项目,即把用户看出一类点,把商品看成另一类点,当某个用户购买过某个商品时,则他们之间会存在一条边,但是同一类点之间不会存在连边的,即用户与用户之间、商品与商品之间没有边相连,类似于这样组成的网络就称作二部图。电子商务中的商品推荐可以看成图上的链路挖掘问题,通过扩散来找两节点的关联程度。基于网络结构的方法的优点是能够发现用户的潜在兴趣,而且能够稍微解决数据稀疏带来的问题,但是它也存在着冷启动问题。例如那些长尾商品,通过网络结构可能就会被发现然后推荐给用户。
3、电子商务个性化推荐技术改进研究
传统的推荐算法存在数据稀疏、冷启动和可扩展性问题,针对这些缺陷,许多专家和学者在已有的算法基础上进行了改进。
针对算法存在的推荐准确性不高问题,王健等人采用将用户特征融入到原有的协同过滤对算法进行改进,以提高推荐的准确度[2]。在用户特征相似性计算中,不同性别的用户在选择物品时会有不同的偏好,除了性别,还从年龄,职业,地区等方面的不同刻画了相似性公式,通过和传统的协同方法结合,得出计算用户相似性公式。
针对传统协同过滤算法存在的数据稀疏和过分依赖评分数据的问题,张小川等人提出一种基于关联规则的改进算法[3]。该算法预先给定一个阈值,然后根据相似度选出较高的用户组成邻居集,根据阈值来判断选择计算的方法。相似度低于阈值,采用关联规则的算法进行评分预测,否则则照原来的方法进行预测。邓爱林等提出根据项目评分预测的协同过滤方法[4],利用物品间的相似度计算出给定用户的最近邻居。
为了提高二部图随机游走推荐算法的多样性和解决数据集稀疏、信息缺失等问题,黄继婷等人提出融合偏好度和网络结构的推荐算法(IUNR)[5]。首先,将偏好度融合于用户-项目二部图及进行随机游走,调整用户不跟随大众个性化喜好的项目的游走概率,降低热门项目推荐概率和提高冷门项目推荐概率,得到符合用户个性化兴趣且多样性好的项目推荐列表;其次,考虑到用户对项目所打标签是项目的重要特征数据,充分利用项目的社会化标签,将偏好度融合于用户-标签二部图再进行随机游走,挖掘用户跟其他用户不同的个性化兴趣标签;最后,将个性化兴趣标签对应的关联项目提取出来,并与得到的推荐列表结合,得到最终的推荐列表top-N,将列表推荐给目标用户。
虽然许多学者都提出了改进的方法,但由于环境的不断变化,现有电子商务个性化推荐技术仍然不能完全解决目前存在的问题。除此上述介绍的改进方法,提高长尾物品的推荐,优化运营策略,也可以带来更多的收益。因为有很多物品因为没有评分,很难被推荐给用户,这些物品就是长尾物品。推荐更多样的物品可以使用户更加满意;同时,根据时代的变化,提出更加新颖的运营策略,再结合个性化推荐技术,可以使用户的体验感更好,从而加强用户对网站的忠诚度,提高网站的销售和利润。
4、电子商务个性化推荐在未来的发展建议
在推荐系统的评估指标中,有很多个指标其中有两个是新颖性和多样性。一般的推荐都是在强调推荐结果的准确率,但是只有准确是不够的,多样性和新颖性也是十分关键的。新颖的物品是用户没有听过或者见过的,给用户推荐新颖的商品可以给用户一种惊喜、意外的感觉。基于内容的方法只是依据用户自身的喜好给用户推荐商品,从而缺少了新颖性。同时还需要增加长尾商品的推荐,可以更加全方位的满足不同用户的需求,而且长尾商品也会是新颖的,因为它不常见。多样化的推荐同时可以提高用户的选择范围,也可以提高用户的体验感。
参考文献
[1] Resnick P, Varian H R. Recommender Systems[J]. Communications of the ACM,1997,40(3):56-58
[2] 王健,马佳琳.协同过滤推荐算法的改进[J].通信电源技术,2019, 36(03):29-30+35.
[3] 張小川,周泽红,向南,桑瑞婷.基于关联规则的协同过滤改进算法[J].重庆理工大学学报(自然科学),2019,33(03):161-168.
[4] 邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003(09):1621-1628
[5] 黄继婷,陈建兵,陈平华.融合偏好度与网络结构的推荐算法[J/OL].计算机工程与应用:1-10[2019-05-28].
作者信息:
郭琪,浙江理工大学经理管理学院,专业:管理科学与工程,研究方向:个性化推荐;
潘旭伟,浙江理工大学,启新学院创业学院党委书记,教授,博士研究生,研究方向:个性化推荐,知识管理,情境感知计算。