网络书店推荐系统的负效应与对策

2017-12-15 20:33杨金花李琼
现代出版 2017年4期
关键词:推荐系统

杨金花 李琼

摘要:网络书店推荐系统主要使用信息检索、协同过滤和内容推荐等技术。过度使用推荐系统会产生负效应,降低用户满意度,给网络书店自身发展带来威胁。网络书店要吸收新成果,提升用户满意度;诚信经营,承担社会责任。

关键词:网络书店;推荐系统;过度推荐;负效应优化

《开卷2016年全国图书零售市场报告》显示,2016年我国图书零售市场总规模701亿元,网上书店的图书销售业务依然保持30%左右的增长,同时,网上书店销售的总码洋首次超过实体书店,当当一家图书销售码洋就近140亿,网络书店已成为绝对优势渠道。与此同时,面对图书种类的纷繁复杂(如当当2016年在售品种就有110万种,还有显示缺货的480万种)和数量的骤增,用户经常感到无所适从。这种可供选择的多样性在为网络书店产生巨大经济效益的同时,某种程度上也降低了用户的满意度。近年来,推荐系统被证明是一种解决信息超载问题、帮助用户做决策的有效工具,被应用到互联网的各个领域。推荐系统中最核心的部分就是推荐技术,它是利用用户的一些行为数据,通过一定的数学算法,向用户推荐可能喜欢的物品的软件工具和技术。

感受推荐系统带来便利的同时,人们也感觉到它的一些局限和问题,开始对其进行反思,如随着“今日头条”的崛起,一些媒体行业的从业者和观察者指出,推荐系统的算法分化瓦解了媒体品牌、媒体受众、媒体策展的概念,这些新平台上的媒体正与粉丝“失联”,但在现有环境和可预见的将来,“任何媒体的掌门人,都必须直面算法,接受算法,与算法共舞”。网络书店是较早引入推荐系统的领域之一,国外相关资料显示,亚马逊的销售业绩有20%35%要归功于推荐系统,京东报告也显示,搜索对京东订单引入贡献非常大,推荐的贡献更是高速增长,但业界、学界较少对其作用进行反思。本文拟结合自身多年的网络购书经验,通过网络调研、文献研读等方法,归纳描述当当、京东、亚马逊(中国)三大网络书店主要使用的推荐系统技术类型,分析其过度依赖和使用推荐系统带来的问题及成因,并针对性地给出建议,以期出版业更健康地发展。

一、推荐系统原理及主要技术类型

随着电子商务的快速发展,推荐系统与技术不断丰富和提高,三大网络书店根据实际需要,选择了适合自身发展的推荐系统。

1.推荐系统原理

推荐系统主要依据人类行为习惯的可预测性,利用信息检索、信息过滤和文本分类等技术,通过数据挖掘、机器学习和基于知识的系统等方法进行预测和推荐,涉及的知识类型和知识来源主要有三类:一是社群知识,指关于整个用户群体的知识,主要来自用户使用过程中的上下文、评价、行为和人口统计等;二是个人知识,指关于目标用户的知识,主要来自目标用户的评价、行为、人口统计、需求等;三是内容知识,指关于将要被推荐的物品的知识以及泛指其用途的知识,主要来自物品内容、领域知识、上下文知识等。当当、京东、亚马逊中国的推荐系统,就是基于上述研究成果,实现的书目推荐。

2.主要推荐技术类型

一是信息检索。信息检索是最早用于解决信息超载问题的技术,我们在三大网络书店所见到和使用过的图书分类浏览、关键词查询以及网站的主编、专家、作者、读者推荐等,使用的就是信息检索技术。其优点是直观、符合用户传统购书习惯,但推荐的信息有限,浏览选择耗时耗力,且因为很多用户缺乏相关知识准备,难以满足在最短时间内找到满意图书的迫切需求。

二是协同过滤。这种方法的原理是找到与该用户有相同品位的用户,然后将相似用户过去喜欢的物品推荐给该用户。其优点是涉及的知识较少,只用到用户对物品的评价等一些简单且基础的数据,如亚马逊会记录读者购买过的图书及其评价,通过人工智能为某位读者提供可能与他兴趣相仿的人购买的图书(alsobuy功能)。其优点是有可能发掘用户自己未曾意识到的兴趣和需求,缺点是对新用户推荐的质量较差,且由于历史数据质量问题,对老用户的推荐质量也有很大提升空间。

三是基于内容的推荐。这种技术方法主要是通过获取用户的浏览、购买等记录来为用户推荐与其过去的兴趣类似的图书,即我们在网络书店看到的“猜您喜欢”下面的推荐,如“与您浏览过的商品的相关推荐”“根据购物习惯为您推荐”“您最近查看的商品和相关推荐”等。基于内容推荐的核心是能够得到图书的描述及其特征的记录。优点是不需要大规模用户就可以达到适度的精准推荐,而且一旦得到图书的属性就能立即推荐新图书。缺点是对新用户推荐质量差,可分析的内容有限,容易过度特征化。

以上是三大网络书店使用的主要推荐技术类型,各有优缺点。目前三大网络书店基本是以协同过滤为主,吸收其他推荐技术的优点,通过多层面算法和数据交融,提高推荐的个性化和精准度。

二、过度使用推荐系统的负效应

推荐系统为提高了图书被发现的几率,不但给网络书店带来了巨大经济效益,也帮助用户节省了大量时间、选择决策成本,并带来新的阅读发现,有其不可替代的优势。但是,我们也应充分认识推荐系统带来的问题。

1.过度依赖推荐系统,降低客户满意度

一是错误推荐或无效推荐。机器推荐不懂节制,面对铺天盖地、无处不在、大同小异的推荐,用户经常感到无所适从,但最令用户难以忍受的是错误推荐和无效推荐,这主要与推荐系统设计的理论依据有关:人们有共同的兴趣爱好且有從众心理;有共同兴趣的用户有共同的需求;过去的需求能反映用户的喜好等。事实上,这些只是部分反映了用户行为的真实性。因为用户浏览购买—本书可能出于各种目的和需求,他们在网络书店留下的痕迹只记录了他们的行为,并不能说明背后的真实原因,人心幽微且变动不居,很多时候连用户自己都不知道自己的诉求,加之目前推荐技术本身的不完善以及网络书店数据库的质量,以此作为用户的兴趣和喜好进行推荐,难免造成错误推荐或无效推荐,降低用户满意度。

二是过度使用甚或操纵推荐系统。三大网络书店将推荐系统当作营销工具,不但页面充满了明显的“硬广”(从各页面的单品推荐到搜索引擎的营销),而且将其暗中植入看似个性化的推荐列表,通过“软广”操纵用户的选择。关于推荐系统能够影响用户对物品的判断,早在2003年,国外学者就给出了在协同过滤推荐时用户评分行为中从众效应的实证研究。如果我们多了解一些社会心理学和认知心理学的知识,还能发现三大网络书店“自动”推荐的看似“客观”的书目序表,有时其实是人工干预的结果。如我们在三大网络书店的搜索引擎键入“红楼梦”,按照当当默认的“销量”“好评”“出版日期”等综合排序,当当出品的《红楼梦》(当当中小学教辅榜排名90位,五星,970条评论,2016年1月出版)排在了第一位,而人民文学出版社的《红楼梦》(当当小说榜排名47位,五星,86142条评论,2013年1月出版)只排在了第三位;按照京东默认的“销量”“评论数”“出版时间”等综合排序,作家出版社出版的“四大名著”(套装)(中小学教辅销量榜第11位,累计评价7100+,2015年12月出版)排在第一位,人民文学出版社的《红楼梦》(小说销量榜第41位,累计评价8.7万+,2008年07月出版)只排在了第三;按照亚马逊(中国)默认的“相关度”,排位前三的是:《红楼梦》Kindle电子书(Kindle商店免费商品排第2名,4.4星,4160条评论)、北京联合出版社的《红楼梦》(图书商品排第474名,4.0星,11条评论)和《红樓夢》(上)Kindle电子书(Kindle商店免费商品排第123名,4.0星,34条评论)。很显然,上述推荐排序利用了社会心理学中的首因效应,将自己主推的图书排在了首位,对用户的购买决策施加潜移默化的影响:用户通常通过图书所在的位置和推荐的优先顺序感受其显著性,除非明显不符合自己的需求,很少逐项浏览推荐序表,更少分析和思考其背后的推荐机制。此外,还暗中使用了认知心理学中的默认效应,利用默认项(实际预设了选项)来展现候选书目,影响用户决策:用户通常默认这样的推荐,一方面由于“知识鸿沟”,有些用户根本注意不到;另一方面,即使有些用户注意到,但因为现状的改变总与某些损失或预期的收益有关,相比于有可能更好的候选书目,因为害怕或厌恶损失,很多用户仍倾向于维持现状,从而购买了网络书店推荐靠前的图书。这种看似机器“自动”推荐的结果更容易迷惑用户,很容易造成用户的多买或误买,降低用户满意度。

三是增加用戶选择成本。网络书店的各种榜单和推荐序表,固然是用户需求的一种表现,但图书不同于快消品(使用过程中发现好用就多次重复购买同一商品),用户需要的是不断满足自身需求的新内容,网络书店的很多推荐不但未能满足用户这种多样性和新颖性的需求,而且耗费了用户大量的时间、精力和费用。长此以往,这种不懂节制的推荐和操纵推荐,会使用户产生“心理饱和”和厌烦,降低使用满意度,甚至放弃选择并离开。

2.给网络书店自身发展带来威胁

网络书店本希望通过推荐系统产生客户引流,从而提高转化率和客单额度,但如果不克服上述问题,则有可能造成悖论,降低客户活跃度、成交比和客单额度,给自身发展带来威胁。电子商务平台的收入=客流量×成交比×客单价×复购率,可见客流量是平台收入的基础和关键,如果用户登录到网站后,面对各种榜单和营销推荐眼花缭乱、无所适从,他们没能力或不愿意耗费时间精力进行筛选,就有可能少买或不买,甚或离开,转至新的能满足其需求的平台,长此下去,客户活跃度就会相应降低,对网络书店收入和发展构成威胁。天猫书城的崛起也可以从侧面印证这一问题:相比三大网络书店,天猫书城入场最晚,但2016年发行总码洋120亿,直追当当。天猫书城有这样的业绩,固然离不开阿里的数据、技术、财力等资源支持,但不可否认的是,天猫上每个书店的规模和特色,相比于三大网络书店的令人“望洋兴叹”,相当程度上满足了用户逛实体书店的直观感和可控感。再者,2016年社群营销的爆发,某种程度上也可以说是三大网络书店海量图书和过度推荐造成用户无所适从的一个间接结果,其带来的隐性忧患是:一些出版商敏锐地捕捉到了用户的心理和需求,将社群营销当作“短跑悍将”,迅速精准地进行第一波大规模销售,将三大网络书店当作“中长跑选手”,实现后续零散销售,造成三大网络书店整体销量增长乏力。

三、负效应的应对策略

与网络书店相比,用户是弱势的一方,因为经济学、心理学的研究成果表明,人的认知资源有限且理性有限,他们只能在现有服务中进行选择;但他们也是强势的—方,因为他们手里掌握着“投票权”——根据自己使用的满意度决定点击哪家网络书店,并决定是否购买,商家精心设计的那些模型并不能长久操控他们。因此,网络书店在未来要多在提升用户满意度、诚信经营方面下功夫。

1.吸收新成果,提升用户满意度

一是吸收新技术成果优化现有推荐系统,提升用户满意度。通过前面原理和主要技术类型的介绍,我们知道,网络书店在数据质量和推荐技术方面还有很大的优化余地。因此,网络书店要保持开放心态,敏捷反应,利用自身在品牌信誉、数据积累和仓储物流等方面的优势,不断吸收探索新的提升用户满意度的方法。如在用户模型中加入长期记忆功能,精准描绘其画像;再如在现有分类体系中引入大众分类法,允许用户自己用关键词从多个维度对图书进行描述,从而方便用户检索使用。此外,在不打扰用户的前提下,探索其他提升用户满意度的新技术方法,如与社交媒体、专业机构等合作,精准导流,目前三大网络书店在此已有所行动。

二是吸收其他学科新成果优化现有推荐系统,提升用户满意度。按照黑格尔正题反题合题的辩证过程,我们会最终发现,目前的推荐技术只能在一定的范围内解决辅助用户决策、提升体验满意度的问题。因此,网络书店还需要开拓视野,吸收其他相关学科的研究成果,特别是一些交叉学科的成果,如结合数据、科学与技术的人类动力学,再如神经心理学与功能性核磁共振成像技术相结合的社会认知神经科学,将其整合进推荐系统,不断提高预测用户行为的能力,节省用户的决策成本,提升其使用满意度。

2.诚信经营,承担社会责任

不操纵用户行为,诚信经营。对于网络书店来说,不操纵用户行为的要求或许目前很难实际得到其积极回应,但百度和谷歌的教训就在眼前:因为2016年的魏则西事件,依据相关法律我国已将付费模式的竞价排名界定为互联网广告,为此,百度不但股指下降,且给品牌和信誉造成了重大伤害;号称“不作恶”的谷歌也在经过欧盟7年的调查后,因为涉嫌操纵搜索结果且同时伤害了竞争对手,2017年面临27亿美元的罚款和90天整改的勒令。可见,这样的要求不是道德高标,而是企业规避法律和道德风险的经营底线。因而网络书店在经营中要始终牢记,收集用户的相关信息,将其整合进推荐系统,是为了更好地满足其需求,而不是为了一己私利。只有诚信经营,尊重用户和满足用户的需求,企业才能生存和长久发展。因而,网络书店今后应该通过共情,更好地体会用户的使用场景,给予适度推荐,而不是过度追求“深入人心”,操纵用户行为。

尊重消费者,承担社会责任。每年“双十一”等节日大促前,电商被相关政府部门约谈的报道时有可见,旨在防止其滥用市场支配地位,利用技术优势侵犯消费者的知情权和选择权等,这说明电商在经营中确实存在不规范现象。但考虑到网络经济具有的生产力和活力,政府部门这些年的管理越来越柔化,在保持经济繁荣的前提下,主要通过正面引导使其更加自律。网络书店要自觉维护好这一市场环境,因为培养健康的市场环境不只是政府的职责,也是企业尊重消费者、承担社会责任的表现和自身发展的现实诉求,而且企业越大,社会责任越大。

猜你喜欢
推荐系统
数据挖掘在选课推荐中的研究
基于用户偏好的信任网络随机游走推荐模型
基于个性化的协同过滤图书推荐算法研究
个性化推荐系统关键算法探讨
浅谈Mahout在个性化推荐系统中的应用
关于协同过滤推荐算法的研究文献综述
一种基于自适应近邻选择的协同过滤推荐算法
UGC标签推荐系统的一种新的标签清理方法
网上商品推荐系统设计研究
基于Mahout分布式协同过滤推荐算法分析与实现