李鸿勋 杨君
摘 要:以支付宝为研究对象探讨了情景化用户偏好对信息推荐的影响,提出了基于情景化用户偏好的信息推荐流程,改进了已有的推荐算法。将传统的协同过滤算法中由项目评分预测项目评分的模式调整为以用户收支模式预测用户的功能使用情况的模式。在推荐结果输出阶段,通过输出情景化将时间这一情景因素融入推荐结果的输出中,在合适的时间段向用户进行对应功能的推荐来提高用户对推荐结果的接受程度。
关键词:情景;情景感知;用户偏好;信息推荐
中图分类号:TP391;G203 文献标识码:A文章编号:2096-4706(2021)22-0001-04
Abstract: Taking Alipay as the research object, the influence of contextualized user preferences on information recommendation is discussed, and the information recommendation process based on contextualized user preferences is proposed, and the existing recommendation algorithm is improved. In the traditional collaborative filtering algorithm, the mode of predicting project score from project score is adjusted to the mode of predicting user function usage based on user revenue and expenditure mode. In the recommendation result output stage, the context factor of time is integrated into the output of the recommendation result through the output of context, and the corresponding function is recommended to the user in an appropriate time period to improve the users acceptance of the recommendation results.
Keywords: context; context-awareness; user preference; information recommendation
0 引 言
當下移动应用市场竞争异常激烈的大环境下,应用的运营商需要尽可能地利用已有的
技术来提高应用的可观性、实用性、体验度等,以求在竞争中获得生存和发展的机会。对于支付宝来说,经过多年来的创新与实践,支付宝开发出了大量的实用性功能为用户提供理财、生活、教育等多方面的服务,然而这些服务大部分缺乏引导,并不为用户所熟知及使用,不能很好地发挥其作用。通过推荐技术结合情景元素来挖掘支付宝实用性功能的潜力并在适当的情况下向用户推荐可能需求的功能能够提高用户对支付宝的了解和使用依赖性,通过这种方式帮助支付宝延长支付宝的产品使用周期,在与同类型及类似产品的竞争中立于不败之地并促进“支付宝生态圈”的整体健康发展。
1 情景与情景化的实现
所谓情景,即表明用户所处的现实环境和虚拟环境,如时间、地点、正在进行的活动、使用的平台及平台上正在进行的活动等。情景的定义会受到实体类型的影响,实体既可以是现实中的人或物体也可以较为抽象的地点、领域,根据实体的不同类型情景也被赋予不同的含义。随着卫星监测技术、物联网和传感器技术以及网站、应用程序监测技术的应用,系统对用户当前所处情景的感知与捕获能力也在日渐提高,并随着情景理论的完善和情景感知技术的发展诞生出了基于情景感知的自适应服务。情景感知服务能够利用传感设备和感知程序智能化地识别用户当前情景,并建立自适应调节机制来提高感知系统的适应性。在情景感知的实际应用中,系统能够根据用户的偏好和实时的情景反馈情况适时调整服务策略。
2 基于情景化用户偏好的信息推荐流程
基于情景化用户偏好的信息推荐流程如图1所示,推荐系统根据信息推荐的需要、数据挖掘与分析方法及情景感知技术的特点,通过显性获取和隐性获取两种方式对信息推荐系统所需的用户数据、情景数据、项目数据、评价数据等相关数据进行获取和收集。其中显性获取就是通过用户主动为项目打分以及主动输入用户个人信息等方式,而隐性获取则是通过记录用户的行为操作以及通过传感器、其他感知程序对使用者的智能手机以及身处的现实环境进行一定程度的感知从而获得情景数据。收集到的数据可能存在着格式不统一以及部分数据缺失、错误等情况,所以信息推荐系统需要在获取到数据之后对数据格式进行规范化并且对缺乏分析价值的数据进行清除,在得到较为理想化的数据后将这些数据存储到情景化偏好的用户模型库中进行持久化管理。在信息推荐阶段,推荐系统将用户模型库中的数据导入到经过情景化改进的算法中计算从而得到推荐结果,该结果在经过用户的体验和反馈后,将用户的评价情况实时更新到用户模型库中以便以后信息推荐系统能够向用户进行更加准确的信息推荐活动。
图1 基于情景化用户偏好的信息推荐流程示意图
3 基于情景化用户偏好的推荐算法研究
3.1 算法概述
本研究中所采用的基于用户情景化偏好的推荐算法是在传统的基于用户的协同过滤推荐算法上改进得来的。本研究以支付宝为研究对象,通过对比以用户的交易类型以及对应的交易额度为代表的用户交易行为来对用户进行一定的分类,并通过皮尔逊相关系数和交易类型占比来找到交易行为接近的近邻用户。在向用户输出推荐结果的过程中,本课题将时间元素融入推荐结果的推送过程中。由于近邻用户使用某项功能的高频时间通常符合该类型人群的生活方式和使用习惯,如在职员工会在月初将部分工资投入到基金、定期等功能中进行理财,异地工作、学习的人员在节假日前会使用购票功能购買返乡车票,因此可以在统计近邻用户使用功能的高频时段后,在对应的时段向目标用户推荐该项功能,把握准确的推荐时间段可以增强用户对推荐结果的接受程度和尝试意愿,提高推荐的效率。
3.2 算法设计及说明
如图2所示,基于用户情景化偏好的支付宝功能推荐算法的执行步骤可以大体分为用户相似度计算、寻找近邻用户、评价预、结果推荐、情景化功能推荐等五个主要阶段。
各个阶段的具体说明如下:
(1)用户相似度计算。本研究先通过用户的交易行为相似度对用户类型进行初步区分,由于皮尔逊相似度计算公式忽视了两个用户之间交易类型协同情况的探讨,因此本研究采用皮尔逊相似度公式和交易类型相似度相结合的调和F分数来获得更加准确的用户交易行为的调和相似度。由于皮尔逊相似度可能出现负数从而影响调和F分数的计算效果,故取皮尔逊相似度计算结果的绝对值。计算公式如式(1)所示:
其中,u,v为支付宝的用户,s(u,v)为用户u与v之间最终的相似度,P(u,v)为交易行为的皮尔逊相似度,T(u,v)为用户u与v之间交易类型的相似性。P(u,v)与T(u,v)的计算公式如式(2)和式(3)所示:
皮尔逊相似度计算公式可以通过用户之间的交易类型与交易金额对用户进行相关度判断。公式中,i表示某一种交易类型,Iu表示用户u的交易类型集合,Iv表示用户v的交易类型集合,nu,i表示用户u平均每天在某一种交易类型上的交易金额,如nu,餐饮=60表示用户u平均每天在餐饮方面用支付宝进行消费的金额是60元,表示用户的日均交易金额。
交易类型相似度T即为两用户间相同交易类型数量NIu∩Iv与他们存在的所有交易类型总数NIu∪Iv之间的比值,通过交易类型的差异性反映出用户类型的差异。
(2)寻找最近邻用户。根据K近邻算法(KNN)的思想,在采用快速排序算法对前一步骤得到的相似度集进行降序排列后,取数据集的前K个相似用户,即与目标用户相似度最高的K个用户,作为近邻用户。
(3)评价预测。传统的协同过滤算法的评价预测部分通过目标用户的评价均值与近邻用户评价的高于均值部分的和来得到,而在本研究中,用户对某项功能的评价则可以通过该用户对这一项功能的使用意愿(即使用频率)来反映。在支付宝功能的使用中,由于受到功能性质差异的影响,有些功能几乎每天都会被使用,然而有些功能则只会每个月被使用极少次,如活跃用户每天都会使用蚂蚁森林这一功能,但是对于普通用户,一个月可能购买火车票或机票的次数寥寥无几,如果计算所有功能使用次数的均值,得到的预测结果将会与实际情况产生较大偏差,不能准确反映出用户对该功能的合理使用情况,因此本研究在协同过滤算法原有的评价预测公式上进行改进,仅采用近邻用户的使用次数作为计算的参照以避免取功能使用次数均值所带来的误差,评价预测的具体公式如式(4)所示:
其中,pu,i表示目标用户u对功能i的预期每月使用次数,s(u,u′)表示近邻用户u′与目标用户u之间的相似度,ru′,i表示近邻用户u′对功能i的每月使用次数。
在该阶段中,算法将融入功能使用的高频时间段这一情景元素,并对近邻用户使用功能的高频时段进行同步处理,即在统计所有近邻用户使用某项功能的高频时段后取其众数作为目标用户使用该项功能意愿最高的时间段。如在对近邻用户使用“充值中心”这一项功能的常用时间段进行统计之后发现大部分近邻用户倾向于在月初使用该功能,则将“月初”作为目标用户的期望使用时间段置入到功能推荐集合中。
(4)结果推荐。在经过上述步骤得到用户对于某项功能使用情况的预测值之后,将所得到的预测值与支付宝用户中有使用该功能的用户每个月的使用次数均值进行对比,若目标用户对该功能使用次数的预测值不小于使用过该功能用户的使用次数均值则将该结果纳入待推荐项目中,其具体示意如式(5)所示:
(5)情景化功能推荐。本研究在推送推荐结果的过程中,对推荐结果的输出进行情景化,将目标用户期望使用某项功能的时间段作为情景化的维度对该项功能的推荐过程进行进一步加工,当信息推荐系统感知到当前目标用户处于功能推送的理想情景下时,系统即对其进行相关功能推荐。
4 实验及结果分析
4.1 实验数据采集
在实验数据的选择方面,在支付宝有限的数据中,用户的交易记录由于其高度个性化并且具有极强区分度是进行用户相似度对比的理想数据集,而各个用户对支付宝各项功能的使用情况则是作为信息推荐系统中进行推荐结果预测所必需的数据,因此本研究主要获取支付宝用户的交易记录以及相应用户的功能使用情况。
在用户的交易记录获取方面,本研究采用基于Python编写的爬虫程序调用Selenium模块自动地登录用户的支付宝账户,并跳转到交易记录页面中,选取研究所需的时间范围内的用户交易记录进行逐条抓取。通过爬虫程序以及调研所获得的数据都将保存到Excel表格中以便于进行后续的数据筛选及处理。
4.2 结果分析
本研究采用结合精确率(Precision)和召回率(Recall)的调和F分数(F-measure)作为推荐算法对某个用户的推荐结果的准确度的评估指标对算法的效力进行评估。
在统计出现理想推荐效果的K值后得到如图3所示。由图可知,当K值在取12时,在多次试验中算法出现理想效果的次数最多,因此K=12为最优K值。
将最优K值置入推荐算法对输入数据集中随机20%的用户进行推荐,得到的推荐结果及效果评价如表1所示。
由表2中数据可知,在对测试集中用户进行功能推荐的过程中,进行输出情景化之后的推荐算法在精确率、召回率及调和F分数上的数值普遍大于未进行情景化的数据,由此可见将情景化元素融入推荐的过程中能够提高推荐的效率和用户接受程度。
5 结 论
本文在传统协同过滤算法的基本思路的基础上提出了一种基于情景化用户偏好的支付宝功能推薦算法。本文改进后的算法采取从收支到功能使用的新模式,即将用户的收支作为用户归类的依据,通过皮尔逊相似度系数计算用户收入状况的相似性以发现相性接近的近邻用户,再利用这些近邻用户的支付宝功能使用情况来通过加权平均数来预测目标用户的功能使用情况并进行推荐。实验证明了本文改进后的算法相比传统算法,其精确率,召回率和F-measure的值都有提高,具有一定的优越性。
参考文献:
[1] 李建军,侯跃,杨玉.基于情景感知的用户兴趣推荐模型 [J].计算机科学,2019,46(S1):502-506+510.
[2] 吴晓强,张春友,侍红岩.情景感知在农业物联网中的应用研究 [J].物联网技术,2019,9(1):34-36.
[3] 李大鹏,余宗健.基于移动情景信息融合的推荐算法研究 [J].信息系统工程,2017(6):104-105.
[4] 李龙生,艾均,苏湛,等.结合用户行为和物品标签的协同过滤推荐算法 [J].计算机应用与软件,2018,35(6):248-253.
[5] GUO T L,ZHOU J,LUO K D,et al. Differentially private graph-link analysis based social recommendation [J].Information Sciences,2018,463(2):214-226.
[6] CHEN J W,WANG C,SHI Q H,et al. Social recommendation based on users attention and preference [J].Neurocomputing,2019,341:1-9.
作者简介:李鸿勋(1997—),男,汉族,广东汕头人,学士学位,研究方向:信息系统与数据分析应用;杨君(1979—),女,汉族,广东广州人,讲师,博士,研究方向:智能信息系统。