个性化推荐系统及其仿真研究综述

2021-12-31 10:49龚映梅侯玉寒杨红娟
科技和产业 2021年5期
关键词:聚类个性化算法

龚映梅, 侯玉寒, 杨红娟

(昆明理工大学 管理与经济学院, 昆明 650093)

2019年8月30日,中国互联网络信息中心(CNNIC)在京发布第44次《中国互联网络发展状况统计报告》。截至2019年6月,中国网民规模达8.54亿,互联网普及率为61.2%,较2018年底提升1.6个百分点。并且中国网络购物用户规模达6.39亿,较2018年底增长2 871万,占网民整体的74.8%。可见互联网和大数据平台的影响力巨大,正在使消费者从传统线下消费转到线上消费。在当前市场环境中,电子商务企业仅仅通过优化传统营销决策变量已经很难在竞争中取胜。信息技术的快速发展正推动着数据运算和存储能力不断提升,消费者需求也更加多元化。在此背景下,电子商务企业开始利用消费者行为数据来寻求提升利润的新方法。因此,个性化推荐系统的应用和研究开始被人们发现和重视。个性化推荐系统能够通过关键性技术和方法将信息进行过滤和筛选,根据用户偏好预测并推荐有用信息,从而缓解由信息过载带来的成本浪费及其他复杂问题。

近年来,中外学者对于个性化推荐系统的研究主要集中在技术和应用两大方面。个性化推荐算法以及新模型构建是推荐技术的主要研究内容,例如对协同过滤推荐算法的改进,利用智能感知分析用户行为从而进行个性化推荐,利用用户画像特性数据集构建新推荐算法,对POI算法的研究,基于各种聚类算法的研究等。在大数据时代,个性化推荐已被应用于很多行业,例如旅游业、音乐领域、电子商务行业、电影业、新闻业、农业等。随着个性化推荐系统的提出,推荐算法或模型的效果检验研究也逐渐被重视,通过验证效果指标来检验推荐系统性能,进而推动个性化推荐系统发展。其中,仿真是使用项目模型将特定于某一具体层次的不确定性转化为它们对目标影响的一种方法。但是就目前相关文献研究来看,个性化推荐系统的仿真研究相对较少。因此,针对现有个性化推荐领域的技术、应用以及仿真研究进行了文献综述,并根据研究结果提出了未来研究方向的预测,以期能够为个性化推荐及仿真领域带来帮助。

文献查找过程包括:在以“个性化推荐”为关键词的数据库检索中,万方数据库包括5 386篇,CNKI中包括3 496篇,SCI数据库中包括300篇,维普数据库中2 295篇。其中有很多数据库中的相关文献存在重复情况,因此通过手动检索,根据相关度选取74篇文献进行参考,其中包含SCI数据库19篇,万方、维普、中国知网55篇。所有外文文献均来自SCI数据库,文献大部分选自CSSCI、EI以及ISTIC。

1 个性化推荐技术研究现状

对于个性化推荐算法和模型,前人研究主要涉及了基于内容、协同过滤、知识、人口统计信息、效用、规则、二部图、社交网络的推荐算法以及混合推荐算法等。这些研究大多都要涉及模型构建,吴丽花等[1]在个性化推荐系统建模技术研究中提到,个性化推荐系统相较于非个性化推荐系统能够根据不同的用户或群体进行定制推荐,而且对于信息过载问题的缓解,前者也远远优于后者。因此,个性化推荐系统越来越受到大众重视。他们将推荐系统用户建模过程概括为数据收集、模型表示、模型学习和模型更新4部分,并且基于这些模块对推荐系统中常用的模型技术做了总结。例如向量空间模型、神经网络表示、用户-项目评价矩阵、本体模型、聚类技术、贝叶斯网络以及决策树归纳等,这些都为学者在推荐领域进行深入建模研究提供了借鉴。

1.1 聚类技术

前人研究表明,传统协同过滤推荐算法存在新用户冷启动、数据高度稀疏以及扩展性问题,这些都会导致系统推荐准确度降低,因此很多学者利用聚类等技术对传统算法进行了改进。常见的聚类技术包括K-means聚类、MI聚类、模糊聚类以及CURE层次聚类等,它们各有优缺点,但本质上都是通过不断分类迭代得到最优结果的过程,有助于缓解推荐中的问题并且提高推荐精确度。如Ajoudanian等[2]提出了一种新的模糊c均值聚类方法,利用最稀疏子图检测算法来定义聚类的初始中心,发挥了模糊逻辑的适应性,在精度、召回率和F-measure方面做出了更多进步。

1.2 矩阵分解及深度学习技术

矩阵分解技术有SVD分解、ASVD分解、概率矩阵分解、贝叶斯概率矩阵分解等。深度学习技术包括循环神经网络技术、卷积神经网络技术、受限玻尔兹曼机、深度信念网络技术以及自编码器等。例如,Zou等[3]运用贝叶斯个性化排序矩阵分解(BPR-MF)中的成对学习抽样策略,将显式反馈引入评分感知框架。然后在潜在因素模型理论基础上,把潜在因素、偏好因素以及属性因素融合进用户评分矩阵,缓解了冷启动问题。He等[4]为了改进基于用户评分矩阵的推荐过程,将贝叶斯网络与神经网络结合,提出了一种新的贝叶斯双神经网络框架,两个神经网络,一个是从评价矩阵中学习用户和物品的共同低维空间,另一个是将用户和物品的属性投射到另一个共享潜在空间。然后将两个输出结合起来,得到最终预测结果。Batmaz等[5]提到用户对项目评分时可能会有不同标准,而深度学习技术可以较好地提取用户与条目之间的非线性关系,因此,为了在多准则偏好下非线性地表示用户关系,提出了一种新的基于自编码的多准则协同过滤算法,提高了推荐准确性。

1.3 数据挖掘技术

数据挖掘技术中的遗传算法、Apriori算法、ART算法等也可以改善传统算法的问题,Duma等[6]提出了一种基于遗传算法(NNAISGA)的最近邻人工免疫系统,可通过快速输入数据弥补数据稀疏问题。除了利用关键技术缓解问题外,有学者针对特定情况提出了解决办法,如吕苗等[7]将情境重要度权重引入协同过滤算法,并且通过选择预测评分精度最高的修正预测评价函数初步预测缺失商品评分值。Zhou等[8]提出了一种新型协同成对学习排序法,即BPLR,将项目分割成积极反馈、潜在反馈和负反馈,旨在从隐式反馈中提高个性化排序性能。Liu等[9]针对个性化服务推荐中某些客户数据偏少问题提出了一种混合MPA-GSO-DNN模型来解决服务组合的个性化推荐问题,实验证明比起单一服务推荐,该方法更有效。Huang等[10]提到现有的CF研究大多集中在离线算法上,这些算法的一个主要缺点是缺乏利用最新用户反馈实时更新学习模型的能力,在互联网时代,在线推荐算法研究不可或缺,因此他们提出基于层次生成模型,推导出预测目标的一组局部和全局一致性约束,最终得到学习算法设计。实验证明,该方法能够在在线环境下提供推荐,并且执行速度要快几十甚至几百倍。

1.4 相似度计算

相似度计算是很多推荐算法的关键步骤,很多学者会从相似度切入进行算法改进。大多数相似度度量方法都可以在联合评价项的基础上快速计算,但是在稀疏数据集情况下,它们的预测精度并不令人满意。虽然充分利用所有评级信息可以有效提高推荐质量,但由于所有评级都需要计算,这就降低了系统效率。传统相似度计算方法包括欧式距离相似度、salton相似度、余弦相似度、皮尔逊相关系数、贴进度法等。还有在此基础上为消除用户评分主观性提出的修正余弦相似性、约束Pearson相关系数等。考虑到上述方法的偏差,还可以将几种相似度进行融合,如Guo等[11]等设计了一种混合商品相似度模型,在预测精度和效率之间权衡。既引入了谷歌相似度又采用了基于直觉模糊集的Kullback-Leibler (KL)相似度算法,保证了质量和效率同在。

1.5 特殊情况处理技术

在进行个性化推荐时可能会面临特殊情况,如移动数据推荐的处理、用户兴趣衰减或漂移问题以及跨领域推荐等。多Agent技术具有终端自适应特征,可以很好地处理多终端或者数据移动问题。例如,危世民,戴牡红[12]提出的多Agent协同电子商务推荐系统就改善了多终端情况下的推荐效率。李桃迎等[13]认为原Slope One算法没有考虑用户兴趣变化,由于人的兴趣变化符合艾宾浩斯遗忘曲线,因此在原有算法的基础上加入了用户兴趣遗忘函数,这也是改进后的Weighted Slope One算法的特点之一。用户遗忘函数可以用指数函数等代替。跨领域推荐时,通过知识转移可以将相关领域联系起来,从而实现跨领域推荐。Huang等[14]提出了一种新的低秩稀疏跨域推荐算法。为了弥补传统算法假定所有领域相关的不可实现性,通过区分不同域的特征来提高不相关域的推荐性能。Yu等[15]认为大多数推荐系统只利用来自用户或项目侧辅助域的信息。因此他们提出了一种利用辅助域的潜在因子空间扩展用户和项特征的跨域协同过滤算法并通过实验证明了该方案下系统性能指标的优越性。此外,在国外学者研究中还有一个比较新颖的方向,就是将人格特征与个性化推荐系统融合,然后预测消费者的购买行为。例如Baik等[16]通过分析用户在社交网络服务中的行为,为每个用户自动构建了用户性格特征预测模型。他们验证了公众自我意识、独特性、欲望和自尊四种人格特征的影响,并通过实验证明该预测模型的确能够更准确地了解用户。

2 个性化推荐应用领域研究现状

在各行业的个性化推荐应用中,电子商务行业的推荐相对更为成熟,也是学者们研究比较偏重的方向。下文对几个重要应用领域的个性化推荐研究相关文献做了梳理。

2.1 电子商务以及旅游业推荐

孙雨生等[17-18]先是从电子商务个性化推荐的内涵、内容、框架等方向研究了电子商务个性化推荐在模型、应用以及技术方面的进展。随后,他们又接着从用户的兴趣建模、推荐机制及信息资源管理3方面做了阐述,总结了目前电子商务个性化推荐核心技术的发展趋势。随着移动通信设备的兴起,移动电子商务也在不断发展。因此,电子商务个性化推荐要顺应移动环境的变化。杜巍等[19]将情景因素加入推荐系统,利用情景要素和项目推荐解决了移动电商环境下的个性化推荐问题。而黄逸珺等[20]则是以淘宝电商为例,从用户自身感受的角度去考察了电商领域内个性化推荐系统的应用效果,利用情景访谈方式使用户情感获取更为真实,最后通过感知有用性、易用性、舒适安全性等效果指标得出结论并提出了针对性建议。

情景因素是学者们经常用来改进算法性能的工具,在旅游推荐方面也不例外。张亚明等[21]在研究移动情景下的旅游推荐时提到,可以将情景因素进行分类然后加入到推荐系统中,将五类用户的情景信息进行分类并表示,在本体论基础上构建一个用户情景兴趣模型,利用云计算、Hadoop等分布式技术进行性能试验,证明了系统可行性。住处舒适度一直是旅客比较关注的点,由于互联网的发展,旅游业的线上房型推荐也趋于普遍,但传统算法的问题仍亟待解决。黄金超等[22]对传统基于内容的推荐算法做了改进,在原来算法的基础上,从用户历史信息和待推荐物品特征间的潜在关系角度出发进行推荐,减少了决策时间,提高了用户满意度。Ravi等[23]提出了一种新的基于位置的混合旅游推荐系统,该系统利用了基于集合的协同训练方法和群智能算法,并且研究表明该系统在实景中具有良好的推荐效果。

2.2 学习资源、新闻及电影推荐

丁永刚等[24]将学习者的社交网络与传统协同过滤算法结合,缓解了数据稀疏问题,很好地提高了推荐准确度。在进行个性化推荐时,很多学者都提到了粒子群推荐算法,并且针对该算法的问题进行了优化,李浩君等[25]认为基于二进制粒子群算法构建的资源推荐模型并没有很好地考虑到学习者和学习资源各自的特征,而且数据预测难度较大,因此他们提出将多维特征差异和协同过滤与粒子群算法结合,以此来满足学习资源推荐的需要。在学习资源推荐研究中,最普遍的是对图书馆图书推荐的研究,面对用户兴趣偏好漂移。刘海鸥等[26]针对多情境下用户兴趣变化特征提出了将蚁群算法与层次聚类技术结合共同进行图书推荐的方法,该方法还同时缓解了数据稀疏问题。

在用户打开一些电影播放软件时,通过推送可以更快更准确地找到自己所需要的电影。在电影个性化推荐方面,用户评论很关键,人们熟知的豆瓣等网站都是用户经常使用的评论和推荐网站,影评也不例外。从评论中能够获取用户的情感倾向,通过构建影评的本体知识库提取情感词,来建立情感分析推荐模型。姜霖等[27]利用豆瓣影评对此模型进行了实验,证明了推荐结果在合理性上的进步。袁仁进等[28]利用向量空间模型和聚类两种方法对新闻个性化推荐系统做了改进,用向量空间模型将新闻的内容进行量化,便于之后聚类分层,构建用户-新闻类别-新闻三层次兴趣模型,改善了用户新闻阅读体验。

2.3 农产品推荐

通过查阅万方数据库、维普数据库以及SCI数据库等,发现前人学者对农产品个性化推荐研究较少。传统协同过滤推荐算法的问题具体到农产品个性化推荐仍然存在,因此很多学者对此展开了针对性研究。郑云飞等[29]为了缓解数据稀疏性问题,在传统算法中加入了激励评分机制,提高了用户评分积极性,从而获得更多有用数据,更准确地进行农产品推荐。许贝贝等[30]利用用户相似度与内容相似度构建了新的算法模型。由于相似用户之间的兴趣偏好一般也会接近,因此当面临新用户时,可以通过分析与其相似的用户偏好进行推荐,缓解了冷启动问题。而内容相似度方面,学者们通过时间评分、最近邻、逆向最大匹配等一系列矩阵模块,丰富了内容向量模型,缓解了数据稀疏问题。裘进等[31]也是利用了基于内容的协同过滤改进思想,提出了一种基于物品的协同过滤改进算法。Zhu等[32]强调了计算机算法在农产品电商推荐中的重要性,构建了农产品特征模型和推荐算法,根据农产品特点,对传统的产品推荐流程进行优化,提高了推荐准确性。Li等[33]研究了Hadoop-based农产品电子商务推荐系统平台,指出Hadoop不仅可以解决大规模数据的存储问题,而且能够快速通过分布式计算分析用户行为数据从而发现用户兴趣,实现目标用户的精准营销。也有学者通过利用聚类等思想改进协同过滤算法来实现推荐精确度的提高。例如,Xie等[34]针对经典Apriori算法的不足,提出了一种新的加权模糊关联规则挖掘算法,以保证频繁项集的向下闭合。

再者,有学者对农业信息服务方面的个性化推荐进行了探讨。陈亚慧等[35]同时利用分类算法和个性化推荐算法,提出了一种针对农产品移动信息的个性化推荐算法,该算法利用决策树进行了农产品分类,之后再利用协同过滤算法,查找兴趣用户,完成个性化推荐。吴达胜等[36]对大数据背景下“三农”信息推送做了研究,由于了解这部分信息的一方为农民,而农产品销售过程容易出现信息不对称现象,因此为了更好地服务于农产品生产者,构建了“三农”个性化服务平台,保证为农产品生产者及时地推荐有用信息。还有学者对具体到某一类农产品的个性化推荐做了研究。吴国栋等[37]认为前人在研究茶产品的个性化推荐时并没有将农产品特征考虑进去,并且传统的推荐算法本身也存在一系列问题,因此,他们提出将评分与产品类别结合起来进行推荐,该方法的确提高了茶产品的推荐精确度。

3 个性化推荐仿真研究现状

就目前能够查阅到的文献来看,前人学者对这部分的研究着重点主要在两方面,一是改进传统推荐算法的仿真研究,二是对个性化推荐具体应用的仿真研究。

3.1 传统个性化推荐算法仿真改进研究

3.1.1 基于用户多兴趣与兴趣漂移改进的算法仿真

余力等[38]指出传统协同过滤推荐算法在面临用户多兴趣情况时,并不能很好地完成推荐,因此提出融合运用基于项目和用户的协同过滤推荐算法,先将项目进行相似度过滤,再基于用户进行过滤推荐,研究利用EachMovie数据库进行了仿真实验,试验表明该方法确实提高了推荐准确率。杨芳等[39]提出了一种用户多兴趣下的改进算法,将聚类思想与仿真实验结合,验证了算法有效性。前人研究表明用户兴趣会随时间推移而变化。胡伟健等[40]引入了一种增强的时间衰减模型,将其与改进后的欧氏距离相似度度量方法结合,保证了推荐时效性,并在不同数据集中进行了仿真测算,实验证明该方法提高了推荐准确度。王志虎等[41]根据用户的历史行为,将用户兴趣偏好进行初步分类,然后在每一个测算出用户偏好的项目上加上相应标签,最后计算项目相似度完成推荐,这种改进方法经仿真实验表明提高了推荐准确度,也缓解了数据稀疏等问题。张世显等[42]指出在计算用户相似度和评分推荐指标时,传统协同过滤算法存在很多欠缺,利用决策树策略和时间模型修正相似度计算方法,前者能够提高相似度计算准确性,后者则能够避免遗漏用户兴趣变化情况。Song等[43]认为目前很多多元化战略都在一个单一模式下运作,这也可能会导致忽略消费者偏好变化,使用了一个多类别实用程序模型,消费者对不同类别内容的偏好、一个类别的满意程度和希望用另一个类别替代它的速度,以及消费者如何发现新内容推荐列表这些要素都能够通过该模型获得。使用了clickstream数据集进行了仿真,实验表明该方法产生的建议平均比优化方案准确10%左右,比使用现有多样化方案准确25%左右。

3.1.2 加入信任因素的仿真改进

肖晓丽等[44]将用户进行聚类,然后利用社交网络中的信任关系创建相似度较高的邻居集合,这种既利用用户兴趣又利用社交网络进行过滤比单纯用一种方法进行过滤在推荐精确度更上了一层。那么,在利用社交网络进行个性化推荐时,对于如何使该方法效果更好。陆坤等[45]提出了一种融合隐式信任的协同过滤推荐算法,指出这种潜在信任关系既包含了用户本身活跃度也反映了用户间的喜好差异,经数据集仿真实验表明,该方法优于传统算法。廖列法等[46]利用隐式反馈数据提出了一种结合信任与相似度的排序模型,这种模型先通过受信度与相似度将新用户融入原本的信任网络,然后再进行修正和模型重构,缓解了冷启动问题,提高了推荐效率和准确度。

3.1.3 加入情境因素的仿真改进

个性化推荐算法如果从数据形式上分类,可分为显式反馈和隐式反馈数据,隐式反馈数据如果能够被很好地利用和挖掘,将会为个性化推荐做出不小的贡献。在分析情境因素对个性化推荐算法的影响时,金淳等[47]通过分析移动商务环境下的推荐系统,提出了一种基于Agent的顾客行为及个性化推荐仿真模型,通过仿真实验证明考虑情境因素确实会提高推荐精确度。张佳琳[48]认为情境因素的加入能够缓解传统算法中的信息共享度低和资源不足等问题,提出多场景融合的分布式推荐模型,将客户需求与服务场景进行双向刻画然后完成推荐,该模型在消费娱乐领域具有更高性价比。蔡海尼等[49]也在其提出的基于情境相似度和二次聚类的协同过滤推荐算法中强调了情境因素的重要性,通过数据集仿真实验验证了算法有效性。

3.1.4 其他

梅创社等[50]提出了一种改进的入侵野草优化算法,针对传统野草算法中的问题加入混合遗传算法,利用计算机仿真证明了算法优越性。高长元等[51]将CURE算法进行了改进,将原算法中数据处理部分改为用Map Reduce函数进行处理,在MIT Reality数据集上利用MATLAB进行仿真,得到的数据聚类效率和准确率的确有所提高,为个性化推荐发展提供了数据处理支持。章讯等[52]提出了一种基于连通性的局部随机游走重启动模型来改进原来推荐技术中偏离目标以及计算开销大等问题。张强等[53]提出了一种MI聚类方法对传统协同过滤算法进行了改进,经仿真实验表明该算法的准确率和召回率要优于传统算法。上下文感知推荐系统通过添加上下文信息来观察用户对上下文的不同偏好,从而做出推荐,但是在传统上下文感知算法中,所有上下文功能都赋予了相同权重,对此Li等[54]提出了一种基于改进随机森林算法的多维上下文感知推荐方法。具体改进是从多个按特征重要性分类的特征子空间中随机选择特征,这能够分解和减少用户、项目、上下文的上下文特征维度。文献中用LDOS-Comoda数据集和循环共享数据集进行了仿真,证明该方法能使两组数据的平均绝对误差和均方根误差分别降低2%~16%和2%~13%。

3.2 个性化推荐应用仿真研究

3.2.1 学习资源推荐仿真

很多学者以图书馆为例进行了个性化推荐仿真研究。陈康[55]针对图书馆推荐提出了一种基于Eclat算法的系统仿真实验,新算法利用了垂直数据表示和交叉计数优势,仿真结果证明了算法有效性。聂晓等[56]利用某高校数据库作为仿真实验研究对象,将改进ART算法应用于数据库知识自动推荐,发现该方法消耗资源较少并且效率较高。除了图书馆个性化推荐外。赵慧勤等[57]对泛在学习环境下的个人学习空间提出了一种基于情境感知的推荐模型,该模型采用了基于信息元组合的协同过滤推荐策略,并构建基于Android的个性化学习空间推荐系统原型进行了仿真探究,该探究提高了学习者学习效率并推动了智慧学习空间的深入研究。黄鹤[58]针对线上教育极速发展带来的海量学习资源推荐问题提出了一种基于 Mahout 的协同过滤算法,研究应用在KDD2010比赛中,结合教育数据挖掘,利用Apache Mahout的Taste 组件等仿真教育数据,实验表明效果预测良好。樊凌等[59]针对MOOCs中采用传统聚类方法造成的大数据聚类不准确问题,利用非线性时间序列将相似度参数对与大数据聚类结合进行最优聚类,仿真实验表明该方法聚类精度较高。此外,解敏[60]也提出了一种分聚类的图书馆移动信息资源面向用户推荐优化方法,以上方法经仿真实验证明,在图书推荐过程中都能取得良好效果。

3.2.2 网络资源推荐仿真

网络资源包括网络服务资源、云平台环境等。张靖[61]对网络个性化服务资源的推荐模型进行了MATLAB计算机仿真研究,具体模型是用户兴趣和资源描述模型,仿真表明该模型切实可行。Web服务的个性化推荐是推荐系统在网络服务环节的重要应用之一,其中,服务质量是一个关键点。江晓苏等[62]针对提出的服务选择函数进行了仿真研究,而用户感知延时是影响服务质量的因素。叶海琴等[63]对此提出了一种新的混合阶Markov模型来减小用户感知延时从而提高个性化推荐效率。目前,云服务提供商将越来越多的资源汇集起来然后发布到网络,使得云中海量资源库越来越庞大,想要从中寻找符合自己需求的资源也越来越复杂。马华等[64]提出了一种面向可信云服务的个性化推荐框架并通过实验仿真证明了该框架在云环境下的可行性。这种基于云平台的个性化推荐方法,应用于其他领域也能够为数据处理带来优化效果,在原本单种因素协同过滤推荐算法基础上,加入云平台算法进行改进,能够更大幅度提高推荐精度。罗娜[65]针对云平台与协同过滤算法提出了一种近邻项目最优临界点优化思路,通过优化多个近邻用户和项目提高了推荐精度。

3.2.3 电子商务推荐仿真

韩建妙等[66]针对超市中商品种类复杂问题,研究了如何使人们花费更少时间行走最短的路线来完成自己的购物需求,该研究针对遗传算法构建的超市最短导购路径进行了MATLAB计算机仿真实验。郑丹等[67]对林业产品个性化推荐做了仿真研究,提出一种weighted slope one用户聚类推荐算法以解决评分矩阵高维稀疏问题,在大数据Mahout平台进行了实际推荐。李聪等[68]提到在B2C电子商务网站上进行数据采集和分析时,传统方法会造成时间跨度大而数据失效问题,如果能够从多方面采集数据,那么将会大大缓解这个问题并提高推荐精度,对4种智能Agent、3条排序规则以及7类用户兴趣数据进行了仿真实验研究。在进行商品推荐时,利用隐式反馈能够挖掘用户潜在信息及其社交网络信息。周巧扣等[69]针对隐式反馈数据中用户购买商品的次数和时间在数据集上进行了多种隐式反馈数据仿真研究,进一步提高了推荐算法性能。

3.2.4 新闻业、雷达情报分发以及股票和手机应用推荐仿真

张瑞华等[70]在北京晚报、新京报和京华时报3种报纸上对他们所提出的改进K-近邻分类器个性化推荐算法进行了仿真测试,结果表明该模型推荐正确率可以达到70%。利用个性化推荐技术可以将情报进行过滤然后得到所需情报信息。余苗等[71]提出的TF-IDF算法和王相平等[72]提出的聚类技术都能够实现情报的个性化推荐,并且都在数据集上进行了仿真实验证明了算法有效性。茅斯佳等[73]针对基金经理为投资者进行股票个性化推荐问题做了仿真研究,提出了一种基于高阶奇异分解的个性化股票推荐算法,对真实股票交易做了仿真实验。现在智能手机发展迅速,涌现出了众多手机应用程序,对于移动应用程序推荐服务方面,学者们研究较少,作为一个新颖的研究方向。Xu等[74]针对移动应用程序中的用户信任行为推荐和隐私保护问题提出了两种基于信任评估的隐私保护移动应用推荐方案。在方案中他们使用了安全协议和同态加密来保护用户隐私数据,与此同时,他们开发了两个可应用于不同场景的移动应用程序,即集中式云服务和分布式社交网络。经仿真实验表明,该方案具有良好的安全性、高效性、准确性和鲁棒性。

4 结论与展望

总结了国内外有关个性化推荐系统的文献研究,从个性化推荐系统的技术、应用、仿真研究3方面进行了梳理。在总体技术与应用方面,除了最基本的推荐算法以外,大多数学者都是在传统算法基础上做出了改进,来应对在具体领域或者特定情况下的问题。个性化推荐发展到今天,从最初的电子邮件推荐扩展到了今天的电子商务、电影、学习资源、音乐、新闻娱乐以及旅游等行业,此外,个性化推荐研究也逐渐开始应用于一些鲜有人研究的领域,比如文化遗产、移动应用程序、电视节目的个性化推荐等。应用聚类技术、矩阵分解技术、深度学习技术等方法,从用户、内容、情境、社交网络(信任关系)、相似度、兴趣点等角度出发缓解冷启动、数据稀疏及扩展性等问题,比如有学者通过融合多种相似度或者利用贝叶斯矩阵分解来改善数据稀疏问题等。

在个性化推荐仿真方面,算法改进仿真主要包括融合多种算法的仿真研究,通过引入函数解决用户兴趣变化的仿真研究,利用聚类或修正相似度改进算法的仿真研究,以及引入情境、信任等因素的推荐仿真研究等。而在应用仿真方面,学习资源与电子商务推荐的仿真研究相对较多,旅游业以及其他有关国计民生的领域相对较少,比如农产品领域等。将仿真与个性化推荐结合对推动个性化推荐研究的发展具有重要意义,而通过以往文献来看,这方面的研究总体还是较少,因此本文根据梳理文献所得到的个性化推荐仿真研究现状一定程度揭示了下一步的研究方向,希望能够为个性化推荐与仿真及营销领域带来借鉴。

4.1 结合区块链技术的个性化推荐仿真研究

区块链是当前一大热点问题,习近平主席在中央政治局第十八次集体学习时提到要把区块链作为核心技术自主创新重要突破口,而区块链技术中的点对点组网技术、时间戳技术、非对称加密技术等都能够对个性化推荐过程中的数据采集及挖掘、数据保护、数据保存、用户隐私保护问题提供帮助,从而有利于个性化推荐仿真过程的开展,将区块链与仿真结合共同构建系统,模拟真实推荐场景,将会成为个性化推荐领域研究的创新点。

4.2 面向移动数据实现精准实时推荐仿真建模研究

目前,由于移动通信设备和互联网行业的蓬勃发展,移动数据充斥着我们的生活,现在不仅可以通过移动手机浏览新闻、随时随地购物以及订阅酒店等,而且旅游业和餐饮业都开始发展移动业务,比如移动餐厅等。此时,人们所处的具体环境对所偏好的推荐影响尤为重要,如果可以利用仿真实时模拟真实推荐环境,将实时变动的各类因素加入仿真模拟中,就能实现有效利用移动信息技术及大数据挖掘技术开展符合顾客需求的精准实时推荐。

4.3 结合用户信任或情境因素的农产品个性化推荐仿真研究

首先,通过梳理国内外农产品个性化推荐的相关文献,发现在利用用户相似度对农产品进行推荐时,目前学者们仍然只在关注用户本身的相似度或者内容的相似度,很少考虑农产品本身的特点,而且对农产品进行个性化推荐仿真的研究极少,为了避免单一考虑相似度造成数据稀疏等问题,以及考虑到对于农产品来说,用户对其质量安全的要求比起其他产品要更高的特点,提高用户对于推荐的信任度很关键,将社交网络中的信任关系加入用户相似度计算并进行仿真模拟,通过仿真实验能更好地观察用户信任相似度对整个推荐过程的影响。

其次,情境感知也是改进个性化推荐算法以及弥补传统算法不足的重要角度。而且将情境中包括的天气、时间、地点、季节、地域特征、物流条件等因素在推荐系统中进行仿真训练与实验,更能直观地反映推荐效果。但在农产品个性化推荐的相关研究中很少提到情境因素的影响,对于农产品来说,情境因素会影响用户对农产品的选择,因此可以尝试将情境因素加入农产品个性化推荐系统中进行仿真建模研究或者仿真实验观察,有望促进农产品销售难及农产品供需信息不对称等有关国计民生重要问题的有效解决。

猜你喜欢
聚类个性化算法
哪种算法简便
一种融合PageRank和PersonalRank的多层个性化推荐算法
坚持个性化的写作
Travellng thg World Full—time for Rree
进位加法的两种算法
根据问题 确定算法
数种基于SPSS统计工具的聚类算法效率对比
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
上汽大通:C2B个性化定制未来