基于个性化自适应的网络混合式信息推荐

2021-11-17 06:44:14颖,韦
计算机仿真 2021年4期
关键词:个性化算法用户

刘 颖,韦 妙

(湖北工业大学,湖北武汉 430000)

1 引言

现如今,信息推荐系统已经全面应用到了各大电子商务网站中,许多线上商家都希望将网络游客变成消费者,信息推荐系统应用到电子商务平台中,是通过学习消费者(即用户)的偏好特征,更好地为广大消费者服务,如何利用社交网络来改进信息推荐系统的相关模型和算法已经成为学术界的重要研究方向[1]。

国外为了推动信息推荐系统的研究,提出了大量的信息推荐算法和用户行为学习算法,进一步推动了学术界对信息推荐系统的研究,美国还将信息推荐系统应用到了社交网络中,为信息推荐系统的长久发展带来了新的挑战和动力[2];国内很多学者也针对信息推荐系统进行了大量的深入研究,开始是将个性化服务技术引入到信息推荐系统中,通过比较现有信息推荐系统的执行程序,设计了信息的个性化推荐算法,并取得了非常优秀的成果[3]。文献[4]针对个性化信息推荐存在的问题,在分析个性化信息推荐的概念、方法以及自适应方面,引入了认知计算和情境感知,提出了个性化信息推荐模型和框架,并深入了个性化信息自适应推荐的内涵,通过认知计算和情境感知的观点和方法,将认知计算和情境感知融合,提取出用户的偏好特征,在认知计算和情境感知的基础上,构建了个性化信息自适应推荐模式框架;文献[5]针对传统协同过滤算法在混合推荐中存在用户兴趣描述粒度过大的问题,提出了将增量学习应用到混合推荐算法设计中,通过增量学习建立了基于内容的用户模型,结合协同过滤推荐机制实现了混合信息的推荐,实验结果验证该推荐算法在收敛速度和准确性上得到很大提高。基于以上背景,本文将个性化自适应应用到了网络混合式信息推荐中,从而提高网络混合式信息推荐能力。

2 网络混合式信息推荐方法设计

2.1 模块化处理网络混合式信息

如果将网络混合式信息推荐作为一个系统,模块化处理是指区分网络混合式信息推荐的关键因素,并且合理分析模块中的子因素[6]。

令采用n个子因素序列来处理网络混合式信息推荐的影响因素时,会形成一个基于个性化自适应学习的模块化矩阵,即:

(1)

式中,m表示个性化自适应学习子因素。采用个性化自适应学习对子因素序列进行模块化处理,可以得到:

(2)

分别计算每一个子因素序列对应的关联系数均值,来反映网络混合式信息与子因素序列之间的关联关系[7],将其称为关联序列,记作

(3)

式中,Si(k)表示网络混合式信息模块i中的第k个因素,计算子因素uij对于网络混合式信息的推荐效用为

(4)

式中,arcmaxSi(j)表示网络混合式信息推荐最大值,Si(j)表示最大值系数,ri0表示网络混合式信息集中划分出来的网络混合式信息的统计数目。利用耦合度函数来研究网络混合式信息之间的耦合关系[8],不同网络混合式信息之间的耦合度可以表示为

(5)

其中Tm的取值在0~1之间,um表示网络混合式信息的总推荐效应,计算公式为

ui=λij×uij

(6)

式中,λij表示混合式信息耦合因子。虽然利用式(6)可以计算出网络混合式信息之间的耦合度,但是通常情况下无法反映出个性化自适应水平对网络混合式信息推荐的状态,因此,构造一个耦合协调度函数[9],来计算网络混合式信息之间的耦合程度,构造的协调度函数为

(7)

式中,A表示耦合协调度函数,Tm表示网络混合式信息的耦合度,F表示协调指数,α和β表示网络混合式信息对总体的推荐权重。

采用模块化矩阵对子因素序列进行模块化处理,计算出每一个子因素序列对应的关联系数均值,利用耦合度函数研究了网络混合式信息之间的耦合关系,完成网络混合式信息的模块化处理。

2.2 计算网络混合式信息的相似度

在求解网络混合式信息的相似度时,主要采用向量空间法,通过判断网络混合式信息的权重值是否高于提前设定好的门限值[10],如果网络混合式信息的权重高于门限值,那么将该信息提取出来作为推荐信息。网络混合式信息的权重计算公式为

Weight(t)d=[α(t)d+β(t)d]×TFIDF(t)d

(8)

式中,Weight(t)d表示网络混合式信息d中词语t的权重,α(t)d和β(t)d表示网络混合式信息的加权系数,分别表示词语t在网络混合式信息d中的标题权重和收尾权重,对于词语t在网络混合式信息d中的TFIDF值,可以通过式(9)计算,即

(9)

式中,Nk表示网络混合式信息集中的信息数量,TF(t)d表示词语t在网络混合式信息d中出现的词频数,ni表示网络混合式信息集中包含词语t的所有网络混合式信息的数量。

通过个性化自适应学习将网络混合式信息之间的相似度定义为

(10)

式中,C表示网络混合式信息中关键词语集合,通过计算两个网络混合式信息si与sj之间相同关键词数量与总关键词数量之间的比值,来确定两条网络混合式信息的相似度。通过式(10)可知网络混合式信息相似度的取值范围在0~1之间,其中0表示两条网络混合式信息完全不相似,1表示两条网络混合式信息完全相似。

通过计算整个网络混合式信息集中任意两条网络混合式信息的相似度,可以得到信息集中网络混合式信息的相似度分布情况[11],采用以下矩阵来表示

(11)

式中,snm表示网络混合式信息sn与sm之间的相似度。

通过判断网络混合式信息的权重值是否高于提前设定好的门限值,计算了网络混合式信息的权重,通过定义网络混合式信息之间的相似度,得到信息集中网络混合式信息的相似度分布情况,计算了网络混合式信息的相似度,接下来通过设计网络混合式信息推荐算法,来实现网络混合式信息的推荐。

2.3 设计网络混合式信息推荐算法

用户发布的每一条信息都会涉及一个主题或多个主题,用户信息发布的特征与网络混合式信息的主题模型相匹配[12]。因此,采用主题模型来判断用户发布信息的主题分布,从而初步判断用户的兴趣取向。

对于网络混合式信息的主题分布,定义C={C1,C2,…,CT}表示网络混合式信息的主题集合,对于一条网络混合式信息t,后验概率为p(Ci∣t),因此,由后验概率构成的网络混合式信息的主体部分向量为(p(C1∣t),p(C2∣t),…,p(CT∣t)),T表示网络混合式信息的主题集合个数。对于用户的兴趣取向来讲,假设{t1,t2,…,td}表示用户发布的网络混合式信息集合,那么T维向量(v1,v2,…,vT)表示用户对网络混合式信息的兴趣取向,计算公式为

(12)

根据用户的兴趣权重,利用个性化自适应学习对vi进行改进,得到

(13)

假设网络混合式信息t是由n个单词组成的,第n个单词记为wn,将wn的主题定义为zwn,那么zwn的概率计算为

(14)

在式(14)的基础上,单词wn的主题分布为Vwn=(v1,v2,…,vT),那么vi的标准化概率为

(15)

网络混合式信息t属于第j个主题的概率为

(16)

根据θt,j可以定义M个周期内,用户的平均偏好相似度

(17)

式中,sim(uk-1,uk)表示用户的平均偏好相似度因子。为了便于比较,可以将用户的平均偏好相似度进行个性化自适应学习处理,计算用户的偏好相似度

(18)

式中,uk-1表示个性化自适应学习处理权值,μk表示个性化自适应学习偏好权值。综上所述,利用个性化自适应学习改进了网络混合式信息的兴趣取向,通过计算用户的偏好相似度,设计了网络混合式信息推荐算法,实现了网络混合式信息的推荐。

3 实验分析

3.1 建立实验数据集

实验数据来自某一网站的部分数据,包括1000名用户以及3000条用户发布的信息,实验数据集包括网络混合式信息类型、发起时间、网络需求、点赞数、评论数、粉丝量和浏览量。将实验数据分为训练集和测试集两部分,首先设置为用户推荐的网络混合式信息为20条。根据测评方法来测评网络混合式信息,将实验结果数据展示出来,仿真环境如图1所示。

图1 仿真环境图

3.2 对比网络混合式信息推荐方法

本文将个性化自适应学习应用到了网络混合式信息推荐算法中,将其与文献[4]网络混合式信息推荐算法和文献[5]网络混合式信息推荐算法进行对比,通过计算混合式数据值来对比信息推荐算法的性能,混合式数据值越低,说明网络混合式信息推荐算法的性能,实验结果如表1所示。

表1 混合式数据值对比结果

表1的实验数据表明,基于个性化自适应的网络混合式信息推荐算法的Perplexity 值要小于其两种信息推荐算法,说明该算法的性能更好。

3.3 离线计算推荐实验

将推荐的网络混合式信息记作用户感兴趣的信息为N,推荐的网络混合式信息总数为M,没有被推荐的网络混合式信息但用户感兴趣的网络混合式信息数目为N′,那么准确率和召回率计算公式分别为

(19)

(20)

用K来表示相似用户的个数,通过取不同的K值,进行实验,得到实验结果如表2所示。

表2 网络混合式信息推荐方法在不同K值下的性能

从表2的结果可以看出,相似度较高的用户数为80个时,网络混合式信息推荐的准确率和召回率都是最高的。为了验证基于个性化自适应的网络混合式信息推荐方法的优势,与文献[4]网络混合式信息推荐方法和文献[5]网络混合式信息推荐方法进行了对比测试,对比结果如表3所示。

表3 信息推荐方法的性能对比

从表3的结果可以看出,基于个性化自适应的网络混合式信息推荐方法的性能要优于其两种信息推荐方法,网络混合式信息推荐的准确率和召回率都有所提高。

3.4 在线个性化推荐实验

在线个性化推荐实验数据集选取某网站的1000个注册用户,利用数据预处理技术将点赞、转发和评论转化为用户的兴趣偏好作为实验的测试集,其余的数据作为训练集。引入覆盖率作为信息推荐性能的指标,覆盖率计算公式为

(21)

式中,Nd表示用于推荐的网络混合式信息数量,Nv表示网络混合式信息总数。

计算1000名用户的网络混合式信息的平均准确率、召回率和覆盖率,并与文献[4]网络混合式信息推荐方法、文献[5]网络混合式信息推荐方法进行对比,结果如表4所示。

表4 在线推荐方法性能

从表4的结果可以看出,基于个性化自适应的网络混合式信息推荐方法在推荐性能上,明显优于其两种推荐方法。

综上所述,基于个性化自适应的网络混合式信息推荐方法在用户满意度方面的优势更高,在准确率、召回率以及覆盖率方面也都具有明显的优势,说明基于个性化自适应的网络混合式信息推荐方法的性能更好。

4 结束语

本文提出了基于个性化自适应的网络混合式信息推荐,结果显示,该推荐方法具有更好的推荐性能,并且在网络混合式信息的推荐精度和个性化自适应学习方面优于其方法,准确率、召回率以及覆盖率较高。然而在以后的研究中,还需要进一步提高网络混合式信息的推荐效率,从而满足大部分用户的需求。

猜你喜欢
个性化算法用户
坚持个性化的写作
文苑(2020年4期)2020-05-30 12:35:12
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
新闻的个性化写作
新闻传播(2018年12期)2018-09-19 06:27:10
上汽大通:C2B个性化定制未来
关注用户
商用汽车(2016年11期)2016-12-19 01:20:16
关注用户
商用汽车(2016年6期)2016-06-29 09:18:54
一种改进的整周模糊度去相关算法
关注用户
商用汽车(2016年4期)2016-05-09 01:23:12