杨瑞仙 黄书瑞 王彰奇
摘 要:[目的/意义]针对目前学术虚拟社区存在对核心用户兴趣变化关注不足的问题,本文基于艾宾浩斯遗忘曲线构建用户兴趣迁移模型,以准确描述核心用户的兴趣迁移,提升对核心用户个性化推荐结果的准确率。[方法/过程]以“小木虫论坛”为研究对象,构建用户影响力评估指标和问答网络,分别利用熵权法和PageRank算法识别核心用户。在此基础上,基于艾宾浩斯遗忘曲线构建核心用户兴趣迁移模型,并对此模型的适用性进行验证。[结果/结论]本文所构建的核心用户兴趣迁移模型能更好地反映核心用户的兴趣迁移。
关键词:学术虚拟社区;用户兴趣迁移模型;小木虫;熵权法;PageRank算法;核心用户识别;艾宾浩斯遗忘曲线;协同过滤算法
DOI:10.3969/j.issn.1008-0821.2021.02.002
〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2021)02-0010-09
Abstract:[Objective/Meaning]Aiming at the current academic virtual community's insufficient attention to changes in core user interest,this paper builds a user interest transfer model based on the Ebbinghaus forgetting curve to accurately describe the core user's interest transfer and improve the accuracy of personalized recommendations for core users.[Method/Process]The paper took the“emuch BBS”as the research object,constructed user influence evaluation indicators and question-and-answer network,and then respectively used entropy method and PageRank algorithm to identify core users.On this basis,the core user interest transfer model was constructed based on the Ebbinghaus Forgetting Curve,and the applicability of this model was verified.[Results/Conclusions]The core user interest transfer model constructed in this paper could better reflect the core user's interest transfer.
Key words:academic virtual community;user interest migration model;emuch BBS;entropy weight method;PageRank algorithm;core user identification;ebbinghaus forgetting curve;collaborative filtering algorithm
随着互联网的发展,网络空间发展理念逐渐由面向数据转变为面向用户。如今,随着社交媒体的出现,经管之家(原人大经济论坛)、科学网博客、小木虫学术科研互动平台(以下简称“小木虫论坛”)等学术虚拟社区逐渐成为科研人员涉足的非正式科研交流新场所。在学术虚拟社区中,用户可以通过发文、点赞、回复以及转发等形式发布与科研相关的知识,社区内的用户可在短时间内完成知识交流的过程,其时效性和交互性逐渐受到科研人员的青睐[1]。随着用户逐渐成为学术虚拟社区的核心,学术虚拟社区能够吸引多少用户成为该社区是否成功的一项重要衡量指标。然而,信息的爆炸式增长使得用户在海量数据中获取其感兴趣内容的需求难以满足,进而导致用户对社区的关注度缺失[2]。在此背景下,学者们开始关注从海量数据中挖掘具有潜在价值的信息和知识的研究,并提出了用户个性化服务的概念。用户个性化服务是以用户为本,通过各种渠道收集、整理和分类用户的历史行为数据,了解用户的兴趣,向用户推荐相关信息,以满足用户的信息需求。对用户兴趣的研究是精准化推荐的重要基础,用户兴趣模型的好坏直接影响着相关分析和服务的準确度。
学术虚拟社区中的核心用户指在人际传播中为他人提供信息,同时也对他人施加影响的“活跃分子”[3],他们既是信息传播过程中的主要扩散者,也是权威起源者,由此形成了社交网络中的信息级联传播,这在社交网络的知识传播交流过程中发挥着至关重要的作用。由于学术虚拟社区信息资源的极大丰富和核心用户在知识交流过程中的关键地位,识别学术虚拟社区中的核心用户,并根据他们的历史行为信息了解他们的兴趣偏好,以实现对核心用户的个性化推荐,对社区的建设和发展而言显得尤为重要。
协同过滤推荐算法可以根据用户历史行为数据挖掘用户的兴趣偏好,预测用户可能感兴趣的内容并向其推荐,实现对用户的个性化推荐,并在电子商务中得到了广泛应用[4]。本文通过协同过滤算法计算核心用户兴趣迁移模型推荐结果的准确率,进而评估模型性能。
在学术虚拟社区中,“小木虫论坛”拥有良好的交流氛围及丰富的学术资源,已成为最具影响力的学术虚拟社区之一。为此,本文主要以“小木虫论坛”为研究对象,通过构建用户影响力评估指标体系和问答网络识别学术虚拟社区中的核心用户;利用用户的发帖相关信息构建核心用户兴趣迁移模型;通过协同过滤算法验证该模型的合理性,为社区的建设和发展提供参考建议。
1 相关研究
相关学者通过文献调研发现,有关核心用户兴趣的研究是个性化信息服务的重要基础,深入分析核心用户兴趣是精准化信息投放的有力保障。Koren Y和Liu J等[5-6]认为用户的兴趣偏好可能随时间变化,一些学者提出部分存储模型描述用户兴趣随时间变化的现象[7-8]。如于洪涛等[9]基于遗忘曲线提出了用户兴趣模型,认为用户所关注信息距离当前时间越远越容易被遗忘,用户关注某领域的信息越多,对该领域的兴趣度越高;董晨露等[10]根据用户评论将遗忘曲线引入传统过滤算法中,利用遗忘曲线描述用户兴趣迁移;王占等[11]综合用户信任度、用户相似度以及用户兴趣迁移,为目标用户推荐项目。相关研究表明,目前有关用户兴趣随时间变化的研究大多从用户在以往某个时刻与当前时间的时间间隔角度计算用户在不同主题方向的兴趣度变化,有关用户在相邻时间窗兴趣变化的研究尚显不足,这不利于准确把握用户兴趣随时间的变化。此外,针对核心用户兴趣迁移的研究较为匮乏。
已有研究表明[12-14],用户原创主题帖内容丰富,能够在很大程度上体现用户的兴趣方向,对用户发帖信息进行研究具有重要意义。由此,本文首先获取“小木虫论坛”的相关数据项,利用熵权法计算用户的影响力,构建用户问答网络,利用PageRank算法计算用户在社交网络中的重要性,进而识别核心用户;同时基于艾宾浩斯遗忘曲线建立核心用户兴趣迁移模型。此研究为提高学术虚拟社区用户粘性,促进学术虚拟社区的建设和发展具有一定参考意义。
2 研究方法
本文主要采用熵权法计算用户影响力,在此基础上构建用户问答网络,利用PageRank算法计算用户在问答网络中的重要性,进而识别核心用户。在此基础上,采用艾宾浩斯遗忘曲线计算不同时刻用户在各主题方向的兴趣度,构建核心用户兴趣迁移模型,并通过实验验证此模型的性能。
2.1 核心用户识别方法
2.1.1 熵权法
熵权法是一种以信息熵为权重标准,计算各指标权重的方法。熵是表征系统无序程度的一个度量,香农最早将其引入信息论中。根据信息论的基本原理,信息是系统有序程度的一个度量,因此称熵的度量值为信息熵[15]。信息熵可用于度量随机指标的不确定程度,以解决信息量度量的问题。某一指标的信息熵越小,该指标提供的信息量越大,在综合评价中的作用越大,权重越高[16]。因而,可利用熵权法确定各指标的权重,以减少主观因素对指标权重的影响,进而使评价结果更为客观。
本文利用熵权法确定各指标权重的过程如下:
1)原始數据标准化。对原始数据的标准化处理公式见式(1):
式(1)中,xij表示原始数据第i个评价对象的第j个评价指标;yij表示标准化后第i个评价对象在第j个指标的值。
2)计算指标j的熵值,见式(2):
3)计算指标j的权重。ej值越小,表明指标效用价值越高,在评价指标体系中所起的作用越大,权重也就越高。指标j的权重见式(3):
4)各指标加权计算综合得分。利用加权和公式计算样本的得分或评价值,见式(4):
2.1.2 PageRank算法
PageRank算法是一种由搜索引擎根据网页间的超链接计算网页重要性的技术。近年来大量研究都致力于利用改进的PageRank算法挖掘社交网络中的核心用户[17]。本文利用PageRank算法网页排名的这一特性体现问答网络中节点的相关性和重要性。
PageRank算法通过网络的超链接关系确定一个页面的等级,把从A页面到B页面的链接解释为A页面给B页面投票,根据投票来源和投票目标的等级确定新的等级。简单地说,一个高等级页面可以提升其他低等级页面的等级。PageRank算法如下,假设有一个由A、B、C和D这4个页面组成的小团体,如果所有页面均链向A,那么A的PageRank值(以下简称PR值)就是B、C、D的PR值之和,即PR(A)=PR(B)+PR(C)+PR(D)。假设B也有到C的链接,且D也有链接到包括A的3个页面,由于一个页面不能投票2次,所以B给每个页面投半票。同理,D的投票只有1/3算到了A的PR值上,此时A的PR值为PR(A)=PR(B)2+PR(C)1+PR(D)3,即根据链出页面的总数评估一个页面的PR值,即如果L(X)表示从X链出页面的数量,那么PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)。
为保证链出页面的公平,本文规定阻尼系数(Damping Factoe)q为常规值0.85,其表示用户在任意时刻达到某页面后继续向后浏览的概率。1-q表示用户停止点击,随机跳转到新页面的概率。Google通过数学系统给每个页面一个初始PR值,其计算过程如式(5)所示。
式(5)中,p1,p2,…,pN指被研究页面,网络中存在由页面pj指向pi的链接,L(pj)是pj链出页面的数量,N是所有页面的数量,q为阻尼系数。
所有页面的PR值是特殊矩阵中的特征向量,这个特征向量可表示为:
式(6)中,φ(pi,pj)=1L(pj),如果pj不链向pi,且对每个j都成立,那么φ(pi,pj)=0,且∑Ni=1φ(pi,pj)=1。
因此,一个页面的PR值由其他页面的PR值计算所得,如果每个页面有一个随机的PR值(非0),那么经过不断地重复计算,这些页面的PR值会逐渐趋向于正常和稳定。
2.2 遗忘曲线
在分析用户兴趣的背景下,遗忘曲线是指用户兴趣偏好程度随时间逐渐衰减过程的数学函数[18]。德国心理学家Hermann E[19]通过对人类大脑接触新事物时的遗忘规律进行系统实验和深入分析,提出了反映人类中长期记忆的艾宾浩斯遗忘曲线,并对记忆时效随时间的变化特征加以描述。艾宾浩斯遗忘曲线可以反映人们的兴趣偏好或记忆随时间增长慢慢减弱的变化[20],有学者采用负指数曲线对其进行拟合,其量化函数如式(7)所示。
式(7)中,p0为初始记忆量,k为遗忘速率,用以反映遗忘曲线衰减速度的差异[21]。
2.3 协同过滤算法
协同过滤推荐算法是根据其他用户的观点对目标用户推荐其感兴趣话题的算法,它基于这样一个假设[22]:如果用户对一些项目的评分较为相似,则他们对其他项目的评分也较为相似。协同过滤推荐算法使用统计技术搜索目标用户的若干最近邻居,然后根据最近邻居对项目的评分预测目标用户对项目的评分,并产生对应的推荐列表。为找到目标用户的最近邻居,首先度量用户间的相似性,然后选择相似性最高的若干用户作为目标用户的最近邻居。目标用户最近邻居查询的准确性直接关系到整个推荐系统的推荐质量。
在推荐系统中,用户对所有产品评价的数据库中包含s个用户的集合U={U1,U2,…,Us}和t个产品的集合I={I1,I2,…,It}。用户评分数据集表示为一个s×t阶的矩阵,如表1所示。本文主要研究不同时刻用户在各主题方向的兴趣度,故将用户发帖的主题方向视为产品评价中的产品,将某一时刻用户在不同主题方向的兴趣度视为用户评分,在此基础上展开研究。
用户—发帖主题方向兴趣度矩阵中共有s行代表s个用户,t列代表t个发帖主题方向。假设某一用户Ua对发帖主题Ij(其中Ua∈U,Ij∈I)的兴趣度为Ra,j,这个兴趣度体现了用户Ua对主题方向Ij的兴趣和偏好程度。
2.3.1 相似性度量方法
相似性计算可以是在用户间的相似性计算,也可以是产品间的计算[23]。本节中以用户间的相似性研究为例,即基于用户的协同过滤算法。余弦相似性可通过向量间的余弦夹角计算度量,其计算过程如式(8)所示。
式(8)中,Ra,k表示用户Ua对主题方向Ik的兴趣度,Sim(Ua,Ub)表示用户间的相似性,它的取值范围在[0,1]区间中,Sim(Ua,Ub)的值越大,表示用户Ua和Ub间的相似性越大。
2.3.2 最近邻(KNN)协同过滤算法
KNN协同过滤推荐算法是采用k个最相似的近邻用户预测兴趣度的一种算法。通常推荐系统对某一用户Ua主要有两个任务:
1)在用户发帖主题集中,选择某一用户a未曾发过的主题方向Ij,Ij不属于Ra,j。
2)在用户未发过的主题帖中,预测用户兴趣度最大的N个主题方向(N≥1),选择推荐给用户。
通过计算用户间的相似性,基于用户的协同过滤算法为未知的Ij寻找k个近邻,即与Ua最相似的k个用户,定义为:S(Ua)且S(Ua)=k,以预测用户在某个主题方向的兴趣度,该算法的实现过程如式(9)所示。
式(9)中,a、b分别表示用户Ua、Ub对其他主题方向兴趣度的均值,Rb,j表示用户Ub对主题方向Ib的预测兴趣度。
3 核心用户兴趣迁移模型构建
3.1 核心用户识别
在识别核心用户前,本文首先根据用户在学术虚拟社区中的行为信息,从用户积极性和权威性两个维度构建用户影响力评估指标,然后采用熵权法计算用户在学术虚拟社区中的影响力,并在此基础上构建用户间的问答网络,利用PageRank算法计算用户在社交网络中的重要性,识别社区中的核心用户。
3.1.1 用户影响力评估指标构建
本文在进行学术虚拟社区用户影响力计算前,首先构造学术虚拟社区用户影响力的评估指标,用户影响力包括用户积极性和权威性两个一级指标,其中用户积极性包括用户应助数、散花数、发帖数、沙发数4个二级指标,用户权威性包括听众人数、红花数、贵宾值、金币数4个二級指标,如表2所示。
3.1.2 问答网络的构建
在大多数识别核心用户的文献中,社交网络分析法具有较为明显的优势[24]。为了在学术虚拟社区中综合性地识别核心用户,本文借鉴郭博等的研究思路[25],结合“小木虫论坛”的数据特征,利用学术虚拟社区中用户间的问答互动行为信息,构建了一个基于用户间问答关系的问答网络结构。根据已建立的学术虚拟社区网络结构,本文首先计算问答网络中每位用户的影响力,在此基础上结合用户问答网络结构利用PageRank算法计算社交网络中每位用户的重要性,以挖掘学术虚拟社区中的核心用户。该研究过程及其框架如图1所示:
3.1.3 用户PageRank综合值计算
PageRank算法是数据挖掘领域较常见的一种算法,该算法利用每一页面的权威值评估网页在网站中的重要性。页面的权威值被定义为指向该页面的其他页面平均分配给该页面的权威值之和,通过迭代计算可以得到该网页最终等级划分[26]。假设用户在问答网络中均与其他用户具有相应的交互关系,本文将PageRank算法的思想用于计算社交网络中每位用户在社交网络中的重要性。
学术虚拟社区中的问答网络为加权有向网络,由于问答网络需要考虑边的权重,因此在计算时需要在每个顶点形成权威值的不对等传递,以真实地反映每位用户的影响力。将两个顶点之间的边权重表示为式(10):
式(10)中,p(i)为利用熵权法根据用户的积极性和权威性计算的用户影响力,Nij为用户i与用户j在问答关系中出现的频次。本文根据传统的PageRank算法式(7)将每个顶点i在问答网络中的综合值QR(i)可以表示为式(11):
式(11)中,α为阻尼系数,在大多数情况下α取值为0.85[27]。本文将控制迭代结束的参数e设定为10-7。
3.2 兴趣迁移模型构建
用户兴趣偏好随时间的衰减过程与艾宾浩斯遗忘率的相关概念类似[18],当用户刚接触某类别内容时,可认为此刻用户对该主题方向的兴趣度最高,然而随着时间的推移,若在一定时间内没有持续的刺激,用户在该主题方向的兴趣度将会持续衰减,直至用户的整体兴趣度保持在有效记录时间窗外的长期兴趣度水平。在用户兴趣偏好变化理论的基础上,本文通过定义遗忘曲线、时间窗与衰减率将时间因子与用户兴趣建立联系。参照式(7)用户兴趣衰减阶段,本文将以上过程用数学公式进行描述,则用户兴趣度的量化函数如式(12)所示。
式(12)中,Wtn-1为处理本条记录前一刻用户的兴趣度,θ是衰减因子,t0是有效记录的起始时间。
同时,在用户兴趣衰减的过程中,若在对应兴趣类别下有新数据加入,即用户在有效记录时段多次发布此主题方向的内容,根据式(12),用户兴趣度的变化情况如图2所示。图2中t1、t2、t3分别表示用户3次发帖的主题方向内容以及用户兴趣加入的时刻,整个兴趣度变化呈现为分段函数,每一阶段均为1次新函数的衰减过程。以(t1,t2)和(t2,t3)的两个衰减过程为例,两衰减过程的主要区别是本阶段的起始位置p1和p2,每次加入新条目后的增量h1和h2,以及衰减率θ,根据这些指标即可计算任意时刻用户的兴趣度。
图2 用户兴趣的变化趋势图
由图2可知,在给定时间窗内,第n个衰减过程的起始位置pn是由上一衰减过程的剩余量rn-1与本次激励下兴趣度的增长量hn叠加而成,其起始位置的计算方法如式(13)所示。
对于每次激励下用户的兴趣度增长量hn,因用户在重复发表某一主题方向的内容时,每次提升的兴趣度并不等量,随着重复次数的增加,用户在此方向的兴趣度总量不断增大,且这一增加过程逐渐趋于平缓,并最终收敛于某最大值。由此可知,在一定时间内,用户所发布的特定主题方向的帖子记录越多,每次兴趣度的增量越少,可使用负指數函数对该过程进行描述,则每次激励下用户兴趣的增量如式(14)所示。
由式(7)、(12)~(14)可得用户在任意衰减过程中的兴趣度初始值,如式(15)所示。
用户兴趣度能体现出用户对该主题方向的兴趣程度,但从用户发帖标签中提取的用户兴趣则需要考虑时效性。在实际分析过程中,研究人员通常以自分析时刻起,相邻一段时间(如30天)的行为记录作为用户兴趣偏好的分析目标。p0为用户兴趣增量的初始值,衰减率θ设定为时间窗长度的倒数。
4 实证研究
4.1 数据来源
本文以“小木虫论坛”为研究对象,首先利用Python程序分别获取“小木虫论坛”中“有机交流”“第一性原理”“微米和纳米”“金融投资”4个版块所有用户的url;然后访问获取用户的url,提取出用户id、性别、生日、专业、分组等用户背景信息,用户应助数、散花数、发帖数、沙发数等用户积极性信息,用户听众人数、红花数、贵宾值、金币数等用户权威性信息,以及用户发帖内容、发帖标签等用户发帖信息,并将所获取的数据项存入Postgres数据库中。其中,用户发帖内容可用于表征用户的兴趣方向,用户发帖标签可用于概括用户发帖信息的内涵,且根据“小木虫论坛”社区的版块导航结构,可将发帖标签映射到16个主题方向上,用户发帖标签在各主题方向的映射结构(部分)如表3所示。为反映用户的发帖信息特征,本文利用SQL脚本对所获取的数据项进行删除残缺项等清洗和整理操作,并将739名用户在2015年1月1日—2020年1月1日的11 119条发帖信息作为本研究的数据集。
4.2 核心用户识别
本文采用熵权法分别计算各级指标的权重,分别得到用户活跃性各指标对应的权重w和信息熵e如表4所示,用户权威性各指标对应的权重w和信息熵e如表5所示,用户影响力各指标对应的权重w和信息熵e如表6所示。
由表4可知,在用户活跃性指标中,用户沙发数对用户活跃性影响最大,权重为0.32,其次为应助数,权重为0.26,由此首先评论用户发帖的用户和主动帮助他人解决问题的用户对用户活跃性的影响最大,因此,社区管理者可通过激励用户成为帖子的首位评论者、鼓励用户积极帮助解答他人的求助问题等方式提升学术虚拟社区用户的积极性。由表5可知,用户的贵宾值对用户权威性影响最大,权重值为0.38,其次为听众人数和红花数,权重值均为0.22。由表6可知,相比于用户活跃性,用户权威性对用户影响力的影响最大,权重为0.55,因此用户若想提升自身在学术虚拟社区中的影响力,应该着重提升自身的权威性。
根据表4、表5和表6的计算结果,计算用户的影响力。本文参照式(11)计算用户在问答网络中的综合值QR,进而识别学术虚拟社区中的核心用户。借鉴袁润等[27]将用户影响力前25%的用户作为高互动影响力群体的结论,本文根据用户的QR值对739名用户进行倒序排序,将排名前25%的185名用户作为学术虚拟社区内的核心用户,其影响力综合值排名如表7所示。
其中这185名核心用户在5年内共计发文5 103条,平均每人每年发文5.5条。这一结果表明学术虚拟社区核心用户的人均发文量较少,然而社区内的核心用户作为社区的中坚力量,在鼓励其他用户积极参与社区活动中发挥着至关重要的作用,因此对核心用户兴趣偏好的研究就显得尤为重要。
4.3 核心用户兴趣迁移
根据3.2节基于艾宾浩斯遗忘曲线的用户兴趣建模结果,本文在计算用户在不同时刻各主题方向的兴趣度时,将用户兴趣增量的初始值p0设置为0.8,时间窗口设置为180天,则用户的衰减因子θ为1/180。因篇幅限制,本文从185名核心用户中随机挑选1名社区编号为“712283”的用户,对其在不同时间节点的7条发帖信息兴趣度进行展示,如表8所示。
由表8可知,用户在某主题方向的初始兴趣度值均为0.8,用户在2015年3月26日首次发表“论坛事务区”相关主题帖,与在2019年8月22日第2次发表“论坛事务区”相关主题帖的时间间隔1 610天,兴趣度由0.8衰减为0.6551,而用户首次发表“版块孵化区”相关主题帖的时间为2016年3月23日,与第2次在2016年5月28日发表“版块孵化区”相关主题帖的时间间隔66天,兴趣度由0.8上升为1.2094,这一结果符合艾宾浩斯遗忘曲线的假设情况。
4.4 个性化推荐实现
1)数据集
本文以185名核心用户的5 103条发帖信息作为实验数据集,整个实验需要将实验数据集划分为训练集和测试集。本文引入变量x,表示训练集在整个数据集的占比,如x=0.8表示随机地将数据集中的80%作为训练集,20%作为测试集。在本文的所有实验中,均采用x=0.8作为实验基础。
2)评价指标
评价指标反映一种推荐算法在运行过程中的效果,准确率反映系统推荐的主题帖内容中有多少是用户真正想要的,这是评价推荐系统优劣性的一个重要指标。推荐结果的准确率计算公式如式(16)所示。
式(16)中,Precision指推荐结果的准确率,R(u)是根据用户在训练集中的行为为用户推荐的列表,而T(u)是用户在测试集上的行为列表。
3)实验结果
在基于用户的协同过滤的推荐算法中,本文使用被推荐用户的最近邻进行推荐,在实验中,本文使用该算法将最近邻数k从2取到20,间隔为2进行测试,利用Precision指标分析算法的运行效果,运行结果如图3所示。
由图3可知,当k=2时,推荐结果的准确率最高,达到了96.4%。随着k值的增加,推荐结果的准确率逐渐降低,当k≥14时,推荐结果的准确率逐渐趋于平缓,并稳定在93.7%上下,高于Lan等学者所提出模型的推荐结果准确率[5]。故本文所构建的核心用户兴趣迁移模型能够更好地预估核心用户的兴趣变化,为核心用户推荐其可能感兴趣的主题帖,提升学术虚拟社区的用户粘度。
5 结 语
本文以“小木虫论坛”为研究对象,获取学术虚拟社区中的用户信息数据项,构建学术虚拟社区用户影响力的评估指标体系,利用熵权法计算各级指标的权重,计算用户的影响力,在此基础上构建问答网络,利用PageRank算法计算用户在社交网络中的重要性,识别核心用户。在此基础上,本文基于艾宾浩斯遗忘曲线计算核心用户在不同时刻各主题方向的兴趣度,构建核心用户兴趣迁移模型,利用协同过滤算法验证此模型的合理性。结果显示,此模型能够更好地评估用户的兴趣变化,推荐结果的准确率高达93.7%,有助于社区更好地根据核心用户的历史行为信息提供精准的个性化推荐服务,对于社区的建设和发展具有重要意义。
参考文献
[1]Dietrich S.Internet:New Scientific Research Establishments[EB/OL].http://www.newso.org/ITNews/Trade/Internet-new-scientific-research-establishments/29eafd05-7352-451a-89bb-3d7c98495f6c,2020-08-19.
[2]Simon H A.Designing Organizations for an Information-rich World[J].Martin Greenberger Computers Communication & the Public Interest the Johns,1971,70:37-72.
[3]劉媛媛,张璇.新媒介时代微博意见领袖研究[J].新闻界,2016,(20):63-68.
[4]荣辉桂,火生旭,胡春华,等.基于用户相似度的协同过滤推荐算法[J].通信学报,2014,(2):16-24.
[5]Koren Y.Collaborative Filtering with Temporal Dynamics[J].Communications of the ACM,2010,53(4):89.
[6]Liu J,Deng G.Link Prediction in a User-object Network Based on Time-weighted Resource Allocation[J].Physica A:Statistical Mechanics and its Applications,2009,388(17):3643-3650.
[7]Michalski R S,Maloof M A.Incremental Learning with Partial Instance Memory[J].Artificial Intelligence:An International Journal,2004,154(1/2):95-126.
[8]Maloof M A,Michalski R S.A Method for Partial-memory Incremental Learning and Its Application to Computer Intrusion Detection[M].1995:392-397.
[9]于洪涛,崔瑞飞,董芹芹.基于遗忘曲线的微博用户兴趣模型[J].计算机工程与设计,2014,(10):3367-3372,3379.
[10]董晨露,柯新生.基于用户兴趣变化和评论的协同过滤算法研究[J].计算机科学,2018,45(3):213-217,246.
[11]王占,林岩.基于信任与用户兴趣变化的协同过滤方法研究[J].情报学报,2017,36(2):197-205.
[12]扈维,张尧学,周悦芝.基于社会化标注的用户兴趣挖掘[J].清华大学学报:自然科学版,2014,54(4):502-507.
[13]何炎祥,刘续乐,陈强,等.社交网络用户兴趣挖掘研究[J].小型微型计算机系统,2014,35(11):2385-2389.
[14]Joachims T,Freitag D,Mitchell T.WebWatcher:A Tour Guide for the World Wide Web[M].Pollack M E.1997:770-775.
[15]王道平,王煦.基于AHP/熵值法的钢铁企业绿色供应商选择指标权重研究[J].软科学,2010,24(8):117-122.
[16]程启月.评测指标权重确定的结构熵权法[J].系统工程理论与实践,2010,30(7):1225-1228.
[17]毛国君,谢松燕,胡殿军.PageRank模型的改进及微博用户影响力挖掘算法[J].计算机应用与软件,2017,34(5):28-32,37.
[18]朱凯歌.面向个性化服务的用户兴趣挖掘方法研究与实现[D].北京:北京交通大学,2018.
[19]Ebbinghaus Hermann.Memory:A Contribution to Experimental Psychology[J].Annals of Neurosciences,2013,20(4).
[20]J.Bobadilla,F.Ortega,A.Hernando,et al.Recommender systems survey.2013,46:109-132.
[21]曾东红,汪涛,严水发,等.一种基于指数遗忘函数的协同过滤算法[J].科技广场,2013,(7):10-15.
[22]Breese J S,Heckerman D,Kadie C.Empirical Analysis of Predictive Algorithms for Collaborative Filtering[C]//UAI'98,San Francisco,CA,USA,1998:43-52.
[23]黄创光,印鉴,汪静,等.不确定近邻的协同过滤推荐算法[J].计算机学报,2010,33(8):1369-1377.
[24]Yoganarasimhan H.Impact of Social Network Structure on Content Propagation:A Study Using YouTube Data[J].Quantitative Marketing & Economics,2012,10(1):111-150.
[25]郭博,许昊迪,雷水旺.知乎平台用户影响力分析与关键意见领袖挖掘[J].图书情报工作,2018,62(20):122-132.
[26]Xing W,Ghorbani A A.Weighted Page-Rank Algorithm[C]//Proceeding of the Second Annual Conference on Communication Networks and Services Research,2004.
[27]袁潤,王琦.学术博客用户画像模型构建与实证——以科学网博客为例[J].图书情报工作,2019,63(22):13-20.
(责任编辑:陈 媛)