基于文献计量的个性化推荐研究进展分析

2019-07-17 02:18徐勇汪倩张玮武雅利焦梦蕾许崇
价值工程 2019年15期
关键词:个性化推荐文献计量研究进展

徐勇 汪倩 张玮 武雅利 焦梦蕾 许崇

摘要:个性化推荐有效缓解了大数据时代“数据爆炸”的现象,通过事先了解用户的潜在兴趣偏好,有针对性的提供符合用户实际需求的信息,从而提高用户的使用效率。本文通过文献计量的方法对2008年到2018年之间的有关个性化推荐的相关文献进行统计分析,分别从时间分布、期刊分布、关键词共现分析以及关键词聚类分析几个部分展开研究,以发现个性化推荐领域的主要研究热点问题与发展趋势,进而探讨未来研究的走向,为个性化推荐的发展提供依据。

Abstract: Personalized recommendations effectively alleviate the phenomenon of "data explosion" in the age of big data, through the prior understanding of the user's potential interest preferences, targeted to provide information in line with the actual needs of users, so as to improve the efficiency of user use. Through the method of literature measurement, this paper makes a statistical analysis of the relevant literatures about personalized recommendations between 2008 and 2018, and studies them from several parts, such as time distribution, periodical distribution, keyword co-analysis and keyword clustering analysis, in order to find out the main research hot issues and development trends in the field of personalized recommendation. Then it discusses the trend of future research and provides the basis for the development of personalized recommendation.

关键词:个性化推荐;文献计量;研究进展

Key words: personalized recommendation;literature measurement;research progress

中图分类号:TP274+.2                                     文献标识码:A                                  文章编号:1006-4311(2019)15-0142-03

0  引言

Web 2.0时代的到来,用户从过去单纯的浏览网络信息到现在既能阅读信息同时还能自由的在网络上生成大量内容,使得网络资源数量庞大,用户使用网络获取资源时,很难准确找到所需要的信息,从而浪费用户时间,促使互联网的使用不再方便便捷。个性化推荐技术有效缓解了该现象,它通过事先了解用户的需求偏好,并针对其偏好推荐相应的内容信息,从而满足用户的需求。目前,个性化推荐技术也被广泛应用于多个领域,有效促进各行各业的发展进步。因此,本文针对个性化推荐领域进行文献计量分析,了解该领域的研究整体趋势特征,挖掘研究热点问题,进而更好的把握个性化推荐的研究进展状况[1]。

1  数据来源与研究方法

本文以CSSCI和EI两个数据库作为数据来源,并以“个性化推荐”作为“主题”“关键词”“篇名”分别进行检索,时间跨度为2008年1月1日到2018年12月31日,共获得510篇相关研究文献。通过人工对搜索到的文献进行阅读筛选,去除无关、重复等文献后,最终获得503篇文献(检索时间:2019年3月17日)。

文献计量法是一种专门通过数学的方式统计文献的如发文时间分布、期刊来源分布、作者机构分布等文献一般特征,并基于得到的特征了解所研究领域的研究整体状况以及研究的走向,探索未来的研究发展趋势,为更好的促进该领域的进一步深入提供支持。本文通过使用Excel、citespace软件对所获得的研究文献进行文献计量分析,获得研究文献的文献特征,并通过对核心关键词以及关键词的聚类分析等来挖掘研究热点问题,探索未來的研究发展方向。

2  计量结果分析

2.1 时间分布

通过对2008年到2018年间发表的503篇相关研究文献进行统计分析后,绘制成发文篇数随时间变化的折线图,如图 1 所示。从图中可以看出,从2008年到2018年期间发文篇数整体呈现上升的趋势,虽期间存在一定的下降,但整体相对于2008年的16篇仍是上升的。而此现象的出现正是由于互联网时代的到来,越来越多的用户使用互联网,造成网络数据泛滥的现象开始出现,为了使用户更好的使用互联网,个性化推荐技术显得尤为重要。因此,对于个性化推荐的研究越来越引起学者的重视,相关的研究文献不断涌现。

2.2 期刊分布

期刊分布能在一定程度上反映个性化推荐领域研究的现状以及研究深度,对于想要初步了解此领域的学者可提供一定的相关信息[2]。通过对这503篇文献的统计后,发现文献共分布在103种期刊上。其中,发表文献数量在10篇以上的期刊共有11种(如表1 所示),而这11个期刊所发表的文献总量高达274篇。图书情报工作发表的相关文献数量最多,高达43篇,情报理论与实践、现代情报、情报科学这3种期刊发表的文献数量也均在30篇左右。可以发现,对于此领域的研究,学者发表的文献主要在这11种,且大多在图情领域较多。

2.3 关键词共现分析

文献中的关键词是涵盖该文献主要研究内容与研究方法,代表研究的中心思想的。因此,关键词共现分析对于明晰个性化推荐领域的研究进展与现状是必不可少的。使用citespace软件进行关键词分析,如图2所示。其中,节点的大小代表其中心度的大小,节点越大,表明中心度越多高,各关键词之间的连线代表其共现的次数,连线越粗,表明共现次数越多。

并统计出频次在10次及以上的高频关键词,如表2所示。

从表2 可以看出,词频在10次以上的共有16个关键词,除了“个性化推荐”“个性化”“个性化服务”“个性化信息服务”这4个明显有代表性的关键词以外,其余几个高频关键词的中心度也很高,说明这些词在个性化推荐领域研究的较多。通过对这12个高频词进行分析,可以将其分为3个部分。第1部分包括“协同過滤”“推荐系统”,它是个性化推荐研究的核心构件,目前对于个性化推荐的研究主要集中于推荐算法、推荐模型、推荐系统的构建,而协同过滤技术是运用较多的一种推荐算法。第2部分是“大数据”“电子商务”“数字图书馆”“高校图书馆”“图书馆”等,表明了个性化推荐的主要应用领域。第3部分由“情境感知”“用户偏好”“数据挖掘”等组成,显示出此研究领域中密切相关的技术与研究方向,是实现个性化推荐的关键部分。

2.4 关键词聚类分析

通过对关键词进行聚类分析,将相同主题的关键词聚成一类,并对同一类别的关键词进行梳理,进而挖掘个性化推荐领域的研究热点话题。本文使用citespace软件进行聚类,并过滤掉较小的类别,按时间进行展示,各聚类结果如图3所示。

从图中可以看出,将关键词主要分为了6大类,分别为“电子商务”“用户画像”“个性化信息服务”“情境感知”“协同过滤”“个性化推荐”。通过对这6类的主题进行统计分析后,将其分为两大主要研究类别。其一是个性化推荐技术的应用领域研究。目前个性化推荐主要应用于电子商务[3,4,5,6]、图书情报[7,8,9]、音乐[10]、新闻推荐[11]等领域中,这是由于个性化推荐技术能够有效缓解大数据时代网络信息资源泛滥的情形,根据用户喜好进行自主推荐,对于提高用户的使用效率和主观感受,显得尤为重要。另一个主要研究类别是实现个性化推荐技术所需的推荐算法、用户画像、数据挖掘等技术的进一步研究。推荐算法是实现个性化推荐的核心所在,而目前使用较多的是协同过滤技术,它通过挖掘出与目标用户相同喜好的其他用户,并将其他用户购买的物品中目标用户未购买的商品推荐给用户,从而实现个性化推荐。而事先了解用户的兴趣偏好对于个性化推荐的实现是不可或缺的,用户画像技术也因此逐渐展开研究。通过采集用户在网络上的行为数据,运用自然语言处理、机器学习等技术分析数据,从而提取用户特征标签,构建用户画像。因此,运用用户画像技术,能够迅速便捷的获取用户偏好,从而进行有针对性的推荐,实现“个性化”。

3  结论

本文通过使用文献计量的方法,运用citespace、Excel软件对2008年到2018年之间的有关个性化推荐的研究文献进行统计分析,分别从时间分布、期刊分布、关键词共现以及聚类分析几方面进行研究,以发现个性化推荐领域的主要研究热点问题与发展趋势。未来对于个性化推荐的研究仍需进一步提高推荐算法的推荐精度,更好的消除冷启动、数据稀疏所造成的影响,实现更精准的推荐。其次,需采集跨领域的用户相关数据,构建更加完善的用户画像,以发现用户的多方面的需求特征,提高推荐效果,同时考虑用户兴趣变化的特点,构建实时的用户画像。然后,现有的个性化推荐大多应用于电子商务、音乐、新闻等领域,未来可继续扩展其应用范围,可将其推广到医疗领域、教育领域等。最后,对于推荐效果的好坏如何进行评价,可构建一个统一的指标体系,提高评价的可信度,更好的实现个性化推荐。

参考文献:

[1]孙湘湘,周小亮.我国产业经济学研究热点和前沿的可视化分析[J].武汉理工大学学报(信息与管理工程版),2018,40(05):550-555,560.

[2]刘智颖,贺颖.基于CNKI数据库的档案用户需求文献计量分析(2010-2017)[J].档案管理,2019(01):22-25.

[3]杜巍,高长元.移动电子商务环境下个性化情景推荐模型研究[J].情报理论与实践,2017,40(10):56-61.

[4]刘晶,李妍,侯会茹.移动电子商务多源关联个性化推荐架构[J].情报理论与实践,2014,37(04):98-100.

[5]陈明.基于信息流的实时电子商务动态个性化推荐[J].情报杂志,2008(08):29-30,56.

[6]邵波,宋继伟.国内外电子商务个性化服务研究分析[J].情报杂志,2008(07):78-80.

[7]耿立校,晋高杰,李亚函,孙卫忠,马士豪.基于改进内容过滤算法的高校图书馆文献资源个性化推荐研究[J].图书情报工作,2018,62(21):112-117.

[8]焦玉英,袁静.基于情景模型的数字图书馆个性化服务研究[J].中国图书馆学报,2008(06):58-63.

[9]王庆,赵发珍.基于“用户画像”的图书馆资源推荐模式设计与分析[J].现代情报,2018,38(03):105-109,137.

[10]李瑞敏,林鸿飞,闫俊.基于用户-标签-项目语义挖掘的个性化音乐推荐[J].计算机研究与发展,2014,51(10):2270-2276.

[11]孟祥武,陈诚,张玉洁.移动新闻推荐技术及其应用研究综述[J].计算机学报,2016,39(04):685-703.

猜你喜欢
个性化推荐文献计量研究进展
MiRNA-145在消化系统恶性肿瘤中的研究进展
离子束抛光研究进展
独脚金的研究进展
我国医学数字图书馆研究的文献计量分析
EGFR核转位与DNA损伤修复研究进展