Web个性化推荐技术

2017-12-30 12:43赵国民
计算机时代 2017年10期
关键词:页面个性化协同

赵国民,唐 恬

(1.广脉科技股份有限公司,浙江 杭州 310051;2.杭州市公安局上城分局)

Web个性化推荐技术

赵国民1,唐 恬2

(1.广脉科技股份有限公司,浙江 杭州 310051;2.杭州市公安局上城分局)

Web页面的几何级增长,使得用户面对信息的海洋却不得不为如何找到感兴趣的内容而犯难。个性化推荐为解决这一难题打开了一扇窗。文章在简单介绍个性化推荐技术现状的基础上,分析了传统的协同过滤及其改进算法、基于内容的个性化推荐技术及其改进算法、基于标记的推荐技术以及将多种信息进行融合的混合个性化推荐技术。对各种技术的优缺点作了比较分析,指出基于标记的推荐技术及混合个性化推荐技术将是未来个性化推荐技术中重要发展方向。

Web;个性化推荐;协同过滤;标记推荐;混合推荐

0 引言

最近几年互联网上的信息呈指数级增长,Web成为人们获取信息的重要来源。而同时,人们在信息过载(Information Overload)的现实中,面对越来越多的Web页面却不容易找到自己感兴趣的内容。让用户去评价并区别各种信息,显然是行不通的。搜索引擎(Search Engine)在一定程度上解决了这个难题,然而,现有的搜索引擎工具以关键字匹配为主,返回的搜索结果往往包含众多页面,无法根据不同用户的不同需求给出个性化的结果,此外,当用户对所要查询的内容缺乏认识,无法确定查询的关键词时,搜索引擎也显得无能为力了。

如何更好地为用户提供服务成为Internet进一步发展的一个瓶颈和技术难题,推荐系统(Recommendation Systems)成为解决这一难题最有希望的途径,它采用知识发现技术,提供个性化的页面推荐。

1 推荐系统

1.1 推荐系统的定义

早在1987年,Malone等提出的智能化信息共享系统(Intelligent Information Sharing Systems)就是一个可以访问高度动态资源的基础分类系统[1]。具体地说,这些系统可以为两类:①认知过滤系统(cognitive filtering systems);②社会学过滤系统(sociological filtering systems)。认知过滤系统,通过提取信息资源的内容和潜在用户的信息需求中的特征,并以此作为给予用户智能化匹配的依据。社会学过滤系统,基于个体在社区中的个人与组织的关系进行工作。早期信息共享系统就属于第一类,是根据文本关键词选择相关的项目。所谓个性化推荐即指,通过分析对用户访问行为和获取的知识,根据用户的要求,提供个性化内容或页面结构。通过对用户访问行为的不同侧面进行分析,就形成不同的推荐技术。

1.2 个性化推荐的类别

众多的文献根据推荐方式的不同将个性化推荐分成以下三种主要类型:

⑴ 协同推荐(Collaborative recommendation),将具有相同的兴趣和偏爱的人曾经喜欢的项目推荐给用户;

⑵ 基于内容的推荐(Content-based recommendation),是把用户的信息需求,事先被以某种形式描述出来,然后,推荐系统根据这些描述在新项目中预测用户的兴趣;

⑶ 基于知识的推荐(Knowledge-based recommendation),依据对用户偏好的逻辑进行项目推荐,要求事先建立对一个用户的特定要求的知识表示(如规则)。

随着个性化推荐技术研究的深入,基于用户活动的单一属性已不能够满足实际需要,事实上,现在有越来越多的方法把各方面的属性进行融合,也就是联合前面提到的各种类型的推荐方式以获取更好的推荐效果,如Balavanovic&Shoham[2],Claypool et al.[3],Cho&Kim[4],Li et al.[5]。

最近研究人员广泛关注的一种个性化推荐技术——基于标记(tag-based)的个性化推荐,不同于以住任何形式的推荐技术,基于标志的技术由用户对浏览的页面进行标记,由系统对所有标记进行分析(如聚类),然后由系统根据用户提出的访问要求使用特定标记进行个性化推荐。

2 协同过滤个性化推荐

协同过滤(Collaborative Filtering),又称为社会过滤,它从用户那里获得综合的协同信息,形成总的规则,或倾向于用户间或倾向于项目间的关联来预测单个用户对项目的兴趣。

在协同过滤技术的发展中,第一代协同过滤技术,又被称为基于用户(User-based)的协同过滤。其基本原理是基于用户行为选择的相关性,用户的行为选择这里指的是下载、购买、评价等能够显式或隐式体现用户喜好的行为。一旦系统能够识别与一个用户拥有相同喜好的用户,就能够将他们最感兴趣的内容作为目标用户的推荐结果推荐给他。第二代是基于内容(Item-based)的协同过滤技术[6],与基于用户的技术不同的是,这种方法比较的是内容项之间的相似度。

3 基于内容的个性化推荐

协同过滤不能保证对用户的需求总有很准确的预测,一旦与活动用户相关的人很少的时候,以此产生的推荐可能就很不准确。原因是协同过滤系统完全依赖于个体对团体的兴趣度,而不考虑推荐的内容。

基于内容的推荐技术可以根据用户预定义的个人偏好[7]或者根据从web日志挖掘出来的用户使用模式,来帮助用户获得其感兴趣的信息。一般这些用户的个人信息包括用户的个人日程表、邮箱、最近访问的站点等,都可以帮助推荐系统向用户提供更准确的推荐。

基于内容的个性化推荐技术的最大的应用领域就是个性化搜索技术,近几年受到研究人员的关注也越来越多,在一定程度上已成为一种专门的研究领域,故本文不对相关技术作进一步的介绍。

4 基于标记的个性化推荐

为了使用户自己建立起来的内容更容易被其他用户共享,最简单的做法就是将这些信息建立相应的索引。实际应用中对内容的索引方式很多,在传统的图书馆或档案馆,索引是一个非常专业的任务,建立起来的索引往往具有很好的一致性,也就是同一个类型的内容往往采用相同的索引,且这种索引采用层次结构组织。然而,随着标记的引入和对在线数据库的评级,内容索引已经从严格的层次化向更多的主观化分类转变。

协同标记(Collaborative tagging)作为一种新型的对在线内容进行索引的方式,允许用户给自己建立起来的内容进行注解,即标记,相比于专业的网络内容的产生机制,协同标记系统面临着一大挑战,即终端用户是以一种不可控的方式安排标记,每个人可以根据自己的理解,给内容加上一个主观性很强的标记,即使对于同类型的内容甚至同一内容,不同用户也可能给出不同的标记,结果必然使得这种标记数据不一致,缺乏系统性。

基于标记的个性化推荐即是利用这种用户对于内容标记的评级向用户进行内容推荐的方法,可以在两个阶段给用户以支持,一是提高用户在社区中标记使用的一致性,再就是提高信息检索时的效率。作为一种新的个性化推荐技术,基于标记的个性化推荐,已经成为个性化技术研究中的热点,很多相应的算法被提出来。

5 混合个性化推荐

协同过滤的主要思想是:把具有相似的访问模式的其他用户的访问项目向用户进行推荐,因为如果不考虑项目的内容,推荐的效果就往往不是很理想,尤其是对于user-item矩阵的稀疏性问题,始终很难有一个很好的解决办法。另一方面,基于内容的个性化推荐虽然考虑到了项目内容与用户描述的相关性,但忽视了用户之间访问行为相似性可提高推荐效果的这一基本事实,得到的效果也不是很理想,且这种方法比协同过滤更复杂。

现有的个性化推荐算法,很多只是用到站点的使用信息,而忽视Web站点的结构信息,导致一些重要的页面,其尽管有很高的PageRank权威评分,却被低估。文献[7]提出一种新算法,UPR,一个类PageRank算法,联系考虑使用数据和连接分析技术,依据他们在站点浏览图的重要程度给网络页面分配一个概率值。本文将局部UPR(L-UPR)应用到个性化浏览子图,以实现在线网络页面的评分和推荐。系统提出一个混合概率预测模型,该模型以马尔可夫(Markov)模型和链接分析为基础,从而为每一个页面分配一个先验概率。实验表明,这个方法得到的推荐结果比纯粹基于使用信息的方法更加客观,更具代表性。

6 结束语

随着个性化推荐技术在商业的实践及逐步推广,相关的技术也成为研究的热点,基于标记的推荐技术及混合个性推荐技术将是未来个性化技术中重要方向。未来的个性化推荐技术的发展可能会体现在以下几个方面:

⑴ 继续将多维度信息相结合,提出更加有效的个性化推荐模式;

⑵ 由于分布式技术环境的普及,基于多Agent的个性化推荐技术的研究;

⑶ 未来的个性化推荐系统会更多地用到用户反馈信息,通过在线用户反馈逐步精化用户的个性化需求;

⑷ 个性化搜索引擎技术,现在搜索引擎已成为用户访问网络信息的一个重要的辅助手段,但以基于关键词匹配为主的搜索手段还是让用户很难轻松定位想要的信息,将语义及用户信息考虑以内的个性化搜索技术,有望在这方面取得突破。

[1]Malone,T.,Grant,K.,Turbak,F.,Brobst,S.,Cohen,M.:Intelligentinformation sharing systems.Comm.ACM,1987.30(5):390-402

[2]Balabanovic,M.,Shoham,Y.:Fab:content-based,collaborativerecommendation.Comm.ACM,1997.40(3):66-72

[3]Claypool,M.,Gokhale,A.,Miranda,T.:Combining content-based and collaborative filtersin an online newspaper.In Proc.ACM SIGIR Worksh.Recomm.Syst.Impl.Eval.,Berkeley CA,USA(1999).

[4]Cho,Y.H.,Kim,J.K.:Application of web usage mining and product taxonomy to collaborative recommendations in e-commerce.Exp.Syst,2004.26(4):233-246

[5]Li,Y.,Lu,L.,Xuefeng,L.:A hybrid collaborative filtering method for multiple-interests and multiple-content recommendation in E-Commerce.Exp.Syst,2005.28(4):67-77

[6]Balabanovic M,Shoham Y.Fab:content-based,collaborativerecommendation.Comm.oftheACM,1997.40(3):66-72

[7]MagdaliniEirinaki,Michalis Vazirgiannis.Web site personalization based on link analysis and navigational patterns.ACM Transactionson InternetTechnology,2007.4(7):21-47

Web page personalized recommendation technology

Zhao Guomin1,Tang Tian2
(1.GuangMai technology co.,Ltd,Hangzhou,Zhejiang 310051,China;2.Shangcheng branch of Hangzhou Municipal Public Security Bureau)

The geometric growth of the Web page makes the user,despite facing the ocean of information,has to make trouble with how to find the content of interest.Personalized recommendation opens a window to solve this problem.On the basis of brief introduction of the status of personalized recommendation technology,this paper analyzes the traditional collaborative filtering and its improved algorithm,content-based personalized recommendation technology and its improved algorithm,tag-based recommendation technology and a variety of information integrated hybrid personalized recommendation technology.The advantages and disadvantages of various technologies are compared and analyzed,and it is pointed out that the tag-based recommendation technology and hybrid personalized recommendation technology will be the future of personalized recommendation technology.

Web;personalized recommendation;collaborative filtering;tag-based recommendation;hybrid recommendation

TP399

A

1006-8228(2017)10-29-03

2017-08-25

赵国民(1965-),男,浙江杭州人,高级工程师,主要研究方向:通信技术,图像与数据处理。

10.16644/j.cnki.cn33-1094/tp.2017.10.009

猜你喜欢
页面个性化协同
刷新生活的页面
蜀道难:车与路的协同进化
坚持个性化的写作
“四化”协同才有出路
新闻的个性化写作
上汽大通:C2B个性化定制未来
三医联动 协同创新
满足群众的个性化需求
协同进化
网站结构在SEO中的研究与应用