胡致杰,胡羽沫
(1.广东理工学院 信息工程系,广东 肇庆 526100;2.中山大学 数据科学与计算机学院,广东 广州 510006)
协同过滤推荐瓶颈问题研究
胡致杰1,胡羽沫2
(1.广东理工学院 信息工程系,广东肇庆526100;2.中山大学 数据科学与计算机学院,广东广州510006)
摘要:进入21世纪以来,我国的科学技术取得了巨大进步,互联网和电子商务正处于迅猛发展的阶段,促进信息化不断深入到人们的日长生活工作当中。在现代社会中人们的工作繁忙,在购物方面越来越多偏向于在电子商务网站上进行,在享受足不出户的便利的同时,也因为电子商务网站所提供的大量商品造成严重的“信息超载”,于是就出现了电子商务推荐系统。其中协同过滤推荐是目前最为常用的电子商务推荐系统,它已经被广泛应用于各商务网站中,但是在使用过程中还存在许多的问题,这些协同过滤推荐瓶颈问题严重阻碍了它的进一步发展。因此,文章的主旨就是针对协同过滤推荐瓶颈问题进行研究,并提出相对应的解决措施清扫阻碍。
关键词:协同过滤推荐;瓶颈问题;解决措施
电子商务网站在用户浏览的过程中需要将适合该用户的商品推荐给它需要在大量的商品信息中进行过滤,所以协同过滤推荐系统的使用对解决这问题其中重要的辅助作用,克服因信息的大量超载为用户带来的不良体验,进而更好的促成商品交易的成功率,帮助企业增加销售额。协同过滤推荐系统作为互联网及电子商务网站发展的产物,是电子商务网站进行正常运行的一种“一对一营销”战略技术,是网站客户关系管理过程中的重要组成部分,在各个大型网站运行过程中的得到很好的应用。随着协同过滤推荐系统的快速发展以及互联网技术的不断变化,需要不断对协同过滤推荐系统进行更新以满足时代发展的需要,目前,在协同过滤推荐系统的使用过程中发现在稀疏性、冷启动、可扩展性等方面出现了发展的瓶颈,这些瓶颈问题制约着协同过滤推荐系统的进一步发展。因此,需要根据实际需求对协同过滤推荐系统的瓶颈问题做出相关对策,以更好的为电子商务网站及用户服务。
第一,稀疏性问题的瓶颈。电子商务市场的快速发展让更多的电子商务站及商品不断加入到这中间来,这样容易造成用户的分流,不在集中在某些固定的网站进行购买活动,因此用户评分数据的稀疏性问题成为制约电子商务网站发展的一个重要瓶颈。由于协同过滤推荐系统对用户评分的依赖性极强,所以越来越多的技术人员开始提出要改善协同过滤推荐系统的稀疏性问题,并不断根据实际情况进行技术研究,通过统计技术的应用来选择与用户购买目标有着相同或者相似属性的商品,让用户可以在众多选择中选出最适合自己需求的商品。因此,稀疏性的瓶颈问题在于提高对用户评分的收集,进而提高过滤商品的质量。
第二,冷启动的瓶颈问题。领启动问题是对稀疏性问题的一种恶化,是一种极端的情况,根据不同的情况可以分为新用户问题和新项目问题两大类。这2种问题的发生情况为当一个新用户被推荐或者是自动加入协同过滤推荐系统之后,由于还没有开始使用网站进行购买活动,所以也就没有提交用户评价,未对任何项目进行评分,导致协同过滤推荐系统无法根据相关信息进行可能喜欢的商品和项目推荐,在协同过滤推荐系统运行过程中,让每个用户在每个项目的各个阶段都面临着严重的冷启动问题。客户对网站的忠诚度需要在使用的早期就开始建立,这对电子商务网站的进一步发展具有十分重要的作用。
第三,可扩展性的瓶颈问题。协同过滤推荐算法是基于内存的协同过滤算法,这大大节约了算法建立模型的时间,提高了系统的工作效率,但也存在一定的局限性,就是无法及时对用户的信息和新的商品项目进行更新,还需要定期根据网站各个阶段内容的变化进行新的模型建立。而随着电子商务网站的不断扩大规模,用户以及商品的大量增加,协同过滤推荐系统难以保证推荐商品对用户是否真正需要,这就不利于系统的可扩展性发展,严重损失了对用户之间的差异性,对数据模型的参数调整造成阻碍。
第一,针对稀疏性问题上的不足,可以提出非目标用户类型区分理论,对已有用户采用最近邻搜索的方式,将其分为无推荐能力和有推荐能力2种类型,并针对不同的类型的用户采取相对应的措施,以提高协同过滤推荐系统的工作效率和信息更改的实时性。在这个过程中为了有效防止用户评分项数据的极端稀疏现象需要进一步采取一种基于Rough集理论的用户评分项并集未评分值填补方法,让用户评分项能够更加的完备化,对领域最近邻理论实现有效的补充。
第二,针对冷启动中的新用户问题,目前已经提出了一种冷启动消除方法。这种方法可以根据用户访问电子商务网站的项序理论来获取用户的访问项序,进而对此进行相应的逻辑分析以及用户访问项序分解,再在基于上面提到的领域最近邻理论对新用户的访问项序进行集合,建立一种新型的数据链模型,实现最终对用户的商品协同过滤推荐。
第三,针对可扩展性瓶颈问题,需要对日益增长的用户和商品采用一种新机制,并可以让新机制完美使用用户各种各样的兴趣爱好,在大量的商品信息中进行筛选。既可以消除传统的筛选方法在梅西进行推荐计算的时候遇到需要对全体项目商品进行扫描的状况,有效的改善了协同过滤推荐系统的可扩展性,还可以得到最新的用户评分数据,掌握用户的兴趣偏好的动态变化。
第四,将电子商务网站的浏览用户转变为购买者,根据用户的浏览记录对网站商品信息进行筛选,选出用户可能喜欢的商品进行推送,这样大大增加了用户的购买力。其次就是可以提高电子商务网站的交叉销售能力,在现代社会,电子商务网站购物逐渐成为人们生活购物的一大选择,在商业发展过程中是不可或缺的一部分,较强交叉销售能力,可以更好的引导用户购买一些自己潜在需要但是未计划购买的商品,协同过滤推荐系统可以对这类商品进行推送,从而增加商品的销售量,获得更多的利润。最后就是可以帮助建立用户对电子商务网站的客户忠诚度,赢得客户对网站的忠诚度是提高商品销售量的一项重要商业策略,在互联网的运行过程中,客户的忠诚度是网站之间的强有力竞争对象,协同过滤推荐系统的使用一方面可以通过对用户的习惯和偏好来推荐用户所需求的合适商品,另一方面,客户越多的使用协同过滤推荐系统来进行购买活动,系统就能对用户的喜好进一步了解,在下次推荐时则会对商品的质量进行一定的优化,从而生成一种良性循环,既提高了客户的忠诚度,还提高了客户多网站的粘性。
本研究结果说明在互联网发展规模不断扩大,人们在信息社会中获取信息的渠道越来越多的环境下,协同过滤推荐系统的使用可以帮助用户每天在大量的信息传播中周旋中面对海量的信息过滤选取一些自己有用的信息,并根据用户的日常检索行为来形成一种个性化推荐,让相关信息可以在大量的信息中被推荐给用户,节约用户的时间并起到重要作用。同时对协同过滤推荐在使用过程中遇到的瓶颈问题进行相关探索,对有关问题的看法进行检验,证实在稀疏性、冷启动、可扩展性等方面存在发展问题,并有针对性的进行有效措施解决,修正其中的不足,并对协同过滤推荐在未来电子商务网站中的应用发展给以肯定,但需要彻底解决发展问题还需要相关人员的不断努力,共同不断推动它向前发展。
[参考文献]
[1]张红霞,杨渊,郎维.基于客户行为和兴趣变化的电子商务推荐系统[J].宝鸡文理学院学报:自然科学版,2012(2):52-56.
[2]张光卫,李德毅,李鹏,等.基于云模型的协同过滤推荐算法[J].软件学报,2007(10):46-49.
[3]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003(9):1621-1628.
[4]冷亚军,陆青,梁昌勇.协同过滤推荐技术综述[J].模式识别与人工智能,2014(8):123-127.
[5]李改,李磊.基于双向主题模型的协同过滤算法[J].中山大学学报:自然科学版,2013(5):68-72.
Research on Collaborative Filtering Recommendation Bottleneck Problem
Hu Zhijie1, Hu Yumo2
(1.Department of Information Engineering, Guangdong Polytechnic College, Zhaoqing526100, China;2.School of Data and Computer Science, Sun Yat-Sen University, Guangzhou510006, China)
Abstract:The 21st century, our country has made great progress of science and technology, the Internet and e-commerce is in rapid development stage, promote the informatization continuously go deep into the People's Daily life long work. In modern society people's job is busy, in terms of shopping more and more favor in e-commerce site, enjoying the housebound convenient at the same time, also because e-commerce sites provide a large number of goods caused serious "information overload", hence the e-commerce recommendation system.The collaborative fltering recommendation is currently the most commonly used e-commerce recommender system, it has been widely applied to an e-commerce site, but many problems still exist in the process of using, the collaborative fltering recommendation bottleneck seriously hindered the further development of it. Therefore, the purpose of this article is in view of the collaborative fltering recommendation bottleneck problem, and put forward the corresponding solutions for cleaning the block.
Key words:collaborative fltering recommendation; bottleneck problem; the measures
作者简介:胡致杰(1974-),男,湖北蕲春,硕士,讲师;研究方向:数据挖掘,推荐系统。