协同过滤推荐算法专利综述

2015-03-25 16:56周瑞瑞
河南科技 2015年19期
关键词:专利申请物品协同

张 博 周瑞瑞 鱼 冰

(国家知识产权局专利局专利审查协作河南中心,河南 郑州 45000050000)

随着电子商务的飞速发展,网上交易为企业、个人商家带来了无限商机,促进了经济发展。随着网上商家和产品的不断增加,为了帮助网购用户进行商品的选择,网购用户在浏览购物网站时,网站常常会向用户提供产品推荐,以提升用户的购物体验。

为了使得推荐的产品能够被用户采纳,常常使用推荐算法以使得产品推荐更加合理、有效[1]。所谓推荐算法是利用用户的行为通过相关的数学算法,推测出用户可能喜欢的东西,推荐算法主要分为6种:基于内容的推荐、基于协同过滤的推荐、基于关联规则推荐、基于效用推荐、基于知识推荐、组合推荐。其中,协同过滤是推荐算法中最经典最常用的[2]。合理的推荐算法所产生的产品推荐对于用户的消费行为将产生重要的影响,对于商家的利益、名气也至关重要。

1 协调过滤推荐算法相关概念介绍

协同过滤算法主要是通过对未评分项进行评分预测来实现的[3],不同的协同过滤之间也有很大的不同。

基于用户的协同过滤推荐算法,1992年提出并用于邮件过滤系统,1994年被GroupLens用于新闻过滤,一直到2000年,该算法都是推荐系统领域最著名的算法。当一个用户A需要个性化推荐时,可以先找到和他兴趣相似的用户群体G,然后把G喜欢的、并且A没有听说过的物品推荐给A,这就是基于用户协调过滤算法,其主要包括2个步骤:①找到与目标用户兴趣相似的用户集合。②找到这个集合中用户喜欢的、并且目标用户没有听说过的物品推荐给目标用户。

基于用户的协同过滤算法无法满足及时推荐的要求,基于项目的协同过滤解决了这个问题。基于项目的协同过滤推荐和基于内容的推荐其实都是基于物品相似度预测推荐,只是相似度计算的方法不一样,前者是从用户历史的偏好推断,而后者是基于物品本身的属性特征信息。

2 协同过滤推荐算法专利技术的进展

北京航空航天大学于2011年3月9日提交的公开号为CN102135989A的专利申请提及一种基于正规化矩阵因式分解的增量协同过滤推荐方法,其根据新增的用户反馈信息进行正确的增量实时更新,能够对新增的用户反馈数据做出实时反馈;于2011年3月11日提交的公开号为CN102129462A的专利申请提及一种通过聚合对协同过滤推荐系统进行优化的方法,其通过构造同类聚合模型的方式来提高协同过滤推荐算法的推荐精度;于2011年3月11日提交的公开号为CN102129463A的专利申请提及一种融合项目相关性的基于PMF的协同过滤推荐系统、于2012年11月20日提交的公开号CN103092911A的专利申请提及一种融合社会标签相似度基于K近邻的协调过滤推荐系统,均通过将社会标签数据信息和用户-项目评分数据信息进行融合,达到提高推荐精度的目的。

清华大学于2011年11月25日提交的公开号为CN102495864A的专利申请提及一种基于评分的协同过滤推荐方法,其利用用户历史评分数据的统计特征计算各个用户之间的相似程度,通过与当前用户相似程度较高的其他用户来计算当前用户未评价过的项目,解决了难以找到用户间共同评分项而导致无法计算相似性或相似性不准确的问题;于2013年6月5日提交的公开号为CN103309967A的专利申请涉及基于相似性传递的系统过滤方法,其遍历所有用户的历史行为数据,获得描述所有用户对物品过往喜好的关系向量,应用关系向量设定阈值,计算各个用户间的相似性,利用相似性传递计算原则计算矩阵中相似性值为零的目标用户与其他用户间相似性,根据与目标用户相似程度最高的其他用户对目标用户未选择物品的喜好程度得到当前用户对未选择物品的喜好程度的估计值,对每个用户的预测结果进行筛选,产生对每个用户的推荐物品;于2014年4月14日提交的公开号为CN103942298A的专利申请涉及基于线性回归的推荐方法,其利用用户和物品的历史评分数据建立线性回归模型,克服协同过滤算法实时性差、无法直接增量更新的局限性;于2015年9月14日提交的公开号为CN105205128A的专利申请涉及基于评分特征的时序推荐方法,其通过对每个时间域中的训练数据进行扩充,解决时序推荐中的稀疏性问题。

浙江大学于2010年5月28日提交的公开号为CN101853470A的专利申请涉及基于社会化标签的协同过滤方法,其基于社会化标签的协同过滤方法有机结合社会化标签对于物品描述的语义信息,并使用lasso logistic regression模型去对物品进行标签的扩展,解决社会化标签的稀疏性与噪音问题;于2011年7月12日提交的公开号为CN102231166A的专利申请涉及基于社会上下文的协同推荐方法,其考虑不同用户之间存在的差异,对矩阵分解中社会上下文约束权重进行调整;于2012年7月16日提交的公开号为CN102789499A的专利申请涉及基于物品间情景化隐式关系的协同过滤方法,充分利用情景信息挖掘物品之间的隐式关联信息,利用物品之间的隐式关系生成推荐;于2013年6月6日提交的公开号为CN103279552A的专利申请涉及一种基于用户兴趣分组的协同过滤推荐方法,其将用户和物品映射到共同的低维空间,利用聚类方法把降维之后的用户和物品划分到不同的兴趣分组,在每一个分组基础上利用协同过滤的推荐方法进行预测;于2013年10月17日提交的公开号为CN103617540A的专利申请涉及一种追踪用户兴趣变化的电子商务推荐方法,其综合考虑用户之间的评分相似度和商品类别信息相似度,采用基于时间加权的协同过滤算法,给用户推荐最可能感兴趣的商品;于2013年12月27日提交的公开号为CN103745100A的专利申请涉及一种基于项目的混合显性隐性反馈的协同过滤推荐算法,其根据用户对各个项目的兴趣信息建立评分矩阵,计算任意两个项目之间的Pearson相似度和修正余弦相似度、显性反馈的相似度、基于隐性反馈的余弦相似度,依据评分矩阵进行推荐;于2014年6月30日提交的公开号为CN104391849A的专利申请涉及融入时间上下文信息的协同过滤推荐方法,其在相似度计算阶段和评分预测阶段都引入时间衰减函数,为不同用户对不同类别的物品使用不同的时间衰减因子。

北京奇虎科技有限公司于2012年12月5日提交的公开号为CN103019860A的专利申请涉及基于协同过滤的处理方法和系统,其利用本地的主体-项目权重矩阵的分块矩阵数据、本地的协同过滤矩阵的分块矩阵数据和接收到的分量之间的对应关系,将至少一个项目推荐给主体;于2012年12月5日提交的公开号为CN103049489A、CN103049486A的专利申请涉及用于处理协同过滤距离的方法和系统,其将每个参与计算的计算服务器计算得到所有协同过滤子矩阵,可以提高针对海量数据的协同过滤距离矩阵的计算效率。

皇家飞利浦电子股份有限公司于2006年6月14日提交的公开号为CN1788280A的专利申请涉及用于执行基于简档的协同过滤方法,其基于其他用户的观看偏好或简档,根据推荐请求过滤一般用户人群以获取亚用户人群,计算同亚人群中每个用户相关联的偏好数据与同受建议者相关联的偏好和简档数据中的一个之间的接近度的度量,以选择同N个用户相关联的偏好数据向受建议者推荐项目,其能够在可利用足够的个性化观看或购买历史之前,不明显地推荐项目。

诺基亚公司于2011年4月19日提交了公开号为CN103620593A的专利申请涉及基于特征的协同过滤的方法,其通过推荐引擎生成一个或多个项目到一个或多个特征的映射,为一个或多个用户确定有关一个或多个特征的偏好信息;于2011年5月27日提交的公开号为CN103703460A的专利申请涉及针对实时推荐的协同过滤方法,其处理用户与一个或多个内容项目的一个或多个交互和/或有助于用户与一个或多个内容项目的一个或多个交互的处理,至少部分地引起基于累积的一个或多个处理的交互的一个或多个用户偏好的确定,基于用户可以具有的与感兴趣的项目或主题的交互生成对用户的推荐。

TCL集团股份有限公司于2012年4月25日提交了公开号为CN103377242A的专利申请涉及用户行为分析方法、分析预测方法及电视节目推送系统,其通过二次聚类考虑用户行为的变迁时序特征,将聚类结果集用于进行用户之间的协同分析;于2013年9月9日提交的公开号为CN103544212A的专利申请涉及一种内容推荐方法及系统,其根据用户行为的时间系数以及用户量化行为数据,评估用户对关注内容的喜爱程度,根据评分情况进行协同过滤;于2015年7月21日提交的公开号为CN104966219A的专利申请涉及一种基于词频加权技术的个性化协调过滤推荐方法,其计算两两物品的相似度、每个物品的特征性频率TF和倒排文档频率IDF、每个物品的TF-IDF频率TI,进而生成推荐列表,即在协同过滤算法中引入TF-IDF算法以有效降低热门商品对推荐结果的影响。

3 结论

随着互联网技术的不断发展,信息爆炸时代的到来,对数据的分析、推荐逐渐引起人们的关注。本文通过对协同过滤推荐算法相关专利的分析,统计了主要的协同过滤算法,旨在研究该算法的发展进步,以将其更好地应用在具体的产业,如互联网购物、电视列表推荐中。

[1]李聪.电子商务协同过滤可扩展性研究综述[J].现代图书情报技术,2010(11):37-44.

[2]耿鑫,等.数据挖掘中的推荐算法综述[J].电脑知识与技术,2012,8(19):4691-4696.

[3]冷亚军,等.协同过滤推荐技术综述[J].模式识别与人工智能,2014,27(8):720-734.

猜你喜欢
专利申请物品协同
称物品
家校社协同育人 共赢美好未来
“双十一”,你抢到了想要的物品吗?
蜀道难:车与路的协同进化
唑啉草酯中国专利申请分析
谁动了凡·高的物品
“四化”协同才有出路
三医联动 协同创新
专利申请审批流程图
专利申请三步曲