胡西 谢雅婷
摘 要:本文主要介紹的个性化推荐的发展现状,基于对相关专利申请的分析对个性化推荐技术进行了梳理,以产业和科研的关注点结合国际专利分类体系,确定了主要的研究方向和研究对象的分类号分布范围。从专利文献的视角对个性化推荐的申请情况及未来发展进行了全面的统计分析,介绍了个性化推荐的重点技术分支及其发展历程,从不同的技术分支角度总结了与个性化推荐相关的专利申请趋势。
关键词:个性化,推荐,信息,采集,定制,数据,挖掘。
1个性化推荐的技术概述
个性化推荐直到20世纪90年代才被作为一个独立的概念被提出来,至今得到飞速发展。由于巨大的应用需求,个性化推荐得到了广泛的关注,国内外越来越多的学者开始研究个性化推荐。个性化推荐是根据用户资料信息、历史行为记录及物品的特征属性来分析用户对物品的偏好而生成个性化推荐列表,为用户提供信息推荐的一种过滤和挖掘技术。个性化推荐是一个综合众多学科的研究领域,涉及统计分析、信息检索、数据挖掘、机器学习、人工智能、自然语言处理等。从系统的结构层次上看,可以把个性化推荐分为:信息采集、用户建模、推荐算法和推荐输出。
(1)个性化推荐是建立在用户信息的技术上,因此,信息采集是建立个性化推荐模型的前提和必要条件。采集数据信息是通过获取用户信息、喜好、特征与兴趣等数据的过程。
(2)为能够准确地反映用户各个方面、动态发展的兴趣爱好,需要为用户建立用户模型。用户模型的表示提供一种结构化的进行个性化推荐。
(3)推荐算法从根本上决定了个性化推荐系统的类型、性能以及优劣。推荐算法是根据收集的用户个人信息和对应的用户模型,通过设定算法目标进行学习,并对特定用户计算出推荐结果。
(4)推荐输出是根据推荐算法得到推荐结果,将结果展示通过预测值、结果推荐或是其他方式呈现给用户。
2个性化推荐专利基本情况分析
2.1全球专利申请分析
2.1.1技术趋势分析
对全球历年专利申请的分布进行了统计,个性化推荐大概是从1993年开始有相关专利的申请的,在2006年之前发展十分缓慢,申请量都很少,属于起步阶段,2006年之后,发展速度明显加快,专利申请量逐渐增多,虽然有波动,但总体而言,专利申请量是不断增加的,这也与互联网技术的迅猛发展趋势相吻合。2013年的申请量达到顶峰。到2014年申请量有所回落,由于2015年专利申请的公开数据不完整导致总申请量下降,但并不能因此判断该领域申请量出现大幅下降趋势。总体来说,本领域依然是专利申请的热点,未来专利申请量仍然会逐年提升,继续保持较高水平。
2.1.2区域布局分析
本节对全球专利申请中的主要申请人进行了分析,在个性化推荐领域,全球专利申请主要集中在美国、中国、PCT、韩国、欧洲以及日本。美国的申请量位于第一位,其申请量占全球三分之一,遥遥领先于其他国家,可见美国在该技术上具有相当大的优势。中国紧随其后,占有19%的申请量,位居第二,这反应出了个性化推荐在中国也具有相当高的研究价值。国际申请排名第三,约占全球申请总量的12%。紧接着是韩国、欧洲以及日本,这些国家的申请量也不容忽视。
2.2国内专利状况
2.2.1国内主要申请人分布
图2.2是对个性化推荐领域相关专利申请的国内主要申请人分布情况进行统计。
从图2.2可以看出,我国个性化推荐领域相关专利的主要申请人还是以企业为主,说明相比于单个高校,企业更加重视相关的研发工作,主要由于个性化推荐能带来相当大的经济利润。百度公司排在第一位,说明百度公司在个性化推荐领域特别是个性化搜索方面投入较多的资源进行研发,申请量远高于其他企业,具有相当大的技术优势。紧随其后,腾讯、阿里巴巴、北京奇虎、小米也占据了一定比例的申请量。
3个性化推荐相关专利的技术分支及技术分析
3.1个性化推荐的技术分支
根据对个性化推荐技术背景的了解以及相关专利文献的阅读,确定个性化推荐在专利申请上主要研究的技术分支为:信息收集和推荐算法。其中,根据推荐目标,数据收集主要分为多媒体信息偏好的数据收集和商品偏好的数据收集两个部分:
多媒体信息偏好的数据收集主要为音视频、电视节目的数据收集。为了获得更准确的信息,各个学者开始考虑通过获取用户观看节目时的表情或者眼跳等计算用户真正对于节目的哪个内容感兴趣,其中就用到了表情识别技术和人眼识别技术。
商品偏好的数据收集主要为电子商务中的信息采集。
个性化推荐算法的主流是内容推荐算法和协同过滤算法。
内容推荐算法侧重于基于学习的推荐,根据用户的反馈信息,自动地校正推荐列表的内容。
协同过滤算法侧重于解决数据冷启动问题,数据稀疏性问题和可扩展问题。如何高效可扩展的个性化推荐是将来研究的重点。
4小结
本文围绕个性化推荐这一技术主题,对全球和国内相关的专利申请进行了分析。从总体的申请量趋势来看,个性化推荐仍是当前的一大热点,呈现出上升趋势;从全球原创区域分布来看,美国占据着绝大部分的比例,处于霸主地位,而我国紧跟美国,处于第二位,可见,我国在这一领域也还是占有一定的地位;从国内的申请量来看,外国来华申请也占据着较高的比例,仍是以美国为首,而微软公司,也是申请最多的申请人;对于国内的申请人,以百度居首,腾讯和阿里巴巴依次位于第二和第四。通过对这些数据的分析,对个性化推荐这一技术有了宏观上的把握,也更加清楚这一技术的发展动态。
作者简介:
胡西 1990.9,汉族,湖北武汉,女,硕士研究生,视频图像处理。
谢雅婷 1991.11,汉族,湖北武汉,女,硕士研究生,视频图像处理(等同第一作者)。