陈 都,苗 方,金立标,吴 敏
(1.中国传媒大学 理工学部,北京100024;2.中国国际广播电台,北京 100040)
广电智能推荐系统的应用研究
陈都1,苗方1,金立标1,吴敏2
(1.中国传媒大学 理工学部,北京100024;2.中国国际广播电台,北京 100040)
摘要:随着广播电视媒体的发展已经进入融合时代,融合媒体要求充分运用新技术、新应用创新传播方式。为了充分挖掘分析潜在的用户需求,针对广电业务的推荐技术越来越受到关注。通过介绍近几年推荐技术新的发展成果,在广电推荐系统应用中充分结合媒体融合、时间因素等,建立广电智能推荐系统的基本构架,提出广电领域业务的进一步设想和展望。
关键词:智能推荐;用户行为分析;媒体融合
随着互联网应用的普及,海量信息资源的爆炸性增长,当今的世界正处在信息过载的时代。传统广电媒体作为大众信息的主要传播渠道,在面临着互联网媒体挑战的同时也在日趋深入地与之融合。电视互动性不断增强,观众的参与度大幅提升,原本被动收视的用户开始更多有目的地“使用”电视所提供的资源与服务。然而随着影视节目资源数量的指数型增长,内容日趋多样,面对海量的节目资源,用户想找到自己需要的内容变得越来越困难。因此需要一种智能的、个性化的广电节目推荐系统,帮助用户在信息的海洋中发现自己需要的资源,同时也使内容的生产、传播更具有目的性和精准性,从而实现价值的最大化。 智能推荐技术应用于电子商务领域起步较早,也已经比较成熟,但是在广电领域应用智能推荐与之相比有很多不同之处:电子商务中推荐的商品特征多为结构性数据,比较容易获取并且可以准确描述,例如用户喜欢的品牌、颜色、款式等。广电系统中的视音频素材特征较难提取,非结构化的数据处理比较困难,数据容量大且相似性度量不好定义。此外用户分层差距较大,用户反馈信息获取不便,视频资源的属性特征无法直观地表达用户的兴趣特征等也增大了广电业务推荐的难度。
1智能推荐系统概述
1.1智能推荐系统的基本框架
智能推荐系统是一种建立在海量数据挖掘的平台,通过收集并分析用户大量的行为日志,根据用户的偏好,推荐具有高度针对性的信息。帮助用户发现对自己有价值的信息的同时也能让信息展现在对其感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢[1]。
图1是一个智能推荐系统的基本框架图。
智能推荐系统输入变量主要分为3个维度:
1)用户维度,包括人口统计学特征、用户兴趣爱好、用户行为等。
2)物品维度,包括物品的属性(关键字、特征描述等)、当前热门程度、平均分等。
3)时间维度,包括季节、观看时段、时间间隔。
用户自身兴趣和关注点是随着时间推移不断变化的,关注用户近期行为最能体现其目前的兴趣,同时物品的热度也会随时间发生变化。用户通过推荐系统给出推荐列表去访问信息,并将反馈信息传递给智能推荐系统。推荐系统能够实时响应用户的反馈,个性化地调整推荐列表,从而满足用户不断变化的兴趣。
1.2智能推荐系统的核心算法
1)经典推荐算法
智能推荐系统的核心是推荐算法,算法的优劣决定着推荐系统的性能[2]。当前随着用户对推荐系统的需求不断增长,很多经典的推荐算法被广泛应用。协同过滤(Collaborative Filtering-based)推荐算法主要是利用对用户历史行为的分析,寻找具有类似行为或兴趣的用户和其感兴趣的物品,找到用户或物品之间的相关性,然后基于这些相关性进行建议推荐。基于内容(Content-based)推荐算法则不需要用户对物品的评价,通过分析用户浏览物品的特征,向用户推荐与这些物品特征相似的物品。这些经典的推荐算法主要研究对象主要是用户和物品,通过比较二维矩阵中相似度来推荐。这些推荐算法也分别存在一些问题,例如协同过滤推荐存在冷启动、数据稀疏、新颖性方面表现不佳,而基于内容推荐则存在物品特征较难抽取、计算复杂、无法满足即时推荐的要求等问题。
2)推荐算法的改进
近几年随着应用的推广和研究的深入,许多新的或者改进的推荐算法被相继提出。为提高用户的兴趣和物品之间的联系,引入基于标签的推荐算法可以深入了解用户行为,指导并改进推荐系统的推荐质量。文献[3]总结了国内外基于标签的推荐研究成果,利用基于图论、基于聚类的标签推荐来描述“用户-标签-物品”的三元关系,提高了推荐的准确率和新颖度。随着Web2.0的发展,很多网站都利用Facebook的社交网络数据给用户提供社会化的推荐。基于社交网络的推荐算法受到关注和应用,文献[4]通过研究社交网络的社会关系、兴趣传播、信任传递、时间等因素,建立社交网络用户兴趣模型,结合个人兴趣和兴趣传播两方面信息对目标用户进行准确的推荐,提高了推荐的质量。推荐系统中引入时间维度,让推荐系统能够准确预测用户在某个特定时间的兴趣。用户兴趣不断变化,推荐系统能够实时响应用户的新行为,让推荐列表不断变化,以此提高推荐效果。文献[5]提出一种计算用户评价时间与项目发布时间的时间间隔,根据用户时间权重值的大小,可以判断该用户是积极用户还是消极用户,以及用户对新项目的偏好程度的方法,能够较好地解决冷启动问题。文献[6]先在传统协同过滤算法的基础上,通过引入反映人们遗忘规律的艾宾浩斯遗忘曲线,提出一种基于时间效应的改进协同过滤推荐算法,并通过引入时效性集合的概念对数据进行预过滤,提升了推荐的准确度。
广电业务应用中用户的偏好矩阵远远小于未观看的物品矩阵,使用基于物品的协同过滤算法会影响推荐系统的性能。基于用户的协同过滤推荐则主要是给用户推荐和他兴趣相似的其他用户喜欢的物品。加入时间信息后,相似用户最近的兴趣显然比很久之前的兴趣更加接近被推荐用户当前的兴趣。利用加入时间衰减函数的改进皮尔逊相关系数测出两个用户的相似度,时间衰减项越小,代表用户之间产生这一行为的时间相隔越远,两个用户的兴趣相似度就会越小。
因电视的操作交互界面受到限制,推荐数量不宜太多。时间变化的推荐系统里,需要建立的是动态的推荐列表,并且提高推荐的精确性。文献[7]提出了一种比较物品推荐数量和推荐评分的“数量-分数曲线”,如图2所示。在“数量-分数曲线”中通过寻找拐点找到划分推荐评级和推荐数量的最佳平衡点。
2智能推荐系统在广电业务中的应用
广播电视媒体的发展已经进入融合时代,生产制作的节目其传播渠道和呈现方式也不局限于传统的广播电视,还包括互联网、移动终端APP、社交应用等。在融合媒体时代,内容、渠道、用户三者关系发生了根本的变化。生产制作域的融合和终端传播域的分化,形成了新型的传播模式。海量的媒体产品进行汇聚,再分流给多种终端,由用户根据所需进行个性化配置。用户希望精准迅速、随时随地获得需要的内容。在整个传播体系中,用户占据着主导的地位。随着用户需求和传播渠道的变化,广电媒体平台在提供海量内容的同时,还要提供丰富的服务。从服务的角度看,就是要更注重与观众的交互,分析掌握观众的个性化需求,才能真正把受众变为用户。智能推荐是为用户提供个性化服务的关键,也是媒体融合的一个重要体现。
广电智能推荐系统的智能性体现在主动发现当前或潜在的用户需求,根据用户历史行为记录的积累分析以及对媒体和应用内容的价值评估和热度评估,将用户信息与内容信息进行智能关联与匹配,预测用户可能感兴趣的内容资源信息。预测分析结果输出为智能推荐策略,包括共性化内容推荐策略和个性化内容推荐策略。共性化内容包括热点关注资源、根据收视情况统计出来的预计热门媒体和应用内容、根据相关媒体宣传需要与用户关注情况得出的热点聚焦内容等,同时也包括运营商推荐内容,如时事要闻、重点推荐等。个性化内容是在用户历史行为分析积累的基础上得出的用户当前或潜在的内容资源需求。为了准确把握用户的需求,可用于分析的信息包括用户基本信息如年龄、性别、爱好等,由用户行为的统计信息能够刻画用户的收视习惯,由观看内容信息和社交关系的分析可以获得用户的兴趣。
广电的主要应用场景是家庭环境,通过多人家庭用户的收视行为分析产生对个人的个性化推荐服务一直是广电推荐业务的难点[8]。融合媒体时代的内容传播模式是立体的、全方位的,包括大量的用户互动、参与,如“摇电视”、“伴随客户端”等形式,用户也会通过微信、微博公众号等方式关注,甚至参加线下活动。因此广电业务需要构建全方位的信息采集和大数据分析,将传统广电渠道和互联网渠道的数据打通,形成智能化的应用。
广电智能推荐应用除了形成内容与用户之间的适配,还需要形成内容与终端的适配。全媒体的业务分别在机顶盒、个人PC、手机、平板PC、互联网电视等终端呈现。不同的终端对应着不同的发布渠道、传播过程和展现形式。推荐系统需要识别终端类型与终端能力,建立用户信息关联和用户终端设备可管理机制,实现跨媒体的立体式服务。
针对智能推荐系统在广电中的应用,设计出广电智能推荐应用系统架构如图3所示。
广电智能引擎推荐系统由如下7个方面组成:
1)用户与广电系统的交互接口:智能推荐系统通过该交互接口收集用户的基本信息和行为记录,同时用户可以通过该交互接口获取个性推荐结果。
2)移动端APP:在移动端方面,设置用户关联账号,用户可以通过移动端登录广电网络的平台,订阅自己喜欢的频道或者节目,用户可以随时随地获得心仪的节目推荐和节目预告。用户行为收集方面,数据的来源不仅限于广电网络,用户通过手机、平板等移动端设备参与互动、评价等活动是获取用户个性化信息的关键组成部分。利用语义分析等技术处理用户的主观评价数据,追踪用户分享、转发到社交应用的信息,可以更准确地把握用户的偏好和需求。
3)用户行为数据库:该数据库用于存储用户在使用广电和移动端中的各种行为记录,例如浏览记录、播放记录、具体的时间长短与播放时段,进行降噪和归一化工作以及云端存储,可供深度挖掘的原始数据资源。
4)用户建模:推荐系统根据用户注册信息、历史行为数据,进行数据挖掘,为用户建模,例如用户年龄、职业、爱好、社交网络关系等,同时也根据推荐对象的相关信息来构造对象模型[9]。
5)第三方信息平台:视频节目标签特征提取也可以通过关联互联网的第三方平台,例如国内的豆瓣、时光网;用户标签基于社交网络,例如微博、微信、博客、QQ,在这些社交网站中,每个用户都有自己的个性化信息墙,从中提取用户标签较为方便。
6)视频节目资源库:视频节目资源数据库的核心是视频资源信息采集分类工作。数据采集量大,利用大数据、云计算等技术,通过网络信息爬虫抓取,模板建立进行标签识别,从而抓取到准确的影视元数据。可引入对视频内容的画面分析识别,深入挖掘出视频节目背后具体的对象,例如一些商品、地名、人物等。
7)智能推荐引擎:利用用户已构建好的模型和视频资源信息特征作为输入,通过智能推荐引擎的核心算法,输出个性推荐列表返回给用户。考虑到广电业务中电视节目视频的数据量庞大,数据相对不够稳定,内容需频繁更新,故选择时间融合基于用户的协同过滤推荐,引入时间效应,可以保证用户每天收到的推荐是不一样的,保持推荐结果的新颖性和多样性,同时可以控制在一段时间内热门的视频节目,防止用户过于跟风。单一的推荐算法并不能发挥推荐系统应有的效果,可以引入近几年兴起的基于标签的推荐、基于社交网络的推荐,提高推荐算法的效率。Netflix从2006年起开始举办Netflix Prize推荐算法设计大赛[1],有很多选手综合采用多种推荐算法去改进推荐结果,得到混合推荐算法,从而达到更好的推荐效果。
3总结与展望
为适应传统媒体和新兴媒体业务融合发展,广电需要建立开放的、融合的、智能的推荐系统架构。广电智能推荐系统对内容、渠道、用户三方面进行统一数据收集、信息管理、深度挖掘,从而识别用户共性化和个性化需求,承载多样化媒体业务新形态。同时广电智能推荐系统存在一些难点,主要包括直播节目元数据关联、用户安全隐私、家庭用户兴趣偏好分析等问题。这些难点需要进一步深入研究。
本文设计了针对广电业务的智能推荐应用系统框架,并对未来的研究方向进行构想。广电智能推荐系统是家庭智能化的重要组成部分,服务于运营,通过媒体与用户之间的双向交流,站在用户的角度为其提供定制服务。通过媒体融合的应用场景和相关技术,把视频内容与其背后蕴藏的丰富信息进行深度关联、精准传播。通过智能化平台的建设,识别用户共性、个性化的需求,利用内容整合、网络融合,为用户高效率、高质量、立体化地提供其真正需要的内容服务,以此提高广电运营在未来的竞争力。
参考文献:
[1]项亮. 推荐系统实践[M].北京:人民邮电出版社,2012.
[2]陈萌,杨成,王欢,等. 交互式电视中个性化推荐系统的研究[J].电视技术,2012,36(14):37-40.
[3]易明,邓卫华.基于标签的个性化信息推荐研究综述[J].情报理论与实践,2011,34(3):126-128.
[4]邢星. 社交网络个性化推荐方法研究[D]. 大连:大连海事大学,2013.
[5]于洪,李俊华. 一种解决新项目冷启动问题的推荐算法[J].软件学报,2015,26(6):1395-1408.
[6]基于时间效应和用户兴趣变化的改进推荐算法研究[D]. 北京:北京邮电大学,2014.
[7]HIROI K,MORITA H. High-accuracy time-variant recommender system with number-score curve[C]// 2014 IEEE Fourth International Conference on Consumer Electronics Berlin (ICCE-Berlin).[S.l.]: IEEE Press,2014:106-110.
[8]李培琳,赵明,王炳飞.广电家庭用户个性化推荐的难点和解决思路[J].电视技术,2015,39(18):33-35.
[9]黄乔,尹四清. 网络电视推荐系统框架及协同过滤算法的研究[J].电视技术,2013,37(9):136-138.
陈都,硕士生,主研信息网络技术;
苗方,讲师,主研宽带网络;
金立标,副教授,主要研究方向为数字电视信息网络技术;
吴敏,中国国际广播电台技术管理办公室主任。
责任编辑:许盈
Study on intelligent recommendation system applied in television broadcasting
CHEN Du1, MIAO Fang1, JIN Libiao1, WU Min2
(1.CommunicationUniversityofChinaFacultyofScienceandTechology,Beijing100024,China;2.ChinaRadioInternational,Beijing100040,China)
Key words:intelligent recommendation; user behavior analysis; media convergence
Abstract:With the development of radio and television media, convergence is coming. New technologies and applications are required to innovate communication ways in the time of convergence. In order to fully tap and analyze the potential needs of customers, intelligent recommendation technology for radio and television is increasingly concerned by people. The results of new recommendation technology are introduced in this paper. In addition, the framework of intelligent recommendation system is established with the consideration of time and media integration. The prospect of radio and television sector are given in the end.
中图分类号:TP301.6
文献标志码:A
DOI:10.16280/j.videoe.2016.01.020
基金项目:科技部国家科技支撑计划课题(2013BAH36F00)
作者简介:
收稿日期:2015-11-04
文献引用格式:陈都,苗方,金立标,等. 广电智能推荐系统的应用研究[J].电视技术,2016,40(1):102-105.
CHEN D,MIAO F,JIN L B, et al. Study on intelligent recommendation system applied in television broadcasting[J].Video engineering,2016,40(1):102-105.