摘要:本文从分析互动电视业务发展遇到的问题入手,阐述将个性化推荐算法技术引入视频点播系统的必要性。个性化推荐使用特殊的信息过滤技术,向用户推荐其感兴趣的内容。简而言之,个性化推荐算法是将用户的个人喜好与具体的内容特征进行对比,从而响应预测用户对某些未评分项目的喜好程度。选择参考功能项基于内容属性、用户属性和情景信息。
关键词:个性化推荐;融合推荐;数据挖掘;自学习能力
0引言
随着江苏有线互动电视业务的快速发展,互动电视节目内容进入海量时代。业务部门通过每日更新栏目推荐内容,使用户可以快速浏览到业务部门推荐的节目。但是每个用户关心的内容是千差万别的,如何保证用户能够从海量内容中准确定位自己需要和感兴趣的内容,是关系到用户体验和运营商收益的关键。因此有必要将一些个性化推荐的算法引入视频点播系统,用于支撑未来业务运营的发展,更好顺应信息技术产业发展趋势,为抢占市场先机打下有利基础。
2 个性化推荐算法
智能推荐系统中的个性化推荐通过贝叶斯网络算法和协同过滤算法。两种算法均是扩展多种服务类型的业务概率、提高用户体验的重要方式。个性化算法赖于用户数据和历史数据对用户喜好进行预测。智能推荐系统可以利用内置的接口API、算法、用户ID、群组和情景来生成HTTP请求,并发送到智能推荐系统接口引擎。推荐项列表将以JSON格式的HTTP消息返回。系统需要提取项目ID(作为业务需求)并获取其它相关信息,以将现有层呈现至终端设备,状态和推荐理由亦将嵌入在返回信息中。
2.1个性化推荐算法概述
根据提取和比较功能项的方式,可将智能推荐系统支持的推荐算法分为两类:
²基于协同过滤的推荐:推荐给用户一些与该用户使用习惯相似的其他用户喜欢的内容。例如,当用户在浏览影片时,基于协同过滤的推荐系统会根据其浏览记录或历史购买记录,分析出与其使用习惯相似的一些用户,将他们浏览和购买的影片推荐给用户。
²基于模型过滤的推荐:通过分析用户属性、内容属性、用户购买历史建立数据推理模型(贝叶斯网络),根据推理模型计算出该用户已选择过的内容相似的内容。例如,当用户在准备购买影片时,一般总是选择与之前购买历史相似的内容,那么推荐系统就会推荐一些相似的内容。
2.2个性化推荐系统特征
支持多种推荐算法(协同过滤、贝叶斯网络、排名),并提供智能的算法选择逻辑,可根据用户属性和购买历史等因数自动选择合适的推荐算法。
提供个人推荐和家庭组成员推荐的支持。在支持个性化推荐的同时,可根据多个家庭成员不同的个人喜好作出群组推荐。例如,当家庭中有多人(父亲、母亲、子女)同时观看电视时,系统可综合多人不同的偏好,返回的推荐列表中将同时涵盖多人的喜好。
同时应用两种反馈机制(隐式、显式)。隐式:用户的访问或点播记录。显式:用户对内容的评价。
2.3健壮性和自学习能力
内置异常处理机制和可靠的数据存储机制保证了个性化推荐引擎的健壮性。推荐系统由于需要进行大量的实时运算,所以采用算法保护和切换机制。可根据不同类型的请求进行算法选择,保证推荐结果的完整性和精确性。在数据存储方面推荐系统支持分布式管理,能够自动维护数据的多个拷贝,并在任务失败后自动重新部署计算任务。
推荐系统支持自我学习的能力,根据用户最近的浏览、购买行为不断修正用户的偏好。有效解决用户兴趣会随时间发生变化的问题。
2.4个性化推荐算法 – 协同过滤(CF)
协同过滤(Collaborative Filtering,简称CF)是一种应用广泛的推荐算法,其特点是算法能够基于一些复杂的信息(如质量、品质)作出推荐。支持发散式推荐,可以帮助用户发现之前从未关注过的内容。系统包含以下两种协同过滤算法:
基于用户的协同过滤:根据用户的评分历史,找到与用户有相近爱好的其他用户,之后把这些用户感兴趣的内容推荐给此用户。
基于项目的协同过滤:根据用户的评分历史,找到与用户曾经观看的内容相近的其他内容,并把这些内容推荐给此用户。与基于用户协同过滤相比,基于项目协同过滤算法解决了随着用户量的不断增长实时计算量过大的问题。
2.5 个性化推荐算法-贝叶斯网络(BN)
贝叶斯网络是一种用于上下文推理的技术,非常适合解决信息分发的概率问题。由于贝叶斯网络是基于数据推导的特性,所以不像协同过滤算法一样存在数据稀疏的问题。该算法通过分析用户浏览、点播、评分记录,并使用贝叶斯网络预测其对内容的偏好,然后将用户偏好与内容特征进行匹配计算从而产生内容推荐。该算法的特点是:能够参照多种属性为用户提供更为精确有效的個性化推荐。
正面模型和负面模型推理过程如下(图1所示):
推荐系统接收个性化推荐请求,推荐系统获取用户属性信息、内容信息、用户情景信息(例如:观看时间、观看人数、情绪等)
推荐系统使用正面负面模型进行数据推理,并对推理结果进行权重距离计算,计算出靠近正面模型的内容权重和远离负面模型的内容权重。
算出的用户对内容的偏好概率大小顺序生成推荐结果。
3关联推荐算法
3.1使用余弦相似度的关联推荐
关联项目算法是一种基于服务内容属性的推荐算法。服务项将在余弦相似度基础上进行比较,并将根据特定项目的相似度进行分类。算法特征:由于事先计算了项目相似度,因此可以实现实时计算。该推荐于终端用户搜索特定类别或关键字时适用。推荐引擎将通过数据库中的预处理矩阵获取关联程序最高的项(由分数决定:1-相同,0-完全无关)。因此,它与终端用户的登录状态不相关。集成人员可以利用内置的接口 API、算法名称(余弦相似度)、用户ID、当前内容ID以及跨服务标识来生成HTTP请求,并发送到智能推荐系统接口引擎。推荐项列表将以JSON格式的HTTP消息返回。集成人员可能需要提取项目ID(作为业务需求)并获取其它相关信息,以将现有层呈现至终端设备。状态和推荐理由亦将嵌入在返回信息中。
3.2使用关键字搜索的关联推荐
使用关键字搜索的关联推荐基于全文搜索技术,该技术旨在通过将文本内容分解为关鍵字来寻找最为相关的服务内容,并根据反向索引进行搜索。该推荐于终端用户搜索特定类别或关键字时适用。操作员可向用户推荐关联的服务内容。集成人员可以利用内置的接口 API、算法名称(关键字)、用户ID、当前内容ID、跨服务标识以及内容所属语言来生成HTTP请求,并发送到智能推荐系统接口引擎。推荐项列表将以JSON格式的HTTP消息返回。集成人员可能需要提取项目ID(作为业务需求)并获取其它相关信息,以将现有层呈现至终端设备。状态和推荐理由亦将嵌入在返回信息中。
4 结束语
将智能推荐技术引入到视频点播系统后,方便用户快速找到自己喜爱的节目,提高了互动电视节目点播量,产生显著的社会效益和经济效益。智能推荐技术除了可以应用于视频点播系统,还可以应用到更多其它广电业务。
通过与终端管理系统集成,获取用户对直播节目的收视习惯的统计和分析,同时结合直播节目的深度EPG信息,可以实现点播、直播、回看节目的融合推荐,如当用户收看直播节目时,可以向用户推荐相关联的点播节目和频道回看节目,给用户带来更好的收视体验。
通过定制化开发,智能推荐技术还可以为其它广电业务,如电视商城、电视游戏、电视互联网等进行内容推荐,具有很好的应用前景。
参考文献
[1]周虹君,殷复莲,陈怡婷,周嘉琪,伊成昱.Spark框架下的受众分群及矩阵分解的推荐算法研究[J].互联网+健康,2016,20(2):139-141.
[2]张晓阳.基于受众收视行为分析的电视节目编排策略刍探[J].企业家天地,2011,3(1):187-188.
[3]高肖俊,丁云强.基于用户收视兴趣模型的广电客户分群及精确化营销系统建设[J].视听界,2016,3(2):1-3.
[4]夏欢.基于组合策略的IPTV节目推荐[D]:[硕士学位论文].昆明:云南大学,2016.
[5]沈建军.面向互动电视的影视节目推进系统研究与实现[D]:[硕士学位论文].杭州:复旦大学,2012.
作者简介:
葛雨,男,1983年生,学士,江苏省广电有线信息网络股份有限公司播控中心科长,主要从事VOD、OTT业务运行管理方面的研究,曾参与过省市县三级播控等江苏省文化产业引导资金项目、Tvos业务等国家“核高基”项目。
江苏省广电有线信息网络股份有限公司,南京 210018