王素然
内蒙古广播电视台 内蒙古 呼和浩特市 010050
内蒙古广播电视台IPTV 媒资补全系统将对以下几个方面进行新增或升级并达到相应目标:
(1)升级播控运营平台,实现对节目媒资的灵活运营与编辑、EPG 深度呈现;
(2)升级BI 大数据系统,实现对收视行为和节目标签的多维度统计分析功能。
最终IPTV 播控平台通过智能媒资补全系统,利用C2 标准库中的媒资进行相似度分析,补充媒资标签等各维度,从而达到利用这些数据,大大减轻人工补充媒资信息的工作量,减少工作时间并提高工作效率,同时可以方便对接集成播控平台EPG 系统及各运营商内容运营系统扩展媒资内容数据。
系统架构图说明:
(1)新建系统:媒资补全业务系统。
(2)底量数据割接:对需要割接的底量数据,用数据库脚本将底量的库存媒资编目数据导入融合媒资数据中,作为基础媒资数据。
(3)增量数据同步:需要内蒙古广播电视台IPTV 播控平台将增量媒资数据同步给媒资补全业务系统,实时对接媒资补全服务接口,获取媒资补全数据。
图1 系统架构图
(4)补全合并后媒资进行人工审核后,按C2 接口将内容注入到智能运营平台。
(5)智能运营平台改造升级:支持媒资自动编排和自动下发;新增接收节点配置以支持媒资补全业务系统的对接,接收媒资补全数据;新增分发节点配置以支持BI 大数据系统的对接,下发媒资补全数据。
(6)BI 大数据平台改造升级:支持媒资补全数据的接收,智能搜索服务支持媒资补全的搜索。
补充的媒资可以用于日常运营,主要用于丰富用户画像、智能推荐、智能搜索等领域。
(1)利用标签进行栏目的自动编排,同时丰富媒资在EPG 上的呈现;
(2)利用不同维度的媒资进行全文智能搜索、提升用户的搜索体验;
(3)利用标签、不同维度的媒资,进行相关的推荐、用户画像的丰富,如拍摄场景,推出相关辅助的旅游类产品推荐等。
元数据采集渠道包括直播EPG 数据、视频网站、搜索引擎、影评网站等。
全网影视大数据平台提供统一的元数据(静态的标签索引数据)和知识图数据(动态的趋势热点数据)作为搜索推荐引擎和网络收视率分析的基础,也可用于内容编排、终端呈现和节目引进的数据依据。
元数据服务可以为直播、回看、点播和IPTV 内容提供统一的元数据和知识图数据。CP或者SP 合作方可以按照定义好的接口规范,通过定时API 接口的方式调用元数据服务来补充和完善影视元数据,对于部分特有的或未匹配到的内容需要由编辑人员补全。同时建立元数据仓库,针对运营提供相关内容量的数据报表。
系统支持多种元数据标签,如片名、别名、类型、标签、地区、类型、年份、奖项、主演、导演、剧情介绍、语言、片长、情节提示、评分、影评、计费方式、价格等。
系统针对接口或抓取到的内容进行元数据管理的功能,可提供编辑、查询、删除的功能。
(1)元数据封装
对所有获取到的元数据按照数据库要求统一转换成指定封装数据格式。
(2)元数据整合
对于同一内容不同CP 的元数据,通过规则进行归一。
通过SQL 整理或者提供EXCEL 模版的方式,将入库的元数据和现网各个内容方已发布的媒资内容需建立对应关系。通过对比直播节目单和点播库中的元数据,打通直播和点播的入口,并且支持通过API接口,获取直播状态下对应的点播信息。
按照定义好的接口规范,通过定时API 接口的方式调用元数据服务来补充和完善影视元数据。
系统敏感词词库对爬取内容做敏感词后续的处理方式包括放弃,删除等等。系统建立敏感词库,提供WEB 管理界面支持录入、更新和维护敏感词信息数据,系统在对采集的补充媒资数据清洗入库时,自动根据敏感词过滤掉那些涉及敏感内容的媒资内容记录数据。其提供的管理功能包括敏感词查询、敏感词新增和导入、敏感词修改、敏感词删除、敏感词过滤策略设置(如放弃,删除等)。
系统对每个被爬取的数据源做相似度分析。预设自动关联
规则,基于媒资数据维度计算出补充媒资的相似度,根据相似度计算的分值,与基础媒资进行自动关联。
表1 扩展主要内容
电影出品公司制作年份出品年份国家地区发行商片长豆瓣评分北美票房香港票房大陆票房全球票房编剧节目格式广电总局备案号公映许可证号引进许可证号首播平台导演主演看点海报看点关键词官方微博剧情简介电视剧出品公司制作年份出品年份总集数更新集数国家地区发行商编剧豆瓣评分首播频道首播时间广电总局备案号电视剧发行许可证号引进许可证号首播平台导演主演看点海报看点关键词官方微博栏目播出时间播出时长总期数更新期数首播时间更新完毕国家地区播出频道监制豆瓣评分主持人嘉宾看点海报看点关键词官方微博栏目简介艺人早期生活经历艺人简介
系统将根据自动合并规则自动将部分补充下来的字段合并到统一媒资内容信息库中,如标题取基础媒资的、演员取补充媒资的、简介取补充媒资的、导演取基础媒资和补充媒资合并去重的等等。但如果统一媒资已经被人工审核过,此自动合并功能失效。
同时,系统在统一媒资内容管理界面集中展示基础媒资和互联网补充媒资内容数据,针对审核通过的互联网媒资内容以列表形式展示在一起,并提供一个多功能的合并操作方式,供用户进行数据合并。针对人工合并完的数据,用户可以手工修改,但自动合并功能将不再生效。
系统提供管理界面列出基础媒资和相关的补充媒资内容记录,选择要保留哪个数据作为基础媒资元数据的扩展参考。
同时系统提供媒资内容相似度对比功能,即系统支持自动比对新获取的媒资内容与媒资库中已有媒资内容的相似度,通过设置一定的阀值和规则设置,如500 分以上的相似性,则自动添加审核标记作为基础媒资元数据的扩展参考。
系统对节目单扩展补充,对接精准节目单系统数据接口,对基础媒资中的节目单中导演、演员、地区、语音、集数、类型、标签进行融合扩充。用经过校对的合作节目单,对基础节目单进行扩展。
精准节目单系统数据接口:根据频道名称获取频道、获取频道分类、获取频道列表、根据频道获取节目列表、获取多个频道的当前节目、获取节目分类、获取节目最后更新时间。
媒资支持扩展补全,对接数据接口,对基础媒资中的导演、演员、地区、语音、集数、类型、标签进行融合扩充。用经过校对的媒资数据对基础媒资进行扩展。扩展主要内容见表1。
IPTV 播控平台通过智能媒资补全系统,不但大幅减少了运营人员的工作量和工作时间,播控平台也新增了人物、评分、直播点播互推等新的智能运营场景;运营方式也由原来的简单内容运营裂变成了结合用户喜好的智能内容运营与结合用户使用习惯的智能产品运营;EPG 呈现效果也通过筛选、多维度内容关联、组合列表页、多维度智能搜索等功能的加入进一步得以提高。智能媒资补全系统为IPTV 播控平台的进一步发展迭代打下了良好的数据基础。