成 培
(广西广播电视监测中心,广西 南宁 530001)
广播电视是党和人民的喉舌,因此广播电视广告对人民群众的影响也是异常深远,近年来传统媒体的广播电视广告比例大幅上升,且时有一些虚假、医疗等违规广告出现在大众荧屏,影响恶劣,严重影响了广播电视在群众心目中的公信力。为规范广播电视广告播出秩序,促进广播电视广告业健康发展,保障公民合法权益,国家广电总局出台了广播电视广告播出管理办法,对广播电视商业广告、公益广告、电视购物广告等播出时长、插播次数等都做了详细规定。但是要彻底治理目前广播电视广告播出秩序混乱的现象,不仅要靠严谨的制度和措施,更要靠先进的技术监督手段和措施。本文提出了较为全面的广播电视广告监管制度和先进的基于视频检索的广播电视广告监管技术方案。
根据国家广电总局61号令及71号文,监管重点主要在以下9个方面:
(1)全天每小时商业广告超时;
(2)黄金时段两小时商业广告超时;
(3)影视剧违规插播广告;
(4)冠名标识违规;
(5)用餐时间播出反感广告;
(6)违规播出71号文件禁止播出的电视购物短片广告;
(7)电视购物短片广告内容违反71号文件;
(8)上星频道18点至24点违规播出电视购物短片广告;
(9)违规药品、医疗、医疗器械和健康资讯类广告。
系统按照规则从电视节目采集系统中获取电视节目视频文件在系统中存储,首先进行视频特征[1]的提取,将提取的特征码以文件形式存储并建立索引,以供后续的重复识别检索。
视频检索[2]程序一方面根据配置的时间窗口,依据重复次数等条件,识别出所有重复视频片段。系统将这些重复片段与广告库进行排重处理,将新出现的不重复视频片段标记为疑似广告,供审看员审核。审看员对疑似广告进行审核并分类,标记其是否为广告以及属于公益广告、烟酒类广告、药品广告等。系统自动根据审看员的审核结果,剪辑拆分视频文件,形成单条的广告视频,并分级存储在系统中。
另一方面,视频检索程序还要将时间窗口内的视频内容与广告样本库比对,将比对上的视频片段切分为广告条目分级存储在系统中。最终两部分数据结果形成电视广告库。用户可编辑广告库中的任意一条广告。
违规广告判定程序基于广告库进行台标检测和倒计时检测,将不符合规定的广告判定为违规广告。另外对于满足在不适当的时间段播放禁播广告等条件,系统也将其判定为违规广告。
本系统采用分布式结构,保证广告监管平台中总平台和地市系统同时处理,例如在重点的地市中每个地市有2路在采集和处理,同时总平台也在进行采集和处理。
系统采用分层逻辑结构,采用三层结构分为:数据采集层、数据分析层、系统管理及总控界面层。其中,信息采集层为整个系统提供最基本的原始采集数据,数据处理层对采集到的信息进行后台数据分析、处理,系统管理总控界面层为用户(系统管理员、普通用户)接口,实现各类功能的操作界面。信息采集层与数据处理层之间的功能模块通过接口相互作用,数据处理的结果反馈信息采集,使信息采集的准确性、效率大大提高;同样,数据处理的结果也为用户提供各类有效的信息。该层次结构的各层在系统平台的管理下协调工作,相邻层之间又相互作用,通过接口进行有效的信息交互,使系统可扩展性强,能根据应用规模、功能变化等因素灵活调整系统布局。
图1 系统主要流程图
广告监管系统采用分布集中相结合的方式架构,对于市、县的电视节目采取当地采集当地识别的模式处理,仅将识别结果实时进行中心回传,视频内容在审核人员调看时再进行回传,这样大大减轻了中心与市、县间的带宽压力。位于中心的节目则采用集中式处理方法在本地进行实时处理。采用此种分布和集中相结合的结构最大程度的节省了带宽,优化了资源。由于系统采用分层逻辑机构和功能模块化结构,可自由部署不同功能模块。再根据系统中各功能的特点、安全性、可管理性等因素,系统实施的拓扑结构如下图。后续可根据系统运行的数据、性能及功能扩展的需求,方便地进行扩展,从而最大化地优化投资。
图2 监管系统部署的拓扑结构示意图
系统的主要功能应包括广告监管、热点广告、频道监管、广告审核、综合检索、业务配置、数据报表、统计分析、系统管理等模块。
图3 系统功能划分图
4.1.1 广告列表
系统根据特定规则识别出疑似广告,并自动切割为单条广告视频文件,记录广告的名称,广告播出的开始时间,广告播出的结束时间,广告时长,广告所在的节目名称(类型),广告所在的频道名称,广告的分类,广告的性质,广告匹配的疑似违规关键字。
4.1.2 排重广告列表
系统根据特定规则对广告进行排重,获取同一广告的重复个数,重复的电视台(频道)个数,重复的电视节目个数。
4.1.3 新增广告列表
系统根据特定规则最新识别出的疑似广告,并自动切割为单条广告视频文件,记录广告的名称,广告播出的开始时间,广告播出的结束时间,广告时长,广告所在的节目名称(类型),广告所在的频道名称,广告的分类,广告的性质,广告匹配的疑似违规关键字。
4.1.4 敏感广告列表
系统根据配置的关键字,对所有识别出的广告进行匹配,获取广告匹配的疑似违规分类,记录广告的名称,广告播出的开始时间,广告播出的结束时间,广告时长,广告所在的节目名称(类型),广告所在的频道名称,广告的分类,广告的性质,广告匹配的疑似违规关键字。提供人工审核功能,将确认违规的广告加入到违规广告列表中。
4.2.1 播放次数排名
获取电视上播放次数最多的广告列表,信息包括广告的名称,广告播出的开始时间,广告播出的结束时间,广告播放次数,广告播放总时长,广告时长,广告所在的节目名称(类型),广告所在的频道名称,广告的分类,广告的性质,广告匹配的疑似违规关键字。
4.2.2 播放时长排名
获取电视上播放总时长最长的广告列表,信息包括广告的名称,广告播出的开始时间,广告播出的结束时间,广告播放次数,广告播放总时长,广告时长,广告所在的节目名称(类型),广告所在的频道名称,广告的分类,广告的性质,广告匹配的疑似违规关键字。
4.3.1 电视频道列表
显示出电视频道的信息,包括频道名称,电视台标,频道分类,开办者名称,广告次数,广告时长等信息。
4.3.2 违规频道列表
当指定电视频道播出违规广告或者人工审核为违规,将电视频道加入到违规频道列表中。并确认该电视台(频道)中的广告违反了广电61号令哪些条例,并形成相应的频道违规报表。
4.4.1 敏感广告列表
系统根据配置的关键字,对所有识别出的广告进行匹配,获取广告匹配的疑似违规分类,记录广告的名称,广告播出的开始时间,广告播出的结束时间,广告时长,广告所在的节目名称,广告所在的频道名称,广告的分类,广告的性质,广告匹配的疑似违规关键字。提供人工审核功能,将确认违规的广告加入到违规广告列表中。
4.4.2 违规广告列表
人工审核后确认违规的广告加入到违规广告列表中,并确认广告违反了广电61号令哪些条例,并形成相应的广告违规报表。
提供高级检索功能,允许用户通过高级条件配置进行检索。
4.6.1 广告样本管理
提供广告样本管理功能,允许用户查询,观看,上传,下载,编辑广告样本。并标识出广告样本的普通分类和违规分类。
4.6.2 广告样本制作
提供广告样本制作功能,允许用户根据现有的或者其他的广告进行广告样本的制作,并生成相应的特征码文件。
4.6.3 关键字配置
系统识别广告内容的分类以及是否涉及敏感内容可以通过文本关键字来实现的。
系统为用户开放多规则关键字的新增、删除和修改界面,以调整系统对新疆公安业务的适应度,使之能够保持长时间的高可用性。用户随业务需要,可配置多规则的关键字,规则中包括“必须包含”、“包含其一”以及“不得包含”的关键词。
4.6.4 台标管理
提供电视频道台标管理功能,允许用户上传,修改频道台标。
4.6.5 广电条例查看
提供广电61号令,以供用户进行查看,对违规节目进行判别。
4.7.1 违规广告报表
系统中的广告违反了广电61号令哪些条例,生成的违规广告报表。
4.7.2 频道报表
电视台(频道)中的广告违反了广电61号令哪些条例,生成的违规频道报表。
4.8.1 广告类别统计
统计系统中广告的各种类别数量,例如烟酒广告,医药广告,食品广告等。
4.8.2 广告性质统计
统计系统中广告的各种性质数量,例如商业广告,公益广告。
4.8.3 广告违规类别统计
统计系统中广告的各种违规数量,例如交友广告,违规时段播出的广告。
4.8.4 电视频道(台标)广告统计
统计系统中各个电视频道中的广告数量,违规广告数量。
4.8.5 违规频道统计
统计系统中各个电视频道中的违规广告分类数量。
4.9.1 用户管理
用户可自行增加系统使用用户,并配以一些默认权限。
4.9.2 权限管理
系统设置不同级别的用户和用户组,分别赋予不同的权限级别,可以实现任意的权限级组合及管理,可以满足不同情况的需求。
4.9.3 日志管理
系统会记录每个登录的用户在系统内的操作日志,保证系统数据修改有证可查。
4.9.4 访问管理
用户通过此功能可以设置允许访问系统的IP地址段,有效的提升了系统的安全性。
4.9.5 系统监管
系统会记录所有服务器的运行状态,保证系统正常运行。监管报告
系统提供对手机视频相关的审批信息、违规信息的分析统计,自动生成监管报告,为政府管理提供数据基础。
本方案提供基于重复视频片段的识别[3],从而实现对广播电视广告的自动识别,大大提高了系统效率,减少了人为参与的几率。该技术为国内先进的主流自动识别技术,效率和识别结果都比较高。
本方案中的相似视频片段的检索子系统所采用的镜头检测技术[4],利用基于图划分模型的特征和支持向量机的分类模型,检测的性能和效率都较高。在国际视频检索领域的权威评测TRECVID 2004到2006中,在对渐变和切变的检测的总体效果上一直处于国际领先的水平,其中在2004年和2005年列第一位,2006年列第二位。
本方案中视频片段静态图像摘要的生成子系统所采用的镜头语义概念检测技术[5],利用rankboost的框架,融合了多种特征以及多种粒度,在国际视频检索领域的权威评测TRECVID 2006中名列第一。
广播电视广告监管系统由广告发现、广告数据存储、广告审核、样本管理、广告检索和统计和系统配置和管理模块组成。通过在系统前端提取电视节目的音视频信号特征,对播出的广告进行自动识别、拆分,自动提取广告内容,快速及时的发现违规广告。从而规范广播电视广告播放行为,提高监管能力。
[1] 冯杰.基于 H.264压缩域的视频分割与特征提取方法研究[D].杭州:浙江大学生物医学工程与仪器科学学院,2009:67-77.
[2] 雷少帅.基于内容的视频检索关键技术研究[D].太原:太原理工大学,2012:33-50.
[3] 刘守群,朱明,郑烇.一种基于内容相似性的重复视频片段检测方法[J].中国科学技术大学学报,2010,40(11):1130-1135.
[4] 瞿中,高腾飞,张庆庆.一种改进的视频关键帧提取算法研究[J].计算机科学,2012,39(8):300-303.
[5] 刘继晴.基于多特征融合的视频高层语义概念检测[D].北京:北京邮电大学,2011:1-71.