袁三男, 吴立新, 严宇晨, 孙伟杰, 黄 勇
(1.上海电力大学, 上海 200090; 2.上海科江电子信息技术有限公司, 上海 200233)
IPTV监管平台是一个高度数字化、智能化、自动化的监管平台,实现了对IPTV“全程监控,全网监管”的监管目标[1],保障了IPTV节目健康和播放安全,并且有效控制和引导节目舆论导向,制止不良节目和违规信息的传播,保障人民群众收听收看的合法权益,维护网络信息和文化安全。传统的监管方式主要是根据现有的数据库进行匹配审查和人工审核两种模式,对于出现过的违规现象可以直接匹配数据库,而对于新发现的则需要人工审核来判定。随着业务数量的提升,人工审核的效率逐渐成为制约发展的瓶颈。本文提出一种智能识别的监管模式,在基于数据库自动识别的基础上,通过深度学习方式对新出现的违规现象能有效地进行自动识别,减少对人工审核的依赖性。
IPTV监管系统由中心监管平台、IPTV节目集成播控(二级)监管前端、运营商传输分发平台(三级)监管前端、用户终端(六级)监管前端、大屏幕显示系统、相关附属设备以及网络和安全系统组成(主要包括计算服务器、存储服务器、监管采集前端设备、以太网交换机、防火墙等设备及监测监管应用软件[2])。其中,IPTV中心监管平台采用云计算技术,所有计算服务器纳入虚拟化资源池,合理调配系统资源,并采用分布式存储技术[3],更安全地保护系统数据,增加容灾能力。
整个系统逻辑架构分为4层:支撑层、数据层、业务处理层和用户交互层[4],如图1所示。
图1 系统逻辑架构
支撑层由数据库、服务器、防火墙和交换机等硬件设施构成,是整个系统运行的基础,通过安全、可靠的链路结构,集成监管中心系统所有计算服务器、网络设备、安全保障设备、存储服务器等。
数据层包括针对节目源数据的二、三级前端和针对用户数据的终端用户监管前端,各端采集的数据作为一层一层的节点构成庞大的数据网络。 其中,二、三级监管前端通过电子节目菜单(Electronic Program Guide,EPG)信息采集、直播频道采集、点播节目采集,并将采集内容传到IPTV 中心监管平台进行处理,实现对节目源的数据监察。终端用户监管前端是数据监测的最后环节也是最重要的环节,可以真实有效地将用户看到的节目数据进行采集对比,还能监测隐藏频道和播出事故等作用。
业务处理层对数据进行处理分析和储存,数据层庞大数据汇聚在中心平台进行处理。数据处理分为两个方面:一方面是安全播出监测[5],主要包括静帧、黑场、无伴音以及彩场等;另一方面是违规识别,主要包括EPG信息对比、码流监测、频道监测等。
用户交互层起人机交互的作用,主要包括节目监看(提供大屏监看以及多屏监看)、报表统计分析、系统运行状态查看以及用户的权限设置等。
终端用户监管前端通过网络爬虫技术获取终端用户的 EPG 信息和节目音频、视频内容信息[6],及时发现违规节目并回传到IPTV监管中心平台。其具体功能主要分为两方面:一是节目跟踪,二是违规检测。
节目跟踪模块将自动对用户直播、点播、回看等业务的EPG信息进行采集和回传,对采集的EPG信息进行系统的分类条目化然后存储在存储服务器里。条目化后的EPG信息更容易进行比对和变更。
完整的节目跟踪流程分为3个步骤,具体如图2所示。
图2 节目跟踪流程
第1步是监管前端采集EPG数据信息然后将数据回传给节目变更功能模块[7]。
第2步则是节目信息的对比,分为自动对比(程序自动循环对比)和手动对比(可以指定相关节目进行对比)。针对节目频道数量较少的直播业务可以使用实时对比方式,根据采集到的数据信息从原有数据库中调取对应的频道数据,然后对比是否一致,若不一致则发送节目变更信息。节目数量巨大的点播业务可以使用按批次的对比方式,每次读取部分批次对比看是否一致,不一致则进行变更,一致则读取下一批次,直至所有批次全部读取并完成对比。分批次对比可以有效减少计算量,提高计算效率。
第3步是数据库方面的存储变更。根据节目变更模块发送的变更信息替换掉原有的节目信息,实现节目内容的动态跟踪。
违规检测模块分为两个方面:一是根据数据库检测违规节目;二是根据视频内容检测违规节目。
违规检测流程如图3所示。
图3 违规检测流程
首先将终端用户监管端采集的用户数据和二级监管端采集的节目源数据进行对比,产生的增量信息代表着隐藏频道。然后将EPG信息送入违规节目检测数据库,检测是否是审批通过节目,接着检测是否是已有违规节目,最后根据敏感关键词等条目审核疑似的违规节目。
视频内容检测是通过视频比对模块,根据六级监管前端发送的视频信息检测相关违规现象。视频比对模块一般采用基于神经网络深度学习的图像识别技术,通过深度卷积神经网络将图像特征提取出来,例如台标识别、人脸识别、静帧和黑屏识别等都是根据相对应的图像特征和模板特征对比,符合一定相似度则认为是产生了违规现象。
(1) 台标检测 使用深度学习模型,利用SIFT特征算子匹配的方法,相比基于图像灰度的HU不变矩方法,匹配成功率从36.81%提升到了89.01%,减少了背景、旋转、灰度、位移等噪声对台标的识别影响[8]。
(2) 人脸检测 基于深度学习模型FaceNet网络人脸识别的准确率高达93.46%,满足绝大部分视频场景的识别要求[9]。
(3) 静帧、黑场检测 利用灵敏度策略和抑制策略,对于不同节目优化静帧、黑场识别的时间判别门限后,对200套节目进行比对,误报次数从968次减少为66次,准确率显著提升。
最后,将违规检测模块检测的违规业务提取相关的违规证据,并送入审核流程(人工审核),审核结果录入数据库方便下一次数据调用。相比传统监管,在人工审核前进行一次视频流的智能识别,将可能产生的违规现象进行了一次筛选,减少了人工审核的工作量,同时将新的违规内容补充至数据库,不断提高识别准确率,使得审核方式更加智能化。
云计算实际上是一种分布式计算的发展,整合了并行计算和网格计算的特征优点,是一种新的计算模式。由于IPTV业务庞大、数据繁杂,传统计算方式难以应对,云计算这种新的计算模式能有效面对这种挑战,为平台快速有效处理和存储数据提供支持。
IPTV监管平台主要是在数据计算和数据存储两个方面运用云计算技术,分别是计算虚拟化技术[10]和分布式云存储技术。
虚拟化技术将一台物理设备通过软件设施虚拟为多台逻辑设备,各台逻辑虚拟机在统一标准下独自运行,互不干涉。当计算物理设备被虚拟化之后,计算资源也会被组合化。资源被调配时会忽略各服务器设备的差异,按照统一标准的逻辑虚拟机进行分配资源。若一个服务器发生故障,对应的虚拟机将会转移到正常设备上,并不会影响计算,相当于计算资源的减少而非真正意义上的应用故障;同时对于计算负载高的设备,可以将部分计算负载分配给计算负载低的设备,避免了高负荷运行的现象出现。虚拟化技术使得每台服务器都能以最优状态运行计算任务,提高了计算效率。
按照传统的存储技术,数据将被集中存储在中央存储服务器中[11],硬件设施将成为数据存储容量的限制条件,同时集中的数据存储考验服务器的容灾能力,难以满足大规模存储应用的需要。云存储技术可以将存储资源分散到各个虚拟化的存储服务器上,并且将这些资源以存储池的形式集中起来,实现资源的协同工作。外部调用资源不是调用单独的存储服务器,而是从整个资源池中随意调用,因而可以实现数据的大量存储和快速调用。由于数据是存储在各个服务器中的,所以不会因为事故而导致所有数据的流失,再加上数据的备份和其他防灾措施,均提高了数据存储的安全性和稳定性。
本文针对国内IPTV实际情况提出了IPTV节目监管系统的总体设计原理和总体系统架构。对IPTV节目内容监管系统的数据采集、违规节目的智能识别、数据存储、云架构平台等都做了分别阐述。新的IPTV监管系统基于嵌入式系统的智能识别和云计算平台的应用,与传统监管方式相比,处理业务效率更高,识别准确度更高,应对故障能力更强。随着IPTV快速发展,IPTV监管平台也需要与时俱进,不断完善健全,构造积极、健康、安全的IPTV业务。