基于微服务架构的广播电视内容监管系统设计

2022-09-05 11:40:24吴慧思
视听 2022年9期
关键词:人脸识别音频容器

吴慧思

传统的广播电视内容管理业务有广告管理、监听监看以及动态舆情等,不同的业务建立不同的系统。笔者根据广播电视监管业务需求以及现有技术的发展,在传统广播电视内容管理的业务分类基础上,整合资源,对传统的广播电视内容管理系统做进一步改进和扩展,提出了一套基于微服务架构,集节目识别、广告识别、新增重复节目识别等节目拆条,舆情处理,人脸识别,节目评议,语音识别于一体的广播电视内容智能化监管平台。

一、总体设计架构和思路

系统在框架上采用微服务架构,在业务的基础上细分功能,分组为各个子功能,不同的子功能就可以分为一个微服务,具有硬件资源可灵活调用、维护简单以及运行高效的特点。具体架构如图1所示。

图1 内容管理平台架构

二、系统概述

系统功能模块主要由监管业务和平台管理两个部分组成,如图2所示。

图2 系统主要功能模块

三、微服务软件架构

在一个系统中,会有多个功能模块,每个功能模块由多个基础子功能构成,通常包含几十个子功能。它们需要通过彼此之间的调用,才能实现各种业务功能,因此基础子功能之间往往存在着各种交错的依赖关系。随着平台的不断壮大,代码规模逐渐变多,各个子功能的调用关系也将趋于复杂和难以维护,甚至还会带来很多难以跟踪和调试的错误。例如,节目识别、广告识别以及新增重复节目识别,这三个模块都使用了消息队列、高速缓存、数据库读写,若节目识别出现错误,消息队列将会出现卡死的情况,这会直接影响其他功能模块的正常使用。若能把节目识别、广告识别以及新增重复节目识别分别安装在各自独立的运行环境中,并且对它们各自所需的资源也都封装在一个相对独立的环境下,那么任何一个模块的异常都不会影响到其他模块的正常运行。

传统的解决方案是通过虚拟机的方式对环境进行隔离。虚拟机是基于操作系统层面的,因此存在以下缺点:云平台难以对虚机的各种异常情况进行监控,云平台不能及时发现虚机的假死、蓝屏、程序错误等情况;启动速度慢,一台虚机需要先启动操作系统,才能启动应用程序,因此需要较长的时间,用户能感受到明显的业务中断;资源调配不够灵活,新建一台虚机需要许多环节,当业务数据瞬间增多时,无法及时补充计算资源。为此,该系统引进了微服务软件架构,并以容器为技术实现,能较好地解决以上问题。

容器类似于沙盒技术,其主要目的是通过将应用程序运行在容器中,实现与外界的相对隔离,并通过统一的资源管理平台对容器进行资源管理。本质上,容器是一个特殊的进程,因此比虚机轻便许多。容器通过名称空间(Namespace)、控制组(Control groups)、切根(chroot)技术,把资源、文件、设备、状态和配置划分到一个独立的空间。容器的新建和启动速度通常能达到秒级,而虚机往往需要几分钟。容器和虚机一样,也可以在不同的宿主机器之间迁移,并且迁移速度比虚机更快。

通过容器来构建微服务还带来以下优点。一是计算环境可移植性较好。由于封装了软件模块所需的内部调用细节,如程序对Java或Python运行环境的依赖,以及对操作系统的特殊配置都封装在容器中,容器不仅可在Windows与Linux的宿主机上进行移植,还能减少因测试与交付环境的不同而产生的无法预知的错误。二是便于版本控制。由于每个容器镜像都可以进行版本控制,不同的版本分支便于在业务的不同开展阶段对微服务的部署做调整。三是提高系统的协同开发效率。由于容器能够对模块的跨服务依赖性进行最大的消除,依赖关系的冲突是消耗开发人员生产力的原因之一。通过对系统进行微服务划分,并对不同的微服务采用不同的容器进行封装,做到独立升级。

四、平台功能模块设计

(一)监管业务模块

系统通过音频分离服务、全天音频特征提取服务、图像关键帧提取服务等,把从前端采集到的音视频文件转换为音频文件,同时进行图像提取,按一秒一帧的频率抽取图像。对音频信号加窗处理,获取短时平稳的音频信号,转到变换域后,应用能量准则提取特征,为后续的音频特征检索做基础服务。

1.节目识别。节目识别是把广播电视的节目按不同类型完整地识别出来,包括新闻节目、专题栏目、电视剧、动画片等节目识别。将节目按类型完整地标注,避免了后期在进行节目审核时需从海量的广播电视节目中寻找节目等问题,降低了人工审核节目的难度。一般情况下,同样的节目,每期的片头片尾都是相同的,可以根据节目的这一特性,运用技术手段找到节目的播出时间。因为音频文件占用空间小、音频特征提取和识别技术已经较为成熟,所以在节目识别方式上使用的是音频识别。在节目识别中,需要由审核人员手动对节目的片头片尾做样本,系统再通过节目样例音频特征提取服务提取样本的音频特征,形成节目样本的数据库。在做节目样本时,把节目样本对应的性质同时绑定,即可把对应的节目分类。同时,系统根据全天音频特征提取服务,对全天的音频做特征提取。音频识别程序收到控制中心的识别指令后,检索相关的广播电视频率频道音频特征索引文件,匹配对应的样本音频特征,最后把识别到的结果标注好并在页面上呈现。

2.广告识别。广告识别主要分为违规广告、商业广告以及公益广告的识别。通过广告的自动识别和拆分,审核人员可以清晰地看到一天的节目时段,播了什么广告,在什么时间播放广告,是否有违规等识别结果,及时了解广告的播出情况,提高了人工审核的效率。该识别原理主要建立不同类型的广告样本库,根据音频特征分别去检索相应的文件,并得出结果。目前,样本的音频识别检索算法发展已经比较成熟,准确率高,识别出来的结果基本可以直接使用,不需要过多人工干预。

3.新增重复节目识别。全天的广播电视节目中,会有新增的电视剧宣传片和广告等,这些新增的素材一般会在当天或者第二天重复播放。利用重复的特点,通过对音频特征重复遍历比对的算法,把在广播电视中重复播放的视频片段识别出来,帮助审核人员快速准确定位到新增的节目内容。通过审核新增的节目内容,并及时做相应的样本让系统去识别和标注,系统自动识别发现新增节目内容和人工维护相结合的方式,提高整个流程的工作效率。因为已有样本的音频检索识别准确率高,所以利用现有节目和广告的识别结果,在识别时间上,首先可以剔除掉其他服务中已经确定的节目时间,节省了计算资源。同时,通过场景识别模块,识别出停机时段,在此基础上再去做新增视频的识别,提高系统的效率。

4.舆情处理。该业务主要是一些相关内容报道的收集和统计,可以分为三大部分:一是专题报道和宣传报道,主要是一些重点工作以及热点事件、突发事件的报道;二是上级广播电视台对于地方的相关报道;三是扩展到某一领域或者行业相关的舆情报道。为了实现该业务,首先通过预设节目时间以及节目识别技术相结合的方式,把特定的节目或者时间段截取出来,然后对其进行语音识别技术,把节目的音视频转为文字,通过设定专题的关键字或者地方的名字等,检索节目的文本,最终定位到节目中的关键字,找到相关的报道或舆情。

5.人脸识别。人脸识别,即对敏感人物自动筛查,可对节目画面中出现的人物进行更加高效、全面的身份识别。人脸识别功能的实现,大大降低了审核人员的工作量,提高了内容审核的智能化管理水平。目前,人脸识别有两种方式,一种是通过静态图像进行人脸关键特征提取来识别,另一种是通过视频进行人脸识别。系统在音视频预处理服务中已经提取过图像关键帧,直接运用已经提取好的关键帧,可以避免出现视频识别中计算量较大的情况,从而提高系统的整体运行效率。对于人脸识别,首先对图像帧做场景识别,剔除掉相似的图片,对不同场景的图像做识别,提高资源利用率。

(二)平台管理

1.审核模块。可对系统识别出来的结果进行审核、确认以及编辑处理,如包括新闻专题节目时间、广告、舆情、人脸等识别结果的审核;对节目进行评议;对舆情信息进行剪辑、编辑;按照条件查询数据,播放识别结果。

2.报表管理。根据不同的业务需求,数据报表主要包括节目报表、广告报表、舆情报表、违规报表等。可对系统的整体数据做统计分析,自定义时间周期,按年、季、月、周、日等统计数据,形成图表和报表。图表和报表可按照常见办公软件的格式导出。

3.配置管理模块。可以在操作页面对采集站点、频率频道、节目等相关信息进行增加、删除、更改、编辑等操作。

4.日志管理。记录系统的相关操作,如数据库的查询、删除、发送接口命令等,并进行及时备份,可按时间对日志进行查询。

5.设备管理。可监控各个微服务的运行状态,显示每个微服务的功能、进程,对异常的服务及时报警,及时发现系统运行中的问题,提高系统维护的可易性和便捷性。

6.用户管理。可以对用户进行权限管理,可增加、删除、编辑用户,对不同的用户进行分组,分配不同的使用权限,不同的业务用户挂载不同的业务管理模块,可形成堆叠。

五、系统优势和难点

(一)系统的优势

1.系统在识别算法前期,已经对音视频文件做了音频分离、音频特征提取文件以及图像帧抽取等,把资源统筹分类,为识别的方式提供了可选择性。不同业务的识别可根据情况选择合适的识别方式,提高了系统的灵活性。此外,在计算前期对数据进行统一的碎片化处理,如后续有新业务需要做识别计算,不再需要重新对音视频做前期处理,可直接进行音频或者图像识别,节省了开支,降低了系统开发成本。

2.系统运用了目前较为成熟的识别技术,配备了语音识别和人脸识别服务,提高了监管的智能化水平,节约了人力成本。

3.系统采用了微服务结构,不同的微服务负责不同的子功能,逻辑清晰,且可快速部署,只需要定义良好的接口,就可让微服务之间进行通信,具有高可用性和扩展性。

(二)系统的不足

1.目前,系统可以对新增重复节目的片段进行识别和标注,在无样本的情况下,还不能完整地识别一条广告或一个完整的电视剧宣传片等。是否可以根据静音和音频特征遍历检索相结合的方式,或者语义识别的方式去完整地识别一条新增广告,还需要做大量的测试和计算。无样例地对节目进行完整拆条,是目前的难点问题。

2.虽然单独的微服务降低了巨大代码的开发难度,但是因为涉及微服务之间的编排、处理,需要全局考虑服务与服务之间的关联,所以增加了整个系统的部署复杂度。此外,由于服务相互的依赖变得复杂,若进行系统测试,要充分考虑服务依赖的强弱、降级、限流等问题,避免出现测试误差的情况。

六、结语

不断加强新技术的更新和应用,探索业务和技术相互推动之路,进一步提升广播电视内容的智慧化监管水平,把工作人员从海量的广播电视节目初筛中解放出来,让审核进入新的时代,是广播电视监测的挑战和任务。

猜你喜欢
人脸识别音频容器
Different Containers不同的容器
人脸识别 等
作文中学版(2022年1期)2022-04-14 08:00:34
揭开人脸识别的神秘面纱
学生天地(2020年31期)2020-06-01 02:32:06
难以置信的事情
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
音频分析仪中低失真音频信号的发生方法
电子制作(2017年9期)2017-04-17 03:00:46
Pro Tools音频剪辑及修正
人间(2015年8期)2016-01-09 13:12:42
取米
基于类独立核稀疏表示的鲁棒人脸识别
计算机工程(2015年8期)2015-07-03 12:19:07