人工智能技术在广播电视综合监管平台中的应用

2022-01-06 10:58胡春虹
数字通信世界 2021年12期
关键词:引擎电视节目广播电视

胡春虹

(云上贵州大数据产业发展有限公司,贵州 贵阳 550081)

0 引言

贵州省广播电视监测中心作为贵州省惟一的广播电视监测部门,主要工作职责有:承担广播电视信号和广播电视安全播出、广告、IPTV节目、网络视听节目(含网络广播电视、手机视听节目等)工作,为广播电视管理提供技术服务和技术支持;承担全省自办广播电视节目收听收看工作;负责广播电视信号监测、安全播出保障体系建设、安全播出风险评估等安全播出日常管理以及应急指挥调度等。

根据国家对广播电视监测监管的要求,贵州省广播电视监测中心积极响应,在运用大量新型人工只能技术的基础上建立健全“技术先进、标准统一、研判专业、制度规范”的广播电视综合监管平台,开展广播电视技术质量监测、IPTV监测、视听新媒体监管、节目内容监管等工作,提高监测监管能力和水平,实现可持续升级、集约高效的广播电视与视听新媒体全业务监测监管。

1 业务范围

贵州省广播电视监测中心监测业务范围如图1所示。

(1)广播电视节目安播监测。负责对全省有线电视、模拟电视、开路电视、DTMB、卫星信号、调频广播等播出信号的全省覆盖播出情况、节目质量传输情况、播出停播情况进行监测。

(2)广播电视节目监听监看。负责对全省自办频道中的广告、新闻热点、敏感人物进行监听监看,同时对全省IPTV直播、点播节目的播出情况进行监测。

(3)网络视听节目监管。完成贵州省辖区内互联网视听内容监管(涉广电相关互联网舆情、微信、微博、手机APP、融媒体中心平台内容监管)。

2 现状分析

2.1 业务形态众多

广播电视节目的监管责任大、任务重、要求高。根据当下的传播技术发展形式,传播内容丰富多源、泥沙俱下,开办主体鱼龙混杂、诉求不一。根据中央和总局要求,各级广播电视监测中心必须立足于“为宣传服务,为安全播出服务,为政府管理服务”,严防死守在广播电视节目内容监听监看一线,始终为国家安全、社会稳定、文化健康、网络清朗保驾护航。

2.2 海量监管对象

一方面,近年来广播电视节目内容监管面临诸多严峻问题。各种形态节目源数以十亿计,每日新增节目量超过数万个,这个数字还在持续增长,违规有害排查对象和范围十分庞大;二是舆情信息日益纷繁复杂、波谲云诡,舆情研判要求和难度增大;三是视听节目服务发展迅速,自制节目等新业态不断涌现,监管工作需要及时迅速跟进;四是4G、5G等技术迅猛发展,手机网民规模不断壮大,移动APP传播视听节目的监管面临更大困难;五是微信、微博、短视频、网络直播等短平快传播手段高速普及,视听节目传播速度及产品数量呈几何倍数增长,更加泛在化,对监管的覆盖面和处置时效提出更高挑战;六是移动互联网电视影响力日渐增加,进一步加强监管,规范传播秩序仍困难重重。

另一方面,要做好广播电视监管工作必须要有强有力的技术支撑手段。随着新业务、新形态、新技术不断涌现,各种形态视听节目通过多源、多屏、多终端、多元网络等不断衍生,呈现海量、交互、融合、微领域、移动化等发展趋势,音视频技术也向着云存储、云播控、云计算、大数据等方面迅猛发展,无论是传播内容的海量化,还是传播渠道的多元化,抑或是传播速度的骤升化,仅靠人工是无法解决监测监管难题,更何况监管智能单位人员编制十分紧缺。总体来说,广播电视节目监听监看业务对技术的依赖性显得越来越强烈。要满足中央和总局的监管要求,很好地完成监管重任,就必须紧贴实际业务需求,优化整合技术系统资源、大力扩展系统功能,竭力提高系统性能,建设功能强大、覆盖全面、反应灵敏、处置及时的广播电视监管技术支撑手段,切实保障视听新媒体信息文化安全、导向正确、空间清朗,并为国家安全和社会稳定作出积极贡献。

3 技术架构

贵州省广播电视综合监管平台将各类人工智能识别引擎融合汇聚,打造成识别引擎资源池,通过上层各类业务系统下发不同的识别任务,统一调度资源池中的人工智能资源算力[1],从而实现一体化综合运算平台。如图2所示。

图2 人工智能引擎资源池架构图

4 技术应用

4.1 语音识别引擎

语音识别引擎可以实现对广播电视节目中出现的敏感话题、敏感人物等进行精准识别,可解决以往人工盯着电视、收音机一秒一秒收听收看的局面,大大节省了人力,更提高了工作的效率。语音识别引擎是指用机器对语言信号进行分析,根据语音单位例如音素、音节或单词的特征参数和语法规则,甚至包括语音之间文意的规律性加以逻辑判断来识别语言的过程[2]。

包括汉语普通话语音转写、中英文简单混合语音转写、略带口音语音转写、变语速语音转写、数字识别、字母识别、专有名词识别、话音/非话音检测、智能断句及智能标点预测、智能词语替换、基于深度学习架构的声学模型训练、基于NGram的大规模语言模型训练。

转写过程包括预处理、特征提取、声学模型、语言模型、发音词典、解码器等几个部分,首先将音频信号经过降噪等语音增强、切分等预处理,然后将信号由时域转换到频率域,由特征提取模块取适用于声学建模的特征向量;声学模型对声学和发音学知识进行建模,输出每条语音的声学模型得分;语言模型用于估计某条文本语句产生的概率,即语言模型得分;通过解码器将所有候选句子的声学模型得分和语言模型得分以及发音词典信息融合在一起,输出综合得分最高的句子作为最终的转写结果。

4.2 文本识别引擎

文本识别引擎可以实现对广播电视节目中的语音转化的文字进行语义分析,可解决以往人工必须收听收看完整个视频后才可理解节目大意的局面。

文本识别引擎首先对文本内容进行内容清洗与过滤,通过垃圾过滤模型滤去无效文本或文本中无效部分内容;对文本内容进行敏感等内容的识别,利用深度双向编码表示将文本内容及文本类别信息嵌入至特征表示中,送给转换器模型进行分类;有害内容提取,对于识别为有害的文本,进一步利用领域知识库提取出其中的有害内容要素;规则灵活定制,可根据用户设定的规则进行自定义关键词配置,返回指定规则的有害文本内容的检出结果;自然语言处理,通过语义分析构建智能机器学习算法,高效过滤复杂变种文本,如某些代音词。

情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等。在大多应用场景下,只分为两类。例如对于“喜爱”和“厌恶”这两个词,就属于不同的情感倾向。基于机器学习的情感分析方法将这个问题转化为一个分类问题来看待,对于情感极性的判断,将目标情感分为正、负2类。对训练文本进行人工标标注,然后进行有监督的机器学习过程。

4.3 图像识别引擎

图像识别引擎可以实现对广播电视节目中出现的每一帧画面进行分析,快速识别出目标台标、字幕、人脸等元素,节省了大量的人工观看审查量[3]。

(1)台标识别。台标识别是一种利用机器学习的方法自动对电视台标进行识别的技术。可以实现对电视是否显示台标、是否遮挡台标、是否切换台标等情况进行监测。

(2)人脸识别。完成对广播电视节目内容中是否存在敏感人物的人脸识别检测,引擎通过逐帧的图像识别析,对输入的视频内容进行人脸识别的检测,并将识别后的人脸与敏感图像样例库的敏感人物进行比对,快速发现敏感人物图像在输入的视频内中出现的位置,并可通过播放的功能完成对敏感人物出现位置的快速监看。

4.4 视频识别引擎

视频识别引擎可以实现对广播电视节目中出现的每一帧画面结合语义进行分析,快速识别出目标字幕、片段等元素,节省了大量的人工观看审查量。

(1)字幕识别。通过分析识别视频图像中的字幕,完成视频图像中的字幕内容与关键词库的比对分析,当检测到视频图像的字幕内容中与关键词库的某个关键词内容一致时,自动进行标记。并可通过视频播放功能,定位到视频画面中的敏感关键词字幕出现的某一帧图像进行调看。

(2)新闻拆条。结合新闻节目识别、候选新闻条目切换点检测、播音员镜头检测、新闻条目标题字幕检测与识别、多模态特征融合等技术以实现新闻视频的自动条目分割。为了便于后续新闻视频点播、浏览及检索等服务的开展,该方案还能够给出一种包括新闻节目名称、新闻条目起始点以及新闻条目标题的新闻视频结构表示。

通过以上步骤,就能获得比较准确的新闻条目切分点,结合通过VOCR自动识别的新闻条目标题,就能够自动地得到新闻视频的完整编目信息,方便用户对其浏览、检索,避免了大量人工标注的工作量。

5 结束语

综上所述,贵州省广播电视监测中心建设的广播电视综合监管平台通过应用本文介绍的各类人工智能技术之后,解决了以往违规识别检出率低、识别精准率低、人工投入成本高、设备资源投入多的局面,大大提高了监测中心的职能业务效率。

猜你喜欢
引擎电视节目广播电视
新海珠,新引擎,新活力!
车坛往事4:引擎进化之屡次失败的蒸汽机车
蓝谷: “涉蓝”新引擎
周六广播电视
周日广播电视
周五广播电视
周三广播电视
电视节目
One Engine Left只剩下一个引擎