蒋 峥
(山西广播电视无线管理中心,山西 太原 030001)
在电视播出过程中,音视频链路结构中关联的运行设备较多,各个设备的处理操作都会对播出的音频信号产生影响,存在发生异常的可能性[1]。电视播出过程中需要准确、及时地对音频信号异常问题类型和具体情况进行检测,明确音频信号异常问题特征,从而采取有效的应急方法进行处理,保证电视播出期间音频信号能够快速恢复正常,保持稳定输出状态[2,3]。
电视播出期间,播出信号串行数字接口(Serial Digital Interface,SDI)监控系统会自动对信号进行采集。除了完全静音的情况外,如果音频数据收集出现特殊显示效果,则表示音频数据处于丢失状态。电视音频系统中包含多个声道,针对音频内容层异常需要对声道逐一检测,检查声道中是否是静音状态、音量高低等级水平,同时对固态电平、周期波以及噪声等情况进行检查[4]。
电视播出期间,声道板卡中每一帧的频域能量平均值会在每间隔8 ms时出现,需要累计100帧的数据进行相加。应用手持信号发生器设备输出0 dBFS千周音信号来作为板卡输入,根据千周音信号和检测信号计算出当前信号的分贝值。将当前信号的分贝值与电视播出声道板卡预设音量标准范围进行对比,观察分贝水平在相应时间中的动态变化情况[5]。
当电视播出音频信号出现大小规格不同的能量叠加时,就会产生白噪声。针对这一异常问题的检测,需要明确白噪声特征。集中收集频域的频点能量分布数据,并对收集的数据进行总体分析,然后按照相应的公式对频点能量值的离散程度进行计算。将得出的数据结果与门限值进行对比,若是计算结果大于门限值,就证明存在白噪声异常情况。实际上,当白噪音的能量水平偏低时,计算出的离散程度与正常音频谱离散程度效果差别较小,音频异常自动检测通常会将其忽略[6]。
在电视播出期间主要针对1 000 Hz音频、其他周期波异常进行检测,而固定电平异常问题的表征现象为出现监视多画面分割器上的音频电平表,凭借人耳无法进行察觉。这类异常主要有3种形式:(1)在播出音频信号中单独出现周期波信号,声频频谱固定频率点位置存在固定能量信号;(2)在输出的声音中,周期波叠加在原本的声频频谱中,周期波能量非常大,并且能量值会大于声音标准能量水平;(3)处于固定状态的大规模直流分量会叠加振动,震动幅度属于偏小的等级。周期波异常时,输出声音频谱中相应固定频点的位置会出现大小规格比较固定的能量分布,根据这一特征进行异常检测,一般情况下可以在频域中获取频点能量大小数据,以8 ms时间窗口为1个单位,针对声音信号采取短时傅里叶变换处理,然后对其中的频点能量进行排序,观察最大能量点的频带位置是否固定不变,延续的时间超过400 ms时证明周期波异常信号出现,其最大能量点位置就是周期波基频所在之处。在检测过程中,能否准确识别还会受到周期波叠加最大能量水平的影响,当最大能量值小于正常声音能量水平时,就很难及时检测出来,通常会被异常检测忽略。尤其是电视播出期间,正常音频最大能量点的频谱位置持续400 ms不变时,周期波异常往往无法识别[7]。
电视播出音频的声道数量较多,在单一声道没有检测出异常问题时,需要对音频声道组合与声道运行规范性进行检测。
在电视播出的音频组合结构中,节目音频输出分为左声道与右声道,需要在板卡位置分别对2个声道所有频点的相关系数进行计算。频域分析方法不能做到对声音波形相位信息的保留,无法对短时傅里叶变换频率进行良好分辨。在电视播出的声音场景类型为类似当当声、水泡声时,频域分析方法最终的结果就容易出现失误,判定其为立体声不相关[8]。
时域分析法主要针对左声道与右声道脉冲编码调制(Pulse Code Modulation,PCM)波形相关系数开展计算,根据计算结果对声道组合的音频输出进行仿真模拟。通常情况下,PCM相关系数计算对于相位变化感知的灵敏度较好,而对幅度变化的感知灵敏度较差。在实际计算分析过程中,将其与服务器正常运行模式进行对比,通过获取不同测试场景的相关系数计算结果,能够明确判断异常检测程序对声道组合异常状态检测感知的灵敏度水平[9]。
音频组合和规范性异常检测中,针对不同的音频场景需要合理选择检测分析方法,以保证异常分析检测结果的准确性。
场景1是电视节目左右组合声道的声音电平、波形处于接近状态,PCM波形时域相关性大幅降低,主要是相位变化对其产生了影响。要想对声道组合异常进行检测,可以应用时域分析方法,对时域上相关系数进行计算,得到的相关系数变化会与声音波形变化状态保持相同的趋势,能够更清晰地获取相位变化相关性。这种情况不建议采用对比分析声道频点能量值的方法检测异常,当相位变化幅度偏小时无法进行精细识别。场景2是电视播出节目的左声道和右声道输出音频内容存在差异,分别播放不同的音频内容。场景3是电视播出节目的左声道音频与右声道音频属于相互配合的状态,如左声道为人声、右声道为伴奏音乐。对于场景2和场景3这2种声道组合音频场景,无法有效应用频域分析和时域分析方法进行异常检测,得出的结论都是左右声道不相关,这时还需要结合其他比对结果来进一步判断异常。当在板卡位置应用时域分析方法时,上述3种场景的立体声不相关均能被识别,板卡中的音频数据均能保持对齐状态,不需要与服务器进行同步对比就能直接、准确计算相关性[10]。
针对响度控制器环绕立体声的相关性检测分析阶段,需要根据声音响度的具体状态来对左声道与右声道的相关性状态进行具体判断。当声音能量差在-8~-1 dB时,响度控制器输出左声道与右声道处于正相关状态,中置声音的能量值要明显比左声道和右声道的能量值高;当声音能量的分贝差大于-9 dB时,响度控制器输出左声道与右声道处于负相关状态。若是左声道与右声道的相位处于相反状态且声音能量值非常接近状态时,声道也是处于负相关状态,中置声音则处于静音状态。当经过响度控制器产生的立体声环绕正常输出条件下,左声道和右声道之间的音频具有很高的相关性。电视播出期间,从源级输出的信号经过传输到达响度控制设备时,需要由控制器对信号进行处理。相对来说,若是对立体声的音频相关性进行检测,检测范围包括左声道和右声道;若是检测环绕立体音,则需要对所有方位(左、右、后左、后右以及中置等)的声道以及重低音声道进行全面检测。
在电视节目左右组合声道的声音电平或波形处于接近状态、PCM波形时域相关性大幅降低的立体声场景中,会存在一种极端现象,即立体声反相。针对这种情况,可以选择在板卡本地采取计算相关系数的方法来对异常情况进行检测。立体声反相检测判定的2个关键参数为相位异常百分比和时间阈值。将相位异常百分比与相位正常百分比进行对比,若是异常百分比更大,则证明立体声反相成立。立体声反相状态持续时间达到阈值后,则证明相反事件形成。此外,还可以将PCM值传输到服务器来对数据进行仿真对比,也能对具体异常情况进行检测。
单纯地对声道音频进行检测只能识别一部分音频异常问题,对此需要建立整体检测观念,对电视播出频道的所有音频主备路和设备运行进行全面检测分析,同步将图像与音频进行关联考量。对多个节点的音频进行比对操作,将音频与图像的同步关系状态进行相互匹配分析,这样能够实现对系统层面的音频处理状态进行显式约束,使音频与图像在电视播出过程中保持高度一致性。应用感知音频信号实时比对算法,能够清晰呈现音频内容的状态,实现响度控制和音频混音等异常问题的准确判断。但是非即时性音频故障检测算法对于时间要求较长,否则会影响故障检测的准确性,同时对于异常的具体部位判断还处于比较粗放的状态。针对这种情况,可以在电视节目播出之前提前引入节目的媒体文件,在离线状态下对电视节目媒体文件运行的特征和状态进行分析,对比正常标准状态来确定节目音频运行是否保持规范状态。离线文件中包含丰富的音频特征值信息,一些音频信息中带有时间序列,通过对这种有时间序列的音频特征值信息进行提取并重点分析,将实际特征情况与实时信号进行对比,从而有效分析问题的具体情况。
在电视播出中出现音频信号异常时,需要采取有效的应急措施进行处理,为节目正常播出提供保障。当电视播出期间检测到源信号音频声道出现缺失异常问题时,可以利用音频包含多个声道的优势进行应急补救,根据实际情况切换电视音频声道。确定应急方案后,由专业技术人员到指定位置开展补救操作,也可以直接应用简单网络管理协议(Simple Network Management Protocol,SNMP)启动音频处理设备的应急操作工作,实现立体声、双声道等不同模式的转换,保证电视播出期间出现异常时能够及时调整,实现音频的正常高质量输出。
在电视台的播出系统中,音频信号的格式与类型具有多样化特征,导致音频信号出现异常的原因也较为复杂。当出现音频信号异常问题时,需要明确各类音频信号的异常特征,合理应用异常检测方法,提升检测的准确性和及时性,针对异常快速做出有效的应急处理,为电视节目的安全稳定播出提供更好的保障。