刘士蕾
摘要:伴随着科学技术进步与发展,广播电视作为传统媒体成为人们接收新闻信息的主要途径。与此同时,广播电视检测也得到了快速发展,最显著的特征就是融入了语音识别技术,对工作质量、工作效率的提升具有重要作用。现如今,怎样更好地在广播电视检测中应用语音识别技术也得到了重视,成为广播电视事业发展重要研究课题。基于此,文章研究了语音识别技术在广播电视监测的应用。
关键词:语音识别技术;广播电视监测;应用发展
面对日益复杂的电磁环境,怎样做好无线电频率资源控制,确保各频段业务的顺利进行成为无线电管理与监测人员重要工作内容。广播电视监测人员主要工作内容即是确保广播电视频谱资源的科学利用,掌握频谱荷载状态进而更好地服务于广大群众。现如今,语音识别技术的出现为监测人员工作提供了便利条件,该技术能够对语音信号特点展开判断,实现频谱占用智能化识别,对广播电视监测具有重要作用。
1 语音识别分析
语音识别系统分为训练与语音识别。其中,前者主要作用是语音搜集、信息分析进而开展信号处理与模板构建。训练工程中语音识别技术主要通过声音的高低、强弱、音色及社会属性科学分析。而后者则是进行音波提取的时间变化及语音特点,根据不同方法推算语音特点矢量排序与发音模板的距离。声音辨别过程中,把语音特点与声学模型综合对比从而获得理想的识别效果。即使分类错误也无妨,仍然能够结合声学模型更正,尤其是相同音的生字,结合前后语义进行准确识别。由此可见,语音识别技术运行过程为:首先,语音信号中产生的语音信息是通过短时幅度谱时间变化编码。其次,语音阅读声学信号可以输送多个不同的、分散的符号。最后,语音交互只是一种认知形式,无法和语法、语义分割[1]。
1.1 语音识别准备
语音识别应用在广播电视监测中对搜集语音文件展开判断,根据现有技术需求,语音文件格式在30 s左右wav或pcm數据的无压缩音频,采样率为11 025 Hz,采样比特16 bit与单通道模式。音频信息将256个采样点氛围一组为一帧,帧则是语音识别单位。对帧展开傅里叶变化由各帧内提取干音频特点。43帧为一组,等同于1 s的数据成一组,组是语种判断的基础单元。
1.2 音频特点
音频文件研究过程中,一般对时域特点和频域分析,常见音频特点包含:时域特点与频域特点。其中,时域特点分为ZCR,HZCRR,STE,LSTER,RMS,SFR,SED。频域特点分为:SF,SC:,SRF,BP,SBE,NFR。(1)过零率与高过零率帧比率。过零率代表窗内信号中信号波形穿出零点频率,因为语音信号转换涵盖清音与浊音,有着较强与较低的过零率,音乐信号较为稳定代表语音信号过零率改变迅速。基于客观性上来说,方差较多,超出零率帧比率较高能够准确判断语音与非语音。(2)静音帧比率。静音帧比率指的是窗内静音帧占据的比例,一帧能量不及预定静音门限后表示该帧是静音帧。在预定静音门低时,语音音调不同,纯语音中静音帧比率超出音乐与非纯语音内静音帧比例。
2 语音识别应用在广播监测中的作用
2.1 声纹识别
该技术结合了语音波形分析人行为特点的语音状态,判断讲话人身份。首先,讲话人身份识别,能够判断出说话人;其次,判断某个语音是否为指定的人声音。声纹识别将语音信号为基础,结合人的发音特点掌握讲话人个性。从生物学范围而言,声纹识别为生物因子认证范围,与指纹识别有着相通性。指纹识别即是利用每个人指纹不同进行判断,而声纹识别则是抓住讲话人特点作出准确判断。
2.2 内容辨识
内容辨别主要针对语音内容的判断,通过语音的物理属性、生理属性分析讲话内容,将判断语音信号承载的内容为目标。不过,内容识别具有一定困难性,容易受到讲话人发音、方言、表达习惯等影响;也正是由于内容辨识的困难性才衍生出声纹识别。想要让声纹与语法、语义模型符合,还需要利用词性标记、词语区分、语境理解等科学判断语音内容,处理过程较为繁琐。
2.3 语种与语音辨别
语种识别是语音材料兼容的语种特征判断,语音内容判断与智能翻译技术就是基于语种识别衍生而来。语种识别能够对计算机中不同语音材料展开判断,将语音材料提取至识别系统内,即是利用语种识别技术。
语音标准判断,利用个人语音材料和语音标准模型比较进行语音标准状态分析;同时找到不标准发音。现如今,该项技术已经被广泛应用在语言教学与语音标准检测中[2]。
3 语音识别技术在广播电视监测的应用
伴随着语音识别技术的进步,通过自动化语音识别达到广播频道中频率节目播出状态的判断,利用语音信号特点提取关键数据信息,分析语音类型、语种,把静音、噪音、言语信号给予分类实现频道中不同频谱占用的智能化辨别音乐、言语等方面语音识别技术理论与综合研究。
现阶段,广播电视监测融入了语音识别、电视内容监测,节约了人力资源投入,对社会和谐稳定与监测事业进步具有重要影响。(1)应用状态。首先,电视监测。电视监测中语音识别技术经过对电视栏目内容构建语音模板与文字模板。随后,节目播出时与播放的电视语音展开语音识别,找到语音模板与文字配合内容实时录像找到播出异态和播出问题。利用系统输送至值班人员展开预警,便于工作人员及时处理,解决故障问题。经过电视监测应用语音技术,系统判断率达到99%,达到了电视智能化监测。(2)广播监测。语种识别技术应用在广播电视监测中有着重要意义。因为国外电台对国内播音时间、语种较多,想要利用人工展开实时判断对工作人员提出了严格要求,人力资源、时间投入较大。针对这一问题,通过语音识别技术利用卫星接收搜集语音库文件。随后,把录制的电台播出语音频谱和语音库展开特征码比较,便于及时判断语种。不过,语音物理属性有着明显差异,现阶段多数语言判断应用仍然存在诸多不足,话语辨别逐步确定。语音识别广播电视监测还融入了音频指纹相近度法,这种技术方法是在训练程序中适应滤波器,起到信道模型作用。滤波器由混合信号与干扰信号提取鲁棒的特点音频指纹,经过迭代搜集推算音频指纹的匹配相近距离,结合距离门限分析试验影响效果。同时,将距离较近的门限转为置信度[3]。
现阶段,语音识别包含远程回传、信息搜集、特征码,信息数据占据的带宽需要高,通常在2 M以下。此外,因为远程设备异常问题汇报合格数据,监测人员难以及时搜集数据精准性。
4 实例分析
4.1 信号解调设备
信号解调设备结束检测信号源解调后,其组成为一台或几台调频广播解调器、调幅广播解调器、有线电视解调器。调频广播/解调器把既定频率的调频/调幅广播电台信号解调为普通音频信号。随后,把音频信号送至信号搜集站录音。调频广播/解调器数量能够结合检测频道的数量分配。
4.2 信号预处理设备
系统内添加AQC4信号预处理设备,有助于信号判断。用过音频信号预处理设备对音频信号展开分析且结合分析结果,控制信号处理器对音频信号展开噪音、失真修正、电平,从而形成可用的信号源文件。
4.3 多路信号搜集站
有线电视解调器把既定频道的有线电网射频信号内的伴音与影響解调为视频信号与模拟音频信号。随后,把音频、视频信号送至信号搜集站记录。有线电视解调器的量能够结合检测的频道数量分配。此外,多路检测信号搜集站能够同时接收电视信号与广播音频信号,展开信号搜集、压缩并储存于服务器陈列柜内。搜集站可以划分为广播信号搜集站与电视信号搜集站。
广播信号搜集站能够一同对各路广播信号采录,采录页面中实时显示信号的音量光柱并具有软调音台,能够结合各路信号大小展开增益控制。同时,研发了监听按钮,实时监控各路输入信号。尤其是对广播时段特征,每周每天分别设计采录时间表从而确保采录有效性,提升系统运行水平。第一,能够同时获得广播音频信号实时采集压缩格式。第二,能够实时监听。并显示录音信号音量彩条,在发生信号异常后自主警报从而避免信号故障而丢失录音内容。第三,结合不同广播频道播出时间,设计录音通道的录音时间。
4.4 视频信号采集站
电视信号采集站能够对8路电视信号采录,视频信号采集站能够对电视信号得音频信号码流实时复合。采录选择MPEG压缩格式,每路压缩码流可选。结合不同频道播出时间,不同频道采录时间能够独立设计。采录时,页面能够显示每录视频图像并对视频信号监听。此外,综合调节每路信号得对比度、饱和度、色度从而确保采录质量。采录视音频文件自动传输至文件服务器。
5 结语
综合分析,无线电频管理和监测作为广播电视管理人员主要工作内容,伴随着无线电技术的运用于业务推广,对于无线电频率资源需求越来越高。广播电视监测自动化、智能化是主要发展趋势,语音识别发挥着重要作用。在语音识别技术与广播电视监测中也要注重校正,防止发生偏差,保证广播电视监测作用发挥。
[参考文献]
[1]刘蕾.智能播种机嵌入式英语语音识别控制系统设计与研究[J].农机化研究,2018(12):240-244.
[2]曹慧,潘琦,吕明珠,等.基于虚拟仪器手持式回放语音识别装置设计[J].安阳工学院学报,2018(2):69-72.
[3]肖强,周民伟,张海波,等.语音识别技术在电子病历中应用的难点及对策[J].中国数字医学,2018(3):66.