全向人声自动增益控制扩音系统研究

2021-08-19 20:20陈润锋莫琦李颖多
软件 2021年2期

陈润锋 莫琦 李颖多

摘 要:为避免音响系统受环境噪音和人为因素的影响使输出端的音量幅度波动过大,项目提出了一种全向人声自动增益控制扩音系统,利用人声辨识算法来收音,运用自适应滤波技术进行人声分离并通过自动增益控制电路实现恒定功率输出,确保输出音量幅度恒定。

关键词:人声辨识;自适应滤波;自动增益控制

中图分类号:TP273.5 文献标识码:A DOI:10.3969/j.issn.1003-6970.2021.02.030

本文著录格式:陈润锋,莫琦,李颖多.全向人声自动增益控制扩音系统研究[J].软件,2021,42(02):100-101

Research on Omnidirectional Automatic Gain Control Amplifying System

CHEN Runfeng, MO Qi, LI Yingduo

(Guangdong University of Petrochemical Technology, Maoming  Guangdong  525000)

【Abstract】:In order to avoid the influence of environmental noise and human factors on the sound system, which makes the output volume amplitude fluctuate too much, the project proposes an omnidirectional human voice automatic gain control amplifying system, which uses human voice identification algorithm to receive sound, uses adaptive filtering technology to separate human voice, and realizes constant power output through automatic gain control circuit to ensure constant output volume amplitude.

【Key words】:human voice recognition;adaptive filtering;automatic gain control

1項目实施的目的及意义

在音响系统的实际应用中,常常会受到环境噪音以及人为因素的影响,如性别的不同或讲话者的习惯不同,有些人讲话声音大,有些人讲话声音小,有的人喜欢离话筒远些,有的人喜欢离话筒近些,这些情况都会导致在音响系统的输出音量输出幅度波动过大,产生巨大的差别。为避免这些缺陷出现,项目提出了一种全向人声自动增益控制扩音系统,利用人声辨识算法来收音,运用自适应滤波技术进行人声分离并通过自动增益控制电路AGC实现恒定功率输出,确保音响系统的音量输出幅度恒定,不受话筒距离远近、人声音大小和环境噪音等因素的影响。

2系统总体架构

系统总体架构如图1所示,扩音系统由全向麦克风阵列作为输入设备,对周围声音进行采集,并通过前级模拟滤波进行初步降噪。其次利用多波束定位原理定位主声源的方向,并对主声源信号进行增强处理。随后将音频信号送入经过训练的人声辨识系统辨别录入的声音中是否含有人声,若含有人声信号,则使用相应的自适应滤波算法过滤非人声部分,并提取较为纯净的人声信号。最终人声信号通过自动增益控制系统保持扩音设备的恒定功率输出,以达到在规定功率范围内播放音频的目的。若主声源信号中不含有人声,则直接关闭自动增益控制的输出。

3系统主要模块的实现

3.1声音信号的采集

系统的主要为场景为室内外的扩音应,因此需要对环境噪音进行降噪。如图2所示,声音信号采集主要使用话筒对音频信号进行收集,并将收集到的音频信号通过模拟滤波的前级处理实现初步的降噪。为了进一步消除环境噪音,实现空间降噪,系统选用了全向麦克风阵列[1],全向麦克风阵列的优势在于考虑了声源的位置信息,可以实现空间滤波,对具有方向性的噪声具有较好的抑制效果。对于全向麦克风阵列每一个驻体咪头,由于距离音源位置的不同,接收到音源信号的强度也有所不同,为了处理掉环境噪声所带来的影响,将阵列接收到的音源信号进行了加权运算,这样做的目的是为了使得声源定位更精确。

3.2人声辨识的实现

为辨识主声源信号中是否含有人声,运用基于Ten-sorFlow框架搭建的卷积神经网络进行人声辨识[2]功能的实现。人声识别分为训练和辨识两个部分,训练指的是数据集通过神经网络训练生成辨识模型,辨识规则是利用模型产生识别结果。辨识模型的生成是人声辨识的关键,模型的生成如图3所示。

3.3 人声信号的分离

人声信号的分离是通过自适应滤波[3]来完成的,即利用前一时刻获取的滤波器参数自动的调节现时刻的滤波器参数,以适应信号和噪声未知、随时间变化的统计特性,从而实现最最佳滤波效果。在实际应用场景中由于扩音系统常常无法获取信号和噪声的先验知识,需要一种不需要先验知识的数字滤波器进行人声分离。由于自适应滤波器不需要输入音频信号的先验知识且计算量小、实时性好,因此利用自适应滤波技术可以获得极佳的滤波性能从而达到分离出纯净人声的目的。其中最小均方误差(LMS)准则是目前最为流行的自适应算法准则。系统采用LMS算法实现人声分离,其步骤如图4所示。

3.4 自动增益控制

自动增益控制是利用AGC电路来实现的如图5所示,也就是利用主讲人的声音强弱变化的来控制放大器的增益,即无论输入人声信号大小如何变化,输出端以恒定功率范围输出,确保音箱输出声音大小保持不变。AGC电路由压控放大电路和控制电压形成电路两部分组成,压控放大电路其增益随控制电压而改变,控制电压形成电路的由输出反馈电路组成。

4结语

全向人声自动增益控制扩音系统,可以广泛应用在课室教学环境中,这样老师在讲课的过程中不会受有线话筒的距离限制、无限话筒的续航等问题影响老师的讲课氛围。该系统应用户外演唱会等扩音系统,可以极大消除环境噪音的影响。因此,全向人声自动增益控制扩音系统具有较强的推广应用价值。

参考文献

[1] Mr_Researcher.麦克风阵列语音增强[E].CSDN,2018.

[2] 张莉.基于深度学习的声纹识别技术研究[D].杭州:杭州电子科技大学,2020.

[3] Paulo S.R.Diniz.自适应滤波算法与实现[M].北京:电子工业出版社,2014.