吉晓东 陈建平 任 珍
摘 要:语音音效是一种人工对采集的数字语音信号进行增强、滤波、调制等再处理的过程,可以将原来干涩的声音变得更加丰富。在详细描述镶边效果一般产生模型的基础上,提出新的镶边效果产生模型,并对两种模型的镶边效果进行了比较。针对改进的镶边效果产生模型,在不同调制波形下进行了仿真实验。结果表明,改进模型能进一步丰富谐波分量,增强镶边处理效果。
关键词:数字语音处理;语音音效;镶边;谐波
中图分类号:TP391 文献标识码:A
文章编号:1004-373X(2009)21-096-03
Improved Design and Implement for Digital Processing of Audio Effect Flanging
JI Xiaodong,CHEN Jianping,REN Zhen
(School of Electronic Information,Nantong University,Nantong,226019,China)
Abstract:Audio effect is a signal processing technique used to modulate or to modify an audio signal.It can make the original dry audio signal to be rich and nice.After briefly introducing the general model of flanging processor,an improved model to generate flanging effect is proposed.The performance of the two flanging processors are compared.Emulation experiments are done for the new flanging processor under different modulation signals.The results show that the new flanging processor can enrich the harmonic components and enhance the flanging effect.
Keywords:digital audio processing;audio effect;flanging;harmonic
0 引 言
语音音效是一种人工对采集的数字语音信号进行增强、滤波、调制等再处理的过程[1],通过语音音效的处理可以将原来“干涩”的声音变得“湿润”[2]。目前,语音音效处理都是通过数字信号处理技术来实现的,通过对原始声音的数字处理,可以产生各种虚拟空间的特殊声音效果,包括 Chorus(合唱)、Echo(回声)、Pitch(变调)、Phasing(移相)、Tremolo(颤音)、Flanging(镶边)、Gate(闸门)等以及由上述效果叠加组合后形成具有幻觉色彩的声音效果[3]。目前,语音音效广泛应用于剧场扩声的背景效果、乐队实况演出时的声音处理、电影录音和演播室录音的特殊声效处理以及数字音响中[4]。因此研究各种特殊音效效果的产生机理有着重大的现实意义,本文着重对Flanging(镶边)效果进行研究。
1 镶边效果的产生模型
镶边效果是用一个超低频信号对延迟时间进行调制后所产生的效果[5]。这种效果可以循环反复地夸张声音中的奇次谐波或偶次谐波分量,使声音的频谐发生周期性的变化,从而产生“空洞声”、“喷流声”和“交变声”等富有幻觉色彩的声音效果,如同为原来的声音镶上一种奇特的声音边缘,让人感到一种回旋、游移的听觉效果。
1.1 一般模型
镶边效果的一般产生模型如图1所示。
图1 镶边效果的一般产生模型
图1中动态延迟单元将原始数字声音信号x(n)进行动态延时生成x,其中d(n)为动态延时调制波;然后在增益因子a2(0 y(n)=a1x(n)+a2x(1) 当动态延时调制波是一个低频信号(频率小于1 Hz),并且d(n)产生的最大延时小于10 ms时,输出信号将产生镶边效果 [2,6]。 图1所示的镶边效果产生涉及到调制波形及其频率,以及增益因子的选择。因此不同的调制波形、频率和增益因子将产生不同的镶边效果。 1.2 改进模型 图1所示的一般产生模型是将原始信号与动态延时信号进行简单叠加,而原始信号与延时信号的简单叠加会产生梳状滤波效应。由于细微的动态延时变化会产生不同的梳状滤波效应,这样图1所示两路信号的叠加就产生了镶边效果[7]。为了提高镶边效果,应提高梳状滤波的凹槽深度和选择性[7]。研究表明,反馈可以提高梳状滤波的凹槽深度[8]。为了增强镶边效果,对一般产生模型进行了修改,提出新的镶边效果产生模型,如图2所示。 图2 镶边效果的改进模型 图2中的动态延迟单元与图1中的作用一致,也是将输入信号在延时调制波的作用下进行动态延时。为了提高梳状滤波的凹槽深度,图2中增加了反馈模块a3,输出镶边效果信号为: y(n)=a1x(n)+a2z(n)(2) z(n)=x+a3z(3) 图2所示产生的镶边效果也涉及到调制波形及其频率、以及增益因子的选择。一般增益因子a1,a2和a3都在0~1之间,调制波的频率也要小于1 Hz。调制信号波形的选择一般有4种:正弦波(Sine)、三角波(Triangle)、对数波(Logarithmic)、指数波(Exponential)。 2 仿真实验及结果分析 仿真实验数字化采样频率fs=44.1 kHz,每个采样数据编码长度为16 b。 2.1 一般模型与改进模型比较 针对图1和图2两种模型,选择正弦波作为调制波形: d(n)=(D/2)(4) 式中:fd=0.01 cycles/sample,最大延迟D=20 samples。输入x(n)为单一频率正弦信号,其频率f=0.05 cycles/sample。图1中,a1=a2=0.5;图2中,a1=0.5,a2=a3=0.8。设图1和图2的输出分别为y1(n)和y2(n),图3给出输入信号x(n)和输出信号y1(n)和y2(n)的波形。从图3可以看出,对输入单频信号,改进模型输出的时域波形幅度变化更大。图4给出x(n),y1(n)和y2(n)的频谱图。从图4可以看出,改进模型输出信号谐波分量更加丰富,因此增强了镶边效果。 图3 两种模型输出波形比较 图4 两种模型输出波形频谱比较 2.2 不同调制波形下的比较 针对图2改进模型,选择四种不同的调制波,在相同的参数和输入信号下比较输出镶边效果。 图5给出选择的四种调制波,它们的调制频率fd=0.01 cycles/sample,最大延迟D=20 samples;输入x(n)为单一频率正弦信号,其频率f=0.05 cycles/sample;增益因子a1=0.5,a2=a3=0.8。图6(a)~(d)分别给出正弦波、三角波、指数波、对数波四种调制波下的输出y1(n),y2(n),y3(n)和y4(n)。可以看出,正弦波作为调制波时输出信号幅度变化较慢、平滑,三角波次之,指数波和对数波变化最快。
利用Matlab的WAVPLAY函数,可产生上述镶边效果处理的音频输出。从主观听觉效果看,正弦波作为调制波具有平滑的输入和输出的变调效果;三角波产生线性变调的镶边效果,在转折点附近会产生快速升高和降低的音调;对数波和指数波镶边变调效果相似且最好。
图5 四种调制波
图6 四种调制波形下的输出
3 结 语
针对镶边一般产生模型镶边变调效果不甚理想,提出改进的镶边效果模型。在输入单频信号下,对两种模型的镶边效果进行了仿真比较。结果表明,改进模型能进一步丰富谐波分量,增强镶边变调效果。对改进模型,分别在调制波为正弦波、三角波、指数波和对数波的情况下进行了仿真实验。实验表明,正弦波的镶边变调效果较平滑,三角波的镶边变调在转折点附近会产生快速升高和降低的音调,指数波和对数波的镶边效果相近,且变调效果最好。
参考文献
[1]Verfaille V,Zolzer U,Arfib D.Adaptive Digital Audio Effects(A-DAFx): A New Class of Sound Transformations[J].IEEE Trans.on Audio,Speech and Language Processing,2006,14(5):1 817-1 831.
[2]Sophocles J O.Introduction to Signal Processing[M].北京:清华大学出版社,1998.
[3]谭少毅.双引擎数字效果处理器的原理及其应用方法(一)[J].电声技术,2003(9):70-74.
[4]张飞碧.数字混响效果器的原理及应用[J].音响技术,2002(4):26-29.
[5]Caputa M J.Developing Real-Time Digital Audio Effects for Electric Guitar in an Introductory Digital Signal Processing Class[J].IEEE Trans.on Education,1998,41(4):341-346.
[6]Cole J.Audio Effects-Noise Gate & Flange[EB/OL].http://www.buzzle.com/editorials/8-31-2006-107181.asp,2006-1-9/2008-8-15.
[7]Dattorro J.Effect Design:Part 1 Reverberator and Other Filters[J].Audio Engineering Society,1997,45(10):660-684.
[8]Dattorro J.Effect Design:Part 2 Delay-Line Modulation and Chorus[J].Audio Engineering Society,1997,45(10):764-788.
作者简介
吉晓东 男,1979年出生,硕士研究生,讲师。主要研究方向为语音信号处理、认知无线电技术。
陈建平 男,1960年出生,硕士研究生,教授。主要研究方向为数字信号处理、快速算法、DSP应用等。
任 珍 女,1986年出生,南通大学电子信息学院学生。现从事语音音效处理方面的研究。