陈成 朱廉洁 陆楠
(泛亚汽车技术中心有限公司,上海 201201)
主题词:主动发声 纯电动汽车 声音合成
大多数新能源汽车低速行驶时发动机不工作,而是使用能效更高的电机驱动,因此不易引起周围行人和车辆的注意,易引发低速交通事故。欧盟、美国和日本都出台了相应法规,要求电动汽车安装行车声音提醒装置,以保护行人的安全。GB/T 37153—2018《电动汽车低速提示音》[1]规定了电动汽车低速行驶时必须发出满足声压级要求的提示音。同时,汽车声音的运动化可与整车的运动感造型相匹配,个性化的声音能增加驾驶乐趣,此类设计理念在传统燃油车中已有广泛应用。
虽然各国、各地区主动发声法规规定了与车辆行驶速度相对应的警示音声压级,但是对警示音的种类并未作出明确规定。本文以运动感排气噪声作为目标声音,根据其特点进行排气声的离线分析和在线合成,并将主动发声系统应用于某纯电动汽车。
排气噪声是由发动机气缸产生的废气周期性排出而产生的,因此其频谱具有明显的周期性谐波的特点[2],以常见的4冲程内燃机为例,其排气噪声声能量分布的主要基频fe为:
式中,M为气缸数量;n为发动机转速。
此基频的谐波称为主阶次。同时,由于2个连续的缸内燃烧不可能完全相同,且发动机旋转2 转,每缸只会发生1次燃烧,因此还有其他2类能量相对较小的谐波声音存在,其基频分别为fo和fh:
对于4 缸发动机,基频为fo的谐波称为奇数阶次谐波,基频为fh的谐波称为半阶次谐波。图1 所示为某4 缸发动机2 030 r/min 转速下排气尾管噪声频谱,由图1 可以看出,声压级高的基本为主阶次噪声,奇数阶次和半阶次噪声声压级相对偏低,很多被背景随机噪声淹没。
图1 某4缸发动机2 030 r/min转速下排气尾管噪声频谱
与发动机相关的声音具有明显的周期性谐波特点,因此各种声音合成技术大多利用此特点展开[3-5]。Amman和Das[3]提出将此类声音分为确定性成分和随机成分,其中确定性成分即为谐波成分,可通过将原始信号进行快速傅里叶变换(Fast Fourier Transform,FFT)提取其频率、幅度和相位等特征量,重新合成只包含谐波成分的声音。原始声音去除合成出的谐波成分,所得到的声音即为随机成分,随机成分可通过多脉冲激励的自回归模型进行合成。此方法在合成声音时需要进行逆FFT 计算,易引起较大时延,从而降低声音合成的实时性。同时,排气系统声音还具备基频随时间变化而非基频稳定的声音信号特点。
为此,本文提出一种基于声音片段的分析和合成方法,其基本原理为:确定原始信号的基频,提取出对应的信号,此信号通常为正弦波信号,因此可以通过其零值点确定原始信号的周期谐波信号位置点,进而提取出基频对应的原始声音片段。该方法大部分计算量集中于原始声音的离线处理,合成时只需要索引出对应的声音片段并进行重叠相加即可,合成的计算量相对较小,适用于排气声合成。
为了成功提取每个转速对应的声音片段,在录制目标排气加速噪声时,加速时间应尽可能长,以使发动机的转速变化能尽可能小,从而保证基频fh的变化足够小。目标排气噪声的录制需在带有底盘转毂的消声室进行,麦克风与排气尾管口的距离为500~1 000 mm,为了降低气流噪声等背景随机噪声,可在麦克风前增加厚50~100 mm的海绵,如图2所示。海绵对低频谐波声的吸收量很小,但可有效降低胎噪和排气尾管气流噪声等中高频随机噪声。降低背景随机噪声可提高谐波声的信噪比,有利于原始信号基频的准确分析。同时,气流噪声较小的目标声具有较好的主观感受,将直接提升合成声的声品质。
图2 排气噪声目标声音录制
在离线分析中,首先需对原始信号进行瞬时基频分析,即分析每个时间点的基频。通常,第1 个主阶次声音在大多数转速下是声能量最高的成分,例如4缸发动机的2阶排气噪声和6缸发动机的3阶排气噪声,因此,本文对原始信号的主阶次频率进行分析,对于第t帧原始数据,可以通过将其进行频域谐波相关(Spectral Harmonic Correlation,SHC)[6]函数分析实现:
式中,S(t,f)为第t帧数据在频率f处的幅度谱;Lw为频谱窗的长度;NH为谐波数量。
在f的整数倍频率点处,H(t,f)有最大值,这些最大值频率点均可能成为第1 个主阶次的频率。对于排气噪声,可按以下方式进行原始噪声第1个主阶次频率的预估:确定第1 帧信号的主阶次频率,可以通过计算其H(t,f)并根据计算结果人工确定;第2帧数据的主阶次频率预估可以第1 帧的主阶次频率为基础,计算该频率点±2 Hz 范围内第2 帧数据的H(t,f),其最大频率点处即为第2 帧数据的主阶次频率(对于加速排气噪声,连续数据帧对应的主阶次频率变化是连续的);依此类推,可自动计算出整段噪声其他数据帧对应的主阶次频率;利用多项式插值,即可得到每个时刻原始信号对应的基频。
在获得每个时刻原始信号对应的基频后,需要从原始数据中提取出无相位延迟的主阶次数据,其应为随主阶次频率变化而变化的正弦波。Butterworth 带通滤波器具有中心频带频响平坦、中心频率无相位延迟的特点,因此使用中心频率随预估的主阶次频率变化的Butterworth带通滤波器可有效提取出主阶次数据,对于时间点nt,N阶Butterworth 带通滤波器的正弦波数据由其“Z变换”定义为:
式中,z为Z变换公式中定义的复变量;为滤波器系数,可以通过对Butterworth带通滤波器的解析公式进行双线性变换得到。
高阶滤波器具有更窄的中心频带,因而选择性更强,但滤波器阶次越高,其稳定性也越差,为了平衡滤波器的稳定性和中心频带宽度,本文选用4 阶Butterworth带通滤波器。将原始数据和提取出的主阶次成分进行对比,结果如图3所示,图中1~4为排气气缸编号,可以看出,主阶次满足正弦波的属性。
图3 原始数据和主阶次成分对比
提取出的主阶次数据为正弦波,因此发动机每转1转,主阶次数据将有M个零点。4 冲程发动机1 个周期内有2M个零点,因此可将每2M个零点处标记为基频标志点,每个基频标志点对应的频率即为在该点预估出的基频,根据该基频由式(1)可反推出对应的发动机转速。
最后,使用Tukey时间窗从原始排气噪声中提取出每个基频标志点对应的声音片段。Tukey 时间窗的中心点即为基频标志点,其长度应为与频率fh对应的1个周期的长度和固定的声音片段重叠区域长度之和。此固定声音片段重叠区域长度可选为128个数据点,目的是确保在合成排气噪声时实现平滑的加权过渡,如图4所示。
图4 声音片段合成示意
经过以上步骤,便可以从目标排气噪声中提取出发动机不同转速下对应的声音片段,将这些声音片段按照基频由低到高排列,便可组成声音片段数据库,以此为基础进行主动发声的声音合成。
排气噪声合成过程中,按照从汽车CAN 总线上获取的发动机转速或者由电机转速转换得到的发动机转速,从提取出的声音片段数据库中检索出相对应的声音片段,依次重叠相加即可得到最终合成声。特别需要注意的是,当作为输入的发动机转速保持稳定或变化很小时,将使用同一声音片段,其重复播放时,将产生不舒适的“人工合成声”[7],为了避免这种情况,随机选取相应转速声音片段前后相邻各3个声音片段中的1个作为声音合成的输入。
某电动汽车主动发声系统框架如图5 所示。由车速和需要模拟的换挡策略对应的燃油车的变速器减速比即可计算出模拟的发动机转速:
式中,v为车速;Gr为变速器减速比;Rtyre为轮胎半径。
图5 电动车主动发声系统框架
表1 列出了本案例中采用的不同车速对应的挡位和变速器减速比。
表1 模拟换挡车速、挡位和减速比
图6 所示为该电动汽车控制器和扬声器的布置位置。其中控制器包含CAN 总线数据解析模块、模拟换挡模块、声音合成模块、数/模转换模块和功率放大模块。
图6 控制器和扬声器布置位置
主动发声系统目标排气声和实时合成声的频谱如图7 所示,从阶次频谱能量复原情况可以看出,合成出的声音较好地还原了原始运动感噪声。需要注意的是,目标运动感排气噪声为12缸发动机的排气噪声,原始声音为1 000~6 000 r/min的加速过程排气噪声,合成的声音为1 500 r/min 匀加速至5 000 r/min 再匀减速至1 500 r/min过程的排气噪声。
图7 12缸运动感排气噪声原始和合成声音频谱
本文提出了一种基于发动机排气噪声周期性谐波特点的声音离线分析和在线合成方法。在离线分析过程中,首先通过逐帧分析确定不同时间点的瞬时基频频率,再将基频对应的主阶次成分无相位延迟地提取出来,利用主阶次成分为正弦波的特点,以零点为基点,确定每个声音片段的提取位置,并最终提取出每个发动机转速对应的声音片段,最后利用重叠相加的方法,在线实时合成出与车辆状态对应的运动感排气声。将本文提出的方法在某纯电动汽车上进行应用,原始声音和合成声音的频谱对比结果表明,该方法可以较好地模拟运动感排气声。