周启迪,孙婷婷,张忠伟,许春光,丁宁,李一帆,李满
(中国北方发动机研究所(天津),天津 300406)
随着消费者对NVH性能要求的提升,声品质成为车辆市场竞争力的关键属性。针对声品质主观评价成本高、效率低的问题,以声品质客观评价指标为输入,构建声品质主客观预测模型对快速声学开发具有重要意义。声品质客观评价指标是为了表征主观感受而提出的物理参量,其客观评价体系主要分为两类:物理声学和心理声学参量、基于信号处理衍生的特征参量。文献[1]以响度、尖锐度、粗糙度、抖动度、语义清晰度及其变化率作为两级评价指标,基于多元线性回归分析进行柴油机加速声品质预测研究。文献[2]以峰值响度、低频能量、响度特征谱包络和平均尖锐度为评价指标,形成了有效的汽车关门声品质预测和诊断流程。文献[3]提取汽车起动阶段、停止阶段和平稳运行阶段的瞬态噪声的声品质客观评价参量,基于BP神经网络实现了轿车车窗上升过程的声品质有效预测。文献[4]以噪声信号分解分量的样本熵作为声品质评价客观参量,并进行声品质主、客观相关性关系,结果显示IMF样本熵对主观评价具有很好的表征性。文献[5]以EEMD分解分量的临界频带计权能量作为声品质客观评价参量,其对主观评价结果具有很高的表征性。基于先进信号处理技术提取的特征参量在一定场景下具有很好的相关性,但相对心理声学参量缺乏主观感知表征意义,因此,基于声学和心理声学参量进行声品质预测在车辆和内燃机领域得到广泛应用。
声品质预测模型通过构建主客观间的关系,实现声品质快速评价。多元线性回归、BP神经网络、GA-BP神经网络[6]、GA-小波神经网络[4]、支持向量机[7]、遗传支持向量机[8]、深度置信神经网络[9](deep belief networks,DBN)、深度卷积神经网络(convolution neural network,CNN)[10]、基于自适应学习树的深度卷积神经网络(ALRT-CNN)[11]、融合卷积神经网络-长短时记忆网络(CNN-LSTM)[12]等模型被广泛应用到多个领域。综合现有研究成果可知,支持向量机(support vector machines,SVM)和深度神经网络方法在非线性预测方面具有更大的优势。
柴油机噪声特征复杂,不同柴油机的声学问题存在较大的差异性,而目前声品质客观量化指标难以有效地对啸叫、刺耳特征进行表征,无法有效地针对异响导致的声品质进行预测,基于此,本研究构建了音噪比(tone-to-noise ratio,TNR)和突出比(prominence ratio,PR)的频域衍生特征参量,完善了声品质客观评价体系,构建声品质主客观非线性回归模型,为柴油机声品质预测提供指导。
在半消声室进行柴油机噪声测试,构建TNR和PR频域衍生特征参量,结合时、频域特征完善了声品质客观评价体系,基于SVM模型构建声品质预测模型,并检验预测模型精度,技术路线如图1所示。
图1 声品质预测研究技术路线
为了量化噪声产生的干扰,Beranek[14]提出了语音干扰级(speech interference level,SIL)的量化指标;随着优先倍频带的提出,发展出了优先语义干扰级(preferred speech interference level,PSIL)的概念,具体计算如下。
使用中心频率为500 Hz,1 000 Hz,2 000 Hz的倍频程带声压级计算优先语义干扰级,如式(1)所示。
(1)
式中:LP500,LP1000和LP2000分别为中心频率在500 Hz,1 000 Hz和2 000 Hz的倍频带声压级。
音噪比[14](tone-to-noise ratio,TNR)定义为单调声能量与单调声所处临界频带内其他噪声能量的比值,其他噪声能量即为临界频带的总能量和单调噪声能量的差值,计算如式(2)所示。
(2)
式中:Wt为单调声的能量;Wn为单调声所在临界带其他噪声能量。
突出比(prominence ratio,PR)定义为单调声所在临界频带的声音能量与其相邻临界频带平均声音能量的比值,计算如式(3)所示。
(3)
式中:WM为单调声所在临界频带的声能量;WL为WM相邻低临界频带的声能量;WU为WM相邻高临界频带的声能量。以某一模拟信号为例进行PR定义说明,如图2所示,Δf0为单调声所在临界频带带宽,图中单调声频率为1 000 Hz,根据临界频带的定义可知,Δf0为920~1 080 Hz。同理,ΔfL为单调声所在临界频带相邻低临界频带带宽,对于该模拟信号ΔfL为770~920 Hz, ΔfU为单调声所在临界频带相邻高临界频带带宽,对于该模拟信号ΔfU为1 080~1 270 Hz。
图2 PR示意
根据TNR和PR定义可知,TNR和PR均属于描述相对显著程度的客观参量。TNR对主观感受的影响不仅仅受纯音本身能量影响,还与纯音所在临界频带的其他噪声能量相关。PR同样受纯音所在临界频带的能量,以及纯音所在临界频带左右相邻的两个临界频带的噪声能量影响。因此TNR和PR的引入,为异响和啸叫主观感受有效的诊断提供可能。
当TNR和PR在全临界频带数值不大时,在某一个频带里TNR和PR峰值很大,仍可能出现强烈的刺耳感,因此需要提取TNR和PR的频域特征。构建声品质客观评价频域衍生特征参量,包括突出比MAP频域峰值,音噪比MAP频域峰值,突出比MAP频域均方根值,音噪比MAP频域均方根值。图3和图4分别示出发动机声品质突出比MAP和音噪比MAP频域衍生参量提取结果。
图3 突出比频域衍生特征参量
图4 音噪比MAP频域衍生参量
本试验采用5点法进行整机噪声测试,如图5所示。在半消声室进行柴油机噪声测试,麦克风测点分别放置在柴油机前、后、左、右、顶侧1 m位置,测试系统是由LMS采集前端、PCB麦克风和笔记本电脑组成,采样频率为40 960 Hz,频率分辨率设置为1 Hz,测试时间为10 s,测试工况为不同转速、不同负荷的典型工况。为了减少气动噪声的干扰,将进、排气管引出室外,同时拆除风扇,并采用吸声材料将排气管进行包裹。
图5 柴油机噪声测试
柴油机噪声特征复杂多变,相近工况噪声特征差异性较小,非专业人士组成评审团队难以准确区分样本细小特征变化的差异,同时,非专业人士在评价过程可能出现判断标准偏移的问题,导致评价结果可信度和一致性低。基于上述考虑,本研究选取20个内燃机专业人士组建评审团队。主观评价听审设备包括笔记本电脑、外接声卡、高保真耳机。
分组成对比较法(grouped pair-wise comparison,GPC)具有成对比较法精度高的优点,同时,可极大提升大规模样本评价效率。本研究采用GPC法进行声音样本主观评价,该方法通过构建关联样本,将大规模样本分成多个具有相互关联的样本组,最后通过反演计算获得全部样本的评价结果。GPC的计算原理参考文献[15],不再赘述。
声品质客观评价指标是为了表征主观感受而提出的物理参量,本研究在传统客观评价参量,即A计权声压级、响度、尖锐度、粗糙度、抖动度、语义清晰度的基础上,引入语义干扰级SIL3,构建柴油机声品质时域客观评价参量体系,如图6所示。为了减少偶然因素的干扰,保证计算精度,窗长度为1 s,步长为0.5 s,重叠为50%。
图6 声品质时域客观参量
根据构建的TNR频域衍生特征参量,发现不同工况样本TNR频域平均有效值基本相同,如图7所示,因此,该参量无法有效量化声音特征的变化,不能作为柴油机声品质客观评价参量。综合考虑柴油机声品质时频特征,即传统声品质时域评价参量、SIL3、突出比MAP频域峰值、音噪比MAP频域峰值、突出比MAP频域均方根值,形成完善的声品质客观评价体系,为声品质预测研究提供输入。
图7 不同工况噪声样本的TNR频域平均有效值
主观评价的精度和效率受样本容量限制,而深度神经网络在建模过程需要大量的数据样本,因SVM模型在小样本非线性拟合问题具有很高的精度,受主观评价样本容量的限制,本研究采用SVM方法进行柴油机声品质主客观预测模型构建。
假设训练样本集为{(xi,yi),i=1,2,3,…N},N为样本数,xi为第i个输入样本,yi为对应的第i个输出样本,支持向量机回归模型为
f(x)=wΦ(x)+b。
(4)
式中:w为超平面权系数向量;Φ(x)为低纬向高纬特征空间的映射关系;b为偏移量。
引入惩罚因子c以及松弛因子ξi和ξi*,支持向量回归机的求解转化为优化问题,如式(5)所示:
(5)
引入拉格朗日乘子,式(5)可转化为式(6):
(6)
(7)
将式(7)代入式(6),可得到式(5)的对偶形式:
(8)
引入核函数K(x,xi)=Φ(x)·Φ(xi),将高纬空间内积计算转化为低纬空间函数计算,获得支持向量机回归模型:
(9)
SVM回归模型中惩罚因子c、核函数、核函数参数g对结果影响较大,其中c表示误差容限,核函数的类型和参数g的选择决定了样本在高纬空间的分布,直接影响了SVM回归模型的精度。目前常用来进行映射分析的SVM核函数主要包括4种。
1) 线性核函数:
K(x,y)=〈x,y〉;
(10)
2) 多项式核函数:
K(xi,x)=[xi,x+d]p;
(11)
3) 高斯RBF核函数:
K(xi,x)=exp(-gxi-x2);
(12)
4) Sigmoid核函数:
K(xi,x)=tanh(κxi,x+v)。
(13)
通过预测组样本的最小均方误差(mean square error,MSE)和复相关系数R2(squared correlation coefficient)结果进行精度检验。MSE和R2计算公式如下所示:
(14)
(15)
为了全面地反映柴油机声品质特征,本研究考虑声品质时、频域特征构建完善的客观评价体系,即时域特征参量A-SPL、响度、尖锐度、粗糙度、抖动度、语义清晰度和SIL3,声品质频域特征参量TNR频域峰、PR频域平均有效值、PR频域平均有效值,共10个声品质客观评价参量。
为了对比传统时域声品质客观评价参量和本研究提出的综合考虑时频域特征的参量在声品质预测精度的差异性,针对待测32个噪声样本,随机选择24个样本为建模组,8个样本为预测组,基于SVM方法构建柴油机声品质主客观预测模型,SVM核函数为RBF核函数。
以传统声品质客观参量作为预测模型的输入,具体参量包括A计权声压级、响度、尖锐度、粗糙度、抖动度、语义清晰度。基于SVM方法进行柴油机声品质预测,结果如图8所示,主观评价结果的真实值来源于文章第3部分,主观评审团成员基于分组成对比较法打分获得,主观评价的预测值是声品质预测模型计算结果。建模组样本预测结果为MSE=0.040 2,R2=0.891 8,预测组样本预测结果为MSE=0.079 3,R2=0.779 6。由于建模组和预测组样本预测结果复相关系数较低,因此,基于传统客观参量进行声品质预测精度较低。
图8 基于传统客观参量的声品质预测结果
综合考虑声品质时、频特征,选择A计权声压级、响度、尖锐度、粗糙度、抖动度、语义清晰度、频域TNR峰值、频域PR峰值、频域PR平均有效值、SIL3构建的客观评价体系作为预测模型输入,基于SVM方法进行柴油机声品质预测,结果如图9所示。建模组样本预测结果为MSE=0.007 8,R2=0.976 2,预测组样本预测结果为MSE=0.015 3,R2=0.981 9,柴油机声品质预测精度很高。
传统客观参量难以量化刺耳感,导致预测精度不足。而综合考虑声品质时频域客观参量构建预测模型具有更高的预测精度,即MSE更趋近于0,R2更趋近于1,本研究提出的声品质预测方法可为柴油机声学开发提供指导。
本研究构建了TNR和PR衍生特征参量,具体为突出比MAP频域峰值,音噪比MAP频域峰值,突出比MAP频域均方根值,结合时、频域特征完善了声品质客观评价体系,采用SVM方法构建了高精度的声品质预测模型,具体结论如下:
a) 基于传统客观评价参量进行柴油机声品质预测,预测组样本预测结果为MSE=0.079 3,R2=0.779 6,由于传统客观评价参量缺乏刺耳感、啸叫特征的表征参量,导致声品质预测精度较低;
b) 通过构建TNR和PR频域衍生特征参量,综合考虑声品质时频特征相对传统客观参量具有更高的预测精度,预测组样本预测结果为MSE=0.015 3,R2=0.981 9。