毕凤荣,黄 宇,张立鹏,沈鹏飞,吕大立
(1.天津大学,内燃机燃烧学国家重点实验室,天津 300072; 2.天津内燃机研究所,天津 300072)
Research on Subjective Evaluation Method of Vehicle Sound Quality Based on Interval Grey Number Theory
BiFengrong1,HuangYu1,ZhangLipeng2,ShenPengfei1&LüDali2
1.TianjinUniversity,StateKeyLaboratoryofEngines,Tianjin 300072; 2.TianjinInternalCombustionEngineResearchInstitute,Tianjin 300072
[Abstract]In order to improve the reliability and practicability of subjective evaluation of vehicle sound quality,and to analyze the interior noise quality characteristics of pure electric vehicle under the condition of constant speed and acceleration,based on the anchored semantic differential method(ASDM)and the interval grey number theory,an improved subjective evaluation method of sound quality is proposed.Firstly,referring to a benchmark sample,the assessors use fuzzy scoring method to evaluate subjectively the noise samples in the vehicles.Secondly,the grey incidence degree is used as scorer reliability to eliminate the invalid score data.Thirdly,a certainty parameter of interval grey number is proposed as an important index for calculating the weights of scores in order to obtain the comprehensive scoring results of each sample.By comparison with the evaluation results of traditional semantic differential method(SDM)and ASDM,it is verified that the improved method can more accurately reflect people's subjective feelings about the noise in the vehicle while the workload of evaluation is not increased.The method is used to evaluate subjectively the interior noise quality of three pure electric vehicles of different positioning under different working conditions,so that the sound quality characteristics of three vehicles can be compared and analyzed.
Keywords:vehiclesoundquality;intervalgreynumber;subjectiveevaluation;semanticdifferential method
主、客观评价是量化汽车声品质优劣程度的主要途径[1],虽然近几年声品质客观评价方法的研究取得了较大的进步,基于各类智能算法的声品质预测模型得到了一定的发展;但人的主观感受作为对噪声最直接的反应,主观评价试验仍是汽车声品质研究中不可或缺的一环[2]。目前国内外较为成熟的主观评价方法主要包括:简单排序法(ranking method,RM)、等级评分法(rating scale method,RSM)、成对比较法(paired comparison method,PCM)、语义细分法(semantic differential method,SDM)和参考语义细分法(anchored semantic differential method,ASDM)等,这些方法在车内噪声品质评价研究中得到了较为广泛的应用[3]。其中RM和RSM简单易行,但前者的评价结果只体现了样本好坏的趋势,后者评分时易受相邻样本的影响,准确性和可靠性较低。PCM工作量与样本数量的平方成正比[4],过多的样本会造成评审员听觉疲劳而使评价结果失真[5],因此需控制样本数量。SDM是采用若干成对的语义词汇来对样本进行不同维度的描述,为评审员打分提供参考,但在应用过程中仍无法避免相邻样本间的干扰,评审员对语义词汇的不同理解也会影响结果的一致性,样本数量同样不宜过多。ASDM是在SDM的基础上改良得到[1],它为评审员提供了一个基准样本作为对比参考,使整个评分过程的标准更加稳定,放宽了样本数量限制,评价结果更加可靠。
但是以上的几种方法均默认评审员在给每一个样本打分时总能给出一个确切的分值,这显然是不符合人对事物进行主观评判时的实际状态,有限且固定排布的评分等级也限制了评审员的打分自由。由此Yuan等[6]引入了灰色区间的概念对ASDM进行改进,这种改进的语义细分法所采用的每一个语义词汇分别对应一段区间灰数,评审员按照词汇对每个样本评出一个分数范围。但在实际应用中发现,该方法没有考虑评分区间长度与评分者对该评分确信程度间的联系,也没有针对区间型分数给出一套切实可行的评分者信度求法,而且该方法限定了每次给分的范围,同样没有做到真正的模糊打分。
针对以上问题,本文中提出了基于区间灰数理论[7]改进的语义细分法。每位评审员以基准样本作为对比参考,采用任意模糊涂抹的方法对每个样本进行评分,得到一组分数的区间序列。通过区间灰色关联度[8]算法求出各个评审员与整体评分结果之间的关联度作为评分者信度,以此对评分结果进行筛选,最后考虑每个评分的区间长度与评审员对该评分的确信程度间的关系,提出区间灰数确信度的计算方法,依据确信度对剩余的评分结果进行加权平均得到最终评价结果。通过与SDM和ASDM的评价结果进行对比分析,证明了改进的语义细分法在保持同样工作量的前提下,能更准确合理地反映人对车内噪声的主观感受,并利用该方法分析了3款不同定位的纯电动汽车的车内噪声品质特性。
定义 1[9-10]若实数 α≤β,且[α,β]⊆B则称不确定数δ∈[α,β]为在论域B上以α为下界,β为上界的区间灰数,L(δ)=β-α为灰数δ的区间长度。
定义2[7]对于缺乏分布信息的区间灰数δ∈[α,β],有如下情况。
(2)若 δ为离散型灰数,εi∈[α,β](i=1,2,…,n)为灰数 δ的所有可能取值,则称为灰数δ的核。
定义3 对于离散型区间灰数,称其能取得的最小区间长度θ为该区间灰数所处论域的分辨率,本文中设计的评分表的分辨率θ=0.1。
定义 4[11]设 δ1∈[α1,β1],δ2∈[α2,β2]为两个区间灰数,则称 d(δ1,δ2)为区间灰数 δ1与 δ2间的距离。
定义5[9]设某系统行为灰数序列为 X={X0,X1,…,Xm},其中反映该系统行为特征的灰数参考序列X0以及影响该系统行为的因素组成的灰数比较序列 X1,X2,…,Xm如下:
称 γ(X0,Xi)为 X0与 Xi的区间灰色关联度,其中 ξ∈(0,1)为分辨系数,通常取0.5。
定理1[12]前文中定义的区间灰色关联度γ(X0,Xi)满足以下灰色关联四公理。
(1)规范性,即 0<γ(X0,Xi)≤1。
证明:因 d(δx,δy)≥(δ0(k),δi(k)),故满足规范性。
(2)偶对对称性,即当 X={Xx,Xy}时,γ(Xx,Xy)=γ(Xy,Xx)。
证明:因 d(δx,δy)=d(δy,δx)且
(3)整体性,即当 Xx,Xy∈X={Xs|s=0,1,2,…m;m≥2}时,一般 γ(Xx,Xy)γ(Xy,Xx)。
证明:因 X={Xs|s=0,1,2,…,m;m≥2},则对于任意 Xx,Xy∈X,一般有δx(k),δy(k))(δy(k),δx(k)),故满足整体性。
(4)接近性,即随着 d(δ0(k),δi(k))的减小,γ(δ0(k),δi(k))增大,显然成立。
ASDM在SDM的基础上进行改进,为评审员提供了一个基准样本作为对比参考,但固定的分值仍限制了评审员的打分自由,无法反映评审员真实的主观感受。本文中认为人在评判事物时的主观感受是一个模糊的区间范围,而非确定的值,并且模糊区间越长,评分者对该分数的不确信程度越高。遂结合区间灰数理论,以各个评审员的评分序列与整体评分序列间的区间灰色关联度作为评分者信度,考虑评分区间长度与评分者对该评分确信程度间的关系,提出了以下改进的语义细分法,总体流程如图1所示。
图1 改进的语义细分法总体流程图
(1)设计了一套用于声品质主观评价试验的模糊打分表。其部分表格如图2所示,打分范围为0~10分,分辨率为0.1,评价指标选取“响亮与安静”、“愉悦与烦躁”等成对词组,以略微、一点、一些和十分等修饰语对语义等级进行大致划分。选取一个客观声学指标适当的样本作为基准样本,令其分值为5。M位评审员参考基准样本,根据主观感受逐一对N个噪声样本进行任意范围的模糊涂抹打分,评分过程基本满足评审员自由打分的需求。
(2)统计评审团的评分结果,得到一组区间灰数评分序列 X={X0,X1,…,Xi,…,XM},其中 Xi=(δi(1),δi(2),…,δi(k),…,δi(N)),δi(k)∈[αik,βik],L(δi(k))=βik-αik(i=1,2,…,M)。i=0时,由以下公式计算参考序列中各区间灰数的核、区间长度以及上下界:
(3)按照式(1)~式(3)计算区间灰数评分序列X中各个比较序列与参考序列的关联度作为评分者信度 γ(X0,Xi)(i=1,2,…,M),将信度过低的 r个评审员的评分结果筛除,得到新的评分序列X′={X′0,X′1,…,X′i,…,X′M-r}。
图2 主观评价试验模糊打分表
(4)基于评分者对评分确信程度与评分区间长度成相反的关系,提出了分数确信度的概念,其计算式为
通过新的评分序列 X′={X′0,X′1,…,X′i,…,X′M-r},计算得到评分区间灰数的核序列 Δ,按照式(7)计算得到每个区间灰数评分的确信度序列Π,其中 θ=0.1。
(5)最后以样本每个分数的确信度与该样本所有分数确信度之和的比值作为分数的权值,计算得到各个样本的综合得分:
参考GB/T 18697—2002《声学汽车车内噪声测量方法》对特斯拉model s、奇瑞eq以及长城C30 EV这3款不同品牌、定位的纯电动汽车进行了车内噪声采集试验。测试设备如表1所示,测点位置及设备设置状态如图3所示,选择副驾驶位,模拟采集副驾驶员双耳在车内收听到的噪声信号。试验时道路环境、声学环境、车辆状态以及设备设置均满足上述标准要求。
表1 噪声样本采集试验设备
图3 噪声样本采集试验装置
所有样本的采集工况为 20、40、60、80、100、120 km/h速度下的匀速工况,以及 0~120 km/h的全油门加速工况,按照国际通用要求,将这些样本分别截取为5 s时长的最佳噪声样本[5]。其中,由于动力性能的差异,部分车型在个别高速或低速工况下的噪声样本无法获得,最终采集到3辆车的25个噪声样本,如表2所示。
表2 各车型噪声样本采集工况
通过LMSTestlab软件提取这些样本的客观响度值,选取其中12个响度值分布更为合理的噪声样本验证改进的主观评价方法的可靠性,如表3所示。
表3 用于方法验证的噪声样本及其响度排序
参考Ma等[3]的实验方案,选取“愉悦与烦躁”、“豪华与廉价”、“有力与乏力”作为声品质主观评价指标,以“略微”、“有些”、“十分”等如图2所示的修饰语对语义等级进行大致划分。组织了18名相关专业听力健康的师生作为评审员,采用改进的语义细分法按照上文中所述步骤依次完成对25个噪声样本的主观评价试验。试验过程中均采用专业声卡以及高保真耳机对噪声样本进行随机回放,评审员听音后在独立设计的模糊打分表上逐一对样本的3组评价指标进行主观评分,试验设备如图4所示。试验过程中,环境背景噪声低于30 dB(A),风速低于1 m/s,温度维持在22℃左右,无明显异味(后文中简称此试验为全样本主观评价试验)。
图4 主观评价试验设备
为验证改进的语义细分法相对于其它方法更加可靠和实用,上述试验结束后,随机抽取其中10名评审员在同样条件下分别采用SDM、ASDM以及改进的语义细分法对表3所示的12个样本的响亮程度再次独立进行了3次主观评价试验,并记录了每位评审员的评分耗时(后文中简称此3次试验为方法验证试验)。
整理统计改进的语义细分法的评分结果,得到一组区间灰数评分序列X={X0,X1,…,Xi,…,XM},按照式(1)~式(6)计算各个评审员与总体评分之间的灰色关联度作为该方法的评分者信度;通过SPSS软件对SDM和ASDM的评分结果进行相关分析,分别计算各个评审员评分数列两两之间的Pearson相关系数,得到每个评审员与其它评审员之间的评分相关系数,取其算数平均值作为评分者信度。表4为采用改进的语义细分法对所有噪声样本进行的声品质主观评价试验,18位评审员对于不同评价指标的评分者信度;表5为方法验证试验中分别采用3种方法时10位评审员各自的评分者信度。
对于采用改进的语义细分法进行的主观评价试验,各评审员的评分者信度取自区间灰数关联度,目前还没有相关文献对其无效临界点的取值做出指导,本文中取其平均值的85%作为无效临界点,即对于评分序列灰色关联度低于各评审员平均值85%的评审员,其评分序列应当予以剔除,以保证评分结果的有效性。由表4可知对所有样本进行的主观评价试验中所有评审员的评分序列灰色关联度均大于平均值的85%,全部有效。由表5可知,评审员g的评分序列灰色关联度为0.582,小于平均值的85%,予以剔除。而对于采用SDM或ASDM进行的主观评价试验,评审员的评分者信度均取自评分数列之间的Pearson相关系数,其数值高于0.7则视为具有较高的一致性[13],由表5可知采用这两种方法进行的试验中所有评审员的评分结果均为有效。
表4 全样本主观评价试验中各评审员的评分者信度
表5 方法验证试验中各评审员的评分者信度
(1)试验结果对比分析
对SDM和ASDM的评分结果作算数平均处理,可得到各个样本的最终综合得分。对于改进的语义细分法,在剔除无效数据后,按照式(8)对其评分结果进行计算,便可得到各个样本的最终得分。3种方法的最终结果如表6所示,其数值大小与样本响度的变化大致成正相关。
表6 方法验证试验结果
为更加直观地比较3种方法的评分结果与样本实际响度大小的相关程度,利用SPSS统计学软件计算3组结果与实际响度之间的Pearson相关系数,并分别对4组数据进行归一化处理后画出点线图,使样本的实际响度参数与评分结果能够在同一尺度上进行比较,结果如表7和图5所示。
表7 方法验证试验的结果与实际响度间的相关程度
图5 方法验证试验的结果与响度随样本的变化趋势
由图5和表7可以看出,相比ASDM和SDM,改进的语义细分法的试验结果在大部分的样本点上与样本的实际响度更为贴近,且整体的相关系数更大,表明改进的方法能够更加准确合理地反映人对纯电动汽车车内噪声的主观感受。
(2)工作量对比分析
忽略打分之外的其它操作耗时,将主观评价试验的耗时分为听音耗时、打分耗时和犹豫耗时3部分。假设应用SDM、ASDM和改进的语义细分法进行主观评价试验时,每次打分的平均耗时分别为L1、L2、L3,犹豫的平均耗时分别为为 H1、H2、H3,考虑SDM和ASDM的打分方式相同,ASDM和改进的语义细分法的判断依据相同,认为 L1=L2,H2=H3,故可得到样本数为10、样本时长为5 s时,这3种声品质主观评价方法的理论耗时与实际耗时对比结果如表8所示。
从表8可以看出,针对单个样本,ASDM实际上只比SDM多耗时3.07 s,而理论上两者之差为(5 s+H2-H1),故可合理推测 H2<H1,表明对于改进的语义细分法或ASDM,选取一个基准样本作为评分参考,可以使评审员的主观判断更加果断。对比ASDM,改进的语义细分法总体上没有明显增加评审员的工作量,考虑新式的打分方式耗时与打分熟练程度以及评分表设计密切相关,可以认为,改进的语义细分法与ASDM的评分工作量基本相同。
表8 3种主观评价方法耗时
同样按照式(8)对全样本主观评价试验的评分结果进行计算,得到3款纯电动汽车不同工况下各个样本的最终得分,如图6~图8所示。
图6 愉悦度主观评价试验结果
图7 豪华度主观评价试验结果
由图6~图8结果可知:
(1)定位高端的特斯拉纯电动汽车与另外两款定位较低端的车型相比,其车内噪声环境明显更加令人舒适,但在动力性上,定位更高端的纯电动汽车并没有表现得更加出色;
(2)从整体上来看,随着纯电动汽车车速的升高,其车内噪声会令人更加烦躁,并且使得汽车带给人的豪华感下降,但其为汽车带来的动力感受影响并不大;
(3)电动汽车车内加速噪声更容易使人体会到汽车的动力性;
(4)愉悦度与豪华度指标在语义上可能存在较多的重合部分,导致其主观评价结果相近。
图8 动力性主观评价试验结果
采用基于区间灰数理论的主观评价方法对3款不同定位的纯电动汽车车内噪声进行了主观评价试验。针对区间型分数序列,以区间灰色关联度作为评分者信度检验的参数,考虑评审员对所评分数的确信程度与分数的区间长度成相反的关系,提出了一种区间灰数的确信度参数作为计算分数权值的重要指标,最终得到了多组主观评价试验的结果,对其进行对比分析得到以下结论。
(1)改进的语义细分法与ASDM的工作量基本相同,而且相比其它两种主观评价方法,改进的语义细分法能更加准确合理地反映人对车内噪声的主观感受,一定程度上提升了主观评价试验的可靠性。
(2)随着纯电动汽车车速的提升,其车内噪声的烦躁度在整体上呈上升趋势,且车速越高,电动汽车给人带来的豪华感越低。
(3)相比于匀速工况,加速工况下的噪声更能表现出纯电动汽车的动力性,故在以动力性作为电动汽车声品质的考察指标时,采集加速工况的噪声信号作为样本尤为重要。