两个听音点处三维声场重建方法

2021-02-04 14:16:42松,张
计算机工程与应用 2021年3期
关键词:听音均方声场

王 松,张 聪

武汉轻工大学 数学与计算机学院,武汉430048

随着3D 电影的流行,三维音视频技术越来越受到大家的欢迎和重视。当前3D音频技术主要有:波场合成(Wave Field Synthesis,WFS)[1-2]、头相关传输函数(Head Related Transfer Function,HRTF)[3-4]、Ambisonics[5-8]、基于矢量的幅度平移技术(Vector Based Amplitude Panning,VBAP)[9]。所有这些技术中,VBAP相对使用简单。VBAP 是一种从矢量角度描述虚拟声源定位的Amplitude Panning技术[9]。VBAP技术计算效率较高,重建声像位置较为准确。

VBAP 技术使用3 个扬声器合成一个虚拟声源,可以看成是正弦法则的推广。如果重建过程中使用扬声器的数目多于3 个,VBAP 技术将会按照3 个扬声器一组的原则,对所有的扬声器阵列进行分组。Wang 等发展了VBAP 技术,使用4~5 个扬声器合成一个虚拟声源,在他们的方法中,当使用4个或者5个扬声器合成一个虚拟声源时不需要对扬声器阵列进行分组[10-11]。针对传统panning 技术当听音者头部发生偏转,声像定位不准的问题,Menzies 等提出CAP(Compensated Amplitude Panning)技术,CAP技术通过考虑听音者头部方向来调整增益,进而修正ITD(Interaural Time Difference)线索,其频率适用范围大约为1 000 Hz,只需使用2个扬声器[12]。VBAP 要想达到最佳效果,对声源的相对位置具有一定的限制,针对此问题,Franck基于优化理论提出一种面向二维扬声器摆放的panning算法用于控制声源传播,该算法不需要实时优化,计算复杂度与VBAP相当[13]。

22.2 多声道系统由日本的NHK 提出,它是一种重要的三维音频系统,基于VBAP 技术产生虚拟声像。22.2 多声道系统的广播应用在文献[14-17]中进行了研究。但是在家庭环境中摆放24个扬声器比较麻烦,同时价格较为昂贵。因此Ando提出了一种将22声道精简到10 声道或者8 声道的方法(两个低频效果声道未做处理)[18]。2016年,Shin提出一种质点速度匹配方法(Particle Velocity Matching Method,PVMSZ),该方法使用在原始多声道系统和重建多声道系统的同一区域内部匹配质点速度[19]。从理论上来讲,它可以用于中心区域或者非中心区域声场重建。文献[19]的实验基于PVMSZ方法使用5个和22个扬声器在中心区域重建声场。

文献[18-19]中的22声道系统或者其相关系统可以用于在中心点或者中心区域保持声音的物理性质不变。因此在中心点处或者中心区域,听音者可以获得最佳的听音体验。但是在实际情况下,当多于一个听音者在重建声场中听音时,多个听音者不能同时获得最佳听音体验,因为最佳听音位置位于中心点处或者中心听音区域内部。

由于两个听音点是多个听音者听音的基础情形,因此本文先研究两个听音点处三维声场重建方法。针对上述问题,本文以10声道系统重建22声道系统为例,提出一种两点处三维声场重建方法。该方法同时保持重建前后两点处的声音物理性质不变,可以让两个听音者在同一个声场中同时获得最佳听音体验。为了验证提出方法的有效性,本文从重建区域大小,重建区域之间的距离,重建区域之间的角度对重建误差的影响方面,对比分析了传统方法与提出方法的优劣。仿真实验结果表明提出方法在两个听音区域声场重建中是一种可供选择的方法。

1 基于声压和质点速度的两听音点处三维声场重建方法

1.1 声压与质点速度的计算公式

其中,k为波数,G为比例系数,,f为声音信号频率,c为声音在空气中的传播速度。

1.2 q个扬声器替换一个点声源

首先考虑多个扬声器替换一个点声源时,求解这些扬声器的信号分配系数。在笛卡尔坐标系中,假设一个点声源和q个扬声器位于同一个球面上,球面的中心为点O,也就是坐标系的原点,其坐标为,球面半径为R。点声源坐标为q个扬声器的坐标为:声场中存在任意两个听音点A1和A2,其坐标为

假设点声源在点A1处产生的声压与q个扬声器在点A1处产生的声压相等,同时点声源在点A2处产生的声压与q个扬声器在点A2处产生的声压相等,可以得到方程组如下:

其中:

假设点声源在点A1处产生的质点速度与q个扬声器在点A1处产生的质点速度相等,同时点声源在点A2处产生的质点速度与q个扬声器在点A2处产生的质点速度相等,可以得到方程组如下:

让式(5)两边的实部与实部,虚部与虚部分别相等,可以得到:

其中:

将方程(4)与方程(6)联合构造方程,可以得到:

其中:

然后可以得到如下方程:

式(8)可以使用现有多种方法求解。

1.3 q个扬声器替换多个点声源

当使用q个扬声器替换m个点声源时,假设m个点声源的信号为S1,S2,…,Sm。假设当q个扬声器替换第i个点声源时,,使用本文1.2节的方法,可以求出q个扬声器的信号分配系数为则可以得到:

2 仿真实验

两区域三维声场重建实验测试了Ando 方法[18]、PVMSZ 方 法[19]和SPPVTLP 方 法 的 表 现。NHK22.2 多声道系统(不带两个低频效果声道)以及其10声道重建系统的扬声器摆放位置如图1 所示。扬声器阵列的中心为点O,两个关注区域为区域1、区域2,它们的中心点坐标分别为因此区域1为一个非中心区域,区域2 为一个中心区域,假设声音在空气中的传播速度为340 m/s,人头半径为0.085 m。700 Hz的单频信号作为原始22声道的原始信号。

2.1 声压的相对均方误差比较

相对均方误差(Relative Mean Square Error,RMSE)的定义为:

图1 扬声器位置摆放图

其中,积分区域V是一个半径为α,中心为点A的球体,为V中任意一点,分别为原始声压和重建的声压。相对均方误差的对比参见图2。

当α=0.085 m 时,Ando 方 法、PVMSZ 方 法 和SPPVTLP 方法产生的相对均方误差如表1。对于10声道扬声器摆放,在一个人头大小的区域内(区域1)SPPVTLP 方法产生的相对均方误差比Ando 方法和PVMSZ 方法分别降低10.53 和10.33 个百分点;在另一个人头大小的区域内(区域2)SPPVTLP 方法产生的相对均方误差比Ando 方法高0.67 个百分点(少于0.01),SPPVTLP 方法产生的相对均方误差比PVMSZ 方法降低0.33 个百分点(少于0.01)。这是因为Ando 方法和PVMSZ方法仅仅关注中心听音点或者中心听音区域内声场的恢复,并不关注非中心听音点或者非中心听音区域内声场的恢复情况。然而,SPPVTLP 的方法同时关注中心听音点A2与非中心听音点A1处的声场恢复,所以SPPVTLP方法在非中心听音点A1附近区域(区域1)产生的相对均方误差低于传统方法,同时保证了中心听音点A2附近区域(区域2)产生的相对均方误差与传统方法差不多(误差小于0.01)。

图2 相对均方误差比较

表1 α=0.085 m,f=700 Hz 时的相对均方误差

由图2 可知,当α大于0.425 0 m(约5 个人头半径)时,在区域1范围内,SPPVTLP方法产生的相对均方误差大于Ando方法产生的相对均方误差;当α大于0.255 0 m(约3 个人头半径)时,在区域1 范围内,SPPVTLP 方法产生的相对均方误差大于PVMSZ方法产生的相对均方误差。当α大于0.510 0 m(约6个人头半径)时,在区域2 范围内,SPPVTLP 方法产生的相对均方误差比Ando方法产生的相对均方误差大得较多;当α大于0.340 0 m(约4 个人头半径)时,在区域2 范围内,SPPVTLP方法产生的相对均方误差比PVMSZ方法产生的相对均方误差大得较多。这意味着当区域1 的半径为单个人头半径大小时,与Ando 方法和PVMSZ 方法相比,SPPVTLP方法能够减少区域1 范围内的相对均方误差。与此同时,当区域2 的半径为单个人头半径大小时,SPPVTLP方法在区域2 范围内可以获得与Ando 方法和PVMSZ方法差不多的相对均方误差。只有当区域1和区域2的半径变得足够大时,SPPVTLP 方法产生的相对均方误差才大于Ando 方法和PVMSZ 方法。这是因为在声场重建的过程中,SPPVTLP 方法比传统方法具有更多的约束条件,接收点距离点A1或A2越远,接收点处的重建误差将会变得越大。因此,当区域1 或者区域2 的半径变得足够大时,SPPVTLP 方法产生的相对均方误差大于Ando方法和PVMSZ方法。

2.2 相对均方误差与两区域之间距离的关系

本部分研究两区域之间间隔距离对两区域范围内相对均方误差的影响。相对均方误差的公式参见式(10)。两个区域为区域1 和区域2,由于原始系统和重建系统包含的声场直径为4 m,因此可以假设两个区域之间距离的变化范围是0~4 m。区域1和区域2的半径都是0.085 m,即人头半径大小。

当区域1 和区域2 的中心点位于x轴上,并且对称时,两个区域的相对均方误差与两区域之间间隔距离的关系如图3 所示;当区域1 和区域2 的中心点位于y轴上,并且对称时,两个区域的相对均方误差与两区域之间间隔距离的关系如图4 所示;当区域1 和区域2 的中心点位于z轴上,并且对称时,两个区域的相对均方误差与两区域之间间隔距离的关系如图5所示。

图3 区域中心点位于x 轴上时,相对均方误差与区域间隔距离的关系图

从图3、图4 和图5 可以看出,所有的方法产生的相对均方误差都是随着两区域之间间隔距离的变化而变化的。但是对于大多数区域1与区域2之间的间隔距离而言,SPPVTLP 方法产生的相对均方误差都低于Ando方法和PVMSZ 方法产生的相对均方误差。这表明SPPVTLP方法重建声场的表现比传统方法稳定。这是因为Ando 方法和PVMSZ 方法只关注中心听音点或者中心听音区域声场的最佳恢复,并不关心非中心听音点或者非中心听音区域声场的恢复。但是,SPPVTLP 方法同时关注两个听音点(即区域1和区域2的中心点)处声场的恢复,因此SPPVTLP方法在区域1和区域2内产生的相对均方误差在大多数两区域间隔距离情况下低于传统方法。

图4 区域中心点位于y 轴上时,相对均方误差与区域间隔距离的关系图

图5 区域中心点位于z 轴上时,相对均方误差与区域间隔距离的关系图

2.3 相对均方误差与两区域之间角度的关系

图6 相对均方误差与两区域之间夹角的关系图

从图6(a)可以看出,SPPVTLP方法和Ando方法产生的相对均方误差都低于PVMSZ方法产生的相对均方误差。对于大多数两区域之间的夹角而言,SPPVTLP方法产生的相对均方误差都低于Ando 方法,除了两区域之间夹角位于区间之内。当两区域之间夹角在之间变化时,SPPVTLP 方法产生的相对均方误差比Ando方法高0.10~0.54个百分点(少于0.01),这表明这两种方法的重建表现差不多。当两区域之间夹角在之间变化时,SPPVTLP方法产生的相对均方误差比Ando 方法高2.08~4.05 个百分点。这是因为两区域之间的夹角引起方程(8)中的矩阵的条件数变大。

从图6(b)可以看出,对于所有的两区域之间的夹角,SPPVTLP方法产生的相对均方误差都低于PVMSZ方法产生的相对均方误差。虽然对于所有的两区域之间的夹角,SPPVTLP 方法产生的相对均方误差都高于Ando 方法,但是SPPVTLP 方法和Ando 方法产生的相对均方误差都低于1个百分点,它们之间最大的差值为0.68个百分点,少于0.01。这一结果表明,在区域2范围内,SPPVTLP方法产生的相对均方误差与Ando方法产生的相对均方误差相当。PVMSZ 方法和Ando 方法在区域2 范围内产生的相对均方误差随着两区域之间角度的变化趋势是两条直线,这表明它们产生的相对均方误差并不随着两区域之间角度的变化而改变。原因是PVMSZ 方法和Ando 方法只关注区域2(也即中心听音区域)内部声场的恢复,并不关注区域1(也即非中心听音区域)内部声场的恢复情况。

2.4 宽带信号相对均方误差与两区域半径之间的关系

假设宽带信号(50~1 000 Hz)被选作为22声道系统的原始信号。两个听音区域为区域1 和区域2,它们的中心点分别为区域1 和区域2 的半径的变化范围是0~0.1 m,刚好可以容纳一个听音者的头部。宽带信号的相对均方误差定义为:

图7 相对均方误差与区域半径之间的关系图

其中,f1和f2分别为频率的下界和上界。图7 展示了使用不同方法产生的宽带信号相对均方误差随着区域1和区域2半径的变化情况。

从图7(a)可以看到,区域半径的变化范围是0~0.1 m,SPPVTLP方法产生的宽带信号相对均方误差低于Ando方法和PVMSZ 方法。SPPVTLP 方法产生的宽带信号相对均方误差与Ando 方法产生的相对均方误差的差异范围是[0.029 4,0.044 9],与PVMSZ 方法产生的相对均方误差的差异范围是[0.018 3,0.029 3]。这是因为SPPVTLP 方法同时关注区域1 和区域2 的声场恢复情况,然而传统方法只关注区域2 的声场恢复情况,没有关注区域1的声场恢复情况。

从图7(b)可以看到,区域半径的变化范围是0~0.1 m,SPPVTLP 方法产生的宽带信号相对均方误差低于PVMSZ 方法。SPPVTLP 方法产生的宽带信号相对均方误差与PVMSZ方法产生的宽带信号相对均方误差的差异范围是[0.002 2,0.025 3]。当区域半径的变化范围是0~0.1 m时,SPPVTLP方法产生的宽带信号相对均方误差高于Ando 方法。SPPVTLP 方法产生的宽带信号相对均方误差与Ando方法产生的宽带信号相对均方误差的差异范围是[0.004 7,0.014 3]。当区域2的半径变化范围是0.07~0.1 m 时,SPPVTLP 方法产生的宽带信号相对均方误差与Ando方法产生的宽带信号相对均方误差的差大于0.01。这是因为声场重建效果与声音信号频率、扬声器数目、重建区域的大小是相关的。Ando方法使用10个扬声器,只关注中心区域2范围内声场的重建效果,因此在区域2 范围内,Ando 方法产生的宽带信号相对均方误差低于SPPVTLP 方法。SPPVTLP 方法在重建声场时同样使用10 个扬声器,但是既需要关注中心区域2范围内声场的重建情况,也需要关注非中心区域1 范围内声场的重建情况。因此,SPPVTLP 方法产生的宽带信号相对均方误差在区域2 范围内高于Ando 方法,在区域1 范围内低于Ando方法。这一结果表明,同时关注两个区域的声场重建效果,将会轻微地削弱SPPVTLP 方法在中心区域2 范围内的重建效果,但是增强了SPPVTLP 方法在非中心区域1 范围内的重建效果。同时,增强的程度高于削弱的程度。

3 结束语

为了让多于一个的听音者在声场中可以获得较好的听音体验,本文提出了一种两听音点处三维声场重建方法:SPPVTLP,它可以让两个听音者所在位置处的声压和质点速度在重建前后保持不变。SPPVTLP方法可以让两个听音者在同一声场中同时获得最佳听音体验。仿真实验测试了不同方法,比较分析了声压的相对均方误差变化,两区域之间距离对相对均方误差的影响,两区域之间夹角对相对均方误差的影响,两区域半径大小对宽带信号相对均方误差的影响。实验结果表明,相对于传统方法,SPPVTLP方法是一种有效的可供选择的方法,还可用于其他的多声道系统进行任意选取的两听音点处声场重建。

猜你喜欢
听音均方声场
一类随机积分微分方程的均方渐近概周期解
听音识人
Beidou, le système de navigation par satellite compatible et interopérable
基于BIM的铁路车站声场仿真分析研究
由“听音为字”看“戏”“䏘”“丫麻”
探寻360°全声场发声门道
修订版PEP 六年级英语毕业检测题
基于抗差最小均方估计的输电线路参数辨识
电力建设(2015年2期)2015-07-12 14:15:59
基于随机牵制控制的复杂网络均方簇同步
听音训练对汉语单音节听感清晰度的影响
声学技术(2014年2期)2014-06-21 06:59:08