吴燕艺,李剑汶,童 峰
(厦门大学 海洋与地球学院,水声通信与海洋信息技术教育部重点实验室,福建厦门361102)
采用时间反转的调频水声语音通信方法
吴燕艺,李剑汶,童峰*
(厦门大学 海洋与地球学院,水声通信与海洋信息技术教育部重点实验室,福建厦门361102)
摘要:调频语音通信技术具有抗干扰性能好、易于实现的特点,但在水声信道多径条件下调频体制传输的水声语音质量受到严重影响.针对此问题在调频语音通信体制下引入时间反转处理,通过抑制多径效应聚焦能量提高信号信噪比,改善调频水声语音通信性能,并采用客观语音质量评估 (perceptual evaluation of speech quality,PESQ)方法对调频水声语音通信质量进行评估.海洋试验证明,时间反转处理可有效提高调频水声语音通信系统性能.
关键词:水声语音通信;调频;时间反转;多径信道
水声语音通信在海洋工程、军事训练、海洋开发、搜救、水下观光、潜水作业等场合有着广泛的应用.单边带水声语音通信是最早的水声语音通信手段,如美国海军水声实验室研制的水下电话[1].但在复杂时空变化特性、强多径、强噪声等恶劣水声信道条件下,单边带调制性能受到了严重的限制.针对单边带技术的缺点,数字体制水声语音通信技术得到广泛研究.法国码激励线性预测实验系统,采用四进制差分相移键控(4-differential phase shift keying,4-DPSK)调制和最小均方算法 (判决反馈均衡器)[2].陈冰等[3]采用正交频分复用技术(orthogonal frequency division multiplexing,OFDM)设计出适用于水声信道环境的实时语音通信系统.殷敬伟等[4]设计并实现一套时域差分OFDM水下语音通信系统,并与常规OFDM方法相比较,体现了差分OFDM具有的优点.曾堃等[5]基于时频差分OFDM设计了水声语音通信系统.但是,OFDM、正交相移键控(quadrature phase shift keying,QPSK)等数字调制技术虽具有高频谱利用率、强抗干扰能力等优点,但OFDM对多普勒频移和相位噪声敏感,子载波的正交性容易被破坏,QPSK需要严格的载波同步,容易受码间干扰影响,造成通信性能下降.同时,数字通信体制的语音通信都需配合声码器或语音识别器,增加了系统的复杂度,且在高误码情况下会导致语音完全损失.
调频水声语音通信技术具有良好的通信效果,如调制效率高、抗噪性能好等特点[6],特别是在较低信噪比条件下可充分利用人耳的噪声抑制能力提高语音通信效果.黄绍[7]设计了一套调频水声语音通信系统.但在多径条件下,调频体制对于多径效应的抵抗能力较弱,严重影响通信性能.在传统模拟调频调制解调过程中会产生噪声干扰,一定程度影响水声语音通信.本研究考虑多径信道下的水声语音通信需求,在传统调频语音通信体制内引入时间反转技术以改善系统性能.
时间反转技术可有效抑制多径效应,通过聚焦多径提升水声语音通信系统性能.目前在数字体制通信系统中,为了对抗信道中的多径效应,时间反转技术在QPSK、OFDM等数字水声通信体制中得到广泛研究和应用[8-9],但在调频体制中的应用尚不多见.
本研究在调频水声通信中引入时间反转处理,对调频解调后的语音信号进行时间反转处理,即在语音频带内进行时间反转处理,保留了模拟调频解调体制实现简单特点的同时,利用时间反转处理改善语音质量.
水声语音通信的性能评估,主要通过计算语音信噪比,从能量方面进行评估,计算方便,但未考虑语音听感、可懂度等.语音质量包括两个方面内容:清晰度和自然度.语音质量评估是一个极其复杂的问题,从评价的主体上讲可分为两大类:主观评价和客观评价.目前,国内外使用较多的主观评价方法有:平均意见分(mean opinion score,MOS)、音韵字可懂度测量(diagnostic rhyme test,DRT)和满意度测量(diagnostic acceptability measure,DAM)[10].主观评价主要靠人对语音质量的感觉,但是费时费力费钱,而且灵活度不够,受人的主观影响较大.
为了克服信噪比评估和语音主观评价的缺点,本研究采用客观评价方法进行质量评估.客观语音质量评估(perceptual evaluation of speech quality,PESQ)方法[11]是国际电信同盟(International Telecommunications Union,ITU)于2001年采用感知语音质量测量(perceptual speech quality measure,PSQM)的感知模型和感知分析测试系统(perceptual analysis measurement system,PAMS)的延时校准方法形成的,PESQ算法采用改进型认知模型技术和听觉模型技术,充分考虑端到端的网络时延,因此对通信时延、环境噪声等有较好的鲁棒性[12],可以用于测评不同类型的网络,已成为了ITU的语音评价标准.为了量化体现信号质量的改善程度,本研究采用PESQ客观语音质量评估算法对时间反转处理前后的海试解调语音进行质量评估.
1调频水声语音通信原理
频率调制[13]可以用式(1)表达:
eθ(t)=A0cos[ω0t+φ(t)+φ0],
(1)
其中,A0为载波振幅,φ0是调角波的初始相角,φ(t)+φ0是调角波的顺时相角.对于调频波[13],则:
(2)
其中,g(τ)是调制信号,Kf是调制灵敏度(rad/(s·V)).将式(2)代入式(1),假设起始相位角为0,则调频信号的表达式[13]为:
(3)
若g(t)=A1cos(Ωt),并将g(t)代入式(1)和式(3)即得:
A0cos[ω0t+mfsin(Ωt)],
(4)
其中mf为调频指数,
(5)
由式(5)可得,对于单音调频波调制指数mf反比于调制角频率Ω.
在调频调制过程中,调频信号由于非线性调制造成了其频谱结构中具有新的边频成分且在有效调制带宽两侧成对称分布.这一特性使得调频信号具有较强的抗干扰能力,可以抵抗信道中的干扰[6].在接收端,解调过程中限幅器的应用使得调频体制对调频信号在信道传播过程中产生的畸变具有一定的抑制.本文采用非线性解调电路,由于非线性电路的特点[14]使得调频信号的解调过程的频率捕获效应更加明显,这一特点可以加强调频体制系统的抗多径性能.
2时间反转技术
时间反转处理[15]可简单描述如下:
设水声信道的冲激响应为h(t),发射的水声语音信号包含语音信息s(t)和探针信号p(t),s(t)和p(t)经过信道后可得:
sr=s(t)⊗h(t)+ns(t),
pr(t)=p(t)⊗h(t)+np(t).
其中ns(t)、np(t)为信道中的噪声干扰.提取接收到的探针信号pr(t),经过时间反转处理得到pr(-t),pr(-t)将被存放在时间反转存储器中,该过程称为预处理过程.将接收信号sr(t)与时间反转后的探针信号pr(-t)作卷积可得预处理器输出信号:
r(t)=s(t)⊗h(t)⊗p(-t)⊗h(-t)+n(t).
其中n(t)即为预处理器输出的干扰噪声.为了还原原始信号s(t),探针信号p(t)必须具有良好的自相关性,使得p(t)⊗p(-t)也近似于δ(t),最终可以得到时间反转处理后的信号:
目前,时间反转已经在数字通信体制如QPSK和OFDM中得到广泛的研究和应用[16],但在调频体制中的应用尚不多见,本研究在调频体制中引入时间反转技术对抗水声信道中的多径效应,提升系统性能.
3调频水声语音通信方案
调频体制虽然已被运用在水声语音通信之中,但由于其对于水声信道中的多径效应抵抗较差,同时在调频调制解调过程中会产生边频分量,一定程度上增加了系统噪声对语音解调质量的影响.这都是在水声语音通信中需要解决的问题.本文中针对调频体制的缺点,提出利用时间反转技术应对上述问题以改善系统性能,方案流程图如图1所示,发射端部分主要包括语音信号输入和信号调制两部分,接收端部分主要包括解调电路和信号处理两部分.
图1 调频水声语音通信系统流程图Fig.1The process of frequency modulation underwater acoustic voice communication system
在接收端,从换能器接收到的信号经过放大滤波等前置处理以后,再经过非线性解调,解调语音一路可供直接输出,另外一路送入数字处理器完成时间反转处理过程,即:首先通过同步定位将探针和信号取出来,并保存;接着将探针信号反转,并与解调语音做卷积计算;最终得到经过多径聚焦的语音输出.
由于是基于调频语音通信系统进行时间反转处理,本系统无需采用声码器,系统复杂度较低,易于实现;同时系统保留一路模拟解调输出,可在数字处理器工作异常情况下作为备份输出,增加冗余性.
表1 调制参数设置
Tab.1 System parameters of frequency modulation system modulation
载波频率/kHz换能器带宽/kHz探针长度/ms语音长度/s间隔长度/ms调制带宽/kHz调制灵敏度探针采样率/kHz语音采样率/kHz调制方式2520~30505.37033322~282×π×300084DDS调制
4海洋试验结果及分析
4.1试验环境
为了验证本文调频水声语音通信系统的性能,在厦门市五缘湾海域进行了海洋试验.海域为半封闭结构,平均水深约为10 m,发射、接收换能器放置深度均为3 m左右,接收、发射换能器之间距离1 km左右.图2为试验海域声速梯度曲线.
图2 声速梯度Fig.2Sound speed gradient
4.2试验系统设置
发射信号调制具体参数设置如表1所示.信号调制部分采用直接数字式频率合成器(direct digital synthesizer,DDS)数字调制实现,由ARM7-LPC2138和AD9851完成.DDS在频率转换时间、相位连续性、频率分辨率等各方面性能指标远远超过了传统频率合成技术水平,提供了优于模拟信号源的性能.
频率调制信号由语音频带探针和语音信号组成.语音频带探针为线性扫频(linear frequency modulation,LFM)信号,扫频范围500~1 500 Hz,采样率8 kHz,长度50 ms.语音信号在探针信号之后,两者保护间隔为333 ms,试验语音内容为“厦门大学正在进行语音测试”,采样率4 kHz,长度5.370 s.
试验系统解调采用非线性解调电路[15],解调语音信号送入PC中进行时间反转处理,由于时间反转处理只需处理解调语音,可以采用较低的采样率从而有效降低运算复杂度,方便进行嵌入式实现.本方案中时间反转处理的数据传输速率为4 kbit/s.
为了进行性能评估比较,在同信道下进行OFDM水声语音通信试验[8].OFDM语音通信系统采样率为96 kHz,FFT点数为4 096,循环前缀长度为10.67 ms,子载波个数为200.采用2.4 kbit/s混合激励线性预测(mixed-excitation linear predictive,MELP)低比特率数字语音编码及卷积编码分别进行信源及信道编码.
由于OFDM语音通信试验的传输语音内容为“语音编码的实验”,与本方案传输的语音内容不同.为了评估系统语音通信性能,本研究采用PESQ对两种方法的水声语音通信质量进行量化评估.
4.3试验结果
调频水声语音通信试验结果如图3所示,其中图3(a)和(b)分别为原始语音波形图和时频图,图3(c)和(d)为调频解调后语音波形图和时频图,图3(e)和(f)为经过时间反转处理后的语音时域波形和时频图.由于浅海信道的多径效应,从语音波形图中看出,解调后的语音信号存在着明显的噪声干扰和时、频扩展现象,极大地影响了解调语音的质量,降低了语音通信性能.图4为利用探针信号得到的信道响应,可以看出信道存在明显多径分量.
图3 语音波形与时频图Fig.3The waveform and spectrogram of speech
图4 利用探针获取的信道响应Fig.4Channel response obtained by probe
通过图3(a)、(c)、(e)方框内的波形对比可知,经过时间反转处理后,语音幅度得到了明显增强;从图3(b)、(d)、(f)中方框内的时频特征比较结果可以明显看出,传输过程中因多径信道导致的语音频谱扩散效应得到了明显的抑制.
PESQ语音质量客观评价方法的满分为4.50,试验中调频解调语音得分为2.23,经过时间反转处理后语音得分为2.78;由于试验信道多径较为明显,同一信道下的OFDM语音通信纠错后的误码率为11.87%,对应的OFDM体制接收语音的PESQ质量评估得分为2.35.
由此可发现,从PESQ得分反映,在海洋试验信道多径较为明显的情况下,时间反转处理前调频方法传输语音质量稍差于OFDM水声语音通信质量,但经过本研究的时间反转处理后语音质量得到改善从而优于OFDM方法.
通过PESQ方法对语音进行质量评估可得出,时间反转处理能有效提高多径信道下的调频水声语音通信质量.同时,PESQ方法提供了从语音质量角度量化评价语音通信系统性能的评估手段.
5结论
本研究针对多径条件下传统水声语音通信系统性能下降的问题,通过在调频语音通信体制中引入了时间反转聚焦多径能量,提高系统对于多径效应的适应性.海上语音通信试验结果表明,所提出时间反转调频水声语音通信方案的语音通信性能良好,在多径条件下解调语音质量较高.
参考文献:
[1]STOJANOVIC M.Underwater acoustic communications[C]∥Electro/95 International Professional Program Proceedings.Boston:IEEE,1995:435-440.
[2]姜卫东,李霞.水下语音通信系统的实时实现[J].舰船电子工程,2010,12(30):91-93
[3]陈冰,尹禄,赵安邦,等.基于OFDM技术的水声语音通信系统设计与实现[J].海军工程大学学报,2012,24(6):70-74.
[4]殷敬伟,王驰,白夜,等.基于正交频分复用的水下语音通信应用研究[J].兵工学报,2013,34(5):593-596.
[5]曾堃,周跃海,童峰.时频差分OFDM水声语音通信系统的设计与实现[J].厦门大学学报(自然科学版),2015,54(3):404-408.
[6]曾晓珊.基于模式调频的水声通信方法[D].广州:华南理工大学,2012:4-6.
[7]黄绍.基于PESQ估测模型的水声语音通信系统研究[D].厦门:厦门大学,2013:84-85.
[8]周跃海,江伟华,陈磊,等.采用时反和时频差分OFDM的水声语音通信方法[J].应用声学,2015(4):283-290.
[9]殷敬伟,张晓,赵安邦,等.时间反转镜在水声通信网上行通信中的应用[J].哈尔滨工程大学学报,2011,32(1):1-5.
[10]陈国,胡修林,张蕴玉,等.语音质量客观评价方法研究进展[J].电子学报,2001,29(4):548-552.
[11]肖东,莫福源,陈庚,等.水声通信中低码速率语音编码算法的研究[J].声学学报,2013,38(5):589-596.
[12]QIAO Z,SUN L,IFEACHOR E.Case study of PESQ performance in live wireless mobile VoIP environment[C]∥IEEE 19th International Symposium on Personal,Indoor and Mobile Radio Communications.Cannes:IEEE,2008:1-6.
[13]吴伯修,沈连丰.调频技术理论及新进展[M].北京:人民邮电出版社,1988:7-8.
[14]孙轶源,朱维杰,李志舜,等.数字调频信号解调的新方法[J].西北工业大学学报,2001,19(4):584-587.
[15]SONG A J,BADIEY M,NEWHALL A E,et al.Passive time reveral acoustic communications through shallow-water internal waves[J].IEEE Journal of Oceanic Engineering,2010,35(4):756-765.
[16]SONG A J,BADIEY M,MCDONALD V K,et al.Time reversal receivers for high data rate acoustic multiple-input-multiple-output communication[J].IEEE Journal of Oceanic Engineering,2011,36(4):525-528.
doi:10.6043/j.issn.0438-0479.201512006
收稿日期:2015-12-05录用日期:2016-01-22
基金项目:国家自然科学基金(11274259,11574258);福建省中青年教师教育科研项目(JA14008)
*通信作者:ftong@xmu.edu.cn
中图分类号:TN 912.3
文献标志码:A
文章编号:0438-0479(2016)04-0570-05
Frequency Modulation Underwater Acoustic Voice Communication Technology with Time Reversal
WU Yanyi,LI Jianwen,TONG Feng*
(Key Laboratory of Underwater Acoustic Communication and Marine Information Technology,Ministry of Education,College of Ocean & Earth Sciences,Xiamen University,Xiamen 361102,China)
Abstract:As the underwater acoustic channel is a hostile channel with serious time varying, multipath effect, high-noise among others, research and design of the high performance underwater acoustic voice communication is highly challenging. Frequency modulation (FM) technology bears strong anti-jamming ability, which is convenient to be implemented. However, the communication performance of FM is seriously affected under the underwater channel with multipath, high-background noise among others. For the purpose of improving the underwater voice communication performance under multipath conditions, this paper introduces the time-reversal mirror technology to the design of underwater FM voice communication system, which can concentrate multipath and improve signal-to-noise ratio (SNR). Finally, this paper adopts the PESQ to evaluate the FM underwater speech quality. Via the sea trial experiment, time-reversal mirror technology can improve the communication performance of the proposed system.
Key words:underwater acoustic voice communication;frequency modulation (FM);time reversal;multipath channel
引文格式:吴燕艺,李剑汶,童峰.采用时间反转的调频水声语音通信方法[J].厦门大学学报(自然科学版),2016,55(4):570-574.
Citation:WU Y Y,LI J W,TONG F.Frequency modulation underwater acoustic voice communication technology with time reversal[J].Journal of Xiamen University(Natural Science),2016,55(4):570-574.(in Chinese)