基于船舶辐射噪声从多个水下声学目标中识别特定船舶的数据库特征比较

2024-09-28 00:00:00朱悦鑫
经济技术协作信息 2024年9期

摘 要:船舶辐射噪声的目标识别是水下目标识别领域的关键。然而,目前缺乏能够准确反映真实水声条件的多目标船舶数据库。为了解决这一问题,我们进行实验数据采集,构建综合水声多目标数据库。为验证数据库可用性进行了两个实验任务。任务一是评估船舶辐射噪声的存在性,任务二是识别多目标场景中特定船舶。实验结果表明,在超过99%的情况下,可以成功从背景噪声中辨识船舶辐射噪声。基于研究结果提出了选择合适特征和深度学习网络的建议。

关键词:水下声学数据库;水下目标识别;水下声学;深度学习

引言

首先,通过实验收集并构建了观山湖湖区高质量水声数据库。该数据库模拟真实识别环境,为研究人员综合评估和改进其水下声目标识别算法提供宝贵资源。其次,本文利用观山湖湖区数据库,区分船舶信号和背景噪声信号,并成功识别出三种特定类型的船舶信号,证明了数据库的实用性。最后,通过提取三个频谱特征,简化了对多目标船舶信号中特定船舶信号的识别。这些特征使用三种流行的深度学习分类器进行测试,为研究人员提供算法评估的基准,并提供选择合适特征和深度学习网络的建议。

一、研究背景

自1913年美国费森登发明声纳以来,水下辐射噪声作为重要信息来源已有百年历史。因此,水声技术逐步应用于各种目标类型的探测,并使环境信号的分析成为可能。值得注意的是,由于其增强了隐蔽性和安全性,研究重点已转向船舶辐射噪声。然而,用于水声目标研究的公开数据库非常稀缺,常用的数据库如ShipsEar和DeepShip主要包含单目标船舶数据,缺乏多目标场景的复杂性。为解决这一问题,采集了观山湖湖区数据库,包含21小时58分钟的背景噪声和9小时28分钟的多目标船舶噪声数据。数据库于2023年6月在本溪观山湖风景区的水声环境中采集,使用数码SR-1自电容水听器确保高质量的船舶噪声记录。水下声学目标识别重点在于从背景噪声中辨识船舶辐射噪声,并通过二元分类确定船舶目标是否存在,将接收到的信号分类为船舶辐射信号或背景信号[1],此外DEMON频谱特征能更好地对船舶螺旋桨叶片数量等信息有响应[2],这种初步分类简化了后续任务。

二、数据库介绍

(一)记录系统和记录方法

数据收集于2023年6月24日至28日,地点在本溪关山湖旅游风景区,利用y2cqYsA1A42sAekzQvnuZM7ruZj/fx1pqqfhxKVupbM=两个主要部署地点,在部署区域的中心使用配重和浮标系统固定安装一个水听器。水深约30米~50米,水听器的定位深度为10米~15米。另外安装一个专用的水听器用于收集数据,位于航行通道附近的独立装置,以捕获更广泛的船舶辐射噪声。所使用的水听器型号是HydSR-1,其关键规格为采样频率52734Hz,采样分辨率为16位,可用的声学频带为1kHz~25.8kHz,接收灵敏度为-162.2dB re 1V/μPa~-126.1dB re 1V/μPa,输入声压级范围为46.3dB re 1μPa ~172.5dB re 1μPa。操作深度可达100米,由塑钢建造,重量约0.77kg,在温度范围0~40℃内工作。该设备由一个可充电的锂离子电池供电,可以连续收集长达12小时的数据。声学数据以WAV格式存储在一个可移动的存储卡上,保留所有配置参数以便后续数据分析。

首先,从收集的水声数据中识别船舶辐射噪声和背景噪声。提取了三个一维特征(频谱、功率谱密度、DEMON频谱)和两个二维特征(LOFAR频谱、Log Mel频谱)用于多目标船舶识别。其次,采用不同的深度神经网络,包括CNN(卷积神经网络)、CRNN(卷积循环神经网络)和BiLSTM(双向长短期记忆网络)进行分类。最后,成功从多目标船舶信号中识别出三类特定船舶信号:快艇、观光客船和无人潜航器。此外,笔者还探讨了数据库的标记和格式化细节。

(二)数据库结构

为了在水听器部署之后观察船只通过湖区航行,记录了一艘船接近大约1公里外的水听器的时间,以及这些时刻的船号和名称。后续的数据对齐包括识别波形峰值处的时刻,并将其与相应的船号相关联,从而将该特定节段的标签和数据关联起来。实验周期与旅游季节正好吻合,导致有记录的船只辐射噪声主要来自观光船和快艇。由于水听器靠近航道,通过的船只,包括观光船、快艇和其他船只,会造成复合辐射噪声。其他目标包括大型旅游船、卫生船、小船、研究船和环境噪声。根据实验记录的文档信息、信号振幅和频谱特征,可以确定每个音频段的开始和结束时间节点。根据听觉、距离和标记数据对每个数据块进行标记,并将信息记录在一个文本文档中。在此过程中,数据被分割成3秒的间隔,以方便后续处理。最终的数据库由10,611条WAV格式的记录组成,总计9小时28分钟13秒的船舶辐射噪声数据。每个音频文件及其相应的数据在观山湖湖区数据中形成一个记录。基于标签的一致性,共确定143个包含单个和多个船舶目标的录音。这些数据主要包括7类船舶目标,通过选择没有船舶目标和其他干扰的时间片构成背景噪声数据做对比,最终共获得了21小时58分钟,包括25,900条背景噪声数据记录,每条记录的持续时间为3秒。

三、船舶噪声检测实验任务及结果分析

水下声学目标检测的重点是识别目标的存在,并将接收信号分类为水下目标辐射噪声或非目标噪声。因此,使用这个数据库承担了两个任务。任务一涉及从采集的水声信号数据中识别船舶信号,其中包括背景噪声信号。任务二的目标是从混合的多目标船舶辐射噪声信号中识别出三种特定类型的船舶信号,分别是快艇、观光船和工作船。

(一)确定音频中是否包含船舶辐射噪声(任务 一)

任务一的目标是确定音频是否包含船舶辐射的噪声。通过选择前5000个船舶噪声记录,以及来自第一天的最初30个录音和来自第二天的20个录音,组成最终的数据库。使用70%的数据库进行训练,15%用于验证,15%用于测试。对数据提取Log Mel频谱特征,采用深度学习网络进行特征分类。每个实验进行10次,计算均值和方差。除了BiLSTM(双向长短期记忆网络),其他方法的分类准确率超过99%。值得注意的是,CRNN(卷积循环神经网络)表现出最稳健的分类性能,准确率达到99.79%。实验结果表明,船舶辐射噪声数据与背景噪声数据之间具有较高的可区分性,显示了数据库的重要应用价值。

(二)确定是否有任何感兴趣的目标多船混合数据(任务二)

在任务二中,主要目标确定在多船混合数据中是否存在任何感兴趣的目标。所选择的研究对象包括快艇、观光客船和工作船。为每个研究对象构建相应的数据库,为了方便不同特征之间的性能比较,将特征维度限制在16384(128×128)到16900(130×130)的范围内。采用深度学习网络进行特征分类,其网络结构与任务一一致。对于一维特征(频谱、功率谱密度、DEMON频谱),CNN、CRNN和BiLSTM专门用于比较实验。使用复原率、精度、准确率评估模型性能。对于所建立的三个目标数据库,用不同的特征和网络进行各种比较实验,从不同角度以更好地分析与总结实验结果。

1.网络的比较

在本节中,为了比较不同网络的性能,我们分别计算在使用同一网络不同数据库的实验中,一维和二维特征的平均指标。

在大多数情况下,工作船实验和观光客船实验的结果为性能优于快艇实验,这可能由于快艇实验中包含的船只范围不同,导致不同船只更复杂的组合。我们记录了三个实验数据库中每种船舶对应的范围,快艇实验共包含2309个数据点,涉及四人座、六人座、十人座、摩托艇等13种船舶;观光客船实验包括649个数据点,包括观山湖风景区的三种观光船舶;工作船实验只有300个数据点,包含打捞、渔船等船只。在相同特征和网络条件下,模型在较小、较不复杂的数据库上表现出更好的分类性能,导致工作船实验的表现优于观光客船实验,进而优于快艇实验。

一维数据的网络分类结果表明,CNN网络的表现优于CRNN和BiLSTM。在观光客船实验中,CNN基于复原率、精度、准确率都优于CRNN。在快艇实验中,CNN比CRNN表现出更好的准确性,而CRNN在复原率、精度指标方面都优于CNN。两者在精度方面具有相对的可比性。值得注意的是,BiLSTM在所有实验中始终表现出较差的性能。除基于BiLSTM的快艇实验外,其他所有网络的分类结果均达到90%以上。结合以上实验结果,推断一维特征包含相对简单的信息,通过直接使用网络分类可以获得令人满意的结果。因此,基于一维特征的水声目标识别任务,提出对于小规模数据库(工作船),可以使用CNN网络进行分类,而对于中大型数据库(观光客船,快艇),可以使用CRNN网络进行分类。

二维数据的网络分类结果表明,网络性能从好到坏,分别是CRNN、CNN、BiLSTM。在使用CRNN网络进行的平均识别准确率可达97.78%,包含工作船目标的数据中有96.96%被准确识别,而网络预测的数据中有97.93%是正确的目标。结合实验结果,二维特征分类整体性能最好的网络是CRNN,此外,CNN在对大规模和复杂的数据库(快艇)进行分类方面具有更明显的优势,而分类性能最差的网络是BiLSTM。

2.特征比较

在特征比较分析中,为了适用于不同环境和神经网络识别,直接对每个特征得到的结果进行平均。LOFAR频谱在二维特征中表现最好,准确率超过95%。实验结果表明,船舶辐射噪声的频谱和功率谱密度在分类中起着至关重要的作用。船舶辐射噪声的频谱由连续谱、线谱和调制谱组成,提供关于船舶操作、发动机状态和水下环境的基本信息[3]。同时,基于人类听觉感知设计的功率谱密度,通过Mel滤波器对信号进行处理,并采用对数缩放和离散余弦变换(DCT)等方法减少冗余特征。这种方法能更好地捕捉船舶辐射噪声中不同频率的特征。

对于其他特征,在Log Mel频谱中利用幂律非线性,而不是传统的对数非线性,引入一种基于非对称滤波的噪声抑制背景激励的抑制算法和一种实现时间掩蔽的模块。然而,这些调整不利于识别船舶噪声信号,所以更换成伽马通滤波器,增强对脉冲信号的识别,由于船舶噪声包含的脉冲信号很少,它们的识别效果鲁棒性(Robust)较差。DEMON频谱特征对船舶螺旋桨叶片数量等信息有响应,但由于本文识别的信号是多目标信号,这种特征不能很好地区分不同的信号。

结论

根据原始的实验结果可以观察到,在观光客船实验和快艇中,表现最好的识别网络都是结合了具有频谱特征的CRNN网络。在工作船实验中,性能最好的识别网络都是将CNN网络与频谱特征结合起来。频谱特征在三个实验中都表现良好,在三次实验中,包含目标特征的最高准确率分别达到97.15%、95.40%和99.56%。此外,它们在十个测试中表现出极端的稳定性,绝大多数的方差几乎接近于零。即使像BiLSTM这样的网络表现出相对较差的整体性能,使用频谱特性仍然可以产生较高的精度。这也间接地表明,在水下目标识别领域,特征决策的重要性可能超过网络决策。

基于实验结果,我们提出了以下针对水声目标识别任务的特征和深度学习网络选择策略。首先,特征选择比网络选择更重要。频谱是一维特征的首选,而LOFAR特征是二维特征的首选。其次,对于一维特征分类,CNN可以用于小规模数据库,而CRNN适用于中、大规模数据库;对于二维特征分类,CRNN推荐用于中小型数据库。

参考文献:

[1]刘忠东,刘雨东,刘文帅,等.舰船噪声特性数据库系统的设计和实现[J].舰船电子工程,2004,24(04):68-71.

[2]戴卫国,程玉胜,王易川.支持向量机对舰船噪声DEMON谱的分类识别[J].应用声学,2010(03):206-211.

[3]冉磊,李庆民,申志伟,等.舰船噪声模型可信度评估方法[J].海军工程大学学报,2011,23(01):94-99.