基于机器学习的内孤立波遥感探测研究综述

2024-03-11 12:18孟俊敏孙丽娜曹泽祥

数字海洋与水下攻防 2024年1期

孟俊敏，龙瑞，3，孙丽娜，张昊，3，曹泽祥，4

（1.自然资源部海洋遥测技术创新中心，山东青岛 266061；2.自然资源部第一海洋研究所，山东青岛 266061；3.中国石油大学（华东）海洋与空间信息学院，山东青岛 266580；4.中国海洋大学物理与光电工程学院，山东青岛 266100）

0 引言

海洋内孤立波是指发生在密度稳定层化的海洋中，最大振幅出现在海洋内部的波动[1]。通常情况下，内孤立波的波长可从几百米到几百千米不等，振幅一般在几十米到上百米之间。当存在内孤立波时，海洋中密度跃层的上下层流速方向相反，使得内孤立波经过时具有强大的剪切力，对水下潜艇和海上石油平台的安全造成威胁[2]，内孤立波传播到陆架海区后受地形的影响将发生多种动力学与运动学特征的变化，并伴随能量的耗散与衰减，是陆架海区海洋内部混合的重要能量来源。大量的现场与遥感观测表明，内波可以传播数百千米而保持波形不变，带来巨大的能量输运，在生产实践、航海活动中扮演着重要的角色，并且与海洋声学、海洋生物学、军事海洋学等许多学科都有着密切关联[3]。因此，对内孤立波的研究成为物理海洋、军事海洋应用等领域的研究热点。

内孤立波主要以现场观测和遥感观测2 种观测手段为主。现场观测主要利用温度链[4]、ADCP[5]等设备直接观测，获取内波的时空特征。但现场观测存在着诸多不足：观测范围小，设备成本较高，获取的观测数据有限，内波传播信息难以完全追踪和记录，浮标的布防、实时监控记录和回收工作受影响因素较多等。因此，难以开展大范围和长时间的现场观测，尤其是在难以到达的海域进行实验时。遥感观测手段的引入为我们开展研究提供了帮助。

遥感观测是海洋内波观测的重要手段，为重点海域的海洋内波分析与传播预测提供了大量的数据支撑。光学传感器和合成孔径雷达（SAR）是目前观测内波最为常见和有效的2 种手段。SAR 作为一种主动式传感器，不受云雨条件的限制，具有全天时、远距离、大范围、高分辨率等优势[6]。SAR遥感技术的应用改善了传统直接观测手段的局限性，可以展开大面积、长期的观测；且由于内波调制海表面流场，形成辐聚辐散现象，能够在SAR图像上形成亮暗相间的条纹[7]，因此能在SAR 图像上很好地观测到海洋内波。自20 世纪70年代以来，多种波段、极化的机载SAR 和星载SAR 获取了大量的内波图像，提供了广域的二维信息，对现场测量以及光学等观测手段形成了有力补充，为内波探测提供了丰富的数据来源，成为海洋内波观测的重要遥感手段。

在过去10年中，来自各种传感器的卫星数据量呈指数级增长，这使得对内波的分析时间更长、规模更大。如何有效地挖掘隐藏在这些海量遥感数据中的稀疏内波信息仍然是一个热点问题。近年来，随着深度学习的快速发展，以深度学习为代表的机器学习方法由于自动快捷且不需要依赖单一阈值等优点，引起了越来越多研究者的注意，而将机器学习方法应用于内孤立波的研究成为了一个热点。本文从海洋内孤立波的不同研究领域的角度，对现有基于机器学习的内孤立波研究进展进行系统综述和分析总结，旨在为进一步发展智能高效的内孤立波研究方法提供参考依据。

1 内孤立波检测和识别

从遥感图像中准确检测与识别内孤立波，对其认知和后续研究具有重要意义。20 世纪90年代以来，内孤立波遥感图像检测识别研究主要应用小波分析、边缘检测等图像处理技术。2020年开始，以深度学习为主的机器学习方法被广泛应用于内孤立波检测和识别。而U-Net 和CNN 这2 种经典的网络框架在海洋内波遥感数据中的像素级分类和目标级检测任务中被广泛应用，如图1 和图2所示。

图1 卷积神经网络框架Fig.1 Framework of Convolutional Neural Network

图2 U-Net 框架Fig.2 Framework of U-Net

1.1 传统内孤立波检测识别

已经利用图像处理技术发展了诸多SAR 图像自动检测内孤立波的算法。如 RODENAS 和GARELLO 提出了基于小波分析的方法来检测和定位内孤立波特征，证明了小波分析适合从SAR图像中自动检测内孤立波[8-9]。此后，DOKKEN 等基于小波变换检测了挪威海岸附近的内孤立波，比较了小波检测、表征算法、傅里叶变换3 者的探测内孤立波效果[10]。SURAMPUDI 和SASANKA 利用傅里叶变换和小波变换方法分别对安达曼海和莫桑比克海峡的内孤立波图像进行了检测和识别，进一步比较了2 种方法对不同类型内孤立波研究的适用性[11]。SIMONIN 等结合小波、边缘检测等技术，从东大西洋地区获取的SAR 图像中提取了内孤立波特征[12]。MARGHANY 等使用粒子群优化算法和二维小波变换，从SAR 影像中自动检测安达曼海和尼科巴群岛的内孤立波[13]。KUREKIN等提出了一种结合空间处理和增强边缘检测算法，从英国大陆架获取的数千幅ENVISAT ASAR 图像中区分内孤立波特征[14]。

然而，这些方法是在单个传感器的最小图像上进行测试的，或者需要手动选择参数才能获得准确的提取结果，导致识别效果较差。而且，现在图像处理技术并不能及时处理每天获取的大量遥感数据，因此我们急需新的方法来开展研究。

1.2 基于机器学习的内孤立波检测识别

近年来，深度学习等机器学习方法具有自动高效、无需人工干预等优势，被广泛用于从遥感图像中提取像素级信息。基于深度学习可从遥感图像中发现内孤立波特征并定位其位置信息。如 BAO 等提出了一种基于 Faster R-CNN 算法的内孤立波SAR 图像检测技术，分析了基于Faster R-CNN 的内孤立波SAR 图像检测网络在不同区域、不同内孤立波形态下的检测结果[15]。CELONA 等利用支持向量机（SVM）方法识别岸基X 波段雷达图像中是否包含内孤立波，为选择内孤立波雷达探测的理想环境因素提供了见解[16]。TAO 等开发了一种机器学习算法，对Sentinel-1 SAR 图像上的内孤立波进行了检测和分类，分析了不同内孤立波尺度和传播方向对检测识别的影响[17]。

此外，随着深度学习技术的发展，深度学习方法在图像分割任务中的速率和准确度得到了显著的提高。同时，基于图像检测的结果也可以用于指导图像分割算法，以提高分割的准确性和稳定性。如LI 等对几种基于深度学习的框架进行了系统综述，所提出的基于DCNN 的模型可以从静止卫星图像中提取内孤立波特征[18]。ZHENG 等利用支持向量机（SVM）方法从图像中识别内孤立波并利用Canny 边缘检测对内孤立波条纹进行了分割，得到了内孤立波长度、面积和传播方向等特征[19]。此后，ZHENG 等基于SegNet 模型对影像中的内孤立波进行分割，手动确定包含内孤立波的图像并放大包含内孤立波的部分，从而获取图像中亮暗条纹的相对位置，进而确定内孤立波极性转换的时间[20]。最近，MA 等提出了一种用于SAR 图像的两阶段内孤立波特征分割算法。该算法主要包括基于决策融合的内孤立波图像分类阶段和基于像素注意力U-Net（PAU-Net）的条纹分割阶段[21]。ZHANG 等基于DCNN提出一种IWE-Net深度学习模型，对ENVISAT、Terra/Aqua 和Himawari-8 内孤立波图像进行检测并提取出内孤立波的特征，并利用Tensor Voting算法填充了光学图像下云遮档导致内孤立波不连续的问题[22]。

需要指明的是，尽管基于机器学习的内孤立波遥感图像检测识别方法能够有效增加检测识别的准确度和降低检测时间，但神经网络的训练等操作要耗费大量的时间和计算资源，对算力也有一定的要求。另外，由于现有数据集大都依赖人工标注，较难产生长期、大规模的内孤立波数据库。

2 内孤立波参数反演

几十年来，遥感已经显示出它在研究内孤立波方面的潜力和优势，内波诱导的海流会调制海面并产生辐聚和辐散区。通过Bragg 后向散射机制，SAR 图像接收到的信号也会随之增强和减弱。由于镜面反射机制，被动光学图像显示出清晰的内波特征。因此，从卫星图像中可以清楚地观察到与内孤立波相关的表面特征。传统的参数反演方法主要基于Korteweg-deVries（KdV）方程和内波的半宽特性。

SMALL 等推导出了内孤立波半振幅宽度与其SAR 图像中波峰亮暗间距的关系[23]，即

式中：D为内孤立波半振幅宽度；L为波峰亮暗间距。

在2 层模式的假定下，KdV 方程可以得到内孤立波的解析解，其形式如式（1）所示。利用SAR图像提取的波峰亮暗间距结合海洋分层条件（这些可从气候态数据集中获得），可以反演内孤立波的最大振幅，这是内波遥感探测的一个重要突破。KdV 方程是描述浅海内波的一种简单形式，然而，在大多数情况下，内波具有比使用KdV 方程建模的特性复杂得多的特性。

随着人工智能技术的发展，利用机器学习算法强大的非线性映射能力来学习内孤立波参数与多源数据之间的关系，进而反演内孤立波的参数俨然成为研究热点。如PAN 等使用深度学习模型，基于大量光学遥感图像反演了内孤立波振幅，模型反演结果与现场观测结果吻合良好[24]。WANG 等基于支持向量机、随机森林、卷积神经网络和多层感知器，采用大量光学遥感图像建立了4 种内孤立波振幅反演模型，并利用实测数据进行了验证[25]。VASAVI 等使用U-Net 网络提取了RADARSAT-1 SAR 影像中内孤立波的位置、波峰线长度等参数，然后基于 KdV 方程进一步得到内孤立波的速度等[26]。ZHANG 等结合实验室实验、卫星影像、现场测量结果，利用迁移学习模型反演了遥感图像中的内孤立波振幅[27]。然而，由于现场观测数据与遥感卫星影像相结合的内孤立波观测很少，导致目前使用人工智能的方法开展内孤立波参数反演研究也很少。

3 内孤立波速度预测

除了对内孤立波进行检测和识别、参数反演，人工智能技术也普遍用于内孤立波的传播预测研究。一种基于机器学习的内波预测模型示意图，如图3所示。最初，JACKSON 等利用经验模型来预测内孤立波速度，基于卫星图像中观测到的内孤立波特征（二维位置和传播时间）来估计模型函数的参数，利用参数化的模型函数生成内孤立波的速度相位图[28]。SHEN 等则提出了一个内孤立波速度矩阵模型，并利用水深测量来量化内孤立波速度，进而得到内孤立波传播位置，并利用连续遥感图像、理论分析和测深的经验方法验证了该模型的准确性[29]。而人工智能具有强大的非线性映射能力，可以帮助建立一个没有确定关系的模型，内孤立波传播速度与其影响因素之间也可以建立间接关系。如ZHANG 等基于人工智能方法在苏禄-苏拉威西海和安达曼海建立了2 个内孤立波传播速度模型[30-31]。最近，ZHANG 等应用聚类算法将内孤立波样本分组，利用回归模型为每组建立内孤立波传播速度模型。模型融入了内孤立波领域知识并解决内孤立波样本分布不平衡问题。模型预测的内孤立波传播显示出良好的准确性[32]。

图3 迭代预测模型示意图Fig.3 Iterative prediction model

需要注意，由于不同海域的内孤立波所处的海洋环境各不相同，传播特征也不同，因此，须在不同的海域用不同的初始条件或边界条件重复模型设计。同时，不同的初始条件或边界条件限制了数值模拟反演全球内孤立波速度的实现。因此，未来选择哪些参数输入到模型中，如何充分利用已有参数反演内孤立波速度是要考虑的问题。

4 基于机器学习的内孤立波研究存在的问题及未来发展

总的来说，人工智能在内孤立波研究方面已经取得一些进展，但还是存在3 个关键问题：

1）如何获取丰富的、高质量的内孤立波数据是一大瓶颈，这需要不断拓展开源生态库，建立丰富的、多源的内孤立波数据集，解决小样本数据的建模问题。

2）用于内孤立波探测的深度学习算法研究还处于初级阶段，面临模型可解释性较差和对内孤立波知识了解不够深入的问题，需要加快开发和创新，研究出高效且针对内孤立波图像的神经网络模型，提升深度学习在内孤立波领域应用的广度和深度。同时，充分利用计算资源来减少训练时间，提高效率。

3）现有人工智能理论与方法无法解析内孤立波数据特征的本质，反而阻碍了数据驱动的内孤立波知识发现。同时传统理论方法存在局部失效性，也限制了对内孤立波认知水平的提高。所以，如何使两者结合，用人工智能补充传统理论的不足，以数据驱动为基础开展面向内孤立波的智能预报研究，是未来研究的重点。

深度学习为遥感大数据的智能分析提供了重要的技术支持。随着遥感大数据的不断积累，深度学习和强化学习等算法的不断优化，数据技术和人工智能技术相辅相成，与遥感相关的机器学习将具备理解、分析、发现数据并做出决策的能力，从而能够从大量数据中获得内孤立波遥感图像中隐藏的信息，并挖掘出遥感数据背后的价值。同时，大量遥感数据的出现，也推动着机器学习的发展。

目前，人工智能主要专注于处理直观感知类问题，而对于一些特定领域的知识，比如内波领域的知识，很难被纳入模型设计中。此外，机器学习模型也可能存在偏见。要解决上述问题，我们可以利用深度学习来改进数值模型中嵌入的隐性内波知识，帮助我们更好地理解和分析，从而解决这些关键科学问题。通过机器学习方法，我们可以进一步深入研究内孤立波领域。

5 结束语

本文首先介绍了海洋内孤立波的检测识别方法，传统的内孤立波遥感图像检测识别研究主要应用小波分析、边缘检测等图像处理技术，并指出其存在的问题。然后，论述了基于机器学习方法在内孤立波的检测识别方面目前开展的研究，并与传统方法相比较。随后，还介绍了机器学习方法在内孤立波速度预测和参数反演方面的研究。

传统方法在内孤立波的研究过程中发挥了重要作用，但近几十年来，随着空间和传感器技术的不断发展，海洋遥感已进入大数据时代，来自各种传感器的卫星数据量呈指数增长，全球海洋遥感数据每天都在获取大量卫星数据，传统方法并不能处理每天获得大量遥感图像，越来越不能满足科研人员日益增长的需求。

在大数据时代的背景下，基于大量卫星图像数据利用机器学习等方法可以有效开展在内孤立波的检测识别、速度预测和参数反演等领域的研究。采用基于机器学习的方法进行研究可以有效提升内孤立波研究的效率和性能。