杨俊钢,穆佳栋,谷浩然,荀佳伟
(1.自然资源部第一海洋研究所,山东 青岛 266061;2.自然资源部海上丝路海洋资源环境组网观测技术创新中心,山东 青岛 266580;3.青岛大学 计算机科学技术学院,山东 青岛 266071;4.中国石油大学(华东) 海洋与空间信息学院,山东 青岛 266580)
71%的地球表面被海洋覆盖,海洋运动变化与人类生活息息相关,认识和了解海洋物理属性与运动特征对于海洋环境保护、海洋资源开发、海洋工程建设和海洋环境安全保障至关重要。温度和盐度是描述海洋物理属性的基本参量,是海水密度的主要确定因素,在中纬度的上层海洋(0~500 m)中温度是决定声速的主要参数,盐度在降雨多或海冰较多的高纬度地区至关重要。海水温度和盐度的变化与大洋环流、全球水循环、海洋-气候系统变化密切相关,影响着海洋对全球气候变化的调节能力。温度和盐度是最早被人类观测的海洋参数,通过现场仪器或卫星遥感手段可以直接或间接观测海水温度和盐度。海水温度和盐度现场观测受观测手段与条件的限制,存在观测时空分布不均和观测频次和时间序列长度有限的不足。卫星遥感为海洋表层温度和盐度观测提供了重要的手段,随着传感器和卫星平台技术的发展,国内外出现了众多用于海洋表层温度和盐度观测的卫星及遥感器。海面温度遥感观测手段主要为微波和红外辐射计,国内外相关卫星或传感器有AVHRR、MODIS、VIIRS、TMI、GMI、SSM/I、AMSR/AMSR-E、AMSR2、Envisat AATSR、Windsat、Sentinel-3 SLSTR、HY-1/2等。海面盐度遥感观测手段为微波辐射计,相关卫星或遥感器主要有SMOS、Aquarius 和SMAP。此外,卫星遥感可获取海面高度和海面风场等观测数据,而海面高度和海面风场与海水温盐变化也密切相关。
海洋三维温盐场信息是描述海洋物理属性特征和掌握海洋物理运动过程的重要参数,获取准确的海洋三维温度和盐度信息对于认识海洋、开发利用海洋和海洋科学研究等具有重要意义。现场观测手段获取的海水温盐场信息时空分布稀疏且时间连续性差。卫星遥感可获取全球海洋海面温度和盐度信息,但无法获取海洋次表层三维温盐场信息。基于描述海水物理运动过程的水动力学方程组,采用一定的数值求解方式并同化海水温盐现场或卫星遥感观测数据,建立海洋数值模型计算可得到时空分布均匀且连续的海水三维温盐场信息。但因海洋数值模型的物理规则不完整、部分物理过程只是近似计算,海水温度和盐度计算精度难以保证,特别在对于海洋动力环境复杂且变化剧烈的区域。因此,如何准确获取海洋三维温盐场信息是海洋科学研究的重要方向之一。从丰富的海洋表层卫星遥感观测数据(海面温度、海面盐度、海面高度和海面风场等)和稀疏的现场剖面观测数据出发,国内外已开展了海洋三维温盐场反演或构建研究。三维温盐场构建的主要内容是基于海洋表层多源卫星遥感数据和温盐剖面实测数据建立由表层到水下的映射关系,最终实现基于海洋表层多源遥感数据的时空连续的次表层三维温盐场数据的获取。基于海洋表层卫星遥感的次表层三维温盐场探测的主要方法可分为:统计类方法、动力学方法和基于声传播时间的经验方法[1]。统计类方法是建立海洋表层卫星遥感观测要素和次表层海水温盐信息的统计关系,主要包括回归统计和经验正交分解及变分方法。经验正交分解将温盐剖面观测数据进行EOF分解,找出某几个模态所对应的振幅与海面温度或海面高度建立回归关系。变分法是采用数据同化方法将观测数据与气候态数据结合,生成三维温盐场。美国海军于20 世纪90年发展的模块化海洋数据同化系统(MODAS)[2]是动力学方法三维温盐场重构的成功案例,通过同化卫星遥感海面温度和海面高度,并结合传统静态气候态,可生成高分辨率的三维温盐场数据。动力学方法运用动力模型结合海面信息模拟海洋内部动力过程,一般采用一定的动力学约束条件或数值模式,将海表卫星遥感观测数据转化为动力学控制变量,实现表层数据到水下的映射。表面地转(Surface Quasi Geostrophic,SQG)和iSQG 是具有代表性的动力学方法,该方法基于准地转方程、将内部解投影到第一斜压模态和正压模态,利用海面观测数据约束求解实现利用海面高度、海面温度和海面盐度等反演次表层参数。基于声学传播时间的经验方法根据声传播时间建立经验模型,反演水下温盐结构。
近年来,随着人工智能与深度学习方法的发展,人们开始采用深度学习方法开展海洋次表层三维温盐场探测研究。本文从海洋温盐观测数据集、传统机器学习三维温盐智能探测、一般神经网络三维温盐智能探测和深度学习三维温盐智能探测等方面对与海洋三维温盐场智能探测相关的研究进展进行综述。
海水温度和盐度的现场和卫星遥感观测数据是海水温盐场数据集的主要数据来源,首先针对基于多种现场观测平台和手段获取的温盐现场剖面观测数据、多源卫星遥感获取的海面温度和海面盐度遥感数据所构建出的海洋温盐观测数据集进行回顾,上述数据集是现有海洋三维温盐场数据集的主要数据源,也是进一步深入开展海洋三维温盐场重构的主要基础数据。以下从温盐现场观测数据集、海面温度遥感观测数据集和海面盐度遥感观测数据集分别展开介绍。
海水温盐剖面现场观测的主要手段包括CTD、XBT、MBT 和ARGO 浮标,其中以ARGO 浮标最具代表性且观测数据不断丰富,图1 是2023年12月10日的全球在用ARGO 浮标分布图(来自https://argo.ucsd.edu/)。基于多种现场观测手段获取的全球海洋温盐剖面数据,主要形成了如下几类温盐现场观测数据集。
图1 ARGO 浮标全球分布示意图Fig.1 Global distribution of ARGO buoys
1)ARGO 网格数据。利用变分插值方法由时空分布不均匀的温盐剖面数据生成全球网格数据,数据空间分辨率为1°,垂向0~2 000 m 共分为27层,时间分辨率为月均,时间跨度为2005年至今。
2)WOD(World Ocean Database)。世界上最大的统一格式、质量可控、公开可用的海洋剖面数据集,是海洋学、气候和环境研究的强大工具。WOD 数据涵盖从1772年至今的海洋气候分析资料,WOD 数据集可通过NCEI 获得[3]。
3)GTSPP(Global Temperature and Salinity Profile Programme)。一些海洋科学组织发起的国际合作项目,旨在为研究人员和海洋业务化管理人员提供准确、最新的温度和盐度数据。世界气象组织(WMO)和政府间海洋学委员会(IOC)共同管理该项目的数据获取、归档和分发,以确保持续的质量控制、存储和访问,NCEI 提供存储和质量控制服务。GTSPP 数据集包括经质量控制和重处理并保存为统一格式的CTD、XBT 和ARGO 温盐剖面数据。
4)EN4[4]。英国气象局哈德利中心提供的一系列温盐剖面数据集,经质量控制和客观分析形式的1900年至今的次表层温度和盐度数据。EN4 中的数据来自:ARGO、北极全流域天气海洋学(ASBO)项目、全球温度和盐度剖面计划(GTSPP)和2018年世界海洋数据库(WOD18)。
除现场观测外,卫星遥感是获取大面积同步海洋温盐观测的重要手段。海面温度卫星遥感数据众多,综合多源卫星遥感数据已形成了多种海面温度融合数据,特别是由高分辨率海面温度小组(Group for High Resolution Sea Surface Temperature ,GHRSST)提供的数据。GHRSST 的成立旨在促进国际关注并协调新一代全球、多传感器、高分辨率近实时SST 产品的开发,该小组汇集了国际航天机构、研究机构、大学和政府机构,总体目标是通过国际合作和科学创新,为短、中、十年的气候时间尺度应用提供最优质的海面温度数据。目前不同机构生成多种不同数据源、不同分辨率的海面温度遥感数据产品,基本情况见表1。
海面盐度卫星遥感数据主要来源于3 颗盐度遥感卫星,分别为SMOS(Soil Moisture and Ocean Salinity,SMOS)、Aquarius 和SMAP(Soil Moisture Active and Passive),海洋盐度遥感卫星及数据产品信息见表2。
表2 盐度卫星信息表Table 2 Information of salinity satellite
受海洋物理过程约束,利用海洋表层遥感观测数据反演次表层三维温盐场的传统方法是一个复杂过程。机器学习方法在三维温盐场智能探测中的应用,为三维温盐场数据获取提供了一种新的手段。用于三维温盐场智能探测的传统机器学习方法主要有:支持向量机(Support Vector Machine,SVM)、支持向量回归(Support Vector Regression,SVR)、随机森林(Random Forest,RF)、基于提升树的加法模型(XGBoost)和轻量级梯度提升机(Light Gradient Boosting Machine,LightGBM)等。
SU 等人[5]提出了一种支持向量机(SVM)方法,利用包括海面温度异常(SSTA)、海面高度异常(SSHA)和海面盐度异常(SSSA)等海洋表层遥感数据估计印度洋的次表层海水温度异常(STA),ARGO STA 数据用于训练和测试的现场观测数据,结果表明SVM 很好地估计了印度洋上层1 000 m 的STA,除了SSTA 和SSHA 外,SSSA 也可以帮助探测和描述更深海洋的热结构,并提高STA 估计的准确性。黎文娥等人[6]基于支持向量回归(SVR)方法利用海面遥感观测数据开展了海洋次表层海水温度异常(STA)反演研究,该反演最优选取海面高度异常(SSHA)、海面温度异常(SSTA)、海面盐度异常(SSSA)和海面风速异常(SSWA)等海面遥感观测数据的组合,利用ARGO数据进行结果精度验证,研究表明SVR 模型可准确估算全球海洋1 000 m 以浅的STA。SU 等人[7]提出了一种基于随机森林(RF)的机器学习方法,从多源卫星观测数据中反演全球水下0~1 000 m 的温度异常(STA),研究使用2010年全球海洋的月均海面高度异常(SSHA)、海面温度异常(SSTA)、海面盐度异常(SSSA)和海面风速异常(SSWA),使用ARGO 数据作为目标值来对RF 模型进行训练和测试,反演不同深度的海水温度异常。实验结果表明,RF 可以准确反演全球海洋海水温度异常,反演结果随深度增加到500 m 后精度逐渐下降,与支持向量回归(SVR)方法相比,RF 方法更准确。
SU 等人[8]基于极限梯度增强(XGBoost)提出了一种用于全球海洋上层2 000 m 的次表层海水温盐异常的反演模型,该模型使用海面卫星观测和现场ARGO 数据进行估计,研究结果表明所提出的XGBoost 模型能够反演海水温盐异常,且反演结果优于梯度增强决策树模型,从反演结果中发现上层(0~500 m)海水温盐异常表现出明显的季节变化信号且随深度增加而变弱,不同季节模型性能存在差异,海面风速异常对海水温盐异常估计的贡献大于其他表面参数。张天一等人[9]利用LightGBM 算法结合随机森林方法开展了全球海洋次表层(0~1 000 m)海水温度异常(STA)与盐度异常(SSA)的重构研究,研究以海面遥感数据(海面高度异常(SSHA)、海面温度异常(SSTA)、海面盐度异常(SSSA)和海面风速异常(USSWA、VSSWA)并结合位置信息作为重构输入变量,使用ARGO 次表层温盐数据作为模型训练与测试数据,开展了不同模型输入参数组合研究,结果表明经纬度位置信息在STA 和SSA 重构中发挥不同的作用,单时相和时序预测STA 中经纬度信息对模型的贡献随着深度的增加逐渐增大,该研究发现LightGBM 较随机森林精度更高鲁棒性更强。汤贵艳等人[10]提出一种融合高斯混合模型和轻量级梯度提升机(LightGBM)算法的海洋次表层温度反演模型,利用2005-2018年的月均海面温度、海面盐度、海面高度和海面风速等遥感数据和ARGO 数据反演了印度洋海域的次表层海水温度,结果表明所提出的模型可以准确反演印度洋海域的海水温度分布特征和季节变化规律,采用所有海表参数的模型反演结果最好,反演结果优于极限梯度增强模型(XGBoost)。
综合比较传统机器学习方法的研究结果发现,模型输入增加海面风速数据会略微提升三维温盐场的反演精度,加入经纬度信息也会提升反演精度;SVM、SVR 和RF 都可用于0~1 000 m 的三维温盐场重构,SVM 和SVR 反演结果类似,RF 模型反演结果稍优于SVR,LightGBM 模型的反演结果优于RF 和XGBoost。
除了常用的传统机器学习方法已用于基于海洋表层遥感数据的三维温盐场智能探测外,已有研究基于聚类方法和BP 神经网络、广义回归神经网络等常规神经网络开展了三维温盐场智能探测研究。
LU 等人[11]使用预聚类过程和神经网络(NN)方法,利用全球海洋海面温度、海面高度和海面风速观测数据来探测海水温度异常,月均ARGO 网格数据用于模型训练与验证,在大时间范围(2004-2010年)和深度(0~1 900 m)内进行了测试,结果表明预聚类的神经网络方法比没有聚类的相同方法更好,也优于聚类线性回归器和随机森林方法。WANG 等人[12]基于多源海面遥感数据(海面温度、海面盐度、海面高度和海面风速),利用人工神经网络(ANN)反演0~2 000 m 的海洋水下温度场,分别选取2005-2015年和2016年的网格化月平均数据作为训练集和测试集,研究发现海洋上层(0~200 m)存在明显的季节变化信号且随深度增加而逐渐减弱,同时比较发现ANN 模型精度高于随机森林、MLR 和XGBoost。CHENG 等人[13]利用一种反向传播神经网络(BPNN)方法,通过选择卫星观测海面参数的最佳组合来反演北太平洋的次表层海水温度,该研究除海面高度(SSH)、海面温度(SST)、海面盐度(SSS)和海面风速(SSW)外,还引入海面速度(SSV)作为新的参量,结果表明BPNN 模型可以准确地估计北太平洋1 000 m 以上的海水温度,SSV 的输入对BPNN 模型具有积极影响,并有助于提高估计的准确性。CHEN 等人[14]针对直接同化卫星观测数据对数值模型次表层结构约束不足的问题,使用间接同化方法建立了一个三维温盐重建模型,该模型首先使用广义回归神经网络与果蝇优化算法(FOAGRNN)合成T/S 剖面,然后利用增量强约束四维变分同化算法将合成的T/S 剖面同化到区域海洋模式系统(ROMS)中,实验结果表明间接同化后的温度和盐度均方根误差相对于直接同化分别降低26.0%和23.1%。聂旺琛等人[15]利用果蝇优化广义回归神经网络算法(FOAGRNN)构建了海面温度、海面盐度、海面高度与次表层温盐场之间的投影关系模型,并在全球范围使用SODA 和卫星遥感数据评估了模型的应用性能,2016年SODA 海面数据的理想全球重构试验的温盐平均均方根误差分别为0.36 ℃和0.08‰,卫星观测海面数据的应用重构试验结果与ARGO 剖面比较的温盐平均均方根误差分别为0.79 ℃和0.16‰,重构温度RMSE 从海面向下迅速增大,至100 m 达到峰值1.35 ℃后又迅速回落,跃层往下不断减小,重构盐度RMSE 基本随深度增大而减小。
已开展的常规神经网络三维温盐场智能探测主要针对全球或北太平洋海域,使用的海面遥感数据与第2 节介绍的一致,个别研究增加了海面流速数据后探测精度有所提高,总体海水温度智能探测结果的均方根误差为0.3~0.8 ℃左右。
随着深度学习神经网络模型与方法的不断发展,海洋科学研究和数据处理中也广泛应用了深度学习人工智能技术。次表层水下三维温盐场智能探测使用的深度学习方法有:卷积神经网络(Convolutional Neural Networks,CNN)、生成对抗神经网络(Generative Adversarial Networks,GAN)、长短时记忆网络(Long Short-Term Memory,LSTM)、自组织映射(Self-Organizing Map,SOM)神经网络以及将不同神经网络相结合的组合网络模型等。下面按照神经网络分类综述次表层三维温盐场智能探测研究进展。
CNN 是一类包含卷积计算且具有深度结构的前馈神经网络,是一种多层的监督学习神经网络,一般由卷积层、池化层、全连接层和激活函数组成,隐藏层的卷积层和池化层是实现卷积神经网络的核心模块。CNN 主要应用于计算机视觉和自然语言处理等领域,目前在三维温盐场智能探测方面也得到了较多应用。图2 是CNN 模型三维温盐场智能探测流程的示意图。
近年来已开展较多基于CNN 的三维温盐场智能探测研究。HAN 等人[16]提出了一种基于海面温度、海面高度和海面盐度数据预测次表层海水温度的卷积神经网络方法,建立了不同月份的CNN 模型用于预测和重建太平洋海洋次表面海水温度,并与ARGO 现场数据进行比较验证准确性,结果表明所建立的模型可以准确估计太平洋的海洋次表层温度,平均均方误差在0.26~0.52 ℃之间,研究发现0~300 m 海水温度变化较大,所建立的模型在500 m 以下的深度预测准确性逐渐降低。SU 等人[17]基于CNN 模型提出了一种结合卫星遥感和剖面浮标观测数据反演全球海洋0~1 000 m 高分辨率海水温度场的方法,基于提出的方法将海水温度场的空间分辨率从1°提高到0.25°,该研究分别基于单时间(2015年12月)建模和时间序列(2010年1月—2015年11月)的数据作为训练数据集,2015年12月的数据作为测试数据集建模,分析了不同深度的反演结果,使用EN4 网格数据进行精度验证,结果表明在大训练样本的情况下 CNN 优于LightGBM,平均均方根误差为1.162℃,时间序列CNN 模型具有更高的精度且反演结果中包含更多尺度的动力过程。MENG 等人[18]基于CNN 模型开展了卫星观测海面数据反演水下0~2 000 m 的不同深度温度异常和盐度异常的研究,提出了一种滑动区域方案从小区域估计网格点的水下温盐异常,将反演的温盐异常数据从ARGO 网格数据的水平分辨率1°提高到1/4°,使用的卫星海面观测数据包括海面高度异常、海面温度、海面盐度和海面风速等数据。考虑到跃层存在对三维温度预测精度会有很大影响,ZUO 等人[19]提出了立体时空四维卷积模型(SST-4D-CNN)来预测海水温度,该模型充分考虑了时间序列和海洋空间关系以提高预测精度,该模型包括4D 卷积模块、残差模块和重新校准模块,其中4D 卷积模块用于提取海洋时间和空间特征,重新校准模块用于探索和量化各区域特征的贡献以提高模型的质量,研究利用2016-2018年每日的西北太平洋海水温度数据,预测了0~2 000 m 的纬向断面和水平各层温度,结果显示SST-4D-CNN的准确率高于SVR、LSTM 以及3D-CNN 等模型。MENG 等人[20]基于多源卫星遥感观测的海面高度异常、海面温度、海面盐度、海面风速数据和全球海洋再分析数据GLORYS12V1,提出了一种基于卷积神经网络的海洋次表层温盐重构的深度学习方法,并开展了高分辨率(1/4)°和超高分辨率(1/12)°太平洋次表层海水温度异常和海水盐度异常重构,所提出的方法提高了从卫星观测中估算海洋内部参数的分辨率和准确性,并且模型在更深的范围也是可靠的。
CNN 虽然能够更好地捕捉空间特征,但在卷积过程中不可避免地会丢失信息,这可能会丢失一些关键的细节特征,并导致重建精度降低。针对于此,MAO 等人[21]提出了一种基于双路径卷积神经网络(DP-CNN)的智能方法,使用CMEMS 的月均再分析的海面温度(SST)、海面盐度(SSS)和海面高度(SSH)数据开展海洋温盐场重建研究,解决传统CNN(卷积神经网络)模型中细节信息丢失的问题,实验结果表明DP-CNN 模型比CNN模型具有更高的重建精度,有效地减少了CNN 模型中详细信息的损失。
作为经典深度学习方法,CNN 已在三维温盐场智能探测方面得到较多应用,已有研究使用的海面遥感数据同样与第2 节介绍的相同,在考虑跃层影响和充分利用数据的时空特征方面尝试对方法做了改进研究,因研究区域和使用数据的不同,不同研究结果得到的三维温盐场构建精度相差较大。
GAN 网络是一种无监督学习算法,通过同时训练2 个模型来实现捕捉训练集分布的生成式模型、判别模型估计样本来自训练数据而非生成模型的概率。GAN 由2 个互相对抗的神经网络组成,1个生成器和1 个判别器,它们彼此竞争推动整个模型学习。已有研究基于GAN 模型开展了次表层温度场和盐度场的预测。海洋内部温度的预测通常是基于物理的数值模型或基于数据驱动的模型。数据驱动的预测模型其物理解释性差且依赖训练数据,泛化能力有限。MENG 等人[22]提出了一种基于生成对抗性网络(GAN)和数值模型相结合来预测次表层温度场的方法,该方法首先基于GAN 模型学习数值模型中海面温度和次表层海水温度间的简化物理关系,然后使用ARGO 数据校准网络模型参数以获得更好的预测,该研究使用HYCOM 海洋再分析数据预训练网络模型,使用 ARGO 和OISST 数据微调部分网络模型参数,并预测中国南海区域三维温度场,结果显示所提出的网络框架有效地利用了数值模型和神经网络的优点,提出的网络模型性能优于PGsim、PGNN 和PGConvLSTM等模型,三维温度场的均方根误差为0.9~1.2 ℃。针对传统海洋次表层海水盐度重建方法经常受到附加约束、先验物理假设和特定回归系数等因素的影响,ZHANG 等人[23]提出了一种基于生成对抗网络(GAN)的深度学习框架,从纯数据驱动的角度直接构建近实时、高分辨率的每日三维海洋表层以下2~200 m(分为12 层)海水盐度数据集;实验使用HYCOM 再分析数据,在中国边缘海域设计了一个原始3D-GAN 模型以及在此基础上加入残差结构、初始化结构和同时加入残差及初始化结构的另外3 个3D-GAN 模型,研究结果表明加入残差和初始化结构的3D-GAN 网络模型性能最优,平均均方根误差为0.135 psu,整体性能超过传统的MODAS 模型。
基于GAN 网络的水下三维温盐场智能探测研究较少,已有研究实现了对每日三维温盐场的智能探测,这是相对于其他智能方法最大的优势,但目前研究探测的水深在200 m 以内。
LSTM 网络是一种循环神经网络的特殊形式,通过门单元的逻辑控制决定数据是否更新或丢弃,克服了循环神经网路权重影响太大、容易产生梯度消失和爆炸的问题。LSTM 包含遗忘门、输入门和输出门,遗忘门用于选择性地遗忘之前的信息,输入门决定新输入的信息中哪些将被保留,并更新神经元状态。输出门使用更新后的神经元状态和tanh激活函数更新隐藏状态,隐藏状态在每个时间步作为模型的输出。LSTM 模型已广泛应用到海洋次表层三维温盐场智能探测研究中了,具体应用流程如图3所示。
使用卫星遥感数据大规模探测和预测海洋次表层温度和盐度结构是一项极具挑战的任务。经典的机器学习方法难以顾及海洋数据的空间和时间序列特征,循环神经网络的LSTM 模型已被广泛应用于基于表层遥感的次表层水下三维温盐场重构研究。SU 等人[24]提出了一种基于双向长短期记忆神经网络(Bi-LSTM)的次表层温跃层结构预测模型,该模型基于月均海面遥感数据(海面温度异常、海面高度异常、海面盐度异常、海面风速异常)、经纬度信息和ARGO 网格数据,预测全球海洋次表层海水温度和盐度异常,该研究测试了不同表层输入参数组合下的精度,预测结果与ARMOR3D数据集具有较好的吻合度,研究结果表明更多输入变量有利于提高网络性能。
除了常规LSTM 网络外,卷积LSTM 模型被广泛应用到三维温盐场智能探测研究中。XIAO 等人[25]提出了一种卷积LSTM 模型用于预测长时间序列海洋内部温度,基于BOA-ARGO 数据重构了南太平洋1年的海洋内部温度,结果表明所提出模型在所有测试样本和所有深度层的表现上均优于AdaBoost 模型和BPNN 模型,这表明所提出的网络模型能够较好地长期预测月均三维海洋温度场。SONG 等人[26]基于卷积长短期记忆神经网络提出了一种利用海面卫星观测(海面温度、海面盐度、海面高度和海面风速)和ARGO 数据反演2 000 m深度以内海洋次表层温盐场的方法,通过考虑海洋变化的显著空间和时间相关性特征来提高反演模型的稳健性和可推广性,结果表明海面温度异常、海面盐度异常、海面高度异常和海面风速异常是获得准确次表层水下温盐场估计的有价值参数,该研究提出的方法优于经典的随机森林和LSTM 方法。SU 等人[27]提出了一种基于卷积长短期记忆神经网络的全球海洋次表层海水温度重构方法,将多源遥感观测数据与 ARGO 网格数据相结合,生成了1993-2020年2 000 m 以浅全球海洋次表层海水温度数据,利用ARGO 网格数据、EN4-Profile 数据验证反演结果,研究结果表明ConvLSTM 模型可以学习海洋观测数据的时空特征,反演结果优于LighGBM 模型。
以往基于深度学习方法预测海水温度只局限于一些孤立点的时间序列预测,没有考虑它们的空间联系,同时将CNN 与LSTM 相结合成为LSTM网络应用的一个方向。ZHANG 等人[28-29]提出了一个多层卷积长短期记忆神经网络(M-convLSTM)模型,使用2005-2017年ARGO 浮标标准全球1°网格月均数据预测太平洋三维海水温度,输入数据为预测月份前28 个月的历史温度数据。该模型包括CNN 和LSTM 的多层叠加,模型使用27 个深度层的输入数据集来预测海面到2 000 m 深度的水平和垂直月均温度变化,研究结果表明随深度增加预测精度略有下降,预测结果精度高于CFCCLSTM 模型。SU 等人[30]基于XGBoost 和RFs 集成学习与Bi-LSTM 和CNN 深度学习方法,通过将多源卫星观测海面高度、海面温度、海面盐度和海面风速数据和ARGO 现场数据相结合,开展了不同方法的次表层温跃层智能提取研究,研究结果表明适用于小数据建模的集成学习算法能够很好地提取单一时刻的次表层温跃层结构,而适用于大数据建模的深度学习算法则能够很好地预测时序次表层温跃层结构。
基于 LSTM 模型的智能探测方法从传统的LSTM 发展到BiLSTM、ConvLSTM 以及与CNN结合等,三维温盐场探测精度有所提高。
除了主流的CNN、GAN 和LSTM 模型外,也有部分研究使用了SOM、U-net 或其他深度学习模型。WU 等人[31]为了从遥感数据中估计次表层海水温度异常,采用自组织映射(SOM)神经网络,使用ARGO 网格月均海面温度(SST)、海面高度(SSH)和海面盐度(SSS)异常数据进行训练,以2005-2010年的ARGO STA 数据为目标特征,根据海面遥感数据估计北大西洋不同深度的海水温度异常(STA),研究结果表明墨西哥湾流区域的STA 估计从海面到700 m 与现场测量一致性良好,SOM 训练过程中SSS 异常数据揭示了SSS 信息的重要性,同时该研究根据遥感 SST 和测高时间序列估计了1993-2004年北大西洋中纬度的STA 时间序列。针对海洋内部温度场重构没有足够重视估计结果的不确定性的问题,CHEN 等人[32]将DERN 方法与EOF 方法相结合提出了DERN-EOF 方法,利用WOD18 全球温盐剖面数据重构三维温度场,首先对温度剖面数据进行EOF 分解以得到EOF 系数和向量,然后通过DERN 方法建立EOF 系数与SST、SLA 间的回归关系;使用WOD18 温度剖面数据建立海面和水下温度场间的回归数据库。XIE 等人[33]针对高精度地预测南海内部三维温度场这一难题,提出了一种注意力U-Net 网络,根据卫星观测到的海面温度、海面高度异常、海面风速以及风应力旋度重建高时空分辨率的南海三维温度场,海洋再分析数据SODA 用于模型的训练和评估,研究结果表明注意力U-Net 模型在中国南海上层100 m 的海水温度重建中表现良好。SUN 等人[34]设计了一个3D U-Net 模型来提取过去12 个月内次表层温度场的时空相关性,尝试预测未来12 个月太平洋及其周边海洋0~400 m 的次表层温度场,将3D U-Net与季节性朴素模型、M-ConvLSTM 模型和简单的3D-CNN(S3D-CNN)进行比较,所提出的方法能够比以往方法更准确地预测大多数深度的海水温度。
其他深度学习方法和经典方法的组合使用在三维温盐场智能探测中也进行了应用,使用的海面遥感数据与前述研究一致,三维温盐场的反演精度也类似。
基于海洋表层卫星遥感观测数据,结合深度学习方法对次表层三维温盐场进行智能探测已成为海洋学研究的前沿热点之一,为获取时空分辨率和精度更高的三维温盐场数据提供了一种新的途径。近年来已开展了较多基于各种机器学习和深度学习方法的次表层三维温盐场智能探测研究,次表层三维温盐场探测在不同的研究中表述为三维温盐场反演、重构或重建,有时也表述为次表层海水温度和盐度预测。总结相关研究可以发现:
1)使用的海洋表层卫星遥感数据主要有海面高度、海面温度、海面盐度和海面风速等的网格数据,个别研究使用了海面流速或增加了经纬度位置信息。用于构建训练数据集的现场数据主要是ARGO 浮标温盐剖面网格化数据,EN4 等数据集用于方法精度评估。为了突出相关参数的变化特征,大多研究采用的均为各变量相对于平均态的异常值,如海面高度异常、海面温度异常、海面盐度异常等智能反演次表层温度异常和盐度异常。
2)已有研究均是纯数据驱动,采用的智能方法包括传统机器学习、一般神经网络和深度学习等方法,机器学习方法主要包括SVR、SVM、RF、XGBoost 和LightGBM 等,一般神经网络方法有NN、BPNN 等,深度学习方法主要包括CNN、GAN、LSTM 等及其相互结合使用的组合模型。
3)次表层三维温盐场智能探测的最大水深一般为500 m、1 000 m,最大至2 000 m,智能探测的三维温盐场绝大部分为月均数据,大多智能探测是按水深分层分别建立模型,探测结果在跃层和深海区域误差较大。已有研究中各种智能探测方法的三维温盐场探测精度相差较大,三维海水温度场最优可达0.02 ℃,一般为0.3~1.7 ℃左右;三维海水盐度场最优达0.025 psu,不同研究差异较大的原因可能与使用的月均数据、研究区域和研究时间段的不同有关。
目前已开展的次表层三维温盐场智能探测都是基于网格化的海洋表层遥感数据,未使用原始遥感数据,而原始遥感数据网格化处理会平滑掉部分高频小尺度信号,现场观测数据使用的是ARGO剖面温盐网格数据而不是真实的ARGO 剖面温盐数据,智能方法均为纯数据驱动。未来该研究方向应从原始海面遥感和现场温盐剖面数据出发,结合海水运动的动力和热力学机制,发展物理机制约束下的次表层三维温盐场智能探测方法,实现基于表层遥感数据对每天或更高时间分辨率的次表层三维温盐场数据的同时获取。