谭俊峰,宋晓阳,张 飞*,杨 杰,常永国,史晓龙
(1. 中国科学院声学研究所 声场声信息国家重点实验室,北京 100190;2. 中科长城海洋信息系统有限公司,北京 100085)
随着海洋经济的发展,关心海洋、认识海洋、经略海洋、建设海洋强国、走向深海大洋已成为新时期国家发展战略的重要组成部分[1]。深海观测是认识和开发海洋的重要手段,正逐步成为国际研究热点。南海作为典型的深水盆地,受季风、环流及复杂海底地形影响,为海洋科学研究提供了得天独厚的条件[2]。2016 年,我国第一个深海海底观测网试验系统建成[3],解决了深海观测受能源供给与信息传输限制的问题,其中在1 800 m 水深布放的海底动力平台搭载了声学多普勒流速剖面仪(Acoustic Doppler Current Profiler,ADCP)和温盐深仪(CTD)等传感器,为深海海洋科学研究提供了可靠的海底动力基础数据资料[4]。
ADCP 是目前国际上测量多层海流剖面最有效的方法,也是应用最为广泛的海洋观测仪器之一[5]。国内外海洋工作者在ADCP 的制造、观测、数据预处理等方面做了大量研究,但对ADCP 的数据后处理和质量控制尚未形成统一的通用标准和规范[6]。随着ADCP 大量投入使用,制定数据处理、数据质量控制及产品生产的标准流程,对于最大限度地发掘科学数据价值,以及推动开发趋于业务化运行的质量控制软件进程具有重要意义。本文基于深海海底观测网试验系统——2018 年度海底动力平台采集的ADCP 数据,重点研究ADCP 数据处理及产品生产流程,其中介绍了ADCP 数据处理流程、数据质量控制方法,对原始数据和经过质量控制后的数据分别处理,分析了深海海流状况,同时也验证了ADCP 传感器在深海的工作性能。
本文采用的数据来源于深海海底观测网试验系统,由布放在海深1 800 m 处海底动力平台搭载的ADCP 采集,如图1 所示。ADCP 为RDI Workhorse Sentinel 系列,工作频率150 kHz,采样间隔10 min,垂向观测层数30 层,每层4 m。本文主要分析了2018 年的ADCP 数据,共有样本数34 140 条,针对数据处理及产品生产流程等开展相关研究。
图1 ADCP 及其工作模式
ADCP 数据处理流程,如图2 所示。不同工作频率的ADCP搭载在不同平台上采集原始数据,获取的原始数据经过数据解析、数据处理系统进行格式转换等操作,再经过一系列的初步质量控制、程序化质量控制和人工质控,输出最终的流速剖面产品(Velocity Profile,VELPROF)。
图2 ADCP 数据处理流程
VELPROF 由3 个分量组成,如表1 所示。
表1 流速剖面产品
ADCP 采集的原始数据为二进制数据流,数据处理需要将数据进行解码、坐标转换及流速分量计算,从而得到观测点的海流状况[7]。
2.2.1 数据解析 读取分析原始二进制数据,进行数据解析,转换成十进制的数据。主要分为以下步骤:
(1)读取数据头部信息(Header Data)的Header ID 与Data Source ID,判断数据是否为ADCP 数据。
(2)计算数据流的Checksum 值,其中不包括ADCP 数据本身的“Checksum”的2 字节。比较Checksum 与计算的值,如果匹配,说明数据是有效的。反之,读取下一个数据流,执行步骤1。
(3)根据数据头部信息(Header Data),获取该数据所包含的数据类型。数据类型包括:Fixed Leader, Variable Leader, Velocity, Echo Intensity, Correlation, Percent Good 等。
(4)根据不同的数据类型,解码相关数据,如流速剖面层数、深度、流速等。
(5)查找每个字节在特定数据类型中表示的内容。将目标字节转换为十进制数据,得到以mm/s 为单位的波束数据以及相关的元数据。
(6)将解码后的数据导出为 MAT 文件,后续进一步的格式转换。
2.2.2 数据转换 ADCP 每个换能器测量的流速是水流沿其声束坐标方向的速度,任意3 个换能器轴线即组成一组空间波束坐标系。同时,ADCP 还定义有自身的设备坐标系X-Y-Z。解析后的十进制数据为波束坐标系下的海流速度,需要应用变换矩阵A转换到设备坐标系,再根据罗盘提供的方向和倾斜计的倾斜数据,利用旋转矩阵M将X-Y-Z坐标下的流速转换为地球坐标系下的流速数据[8]。
(1)转换矩阵A将波束坐标转换到设备坐标系:
其中:a=1/[2*sin(θ)],θ为波束角度;
c=凸头传感器为+1,凹头传感器为-1;
每个深度单元的速度数据由4 个分量组成,在波束坐标中分别表示波束1 (b1)、波束2 (b2)、波束3 (b3)和波束4 (b4)的速度:
(2)旋转矩阵M将设备坐标转换到地球坐标系:
H、R和P分别为航向角(Heading)、横摇角(Roll)和俯仰角(Pitch)。如果ADCP 的方向是朝上的,则在应用矩阵M之前,需要将内部倾斜传感器测得的横摇角加上180°,并修正俯仰角。
式中:Tilt1 为测量的俯仰角;Tilt2 为测量的横摇角。得到地球坐标系下的速度值:
(3)对地球坐标系下的速度剖面还可根据需要进行磁差校正,校正矩阵B如下:
β为磁偏角估计值,旋转矩阵B将向量顺时针旋转β度。正磁差表示正北偏东,负磁差表示正北偏西。输入是地球坐标系下的水平速度剖面(VLE,VLN):
数据质量控制是通过一系列的技术操作及测量、标注等过程,检测数据质量,剔除无效、错误的数据,用来确保数据的准确性和可靠性,为用户提供一个通用的方法来筛选出有效可用的数据。针对ADCP 数据,主要采用初步质量控制、全局检测[9]、尖峰检测[10]、卡值检测[11]、梯度检测[12]、良好数据百分比和人工质控等方法进行质量控制。
2.3.1 初步质量控制 主要对数据进行缺测值检验、非法码检验。如果经纬度缺测(数值为30 000),流速流向缺测或错误(数值为-32 768),缺测值需要剔除处理。非法码检测用于处理文件中编码与属性不符者,通常标准数据格式中每一位编码均定义了特定的属性,出现非法码则表明数据不可用。
2.3.2 全局检测 该方法旨在测试数据是否落在指定的阈值范围内,如经度0°~180°,纬度0°~90°,流向0 ~360°等。超过传感器的有限输出范围,表明数据可疑或错误,在实际操作中还可以根据经验值选择更小的阈值范围。
2.3.3 尖峰检测 海洋观测要素在某空间或时间范围内变化是有限的,若出现观测值突变且与周围观测值明显不同,则判定为异常值,如相邻两层流速突变大于50 cm/s。
2.3.4 卡值检测 比较一个时间序列范围内若干相邻观测数据误差是否全部小于预定精度,如果小于预定精度,并且相邻观测数据大于预定的个数,则说明数据可疑或错误。对于深海观测,由于海流本身变化可能不明显,因此精度值不宜过大。
2.3.5 梯度检测 海洋观测要素在一定时间和空间范围内具有连续性,时间接近或者位置邻近的观测要素变化值应该在一定范围内,否则认为数据异常,如垂直流速梯度超过了15 cm/s。
2.3.6 良好百分比检测 良好百分比为ADCP 标准数据格式内容,用于描述数据良好情况。良好百分比小于50%,此深度单元数据可疑。
2.3.7 人工质控 人工质控要求操作员必须在适当的时间范围内,对程序化检测的异常数据、数据采集状态等进行人工检查,以确保系统的完整性。
深海海流受风浪和深层洋流的综合作用,表现较为复杂。为了从不同角度和层面分析数据,首先对原始数据进行处理,有针对性的绘制了各类图件,以便对数据质量、数据有效性、设备状况等进行评估。
3.1.1 伪彩图 原始数据分析以2018 年1 月至2018 年5 月时间段为例,共17 491 条样本数据。图3 为样本数据的分布伪彩图。
图3 2018 年1 月—5 月数据伪彩图
从图3 中可以看出,在观测点以上约30 m 范围内,色块均匀,数据表现良好;超过30 m 范围后,出现了黑色条带。经初步质量控制检测,发现该条带为大量缺测数据,值为-32 768。图4 对30 m范围内的数据进行局部放大,可以清楚地看到,在1 ~8 层数据是良好可用的。这说明ADCP 在深海工作时,由于深海水体清澈、水质透明,导致回波信号减弱,同时ADCP 频率高衰减大,因而工作距离会极大缩短,导致观测上层出现缺测无效值。
图4 第4 055 到第4 311 条数据伪彩图
3.1.2 时间序列图序列图显示了选定变量(流向、幅值、速度)的各水层数据,反应深海海流的长期变化趋势和季节周期性规律等。方框小矩形表示标准差,连接的长线表示最小值和最大值,中间短实线是平均值。可以看到,在长时间序列范围内,深海观测点的海流保持相对稳定,速度整体比较平稳;不同时段流向变化较大;同时段不同流层,变化趋势基本一致,流速大小存在差异。说明深海海流并不是单纯的均匀流或者表层流,而是二者的结合。
3.1.3 剖面图 给出了1 ~10 层不同样本数据的速度、幅值及流向剖面图,为典型的深海流速剖面。可以看到在上层深度部分数据缺失,说明此深度超出ADCP 工作范围;浅层各分量变化比深层略大,即随着深度增加,海流速度有减小的趋势。
图6 不同时刻下的样本剖面图
3.1.4 数据序列趋向和残差图 分别提取各层幅度数据,得到数据序列趋向和残差图,如图7 所示。从趋向图得到1 ~8 层各数据点具有很好的拟合性、一致性,整体残差值均匀分布,各层曲线拟合基本一致;第9 层数据开始出现明显差异,数据量小,拟合失效,证明9 层及以上数据无效。验证了该ADCP 在大约30 m 工作范围内的有效性和可靠性。
图7 不同观测层数幅度数据序列趋向和残差图
3.2.1 原始四波束速度 对原始数据经过质量控制后分析,以2018 年ADCP 采集的34 140条样本数据为例,原始波束速度分4 个波束(Beam1 ~Beam4)绘制,所示。原始四波束速度图反映了各分量的波动情况以及波束的一致性。各层波束速度范围为[-0.2, 0.2](单位:m/s,负号表示反方向),不同深度海流速度存在明显差异,随着深度减小,海流速度呈现增大趋势。
图 8 不同层数原始四波束速度图
3.2.2 不同流层波束速度对比 将观测站点1 ~9层的波束速度(Beam1)绘制在同一图上,如图 9所示。通过不同流层测量数据的对比分析发现,在长时间序列范围内,各层海流速度变化均匀,整体海流速度小于0.2 m/s,说明了深海海流的相对稳定性,长期变化趋势和季节性规律不明显。
3.2.3 地球坐标系下的三维流速 根据2.2.2 节,利用转换矩阵A和旋转矩阵M对波束坐标系下的速度剖面进行转换,得到地球坐标系下的流速剖面产品VELPROF,共有3 个分量——VLE,VLN,VLU。结果如图10 和图11 所示,分别为地球坐标系下水平层和垂向层三维速度分量。
图11 不同时刻下三维海流速度(垂向层)
由上得到深海海流更为精确的数据:水平方向一般为均匀定常流动;垂向上随着深度增加流速减小;深层海流速度小于0.1 m/s,大部分流速值在0.05 m/s 左右。根据深海垂向流速剖面数值模拟[13]可知,在典型的垂向流速剖面中,表层流速可达0.4 m/s,随着水深增加,均匀流速层下降到0.1 m/s,更深处的流速接近于0,与实际数据分析结果相符合。
本文基于2018 年深海观测网试验系统的ADCP 数据集,重点介绍了ADCP 数据处理原理、质量控制方法、产品生产流程,分析了在长时间序列范围内深海海流状况,验证了ADCP 的深海工作性能,为后续利用ADCP 开展深海海洋观测提供参考意见。研究结论如下:
(1)完整的ADCP 处理流程需要经过解码、计算、格式转换、质量控制和数据分析等,分别输出L0 级数据、L1 级数据产品。该流程适用于搭载在不同平台上不同频率的ADCP 观测设备,并可根据操作员经验做出个性化改进,对后续推动ADCP 数据的流程化处理具有指导意义。
(2)数据质量控制用来确保数据的准确性和精确性,并给出质量控制标志QC。对于ADCP 采集的数据,主要通过初步质量控制、程序化质量控制和人工质控3 个环节,其中程序化质量控制包括了全局检测、尖峰检测、卡值检测、梯度检测和良好数据百分比检测。完善的质量控制流程能有效去除无效、错误的数据,提高海底观测数据的质量,为海洋管理和科学研究提供可靠的、准确的海底观测数据,保证分析结果的真实可靠性。
(3)本次数据采集的ADCP 设备布放于海深1 800 m 处,垂向观测层数30 层,每层4 m。数据分析结果表明,在1 ~8 层数据表现良好,9 层以上为大量无效数据,因此该设备的有效工作范围在30 m 左右。在海洋流速测量和考察中,ADCP工作性能与海区、深度、水体环境等都有很大关系。该深海观测点由于悬浮物少、水质清澈,水体散射度较弱,导致ADCP 接收的回波信号减弱,同时频率高衰减大,因此有效工作距离会极大缩短,为后续ADCP 深海观测提供参考意见。
(4)深海海流受风浪和深海洋流的综合作用,流速并不是单纯的均匀流或表层流,而是二者的结合,在不同深度形成了典型的深海流速剖面。在1 800 m 海深观测点,全年海流速度小于0.1 m/s,大部分流速值在0.05 m/s 左右,垂向上随着水深的增加流速逐渐减小,水平方向为均匀的定常流动,长期变化趋势和季节性规律不明显。数据分析结果与理论计算、数值模拟相符,为深海海流分析提供了有力数据支撑。