罗 宇,郑 旭,施 剑*,吴逸凡,2,李 斌
(1.山东科技大学 测绘学院,山东 青岛 266590;2.自然资源部第二海洋研究所,浙江 杭州 310012)
海底底质类型是重要的海洋环境参数,是进行海底科学研究的基础,海底底质分类对于海洋工程建设、海底科学研究、海洋资源开采具有重要的科学与实际意义。传统的底质分类依靠机械进行直接采样来确定沉积物的类型及分布,该方法效率低、采样数据离散,不适合进行大面积的调查分类。声学方法遥测海底类型根据海底底质的反射系数、声速、散射等声学特性反演出底质的类型、粗糙度、硬度等属性,具有效率高、费用低、获取内容丰富连续的特点,为海底分类提供了快速可靠的方法[1]。对于单波束、浅地层剖面仪等正入射仪器进行底质分类的主要方法有海底声学参数反演法[2]、统计特征分析法等[3];对于多波束、侧扫声呐等斜入射仪器进行底质分类的主要方法有反向散射强度分析法[4-5]、图像纹理特征分析法等[6-9]。目前,对于回波信号的统计多基于回波信号的波形特征,对声呐回波能量特征研究较少。
浅地层剖面仪(Sub-bottom Profiler),简称“浅剖”,是一种用于获知海床以下浅部地层信息的声学探测设备,是进行海洋地质勘探常用的设备之一,其工作时通过发射换能器垂直向海底发射声波信号,声波穿透水层、海底地层,下行过程中经各层介质的滤波,遇声阻抗界面返回,最终携带有界面层信息的反射声波被接收单元接收[10]。相较于其它设备,浅剖具有发射频率低、底质穿透力强的特点,获得的回波信号可携带很丰富的沉积物特征。本文主要对不同底质下浅地层回波信号的能量序列进行分析,提取海底浅层沉积物的回波能量序列进行地质分类。
浅剖在工作中发射的脉冲强度是固定的,接收的回波强度由于深度和海底不同沉积物的反射系数、硬度、粗糙度等物理性质不同,其回波的能量序列特征也有所不同。具体表现为:(1)回波能量序列的总强度不同。不同底质之间回波能量序列的总强度存在较大差异,且与深度有关,深度较浅回波能量序列的总强度较强,较深回波能力较弱;(2)回波能量序列分布特征不同。浅剖发射的脉冲信号接触到海底沉积物,受到反射的同时,也会有一部分能量被吸收,利用反射的部分可以进行测深,而不同的沉积物对声波的吸收不同,其能量分布存在较大的差异[11];(3)回波能量序列分布与换能器的工作频率有关。工作频率越低,其回波能量的平均强度越高,且出现波峰的序列越多,工作频率越高,其回波总能量越低,波峰数量越少。
图1 回波能量序列分布特征
对浅表层回波信号数据进行处理,可分离出回波能量序列,接收的1帧数据可以换算为垂直方向上有限的回波能量值,其数量与浅剖的发射频率、声速等有关[12],可将回波能量序列映射为水深,计算公式为:
式中:S为1帧中回波能量的数量;n为回波能量的序列值;HMAX为声呐设置的最大量程,为HMIN测量最小量程。
图1-a为淤泥底质在不同工作频率下的浅剖能量序列分布情况,高频(200 kHz)下其分布中只出现两个较为明显的波峰,第一个波峰为水面反射,第二个波峰为声波到达海底表面后的反射。低频(20 kHz)下则出现了多个波峰,其平均能量也更高、低频穿透性较强,其分布更能反映出不同底质的特征。图1-b为淤泥、砂砾、水泥3种不同底质的回波能量序列分布,可以观测到不同底质的回波能量序列分布具有差别。
支持向量机(Support Vector Machine,SVM)是一种有监督的分类算法,其最初由Vapnik首先提出[13],其主要思想是通过映射函数将向量映射到一个更高维的空间,求解一个分类超平面,使正例和反例之间的隔离边缘被最大化。支持向量机针对有限的样本数量下的分类问题,根据结构风险最小化原则在保证学习精度的前提下提高了泛化能力。考虑到在实际的勘测工作中,海底样本采集困难、样本数量较少等情况,使用支持向量机对海底底质进行分类识别研究。
支持向量机最初用于对线性可分问题进行分类,给定训练样本{(x1,y1),(x2,y2),(x3,y3)…(xn,yn)},得到期望输出y∈{-1,1}。即寻找一个超平面将训练样本分离,并使任意样本的点到超平面的距离大于等于1。用于分类的最优超平面的方程为:
式中:w为法向量;b为截距。满足上述条件的超平面实际构建了两个平行的超平面作为间隔边界以判别样本的分类:
所有在上间隔边界上方的样本属于正类,在下间隔边界下方的样本属于负类,位于间隔边界上的正类和负类样本为支持向量(Support Vector)。对于非线性问题,需适当放松约束条件,引入松弛变量ξi>0,此时的分类条件变为:
当ξi=0时,问题变为线性分类问题,当0<ξi<1时,样本可落在超平面内并被超平面正确分类,当ξi>1时,允许错误分类。松弛因子越大表示对离散点的容忍程度越高。同时为松弛因子加入一个惩罚系数c,以免松弛因子过大。此时的目标函数为:
对于非线性分类问题,可使用映射函数将其转化为线性可分问题,此时作为决策边界的超平面表示为wTφ(x)+b=0。公式中φ(x)即为映射函数,可定义映射函数的内积为核函数k(x1,x2)=φ(x1)Tφ(x2)。常见的核函数有多项式核、径向基(RBF)函数核、拉普拉斯核等。本次实验使用RBF核函数:
在进行底质分类之前,首先对回波能量强度数据进行预处理,根据回波能量序列的特点,最大限度地消除非海底底质因素的影响,提取出代表底质特征部分的序列,对数据进行分类整理,选取适当数量的数据作为SVM的训练集和测试集,对SVM进行训练,并用测试集进行测试,得到分类结果。流程如图2所示:
图2 底质分类处理流程
回波能量序列分布与深度有关,进行数据选取时,需剔除深度的影响,利用阈值算法来获取回波能量序列中代表底质特征的部分。如图3所示设每帧回波能量序列为{P1(h1,k1),P2(h2,k2),…Pn(hn,kn)},其中hi为序列值,ki为能量强度。根据测量时的水深值可根据公式(1)计算出水深的序列D,根据水深序列D设定合适的范围{D∈[hmin,hmax]},即图3中的黑色虚线。在设定的阈值内,寻找能量强度的最大值得到水底表面的深度序列h,选取适当的厚度Δh,截取海底表面深度h后的[h,h+Δh]范围内的回波能量序列作为底质分类的有效原始数据,即图3中的红色虚线。对数据进行筛选,这样可以有效地过滤掉水面反射回波、二次回波等其它异常的回波能量。对底质厚度的选取,可在一定的厚度内进行循环测试,根据分类成功的准确率选取合适的底质厚度。
图3 底质特征数据选取
支持向量机在实际应用中,惩罚参数c与核函数参数g的选择对于最后的分类效果具有十分重要的影响,选择恰当的参数十分必要。在原始数据底质已知的情况下,可将参数c与g在一定范围内取离散值,将原始数据一部分作为训练集,一部分作为测试集,并对参数进行归一化处理,归一化处理可将不同来源的特征数据统一到同一数量级下,消除不同特征间量纲的影响。使用离差标准化,使结果值映射到[0,1]之间,转换函数如下:
式中:ki表示序列i的能量强度;max{ki}表示所有样本数据中回波能量强度最大值;min{ki}表示所有样本数据中回波能量强度最小值。训练完成后利用测试集对分类准确率进行测试,如图2所示。以测试集的分类准确率作为评价标准,不断对参数进行优化测试,最终得到一定条件下最佳的惩罚参数c与核函数参数g。
本次实验数据来源于山东科技大学海洋测绘重点实验室消声水池,该水池长40 m,宽6 m,水深3~8 m。水池池壁放置了消声材料,水池底部有规律阶梯状布设有卵石、砂砾、淤泥、水泥等不同底质,模拟真实的海洋环境。采集数据使用到的仪器为某型号浅地层剖面仪、GPS定位系统、处理软件南方自由行2016等。设置浅地层剖面仪的最大工作深度为20 m,声速为1 500 m/s,保持参数不变,分别对淤泥、砂砾、水泥3种底质进行数据采集,每种底质选取不同的点进行5次采集,每个采集点采集数据5分钟。对数据进行回放,选取其中4组回波较清晰的信号。
每组选取50帧数据,其中100帧作为训练集,100帧作为测试集,根据上述方法,首先对数据进行处理,利用阈值算法截取底质能量序列。如图4所示,为了剔除水深的影响,截取的序列为表面波峰后的13列。可以观测到不同底质之间的回波能量序列具有较明显的差异。水泥底质回波序列中会有一个明显的波峰,砂砾底质与水泥底质相比波峰较小,且波峰序列靠前,淤泥底质回波序列能量强度缓慢下降。
图4 不同底质回波能量序列
选取能量回波序列的多少即选取的底质厚度不同,对分类结果影响很大,默认SVM参数c=1,g=1,不同厚度下的分类结果如表1所示。
表1 不同序列长度下分类准确率
通过表1观察到,在SVM参数不变的情况下,截取能量序列长度为13时分类准确率为95.33%,而选取序列长度为7时分类准确率仅为67.33%,本次所取的能量强度序列为13,其对应的底质厚度为0.87 m。
本次测试集的底质类型已知,设定不同的参数c,g利用训练集进行训练,训练完成后利用该支持向量机对测试集进行分类,预测结果与实际底质类型结果对比可选出最优的参数c与g,如图5所示。先在较大范围内粗略的选取c与g,将c与g范围设为[2-4,24],递进步长取2为底的幂指数0.5,结果如图5-a所示,在log2g=0处,即g=1处分类准确率较高,且参数g对分类准确率影响较大,进一步缩小范围,将c设为[0,2]步进间隔为0.1,将g设为[0,2]步进间隔为0.01,得到结果如图5-b所示。在这种条件下的最优参数为c=1,g=1.01。
图5 SVC参数优化示意图
利用优化参数后的支持向量机,对测试集3类底质共300个样本数据进行自动分类,分类结果如图6所示,预测底质类型与测试集已知的底质类型相同,分类准确率为96%。其中淤泥有2个样本被错分为水泥,水泥有10个样本被错分为淤泥。
图6 底质分类测试结果
从浅地层剖面仪回波信号中提取的回波能量序列,可有效地应用于海底底质分类。本文总结了浅地层回波信号能量序列的特征,提出了一种简单有效的截取含有底质特征的回波能量序列的方法。在分类方法上,利用SVM算法进行分类,优化了SVM的参数,使其在一定意义上达到了最优,在实验水池进行数据采集,浅剖工作状态与工作环境较为理想,且采集的底质数据样本数量较少,每个底质类型用于训练的数据相似度较高,所以取得了很高的分类精度。浅地层剖面仪在实际的测量工作中面临船运动、环境噪声等多种因素的影响,且海底底质类型复杂多变,需要进一步利用浅剖采集真实的海底底质数据,并在数据预处理、底质特征选取以及多底质类型分类等方面进行更深入的研究。