郑友亮
基于卷积神经网络的沿海水质评价技术研究*
郑友亮
(广东省科技基础条件平台中心)
针对沿海水质评价,利用遥感图像获取的实时与大范围优势,提出基于卷积神经网络的沿海水质综合评价方法。该方法应用非线性回归模型对遥感图像进行校正;建立基于卷积神经网络的沿海水质评价模型;引入水质评价先验知识,结合遥感图像形成多模态矩阵输入数据;通过多层卷积与池化操作,降低因图像平移、缩放、倾斜等变换引起的误差,提高水质评价精度。实验结果表明,该方法可较准确地评价沿海水质,具有一定的实用价值。
沿海水质评价;遥感图像;卷积神经网络
广东省沿海区域是我国南方经济发展较快速地区。随着沿海养殖、工业、运输和旅游等行业的迅速发展,近岸海域所承受的资源与环境压力也日益严重,自净速度往往赶不上生产、生活排污速度,从而导致沿海区域水质下降和生物资源减少等海洋生态环境问题。2015年全省近岸海域水质大部分较清洁,符合Ⅰ、Ⅱ类海水水质标准的面积比例近90%,但近岸海域存在化学成分,如氮、磷超标等水质问题,其中劣于第Ⅳ类海水水质标准的海域面积比例年均值为4.0%[1]。
目前,沿海水质评价数据采集手段已多样化,主要包括卫星遥感、船舶、航空、浮标和台站等方式,而基于遥感图像的水质评价因具有快速、低成本、即时同步性好等优势,已成为当前沿海水质监测与评价的主流方式,可实时快速获得大面积区域沿海水质信息。卫星遥感的原理是利用卫星重现观测目标电磁辐射特性的空间分布状况,包含观测目标的光谱、时空等特征,并通过分析、推理与判断遥感影像中的目标特征信息来实现观测目标识别。
目前常用的水质评价方法有经验与统计分析法、神经网络法[2]、模糊评价法[3]、支持向量机[4]和人工蜂群优化法[5]等,但均基于已采集的水体观测因子,如PH、DO、无机氮等指标进行评价,仅考虑观测因子与水质等级之间的关系,而观测因子的采集存在实时性差、耗费大、覆盖范围窄等问题。文献[6]提出基于遥感图像的神经网络水质反演评价模型,但仅针对叶绿素a浓度单因子进行评价。文献[7]提出基于模糊评价的水质监测模型,但实现过程复杂且对Ⅱ类、Ⅲ类海洋水质评价的准确率较低。遥感图像与水质参数之间是较复杂的非线性关系,水体水质状况具有模糊性与随机性,且海洋遥感图像还包含海洋深度信息。而传统水质评价方法仅适用于浅层结构模型[8],即对于原始的输入信号仅通过较少层次的线性或非线性处理来达到数据处理目的,对于基于高分辨率遥感图像的沿海水质评价存在精度偏低、适用性差等问题。
近年来,人工智能技术飞速发展,在图像理解领域以深度学习尤为突出,其中卷积神经网络极具代表性。它是一种带有卷积结构的深度神经网络,卷积结构可减少深层网络占用的内存量,也可减少网络参数个数,缓解模型的过拟合问题[9]。因此,本文针对沿海水体遥感图像数据,提出基于卷积神经网络的水质综合评价方法。该方法引入沿海水质评价相关先验知识,并结合遥感图像数据形成多模态三维矩阵输入数据,以进行卷积神经网络训练与评价,有效实现沿海水质的分类识别,为相关部门快速提供准确的决策依据,保护海洋环境,促进社会健康和谐发展。
沿海水质评价技术框架如图1所示,在水质评价前,需对卷积神经网络进行样本训练。训练集由沿海水质评价知识集、沿海卫星遥感图像数据和实测的沿海水质数据组成。其中以卫星遥感图像数据和沿海水质评价知识集为输入样本,以实测的沿海水质数据为目标样本。在沿海水质评价过程中,将卫星观测的遥感图像数据和水质评价知识数据作为输入数据集,利用训练好的卷积神经网络进行分类识别,最终实现沿海水质的评价与分类。根据《中华人民共和国国家标准海水水质标准》(GB3097-1997),海洋水质分为Ⅰ类、Ⅱ类、Ⅲ类和Ⅳ类[10],对于劣于第Ⅳ类的水质,根据文献[1]将其分为劣Ⅳ类。因此在训练及识别过程中,以上述级别的分类标准作为沿海水质评价标准指标,实现沿海水质的分类处理。
图1 沿海水质监测评价技术框架
2.1沿海水质遥感图像校正
由于受到遥感器自身特性、大气折射、地球自转和成像方式等因素的影响,卫星遥感采集的影像存在一定的数据失真与几何畸变现象,这必然影响后期影像处理质量和应用效果。为消除此类几何差异,必须对遥感图像进行校正。通常卫星遥感图像已经过大气校正、几何校准、辐射定标等预处理[11],如几何畸变校正、图像均衡化、空间滤波等,但仍然存在精度低的问题,较难准确反映沿海水质状况,需进一步进行图像校正。本文根据沿海水质观测图像的特征以及其与实际测量数据间的关系,建立基于遥感图像变换的非线性回归模型,确定输入和输出的映射关系,以实现卫星遥感图像的校正。
设在原始遥感图像中任一点表示为,对应像素值为,为图像中某像素点的值计算函数。校正过程中,经过映射函数作用后形成校正后的遥感图像,其任一点可表示为,对应的像素值为,则
2.2卷积神经网络
卷积神经网络是多层感知器的一个变种模型,一般由卷积层、池化层、全连接层和输出层组成。它通过卷积来模拟特征区分,并通过卷积的权值共享及池化操作,来降低神经网络参数的数量级,最终通过传统神经网络完成识别与分类。
2.2.1 卷积层
卷积层将不同的卷积核分别与上一层的所有特征图进行卷积求和,加上偏置,再通过修正线性单元激活函数作用,形成当前层的输出神经元。运算公式为
2.2.2池化层
池化层即下采样层,依据一定的池化规则对特征图进行下采样。主要作用有:1) 对输出的特征图降维;2) 在一定程度上保持卷积层输出特征的不变性(含旋转、平移、缩放等)。计算式为
2.2.3全连接层
模型的最后一层隐含层即为全连接层,该层将池化后的特征图转化为一维特征,其输出计算式为
2.2.4输出层
输出层为soft-max,它是一种多类型分类器,用来预测各类的输出概率,其表达式为
2.3 卷积神经网络结构设计与训练过程
为准确实现沿海水质评价与分类,本文设计一种用于沿海水质评价的卷积神经网络,由9层组成。输入层是由D0、D1、TM1、TM2和TM3层叠组成的三维矩阵数据(具体参考3.2节);C1、C3、C5三层为卷积层;S2、S4、S6三层为每层对应连接的最大池化层;F7为神经网络的全连接层;soft-max层用来输出遥感图像对应的各类水质等级概率,其结构如图2所示。
图2 卷积神经网络结构
在对卫星遥感图像进行海洋水质评价前,需对卷积神经网络模型进行训练。卷积神经网络属于监督学习方式,训练前需要进行样本标记。利用实测样本结果对对应的遥感图像进行标记,并随机初始化所有权重,然后进行前向传播。即从样本集中取一个样本,将输入至卷积神经网络,并计算相应实际输出;再计算实际输出与相应实际样本标签的差异,按极小化误差的方法反向传播调整权矩阵。
3.1 样本数据获取
以广东省沿海海域为实验分析区域,实验数据来自与实际观测同期(2015年)的具有8个光谱波段LANDSAT 7 ETM+卫星的遥感图像数据集,选取对沿海水质特征反应良好的TM1(蓝波段)、TM2(绿波段)、TM3(红波段)3个波段遥感图像进行水质评价,其中蓝、绿波段对叶绿素及色素反应敏感,且有助于提取水体透明度及水深等水下特征信息,红波段对水中悬浮泥沙反应敏感。采集的样本数据主要分布在珠江口海域、汕头港和湛江港海域,少数分布在其他沿海海域,如图3所示。
图3 测试样本分布图
3.2 实验过程
实验过程如图1所述。首先,采用非线性回归校正模型对TM1、TM2、TM3波段遥感图像进行校正;然后,对沿海水质评价先验知识进行编码,并结合遥感图像与实测目标数据形成训练样本,并对卷积神经网络进行训练;最后,基于训练后的卷积神经网络,以遥感图像测试数据和沿海水质评价知识作为测试样本集对测试点水质进行评价。
输入数据主要包含沿海水质评价先验知识和遥感图像数据,其中沿海水质评价先验知识包含2类数据:1) 沿海水质的地理分布与海底深度的先验知识,对其进行编码(如陆地标记为0,海湾区标记为1,沿海浅水区标记为2,沿海深水区标记为3)形成编码模板D0(128×128);2) 通过对遥感图像所对应的假彩色合成图像进行解译[6]而获得的沿海水质分类数据,如图4所示,得到广东沿海的水质类别的预估划分,如黑色部分代表水质较差区域(标记为3)、浅黑色部分代表水质一般区域(标记为2)、灰色区域代表水质较好区域(标记为1),对其进行编码形成编码模板D1(128×128)。遥感图像数据主要有蓝波段遥感数据TM1、绿波段遥感数据TM2和红波段遥感数据TM3,由于原始图像覆盖范围大且分辨率高,故将其划分成128×128图像序列,与采样点对应进行依次训练与评价。综上所述,输入数据是由D0、D1、TM1、TM2和TM3层叠组成的三维矩阵数据(128×128×11),涵盖水质评价的先验数据与水质评价关键波段遥感图像等绝大部分特征信息。通过三维卷积自动提取各模态数据间的特征信息与差异,有助于提升沿海水质评价准确率。训练过程中的实测目标数据为2015年各船舶航次观测数据的处理结果。
图4 广东沿海水质等级预估划分
实验基于遥感图像处理软件ERDAS9.0的c toolkit二次开发库,并结合贾扬清的开源快速深度学习框架caffe[14]进行实验测试,共生成500组训练样本,其中Ⅰ类100组、Ⅱ类100组、Ⅲ类100组、Ⅳ类100组和劣Ⅳ类100组,最后随机挑选16个测试集进行水质评价测试。
3.3 结果分析
由式(5)可知,卷积神经网络输出层输出当前测试样本在各类水质等级中的概率,取最大值对应等级为沿海水质评价结果,所有测试样本的预测结果如表1所示。结合图3可知,实测数据与预测数据均显示Ⅳ类与劣Ⅳ类水质主要分布在珠江口海域,Ⅲ类与Ⅳ类水质主要分布在汕头港、湛江港局部海域,其他沿海海域均为Ⅰ类与Ⅱ类海水水质。以实测数据为评价标准,预测结果准确率为93.75%。相比传统方法,本文方法通过卷积操作较好地处理遥感图像与水质参数间的复杂非线性关系,有效修正遥感反演参数与实测数据间的误差,较准确地实现沿海水质的分类。
表1 广东沿海水质实验数据分析表
本文针对现有沿海水质评价技术存在实时性差、准确度较低等问题,以卫星遥感图像为原始数据,提出了一种基于卷积神经网络的沿海水质评价方法。针对遥感图像校正建立基于遥感图像变换的非线性回归模型,实现遥感图像的精确校正;将水质相关知识与遥感数据作为卷积神经网络的初始输入数据,通过多层卷积与池化操作,保持对遥感图像平移、缩放、倾斜等变换的高度不变性,且通过共享权值减少训练参数,在一定程度上简化了网络结构,对高分辨率沿海遥感图像的实时处理与水质分类有较好的适用性。通过试验验证,该方法可较准确地实现沿海水质评价,具有一定的实用价值。但仍存在不足,如输入数据维度过大,其训练过程特征参数多。后续可优化输入数据或通过采用并行网络结构来降低训练复杂度。
[1] 广东省海洋与渔业局.2015年广东省海洋环境状况公报[R]. 海洋环境公报,2016.6.15.
[2] 李雪,刘长发,朱学慧,等.基于BP人工神经网络的海水水质综合评价[J].海洋通报,2010,29(2):225-230.
[3] 刁美娜,温小虎,刘有刚,等.基于模糊神经网络的海水水质综合评价[J].海洋通报,2012,31(2):228-232.
[4] 赖清,衷卫声,熊鹏文,等.基于BP神经网络与多分类支持向量机的水质识别与分类[J].南昌大学学报(理科版),2016,40(6):563-566,574.
[5] 苏彩红,向娜,陈广义,等.基于人工蜂群算法与BP神经网络的水质评价模型[J].环境工程学报,2012,6(2):699-704.
[6] 石爱业,徐立中,杨先一,等.基于知识和遥感图像的神经网络水质反演模型[J].中国图象图形学报,2006,11(4):521-528.
[7] 张春桂,曾银东,马治国.基于模糊评价的福建沿海水质卫星遥感监测模型[J].应用气象学报,2016,27(1):112-122.
[8] 刘敏,李海涛,顾海燕,等.WorldView-2高分辨率卫星影像面向对象分类[C].第十八届中国遥感大会,2012:123-129.
[9] 常亮,邓小明,周明全,等.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312.
[10] 国家环境保护局. GB 3097-1997 海水水质标准[S].北京:中国环境科学出版社,2004.
[11] 于小林.环境遥感监测系统的水质监测图校正算法研究[D].长沙:湖南大学,2010.
[12] 杨卫锋,曾芳玲,王强.非线性回归模型参数估计的区间分析方法[J].电子信息对抗技术,2009,24(6):40-44.
[13] Krizhevsky A, Sutskever I, Hinton G E. Image Net classification with deep convolutional neural networks[J]. In: Proceedings of Advances in Neural Information Processing Systems 25. Lake Tahoe, Nevada, USA: Curran Associates, Inc.,2012, 1097−1105.
[14] Caffe, a deep learning framework developed by Berkeley AI Research (BAIR) and by community contributors[DB/OL]. http://caffe.berkeleyvision.org/.
Research of Coastal Water Quality Evaluation Technology Based on Convolutional Neural Network
Zheng Youliang
(Guangdong Science & Technology Infrastructure Center)
Aim Aiming at the evaluation of coastal water quality,using the real-time and large-scale advantage of remote sensing image acquisition, a comprehensive evaluation method of coastal water quality based on convolutional neural network is proposed. The satellite remote sensing image are corrected by applying nonlinear regression model, and the coastal water quality evaluation model based on convolutional neural network is established. The multimode matrix input data is formed by Adding the prior knowledge of water quality evaluation and combining the remote sensing image, and through the multi-layer convolution and pooling operation, it reduce the error caused by the image translation, scaling, tilting and so on, and improve the water quality evaluation accuracy. The experimental results show that the method can accurately evaluate the coastal water quality and has a practical value.
Evaluation of Coastal Water Quality; Remote Sensing Image; Convolutional Neural Network
郑友亮,男,1985年生,本科,工程师,主要研究方向:计算机技术及应用、科技项目管理。E-mail: ylzheng2008@qq.com
广东省科技计划项目(2013B030200002,2016A020222016)