程清 张航 张承明 殷复伟 王程成
摘要:针对目前利用深度学习技术进行高分光学遥感图像分类方法研究中尚存在的不足,本文提出了一种以多时相遥感数据为数据源,面向农作物种植信息提取的分类算法。该算法首先获取农作物在若干典型生长时期的光学遥感图像并进行配准等预处理,然后建立了一种以像素为单位的数据组织结构,该结构包含不同生长时期的作物信息、纹理信息,能较好地解决现有分类研究中信息不足的问题;接着以前馈神经网络为基础,建立了一种以像素为单位的分类算法,最后以得到的逐像素分类结果为基础进行成图。与同类方法相比,本文提出的算法综合考虑了农作物在不同生长时期的特征,更能发挥深度学习技术的优势,且多时相数据在提高农作物提取信息精度方面具有明显优势。
关键词:遥感分类;多时相数据;信息提取;农作物;神经网络
中图分类号:S127文獻标识号:A文章编号:1001-4942(2018)04-0149-05
Abstract In view of the shortages in researching high resolution optical remote sensing image classification method by the deep learning technology, a classification algorithm for crop information extraction based on the multi-temporal remote sensing data was proposed in this paper. The algorithm firstly obtained the optical remote sensing images of crop at several typical growth stages, and preprocessed these images such as registration. Then it established data organization structure based on pixels to solve the problem of insufficient information in the existing classification researches, which contained crop information and texture information at different growth stages. And it proposed a pixel classification algorithm based on the feedforward neural network. Finally,it mapped images based on pixel by pixel classification results. Comparing to the previous methods, this method comprehensively considered the characteristics of crop at different growth stages,could give full play to the advantages of the deep learning technology and had obvious advantages in improving the precision of crop information extraction.
Keywords Remote sensing classification; Multi-temporal data; Information extraction; Crop; Neural network
获取准确的农作物种植种类、面积、空间分布等信息,对于加强农业生产管理和国家宏观调控、保障农业可持续发展并最终保障国家粮食安全具有重要的意义。
围绕该问题,研究者们已开展了很多研究,并取得一定成果。闫慧敏等[1]利用MODIC/EVI时间序列影像,分析了鄱阳湖农业区多熟种植时空格局特征;郑长春等[2]以黑龙江852农场为研究区域,利用 SPOT 影像基于简单决策树分类器提取了水稻、小麦和玉米三大作物组成的种植结构信息;Mathur 等[3]利用IRS-1D 影像的光谱单波段特征量,采用支持向量机分类器提取出了印度旁遮普区域棉花和水稻两大农作物的空间分布;苗翠翠等[4]利用TM与NOAA影像数据,以江苏省水稻面积分布为研究对象,对NOAA-AVHRR进行混合像元分解,统计出各市的水稻面积;王凯[5]利用多源遥感数据,建立了针对湖北省的作物耕作面积提取及其动态监测技术体系;胡琼等[6]对利用遥感数据提取农作物种植结构的研究进行了综述,分析了各类方法的适应性;舒田等[7]在分析农作物光谱信息特征基础上,利用不同数据变换形式和10种常用植被指数对采收期的7种农作物进行了识别能力研究。尽管以往的研究中研究者们提出了多种优秀的提取算法,但由于数据源的限制,导致结果的精度仍较低,不能更好地满足农业生产管理和决策的需要。
随着高分辨率卫星的发展,人们获取的光学遥感图像的分辨率不断提高。在我国,随着高分系列卫星的成功发射,研究者已经可以稳定获取1 m分辨率的遥感图像,成为可靠的数据源。高分辨率图像与中低分辨率图像存在着较大的差异,突出表现在:高分辨率图像中地物的光谱特征更加丰富,同类地物内的光谱差异增大,而不同类别间的光谱差异减少,导致同物异谱及同谱异物现象更加普遍;同时,影像中大量细节的出现和地物光谱特征的复杂化导致了基于光谱统计特征进行分类的传统方法如极大似然法、最小距离法、K-均值聚类法等分类准确性的降低,甚至不能应用[8,9]。针对高分遥感图像的分类问题,研究者们已进行了大量研究,目前遥感影像分类方法主要分为两大类:监督分类与非监督分类[10]。监督分类是理论最成熟、应用最广泛的一类方法,主要包括最大似然法、最小距离法、人工神经网络等。
现有研究中基于高分遥感图像的分类算法多是针对一般地物的,专门考虑农作物分类的算法较少。事实上,农作物信息提取与一般地物分类问题有很大不同,其中最大的不同之处在于农作物存在一个明显的生长变化过程,只有综合利用多个时相的数据,才能有效提高分类精度[11]。为此,本研究提出了一种利用多时相遥感数据提取农作物信息的方法,该算法将多幅典型生长时期的遥感图像统一按像素组织,然后利用神经网络强大的自学习能力学习每类样本的特征,最终利用学习到的特征进行农作物信息提取。
1 研究区概况与数据来源
1.1 试验区概况
本研究选取华容区作为试验区。华容区隶属湖北省鄂州市,位于鄂州市西部,长江中下游南岸。地处东经114°30′~115°05′,北纬30°~30°36′。位于我国地势第二階梯过渡到第三阶梯的地带,以丘陵为主,西北部为垄岗平原,东南部多湖泊。
华容区属典型的亚热带大陆性季风气候,四季分明,光照充足,雨量充沛。无霜期年均266 d,年降水量1 315 mm,年均日照射时数1 995 h。良好的气候条件为农作物提供了良好的生长环境。
华容区土地总面积为49 274.72 hm2,占全市土地面积的39.2%。其中,耕地面积20 682.55 hm2,占总面积的41.97%,粮食生产在该区占据重要地位,是我国主要的粮、棉、油生产基地之一。因此,及时准确地掌握华容区的农作物信息,可以为农业生产部门提供有利数据,具有极大的利用价值。
1.2 数据来源
高分二号卫星(GF2)于2014年8月19日11时15分发射,是迄今为止中国地面像元分辨率最高的光学对地观测卫星,具有米级空间分辨率,全色分辨率为1 m,多光谱分辨率为4 m,成像幅宽为45 km。主要参数见表1。
本研究选取了华容区2015年11月、2016年3月、2016年5月共三期的GF2遥感影像,并利用华容区的矢量边界对获得的三期高分影像进行裁剪,最终得到研究区域的遥感影像图(图1)。
2 方法建立
2.1 数据预处理
遥感数据在采集过程中,由于受到卫星高度、角度、传感器性质等多种因素的影响,会产生图像变形。因此,首先利用ENVI软件中的RPC(有利多项式系数)和FLAASH模块分别对影像进行正射投影和大气校正,接着进行图像融合,以提升图像的空间分辨率和光谱分辨率,利于监测。
2.2 数据结构
为了充分利用遥感数据提供的信息,考虑到纹理信息是由多个相邻像元共同表现出的特征,是二维结构的数据,而光谱信息是一维结构的数据,本方法首先设计了一个以一维数据存储像素信息的数据结构,以便逐像素统一存储光谱和纹理信息。该结构以经过预处理的数据为基础,采用逐像素逐时相存储的方式,首先存储像素第一个时相的光谱信息,然后存储第一个时相的纹理信息,由于每个像素的纹理是3×3的结构,需将该结构逐行逐列转化成一维结构加以存储;然后存储像素第二个时相的信息,依此类推。
2.3 模型建立与学习
神经网络和遗传算法都是仿效生物处理模式,并从中获取解决复杂实际问题的方法。神经元网络算法是一种“黑匣”式的映射,无需明确两者之间的确切关系,只需要“现象上”存在关系即可,非常适合解决非线性的复杂问题,具有极强的容错性、自组织性、非线性模拟和泛映射能力;但运用该算法容易陷入局部最优,得不到全局最优解,且其网络的设计没有理论上的指导,完全依赖设计者的经验和样本空间的反复试验,这限制了运用神经网络求得全局最优解的可能性。遗传算法(genetic algorithm,GA)是基于自然选择和遗传学机理的迭代自适应概率搜索算法,是一种全局优化算法,能够收敛得到全局最优解,鲁棒性好,但其不具备自适应学习能力。因此,将神经网络和遗传算法结合起来,不仅能发挥神经网络的泛化映射能力,而且能使神经网络具有较快的收敛性、全局优化能力和较强的学习能力,进一步提高网络训练速度和预测精度。
基于以上考虑,本文提出一种基于GA-BP神经网络优化的分类模型,并以此为基础进行农作物信息提取。该模型首先建立一个BP神经网络,并利用遗传算法对网络的节点权值进行优化;然后将样本逐像素数据作为遗传神经网络的输入参数,像素的类别作为输出,通过学习,建立一个能够用于分类的识别模型。其分类识别流程如图2所示。
遗传算法对BP神经网络进行优化的具体步骤如下:
(1)初始化BP神经网络,确定输出输入节点个数X、Y,隐含层数H,训练次数N,训练误差ε等。
(2)遗传编码。确定遗传算法的种群规模P,染色体个数n与最大迭代次数T,交叉概率Pc与变异概率Pm,将BP网络权值与阈值按一定顺序级联起来,作为遗传算法的一个染色体,其长度l为神经网络的权值个数和阈值个数之和,即:
l=H×(X+Y)+H+Y 。
(3)适应度函数计算。将BP网络的误差函数E作为适应度函数,计算种群中每一个染色体的适应度。
(4)遗传进化。将交叉和变异算子作用于父代种群Pt产生子代种群Qt,并将两个种群联合在一起形成2n的种群Rt,对Rt进行非劣分类操作,按照拥挤选择算子的原则产生下一代种群Pt+1,并将副本复制到P′。
(5)重复(2)~(4)步,直到满足终止条件为止。至此,将P′中最优个体解码,作为BP网络的初始权值和阈值。
GA的进化代数要求不是很大, 因为GA-BP神经网络中只要求GA为BP神经网络提供具有全局性的进化较好解,并不要求GA进化至权值、域值的最优解。
2.4 分类实现
改进好的BP神经网络,设置输入层神经元节点数目为4,输出层神经元节点数目为5,最后确定隐含层神经元节点数,即根据输入、输出层神经元节点数目、网络传递函数等参数,采用遗传算法进化确定隐含层神经元数目。在Matlab中读入待分类图像数据并归一化,然后将向量数据输入到训练好的BP神经网络中,再结合纹理信息在Matlab中实现农作物信息的提取。
3 试验验证
利用本文构建的方法,对华容区的作物进行识别分类。分类模型在Matlab中编程实现,成图在ENVI中实现。图3给出了分类结果图,图4给出了以分类结果为基础形成的矢量图。
该方法的总体分类精度达到87.133 2%,Kappa系数达到0.803 3,与单一时相的光学遥感数据分类算法相比,分类结果准确度较高,能获得较为理想的分类效果,具有明显的优势。可见,在运用神经网络进行遥感分类的基础上,考虑数据源问题,结合合适的纹理信息进行分类,能够获得更好的分类结果。
4 结论
本文提出了一种基于GA-BP神经网络的利用多时相遥感数据的农作物信息提取方法,该方法首先建立了一种能够逐像元统一存储多时相光谱信息和纹理信息的数据结构,然后建立一个BP神经网络,并采用遗传算法对BP网络的节点权值进行优化,获取一个最优权值作为BP网络的初始权值;完成BP网络训练后,以多时相光学遥感数据作为输入,生成逐像素的分类图,并利用ENVI软件进行成图。
试验结果表明:
(1)本文提出的数据结构能够有效、统一地存储像素的光谱信息和纹理信息,并应用于神经网络模型,解决了异构数据在神经网络中的应用问题。
(2)经与单一时相光学遥感数据分类算法对比,新优化算法的总体分类精度达到87.133 2%,Kappa系数达到0.803 3,能取得利用潜力更好的特征和信息,有效提高识别精度,能够用于工程实践。
参 考 文 献:
[1] 闫慧敏, 黄河清, 肖向明, 等. 鄱阳湖农业区多熟种植时空格局特征遥感分析[J]. 生态学报, 2008, 28(9):4517-4523.
[2] 郑长春, 王秀珍, 黄敬峰. 基于特征波段的SPOT-5卫星影像水稻面积信息自动提取的方法研究[J]. 遥感技术与应用, 2008, 23(3): 294-299.
[3] Mathur A, Foody G M. Crop classification by support vector machine with intelligently selected training data for an operational application [M]. Taylor & Francis, Inc.,2008.
[4] 苗翠翠, 江南, 彭世揆, 等. 基于NDVI時序数据的水稻种植面积遥感监测分析——以江苏省为例[J]. 地球信息科学学报,2011,13(2):273-280.
[5] 王凯. 基于多源卫星遥感的湖北省作物耕作面积提取及其动态监测[D]. 荆州:长江大学, 2015.
[6] 胡琼, 吴文斌, 宋茜, 等. 农作物种植结构遥感提取研究进展 [J]. 中国农业科学, 2015,48(10):1900-1914.
[7] 舒田,岳延滨,李莉婕,等.基于高光谱遥感的农作物识别[J]. 江苏农业学报,2016,32(6):1310-1314.
[8] 刘大伟, 韩玲, 韩晓勇. 基于深度学习的高分辨率遥感影像分类研究[J]. 光学学报, 2016,36(4):298-306.
[9] Cybenko G. Approximation by superpositions of a sigmoidal function[J]. Approximation Theory & Its Applications, 1993, 9(3):17-28.
[10]Lippmann R P. Pattern classification using neural networks[J]. Communications Magazine IEEE, 2002, 27(11):47-50.
[11]郝卫平, 梅旭荣, 蔡学良, 等. 基于多时相遥感影像的东北三省作物分布信息提取 [J]. 农业工程学报, 2011, 27(1):201-207.