基于遥感图像提取小麦种植分布信息的算法优化研究

2014-04-08 02:35张娟娟张钰洋马新明
河南农业大学学报 2014年4期
关键词:准确率距离分类

张娟娟, 张钰洋, 马新明,2

(1.河南农业大学信息与管理科学学院,河南 郑州 450002;2.河南粮食作物协同创新中心,河南 郑州 450002)

从遥感图像中提取植被覆盖分布信息是作物生长信息提取的基础步骤,也一直是遥感图像信息提取应用领域研究的方向之一[1~3].用于提取遥感图像的植被覆盖分布信息的方法有很多,最常见的是采用图像分类的方法,如K邻近法[4]、小波神经网络[5]、基于多源数据融合的分类[6]、基于专家知识和地学知识的图像分类[7~10]等分类方法.这些分类算法虽然通用性较好,但在某些应用场景中却并不太适用[11~12].如在仅需要提取指定作物种植分布信息的农业信息系统中,先将图像分为几类,再提取需要的信息过于烦琐,并且效率低下.显然,直接提取需要的信息是最优的选择,而目前这方面的研究还鲜见报道.小麦在拔节期进入营养生长和生殖生长并进阶段,该阶段的生长发育决定着小麦群体的库源特征,是小麦一生中的生长发育关键时期.故本研究针对从小麦拔节期遥感图像中快速获取小麦田地分布信息这一需求,对传统分类算法进行一定的优化改造,从而找出适用于这一需求的遥感图像信息提取算法.

1 材料与方法

1.1试验材料

试验区域覆盖了鹤壁市浚县的席营村、园上村、东许庄及东许庄村.遥感图像(图1)包含SPOT-5卫星的XS 3,XS 2,XS 1波段遥感图像信息(400×400),图像空间分辨率10 m.图像顶点经纬度坐标信息分别为东经114°25′48″和北纬35°44′24″、东经114°28′48″和北纬35°43′47″,东经114°25′12″和北纬35°42′36″,东经114°28′11″和北纬35°42′0″.图像获取时间是2012-03-26 T 11:12:2,此时小麦正处于拔节期.

图1 鹤壁市浚县村庄原始SPOT-5遥感图像

1.2研究方法

本方法对传统的遥感图像分类方法加以改进实现.传统遥感图像分类方法大致可以归类为监督分类、非监督分类、模糊分类及基于面向对象影像分割的分类[13].监督分类可充分利用分类地区的先验知识,预先确定分类的类别,提高分类精度;非监督分类与面向对象的遥感影像分类可以在没有训练数据的情况下进行分类,但需要对其结果进行大量分析及后期处理,需要的运算量较大[13].模糊分类虽然可以处理2种或多种目标物相互交错的情况,但是这种情况在本研究中是几乎不会发生的,并且该方法较监督分类更加复杂.本研究主要针对遥感图像中耕地目标的识别,其识别目标较为单一,并且对于识别目标也有较多的先验知识,加之其作为监测系统的构成部分之一,需要高性能的算法.因此,根据本研究目标的特点,本研究选择监督分类中的方法作为本研究优化识别解译方法的基础方法.

本方法利用最小距离分类算法及最大似然分类算法分步对遥感图像进行处理计算.这里,假设遥感图像是n波段的,用BV表示特定像元亮度值,k,l表示2个不同的波段,那么BVijk就表示在k波段的n行j列的像元值.

由于最小距离法计算量较小,且对于明显属于耕地的像元能够准确分类.因此,将最小距离法作为第一步对遥感图像的处理方法,这样大大减少后续图像的处理运算量.最小距离法需要用户给出每个波段上的训练数据的均值向量(μk).为了进行最小距离分类,需计算每个波段中待定像元BVijk到每个均值向量(μk)的距离[13].假设在波段l和波段k中,点a(32,43)到待分类的均值(34.5,55.5)的欧式距离按公式(1)计算:

(1)

计算结果如下:

如果分类中使用的波段超过了2个,则可以将上面的方法扩展到n维空间.用DAB表示点A,B的欧氏距离,用ai,bi分别表示i波段上A,B点的亮度值.此时,可用公式(2)计算2点间的距离[13]:

(2)

采用公式(2)计算待分类像元距离训练类的距离DAB,设定2个距离阈值参数:Dist1,Dist2.这2个阈值参数是根据以往的分类经验获得.Dist1是识别耕地的最近距离,当计算得到的距离小于它,像元就属于耕地像元.Dist2是识别耕地的最远距离,算得的距离大于它,该像元不可能属于耕地像元.若位于两者之间,则需采用最大似然法做进一步的判断.可以采用公式(3)进行描述:

(3)

式中:P(X)是像元属于目标类别的概率值;G(X)是采用最大似然法计算出的像元属于目标类别的概率值.

最大似然分类算法与最小距离分类算法不同,最大似然法的判别规则是基于概率的,它把每个具有模式测度或特征X的像元划分到很有可能出现特征向量X的目标类中[13].

最大似然法假设每个波段中各类训练数据都呈正态分布.直方图具有2个或多个波峰的单波段训练数据不理想.在这种情况下,各个波峰很有可能来自多个类别,应该作为分离的训练类单独训练和标志.

最大似然法用正态概率密度函数来近似表达训练类数据的分布规律.针对目标类的估计概率函数用方程(4)来计算:

(4)

当感兴趣类的训练数据由多波段遥感数据组成时,可以采用下式(5)计算n维的多元正态密度函数[13]:

(5)

式中,|V|是协方差矩阵的行列式;V-1是协方差矩阵的逆矩阵,(X-M)T是矩阵(X-M)的转置.从训练数据中,可以估算出目标类的均值向量M和协方差矩阵V.

常采用下面的变形公式(6)来简化计算g(X)值:

(6)

该式是由式(5)两边同取自然对数得来,g(X)代替概率密度用来作为分类参量,并略去了对于分类意义不大的系数部分.

该公式计算出概率密度,但最终需要得出像元属于目标类的概率,需要将概率密度转为用以评价像元归属目标类的概率.用w表示待分类数据集,用m=min(g(X|w|)表示待分类数据中概率密度值最小值,那么评价像元归属目标类的概率G(X)计算公式:

(7)

最后,设置一个概率阈值,当高于这个概率值就视为耕地像元;否则,不属于耕地像元.

1.3评价指标

为了考察算法的可靠性及实用性,本试验将提取准确率与计算耗时作为算法好坏的评价指标.(1)提取准确率评价方法 人工处理遥感图像除去其中的非麦田像元,并将该处理过的遥感图像作为处理对照(CK).利用原始遥感图像经过人工识别解译出麦田的分布信息与经过算法识别解译的麦田分布信息进行逐像素对比,计算提取准确率.(2)计算速度评价方法 从遥感图像中提取一部分仅包含耕地信息的遥感图像数据,将这部分图像数据作为训练数据(包含2 888个像元样本),分别使用最小距离算法、最大似然算法及优化算法处理遥感图像,每种方法计算10次,记录每次的计算耗时.将10次计算结果取平均值作为计算耗时.

2 结果与分析

按照提取准确率和计算耗时的方法对最小距离法、最大似然法、优化算法及人工处理方法的结果进行了比较(表1和图2).在分析中,由于最小距离算法与其他2种算法需要的参数类型不同,故使用了经验值63作为提取参数,而其他2种算法均采用了0.5概率阈值作为参数.从表1及图2可以看出,最小距离法与最大似然法在准确率和计算耗时上的表现正好相反:最小距离法,识别准确率较低,但计算耗时较少,而最大似然法在识别准确率上较高,但计算耗时也较多,故引入优化算法.由于优化算法的最后一步引用了最大似然算法,故优化算法的准确率与最大似然算法一致,为95.60%,这2种算法的准确率均优于最小距离法(89.96%).而优化算法在准确率与最大似然法相同,但是在运算耗时上较最大似然法少了45.01%(图4).最小距离法耗时最少(0.58 s),但其准确度也最低,不能满足对识别准确度的要求.最大似然法虽然准确度达到了要求,但其计算速度太慢,不能满足对算法性能的要求.优化算法在识别准确度上与最大似然法一致,既满足了对运算速度的要求,同时也显著提高了运算速度.因此,优化算法具有更好的实用性,在一些要求快速提取农作物分布信息的场合能够取得更好的应用效果.如开发作物长势监测系统,利用优化后的算法后可以显著提高系统的运行性能.

表1 3种算法试验结果

图2 不同方法提取小麦种植分布信息图像

3 结论与讨论

本研究主要针对作物智能诊断系统要先对分析目标实现自动位置识别与范围定位这一目的而进行的.这一需求要求识别算法同时具有较高的准确率与较快的执行速度.前文已经提到,最小距离法与最大似然法均不能完全满足这些需求.其他文献中往往采取一种新的分类识别方法,例如,有学者为了提高分类识别准确度采用面向对象方法[14].该方法突破了传统分类方法以像元为基本分类和处理单元的局限性,以含有更多语义信息的多个相邻像元组成的对象为处理单元,可以实现较高层次的遥感图像分类和目标地物提取.该方法虽然实现了高精度分类的目的,但运算量非常大,对于不以作物分类为主要目的的作物智能诊断系统就过于庞大了,运算耗时也不能满足这类系统的需求.而本研究则通过对已有的分类识别算法加以利用改进,从而形成优化算法.

试验过程中,最小距离法需要反复测试,设定合适的最大距离阈值才会有最好的分类结果,操作较为不便.最大似然法计算耗时最大,是最小距离法的50多倍.优化算法虽然来自最小距离法与最大似然法,但结合了二者的长处,兼具准确率与速度的优势.而结合二者优点的优化算法,耗时介于二者之间,但操作更为简单些,不需要反复测试,一般只需要一个固定的概率参数0.5即可获得较好的结果,计算耗时也比最大似然法小很多.另外,优化算法可以得到一个像元分类的概率值,对于后续的数据处理也有一定的参考意义.可见,优化后的算法在达到相同分类精度的情况下耗时更少且可获得额外的信息,达到了算法优化的目的.其在特定的场景中具有较好的实用价值.如在进行遥感图像分析前,可利用优化算法得到麦田位置分布信息,之后结合利用麦地提取地面反射率等信息进一步分析.

目前的优化算法非常依赖训练数据的准确度,如果训练数据不够准确,则优化算法提取的麦田位置信息的准确度也将大打折扣.可见,训练数据的提取是优化算法能够提供准确识别结果的关键所在.因此,该优化算法更适用于具有较准确训练数据的图像信息提取任务.对于不具有准确训练数据的图像信息提取任务还需要进一步研究.

参考文献:

[1]贾 坤,姚云军,魏香琴,等. 植被覆盖度遥感估算研究进展[J]. 地球科学进展,2013,28(7): 774-782.

[2]王来刚,刘 婷,高 超,等. 基于环境减灾卫星遥感数据的小麦干旱监测研究[J]. 河南农业大学学报,2013,47(4): 465-469.

[3]史泽鹏,马友华,王玉佳,等. 遥感影像土地利用/覆盖分类方法研究进展[J]. 中国农学通报,2012,28(12): 273-278.

[4]林啟锋,蒙祖强,陈秋莲. 结合同义向量聚合和特征多类别的 KNN 分类算法[J]. 计算机科学,2013,40(12): 55-58.

[5]王耀南. 小波神经网络的遥感图像分类[J].中国图象图形学报,1999,4(5): 368-371.

[6]何祺胜,曹春香,塔西甫拉提·特依拜. 基于多源数据的干旱区盐渍地信息提取[J]. 遥感技术与应用,2010,25(2): 209-215.

[7]程昌秀,严泰来,朱德海,等. GIS与RS集成的高分辨率遥感影像分类技术在地类识别中的应用[J]. 中国农业大学学报,2001,6(3): 50-54.

[8]MURAI H,OMARTU S. Remote sensing image analysis using a neural network and knowledge based processing [J]. International Journal of Remote Sensing,1997,18(4): 811-828.

[9]赵 萍,傅云飞,郑刘根,等. 基于分类回归树分析的遥感影像土地利用/覆被分类研究[J]. 遥感学报,2005,9(6): 708-716.

[10]李石华,王金亮,毕 艳,等. 遥感图像分类方法研究综述[J]. 国土资源遥感,2005(2): 1-6.

[11]刘咏梅,杨勤科,温仲明. 地形复杂地区遥感图像分类方法应用研究——以黄土丘陵沟壑地区坡耕地遥感调查为例[J]. 水土保持通报,2003,23(4): 30-33.

[12]仇江啸,王效科. 基于高分辨率遥感影像的面向对象城市土地覆被分类比较研究[J]. 遥感技术与应用,2010,25(5): 653-661.

[13]JOHN R. 遥感数字影像处理导论[M]. 北京: 机械工业出版社,2007: 325-384.

[14]曹 宝,秦其明,马海建,等. 面向对象方法在SPOT-5遥感图像分类中的应用——以北京市海淀区为例[J]. 地理与地理信息科学,2006,22(2): 46-49; 54.

猜你喜欢
准确率距离分类
分类算一算
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
分类讨论求坐标
算距离
高速公路车牌识别标识站准确率验证法
数据分析中的分类讨论
教你一招:数的分类
每次失败都会距离成功更近一步