于基业,张新利,李 珊
(1.长安大学地质工程与测绘学院,陕西西安710054;2.国家测绘地理信息局第一航测遥感院,陕西西安710054)
遥感对地观测具有快速、覆盖范围广、周期性等特点,成为最重要的地理国情监测数据获取手段[1]。监督分类是遥感分类的重要方法,是模式识别技术在遥感技术领域的具体应用[2-3],过程主要包括影像预处理、分类判别和分类后处理三大步骤[4-5],其核心在于模式(样本)的选取,样本的选择受作业人员对待分类目标的认知程度、目视判读倾向性和影像上像素值及像素分布等多重因素影响。对于大范围地表数据的提取,其分类结果受当地的地形、气候等条件的影响,精度不高[6],一般采用裁切影像、单景影像分类的方法。在具体工程中,为实现多景影像接边,一般是在影像重叠区选择若干成对样本点。但该方法具有以下局限性:当多景影像在重叠位置的像素差距较大时,难以为相邻景影像选择成对的样本点;当影像裁剪不规则,需要与周围多景影像进行接边时,重叠区样本位置的确定具有盲目性;工作流程繁琐,不利于管理,为保证接边一致性可能导致多次样本选取及重分类工作;在重叠区域选取的样本只能被单幅影像使用,利用率不高。
本文基于“多景影像重叠区域的像素代表的必是同一类地物”的思想对传统方法进行扩展,使影像公用边的样本只采集一次,利用接边样本数据库的管理手段,使这些公共的样本点为多幅相邻影像共用,其优点是:对于重叠部分像素差异大的多景影像,只在其中一景影像处找到典型的、可以明确判断地物类型的区域,建立样本,其他与之相接的影像只需拷贝这些样本即可,这样不仅降低了样本选取的难度,并且提高了样本选择的精度;对于几何边界复杂,与多景影像接边的情况,这种样本的建立方式提高了样本的重用性,降低了样本采集的工作量;利用采样样本数据库,有利于重叠区域的样本管理,满足数据工程的管理要求。
影像样本重用的依据是:多景影像重叠区域所表示的地物对于每一景影像是一致的,具有相同的波谱特征;在统一的坐标参考下,若某些样本的坐标包含在若干景影像的坐标范围内,则这些样本是这些影像的公共样本。如式(1)所示,其中p代表样本点,A、B、C 代表影像。
如图1所示,图中的灰色区域是影像A与影像C的重叠区域,该区域中所有的像素表示的地物在影像A与C中是一致的;对于样本p,有p∈A,p∈B,因此,p点是影像A和B的共用样本;对于样本q,有 q∈A,q∈B,q∈C,因此,q 点是影像 A、B 和C的共用样本。
基于此,可以扩展传统的接边采样办法,即在多景影像的公共坐标位置,为每一景影像建立一类地物的样本。
图1 样本重用原理示意图
本文以ENVI软件为工具进行研究,在ENVI中,传统监督分类作业流程是:根据影像的像素判断地物类型,建立样本文件(region of interest,ROI),为了促进多景影像接边,需要打开一景或多景相邻影像(接边规则通常是沿着一个方向的,例如,接边方向是西北接东南,只需打开东南方向的相邻影像即可),建立地理关联(geographic link),在影像重叠的位置,结合相邻影像的影像情况或已分类的结果情况,为待分类影像建立样本文件,最后执行监督分类。
多景影像样本重用分类方法的流程如图2所示。
图2 多景影像样本重用分类流程图
首先将待分类的影像图号信息输入影像信息库,获得该影像的外轮廓SHP文件,遍历样本数据库中的所有样本点,判断这些点是否在待分类影像范围内,将存在于该范围的样本点作为结果,输出成ENVI指定的 ASCII格式,利用 ENVI的“Input Points from ASCll”功能导入样本点,以此为基础,在影像的其他区域进行采样。最后将最终的采样结果导出ASCII文件,再次存入到样本数据库。
核心技术主要包括接边ROI的获取、接边样本数据库的建立、影像信息库的建立等。
在ENVI中,ROI可以在ROI Tool中导出ASCII码,用TXT文档打开这个文件,其文件结果如图3所示。
图3 ENVI中ROI的ASCII文件格式
图3中,以“;”起始的信息是说明信息,分别标识了ENVI产品版本、分类总数、文件像素的范围;空一行依次是ROI分类的名称、RGB值、该分类中选取的样本总像素个数,同样以空行区分每一个分类的信息;以“;ID”为起始的数据部分就是各个分类中的具体像素信息,其中X、Y表示该像素的像素坐标,MapX、MapY代表经过变换后的坐标,Lat、Lon代表经纬度,B1—B6代表各个波段值,同样,不同类别的样本通过空行的方法进行区分。
根据样本重用的原理,能被公用的样本应在各张影像上具有相同的坐标,唯一不同的是像素坐标和波段值,这意味着如果影像A和影像B的范围包含样本点像素p的坐标,p是来自影像A的样本,只需要将像素点p的像素坐标进行平移变换到B相应的像素上即可,p导入到B中以后会自动获取B影像该像素位置的波段值,作为以后分类的基础。
建立公共接边处的样本数据库,一方面将这些可能会重用的ROI文件管理起来;另一方面加快影像获得所需ROI数据的速度,提高数据的使用效率,这一点与空间数据工程的要求是一致的[7]。接边样本数据库设计见表1。
表1 接边数据库字段设计
在数据库检索过程中,输入影像的范围信息,查找包含在该影像范围内的点,获得属于该影像的像素信息;再按照“Class”的类型生成ENVI ROI文本的规定格式,即可作为该影像的分类样本并参与之后的分类。
在对影像进行裁剪等相关操作时,一般使用ArcGIS制作影像的外轮廓SHP文件,这些SHP文件与影像的实际范围是一致的,将这些影像SHP文件进行统一存储,以影像景号作为SHP文件检索的主码,并作为判别公共样本点的依据。
土地覆盖变化研究是全球环境变化研究的重要组成部分[8-10],本试验是对某区域植被信息提取,采用监督分类。在分类的样本选择过程中,应用传统方式和多景影像样本重用方法进行对比试验,对其接边情况进行对比分析。
试验数据采用某区域的TM影像,空间分辨率为30 m。经过大气校正、几何校正、裁剪等处理,相邻影像之间具有几十像素的重叠区域。
参考数据:USGS 2001全球地表覆盖成果,Google Earth影像。辅助数据:SHP格式的掩膜文件,包括耕地、人造覆盖、水体和冰川等。软件环境:ENVI 4.7 ,ArcGIS 9.3。
1)数据准备:对影像进行批量像素值值域转换,并进行水系、人造覆盖批量掩膜,得到待分类的影像数据。
2)监督分类:监督分类的样本采集过程采用对比试验的方法。第一种是传统的接边样本选取方法,即在影像的重叠区域选取成对的样本点,作为控制组;第二种方法采用多景影像样本重用的方法进行采样。在非重叠区域,两种方式的影像采样点保持一致,每一类3型样本点数量为40左右。样本选取完毕后,用SVM方法进行分类。
3)分类后处理:滤波像元大小设定为5像素×5像素,处理后,对比两种样本选择方式的处理结果。
以两幅相邻的像素值差异较大的影像为例,将原始影像(掩膜后)和分类后的成果在ArcMap中打开,结果如图4所示。
图4 两种采样方式分类结果对比
图4中,(a)为两张原始影像,其接边处像素颜色差异较大(如(b)所示),(c)为控制组采样方法的分类结果,(d)是采用多景影像样本重用方法的分类结果。从图4中可以看出,采用样本重用方法的接边效果优于传统方法。导致这种结果的原因是对于颜色差异较大的影像,很难在颜色复杂的影像上找到确定的地物样本;而样本重用的方法可以将已知的确定的样本复制到接边影像,这有利于促进影像接边的一致性,同时减少了样本的采集量。
本文针对传统监督分类影像重叠区域接边存在的问题,优化、改进了重叠区域的样本选取策略和作业流程,提出了“多景影像监督分类的样本重用”方法,利用样本库对重用的样本进行管理。实际分类结果证明这一方案可行,有利于保证多张影像的接边一致性和正确性;同时,对于大区域、多人参与的分类工作,该方法提供的接边样本降低了采样工作量,对于应用监督分类进行地理国情监测、大区域地表覆盖研究等大型项目的效率提高具有重要意义。
[1]李德仁,眭海刚,单杰.论地理国情监测的技术支撑[J].武汉大学学报:信息科学版,2012,37(5):505-512.
[2]王圆圆,李京.遥感影像土地利用/覆盖分类方法研究综述[J].遥感信息,2004(1):53-59.
[3]刘仁钊,廖文峰.遥感图像分类应用研究综述[J].地理空间信息,2005,3(5):11-13.
[4]张银辉,赵庚星.土地利用/土地覆盖遥感分类方法的研究综述[J].中国农业资源与区划,2002,23(3):21-25.
[5]蒋艳凰.遥感图像高精度并行监督分类技术研究[D].长沙:国防科技大学,2004.
[6]郭艳芬,刘志红,谢明元.基于知识与监督分类的青南高原植被信息提取[C]∥中国气象学会.北京:[s.n.],2008:277-282.
[7]刘瑜,张毅,邬伦.空间数据工程理论框架研究[J].地理与地理信息科学,2003,19(1):12-15.
[8]王素敏,翟辉琴.遥感技术在我国土地利用/覆盖变化中的应用[J].地理空间信息,2004,2(2):31-32.
[9]杨立君,马明栋,唐立军.基于TM影像的崇明东滩湿地植被分类研究[J].水土保持研究,2013,20(1):126-130.
[10]乔朝飞.国外地理国情监测概况与启示[J].测绘通报,2011(11):81-83.