陈佳 来平军 陈适 成晓英 杨红艳
(1.自然资源部第一地理信息制图院,陕西 西安 710054;2.自然资源部第一地形测量队,陕西 西安 710054)
随着“一带一路”、“走出去”、可持续发展、创新驱动发展等国家重大战略的推进,我国对全球范围内多尺度地理数据产品和覆盖全球的高精度自主位置服务的需求日益迫切[1]。根据地理国情监测项目生产经验,由于高空间分辨率遥感影像自身存在的高度细节化、数据量大、类内差异大等原因,影像自动解译的难度增加,通过易康等自动分类软件处理后的边界及属性错分较多,修改工作量大,难以满足生产要求。同时,目前大多数有关地类采集和变化发现项目,还是以全人工方式进行,因此,开展自动化或半自动化地表覆盖生产工艺的研究显得尤为重要。
当前,以深度学习为代表的机器学习是最接近人类大脑的智能学习方法和认知过程,通过多分层结构、神经元的连接交互,分布式稀疏存储和表征,信息的逐层分析处理机制,自适应、自学习的强大并行信息处理能力,在图像识别等领域取得了突破性进展。近年来,高校和科研单位在引入机器学习方法解决自动分类问题上进行了大量研究,取得了丰富的科研成果,其中武汉汉达瑞科技有限责任公司开发的EasyFeature 软件作为一款人机交互式智能采集和更新软件,把先进的计算机图像处理算法和作业员对影像的判读经验充分结合起来,通过必要的人工干预,实现对遥感影像特征进行快速可靠的解译提取。
对于地表覆盖分类信息的提取,不同的遥感影像的解译方法,提取效率不同,地表覆盖分类信息提取的精度也大相径庭[2]。本试验在深入分析10 米地表覆盖项目的前提下,采用人工目视判读和EasyFeature软件半自动提取模块进行地物分类,对分类结果进行对比分析,评估软件功能的准确度和效率,为项目生产提供技术支撑,进一步确定更高效的生产方式,为后期地表覆盖类项目数据生产提供必要的技术服务。
本次试验综合地形、地物等因素,选取全球项目10 米地表覆盖子项目中的越南宁平省1∶50000 标准分幅大小的面积进行试验。试验所使用的影像为融合后影像。
试验区域影像为ZY3 影像,空间分辨率为2 米,影像质量较好,无云雪覆盖,影像地形特征为山地+平原,同时具有城市、城镇和自然环境,要素覆盖种类较全。具体信息如表1 所示,试验区影像如图1 所示。
表1 试验样区ZY3影像分析
图1 试验区ZY3影像
本次试验主要采用人工目视解译和半自动解译的方法进行,试验软件主要有Arcgis10.2 以及EasyFeature 软件。
EasyFeature 软件的半自动提取模块可以准确快速地从遥感影像上采集地理空间数据,适用于从航空、航天或地面遥感影像中提取特征信息的各种应用,其特点是利用作业员在影像上绘制的少量点、线信息作为采样信息,应用基于人工智能的遥感影像处理与解译技术,快速自动地提取目标地物,包括各类图斑、地块、水域、房屋和道路。该软件充分结合了作业员的目标识别能力和计算机的快速计算能力,保证识别结果可靠性的同时,大大减少特征提取时间,有效提高了采集效率,降低了劳动强度。
目视解译是遥感影像解译的一种,是通过综合多种非遥感数据的资源信息,利用专业人士的技术和知识进行对照和分析,判断解译提取遥感影像信息,效率和灵活性较差,受人为因素影响通用性差[3]。本次试验解译人员为生产中经验丰富的作业人员。
与传统的人工目视解译、全自动地物提取方法相比,半自动信息提取方法既充分利用人的认知、识别、检测能力,提高了识别的准确性,又发挥了计算机强大的运算能力,在目前的生产应用中被广泛推广。
本次试验采用EasyFeature 软件中的半自动提取功能进行地表覆盖信息的提取。作业人员利用该软件的矢量采集工具在影像上绘制提供少量点、线等样本信息,在计算机的快速处理下反馈目标地物图斑,该过程充分利用作业人员的判读经验和计算机处理优势,提高数据生产效率[4]。整体流程如图2 所示。
图2 EasyFeature软件中半自动提取流程
10 米地表覆盖数据包括10 个一级类和21 个二级类,一级类包括耕地、林地、灌木地、草地、人造地表、荒漠与裸露地表、水域、冰川与常年积雪、湿地、苔原。其中,荒漠与裸露地表、湿地的采集指标为50000 平方米;耕地、人造地表、水域的采集指标为10000 平方米;其余地类的采集指标均为25000 平方米。具体定义如表2 所示。
表2 地表覆盖数据分类系统定义
解译结果的分析指标有如下三个:
(1)图斑总量:依据全球测图分类体系和技术指标规定,样区内包含的图斑总量,由人工解译获取。
(2)提取图斑数量:利用EasyFeature 软件提取的图斑数量,该指标与图斑总量的比例,表示软件为全球测图项目地表覆盖提取提供服务的程度,比例越大服务程度越高。
(3)效益指标:为了体现EasyFeature 软件提取的图斑中人工边界修改的工作量,利用图斑成果边界修改程度表示,分为提取正确、较少修改、大量修改三项,按每条边界进行统计。
使用最新版本的EasyFeature 软件开展地表覆盖提取试验,提取方法为软件辅助下的人工半自动解译,提取类别包括耕地、林地、草地、人造地表等类别,利用提取成果开展对比试验并进行统计,统计指标包括图斑总量、提取图斑数量。主要步骤如下:
(1)参考遥感影像,利用EasyFeature 软件的半自动辅助提取功能与人工干预相结合的方式进行地表覆盖信息提取,获取地表覆盖结果(软件结果)。
(2)参考遥感影像,利用人工目视解译方式进行地表覆盖信息提取,获取地表覆盖结果(参考结果)。
(3)将地表覆盖信息提取的软件结果和参考结果进行对比,计算分析指标,分析指标包括图斑总量、提取图斑数量、效益指标三项。
根据各阶段的生产试验统计结果,从稳定性、实用性、功能性及效率等方面对EasyFeature 软件进行评价,形成生产试验报告。
以项目开展常用的操作系统windows XP 和windows7 为基础,完成软件安装,测试软件兼容性,试验过程中通过对软件输入、输出、处理、编辑等功能的使用,发现测试软件均能稳定运行。
实用性测试包含两个内容:数据编辑模块和软件上手难易程度。数据编辑模块的测试针对数据采集对功能的需求开展,如针对清晰影像的边缘吸附功能、房屋采集的直角功能、初分边界不准确需要修改的面拓展/消减借边修绘功能等,数据编辑模块评价如表3 所示;软件上手难易程度的测试主要针对地表覆盖表数据采集人员学习软件的时间成本进行评估,软件学习难度评价如表4 所示,表中的1d(1 天)按照工作制8 小时为单位进行统计。
表3 数据编辑模块评价
表4 软件学习难度评价
试验区域地表覆盖提取分析结果如表5 和表6 所示,表中的1d(1 天)按照工作制8 小时为单位进行统计,试验区没有的地物类别不进行统计。
表5 软件功能评价
表6 地表覆盖提取效率评价指标
通过对综合评价表及地物提取结果分析得出,EasyFeature 软件半自动提取模块对水系、道路、突出房屋、林地、灌木地等要素矢量采集结果较好,但对单栋房屋、街区及植被等纹理复杂、色彩偏差较大的地物要素采集精度较差。具体类别总结及建议如下:
(1)水域:水域采集结果准确,少量修改的图斑占总图斑的90%,此地类可以用半自动提取分类采集。
(2)人造地表:人造地表中采集比较多的主要有道路和房屋建筑区。软件中道路采集是采集道路中心线,实时根据道路宽度进行缓冲采集道路边线,道路采集结果准确率为100%,对于道路较多的区域,此软件完全适用。
(3)林地和灌木地:此软件对于此类植被指数特征高的地类,提取效果较好,可以用此软件提取,然后进行少量的人工修改。
(4)耕地:对于比较规整的旱地,此软件提取结果较准确;对于形状较复杂的耕地,在软件提取结果上需要少量的人工修改。
通过此次试验,得出了某几类地物在EasyFeature软件中进行半自动提取结果符合项目精度要求,修改量较少,对项目生产质量和效率有一定的促进作用。在后期类似的地表覆盖图斑提取项目中,可考虑采用此软件进行生产来提高生产效率。