许凯,周峻松,杨帆
(1.云南师范大学 旅游与地理科学学院,云南 昆明 650500; 2.云南省基础地理信息中心,云南 昆明 650034)
地理国情监测变化信息数据是基于地理国情监测矢量成果提取的空间地理数据,通过分析其变化量、变化频率、变化趋势等,充分发掘变化信息数据中丰富的地理信息和社会信息,获取反映各类资源、环境、生态、经济要素的空间分布及发展变化规律的分析数据,是实现国情监测数据高效应用、辅助综合决策和数据库动态更新的重要手段。
地表的变化监测与变化提取是学者研究的热点,但相关研究主要集中在遥感影像变化提取上,容易受到影像分辨率、浮云和波段色彩的影响。地理国情变化信息数据是以经过实地调查验证的矢量数据为基础,通过可视化方法表达和处理的成果,能准确概括地物实体最真实的变化情况,同时还包含了人文社会属性,数据有较高的可应用性。在基于矢量数据的提取中,作业人员须与数据频繁交互,要求数据问题能快速反馈至提取过程并优化技术方法;然而,受提取方法和本底数据质量的限制,目前能广泛应用到生产实践中的技术和成果还比较少。在提取变化数据的同时开展质量控制是一种保证数据质量的技术方法,它能将质量问题消除在提取过程当中,是贯穿整个提取过程的核心工作[1]。
笔者结合近年来在地理国情监测和地理信息数据处理工作中的经验,对省级地理国情监测地表覆盖变化数据和地理国情要素变化信息提取技术方法和质量控制模式进行探讨,提出基于空间位置和统计分析的变化信息提取方法,并以昆明市呈贡区为实验区进行验证,希望为今后更好地应用基础性地理国情监测数据提供参考。
地理国情监测变化信息数据是在2期监测矢量数据所反映的地表状况比较之下发现变化,并辅以专题资料和行业资料,按照采集要求获取的相关地理信息数据,主要分为地表覆盖变化数据和地理国情要素变化数据。地表覆盖变化数据反映种植土地、林草覆盖、房屋建筑(区)、铁路与道路、构筑物、人工堆掘地、荒漠与裸露地表和水域8大类地表覆盖的类别、位置、范围等的变化情况;国情要素变化数据反映道路、构筑物、地理单元和水域4大类要素位置、属性的变化情况[2]。较地表覆盖数据而言,国情要素数据的数据量更小、提取时间较短,但它图层多,变化类型多,提取时须按多个实体类依次进行提取,对地理信息提取的正确识别有更严格的要求。
决策正确与否与一个国家、民族的前途、命运休戚相关。地理国情监测变化信息数据可支撑区位条件、土地资源、水文状况、基础设施状况等方面的地表变化情况分析,提出问题并帮助解决问题,为制定科学的发展规划提供可靠的信息支持,为政府提升综合决策水平提供客观依据。近年来,资源环境恶化、土地利用不平衡等问题愈发严重,地理国情监测变化信息数据在生态环境变化监测、城镇发展变化监测等专题监测中也发挥起越来越重要的作用。
地表覆盖数据主要提取4类变化类型:1)原有图斑在边缘处发生的此消彼长的“空间变化”;2)在原有图斑内新产生的与周围类型完全不一样的图斑的“新增变化”;3)原有图斑在变化区域内灭失的“灭失变化”;4)原有图斑空间位置不变,但属性发生变化的“属性变化”。
国情要素数据提取3类变化类型:1)原有地理要素分布范围和位置发生变化的“位置变化”;2)要素发生新增、灭失、部分改变的“新增、删除变化”;3)空间位置不变,但其他属性发生了变化的“属性变化”。其中,新增、删除和位置变化都属于空间变化。
提取方法分为人工提取、人机交互提取和自动提取。在自动提取的基础上,可按照空间变化和属性变化规则针对变化不明显的目标进行人工识别提取。由于数据还存在社会属性,因此在划定变化区和识别变化要素时须辅以叠加影像、行业资料等参考数据。
2.2.1 数据收集与整合
选取3 a内时相合适、指导规范相同、数据质量高的数据与资料,整合保留有效图层。如2015—2017年基础性地理国情监测成果、专题地理国情监测数据、基础地理信息更新成果、行业资料等。
2.2.2 变化信息识别提取
地理国情监测数据都具有空间属性,利用空间分析、统计分析、叠加分析和拓扑分析对2期数据进行对比,识别出图斑(要素)的变化部分并确立变化区,依次从属性变化、空间变化、空间和属性同时变化3方面进行变化提取。
1)属性变化。若是非点要素,则先将其转为点作为连接要素,利用点与点、点与线、点与面的空间连接和拓扑检查将连接要素和目标图层匹配,确定2期数据图斑、要素之间的空间位置对应关系,提取出空间位置相对应的图斑(要素),再利用字段计算器对属性字段进行对比,识别并提取出属性内容发生变化的图斑(要素)。
2)空间变化。利用点与面的空间连接,分别提取前后2 a数据中空间位置未匹配的图斑(要素),经过拓扑检查初步确定空间位置发生新增、灭失、位移的图斑(要素),再依次分析相同特征属性字段图斑(要素)的分布和变化情况。
3)属性和空间同时变化。识别既发生属性变化又发生空间变化的图斑(要素),再结合2 a的本底数据进行人工目视解译,提取出属性和空间都发生变化的图斑(要素)。
2.2.3 变化信息筛查整合
将变化识别提取出的要素与2期本底数据叠加,再辅以行业资料和高分影像数据,用特征属性字段汇总分析的方法逐层对变化图斑和要素进行关联筛查。通常,一个属性字段无法关联所有要素,还须使用其他唯一特征属性字段来关联未关联的要素。人工目视排查出提取错误的关联要素并改正分类,将变化图斑(要素)统一为第1年属性在后1年之前的属性格式,最终在ArcMap中整合为4类变化数据层,即属性变化层、空间变化层(新增和灭失)、位置变化层和空间属性变化层。
2.2.4 质量检查
质量检查是质量控制中的重要步骤,也是提取过程中必不可少的一步。采用人工与软件结合的方式对变化数据的属性正确性、格式规范性和数据完整性进行检查,查出问题后及时修正,并反馈到变化信息识别步骤,改进提取方案后重新提取(图1)。
图1 基础性地理国情监测变化信息提取流程
2.3.1 基于空间位置的变化识别
地理国情监测数据存在拓扑关联和属性关联两种复杂的关联,一个图斑要素变化时往往联动2个以上的要素,并伴随属性的变化[3],若提取时无法准确获取要素之间的关联,则易出现大面积提取错误。基于空间上有关联的图斑(要素)的空间连接和统计分析,可以精确定位发生变化的图斑。提取时,基于代表中心建立2期要素点图层的空间连接,通过空间叠置分析判断图斑、要素的对应关系并提取变化区,之后用与变化区对应的图斑(要素)数据进行编辑、修改、删除,准确定位到发生联动的要素,并将其提取出。
2.3.2 结合特征属性的变化信息筛选
地理国情监测数据严格按照规范采集并经过外业调查,不同期同一要素层具有相同的数据结构、属性字段。基于GIS技术结合统计分析的方法,准确、直观地分析2个图斑(要素)之间的联系,从而精确筛选变化信息。提取时,以要素的多个特征属性字段为基础依次进行汇总分析,直到所有要素匹配上为止,再判断要素的变化类型。这样就能得到要素间属性存在的关系,再结合空间位置的关联判断变化类型,筛选错误分类,实现数据真实变化情况的追溯。
云南省昆明市呈贡区位于滇东高原腹地,滇池东岸,全区面积510 km2,随着呈贡大学城的建设和蔬菜、花卉产业的发展,呈贡区城镇化水平不断提高,社会经济发展迅速,地表变化明显,数据库更新要求高[4]。实验数据为呈贡区2015—2017年3期的高分影像和地理国情监测数据,具体图层包括构筑物(V_SFCP)、城镇功能综合单元(V_BUCP)、公路(V_LRDL)、水网(V_HYDL)、地表覆盖分类(V_LCRA)等,数据采集时点分别为2015年6月、2016年6月和2017年6月。辅助参考数据有昆明市主城区及滇池流域监测等项目成果数据、云南省基础地理信息数据更新项目数据、《云南省主体功能区规划》(2012—2020年)等。
3.2.1 变化信息识别
利用空间位置结合属性字段的方法依次对2015—2016年和2016—2017年的实验数据进行初步提取。以2015—2016年为例:空间位置连接上的点所对应的图斑(要素)提取为“图层名称_SXBH”,添加“变化类型”字段并填写“属性变化”,再用字段计算器更新属性字段,判断具体属性变化(表1、图2)。提取空间位置未连接上的要素,合并为“空间变化”,包括新增、灭失和位移。识别时,2015年要素转点并连接2016年相应的目标要素,提取2016年多出的部分,即为“2016年新增”;2016年要素转点并连接2015年相应目标,提取2016年删除部分,即为“2016年灭失”。以此类推。
表1 属性字段计算变化项
3.2.2 变化信息整合
经过初步提取后,准确定位特征属性进行汇总分析,结合实体变化规律再次判断、提取和整合。如对于“2017年新增”的实体,有可能是新增要素,也有可能是位置或形状发生较大变化的伸缩型变化要素,对于“2017年灭失”的实体,有可能是灭失要素;也有可能是空间位置发生变化的要素:所以,“空间变化”的要素须结合空间位置判断NAME、FEATID、EC等特征字段相同的记录,提取位置发生变化的“位置变化”。最后,将所有变化图层的属性整合为“前一年属性+后一年属性”的格式,方便后期对比分析(图3)。
变化图斑提取准确度为正确提取变化图斑数与发生变化图斑总数之比,是反映提取效果的重要参数。2015—2016年地表覆盖变化信息平均提取精度为99.5%,国情要素变化信息平均提取精度为94.9%(表2);2016—2017年地表覆盖变化信息平均提取精度为99.8%,国情要素变化信息平均提取精度为96.4%(表3)。可以看出,2016—2017年变化速率加快,变化图斑增加明显。结合影像和辅助资料分析,相应图层的变化情况符合客观实体变化规律,证实了实验所采用的方法对地理国情监测变化信息提取没有明显遗漏,变化要素提取准确率达96%以上,可以在基层数据生产中广泛使用。
图2 2015—2016年地表覆盖变化信息提取结果
图3 变化要素信息提取结果
表2 2015—2016年变化信息提取结果统计
表3 2016—2017年变化信息提取结果统计
变化信息数据的质量指在实体空间位置、特征和时间的表达所能达到的准确性、一致性、完整性,三者统一的程度,以及数据后期参与应用的能力[2]。变化数据质量控制分为过程质量控制和成果质量检查,贯穿提取全程,在消除质量问题的同时反馈并优化提取技术方法(图4)。
图4 质量控制贯穿提取全程
1)对软、硬件进行调试,检查提取人员组织、专业技术准备情况。检查本底数据正确性及收集的专题地理信息成果和相关行业资料的完整性、合法性、权威性、现势性、可靠性。
2)检查辅助数据处理整合、变化信息识别提取等环节的规范性。结合本底数据、监测期影像等检查变化区域提取数据的正确性、更新充分性,以及与本底数据的拓扑一致性。
3)抽查提取过程中主要技术标准的实施情况。检查提取内容及记录的完整性、质量问题的修改与复查情况等。检查初期成果数据内容的完整性和数据组织、数据格式、数据属性等,并选取实验区验证提取精度和正确性。
4)检查提取成果的数据时点、数据完整性、属性正确性、逻辑一致性、图形质量、附件质量等项的正确性,出现问题及时修正、记录。
总结提取过程中遇到的主要问题,结合相关规范、设计,深入分析提取过程,探讨问题产生的主要原因。
4.2.1 要素对应关系问题
进行空间连接后,存在少部分没有发生空间位置变化的图斑(要素)被识别并提取为变化图斑(要素)的情况。如V_LCRA层中,A图斑2015年到2016年空间位置未发生变化,因节点数不同而被提取为变化图斑。分析其原因,有要素空间节点存在差异、不同年份的数据存在采集规范不同等,反映出地理国情监测数据采集指标及数据规定要求的复杂性。针对这一问题,应加强本底数据整合选取,在提取时加上属性的关联辅助识别,确保图斑和要素关联的正确性。
4.2.2 属性伪变化问题
表现为属性变化层中,因为某些属性字段的描述差异,从而提取出空间位置和属性含义均相同的图斑(要素),但实质上属性是未发生变化的。如在相同空间位置,“NAME”字段中的2016年“A镇完全小学”与2017年“A镇完小”存在差异,而被提取成属性变化。这反映出本底数据技术标准认识与理解存在问题,分析原因是本底数据采集时作业人员规范不统一或数据整合时没有完全整合等。数据准备时要选择质量高的、可靠性高的数据,提取时遇到类似情况应先参照影像、参考资料判断是否为同一实体,再判断变化类别。
4.2.3 属性字段正确性问题
主要有提取结果属性表结构错误或内容不完整的情况,如变化图层中属性表中2 a属性信息排序有误,有的甚至还缺少上一年的属性字段信息,缺乏对比性。如“2016—2017位置变化”层中不应存在2016年的要素,但需含有2016年的属性。分析原因是作业人员对变化信息提取规则把握不好,提取不够细致。针对这一问题,应加强整理筛选批处理过程中代码细节的细化。作业人员也应增强技术标准的理解和执行,准确提取变化信息。
地理国情信息数据含有丰富的关联关系,可用于实现实体的有效连接,为变化信息提取和应用提供基础。在处理数据的同时建立质量控制体系,是保障数据质量的前提[5-6]。针对地理国情监测工作中变化信息无法被广泛、准确提取的问题,制定了以空间位置定位和特征属性字段分析相结合的提取模式,并加强了质量控制。提取和控制实验结果表明,此方法能广泛地适应基层地理信息工作,克服
了传统提取“一站到底”的模式,在提取过程中既优化了方法,又保证了提取精度和数据质量,能为各省市的地理国情监测数据应用提供参考。如何保证变化信息提取成果的准确度,如何在生产实践中快速地、最大限度地高效应用这些研究成果等,都需要进一步尝试和实践。下一步笔者会继续完善实验,改进技术方法,以期实现能应用在生产中的半自动化甚至算法自动化提取方法。