闫钟月,支瑞荣,葛超英,马泽斌,李远华
(1.吉林大学 地球探测科学与技术学院,吉林 长春130026;2.河北省水文工程地质勘查院,河北 石家庄050021)
在进行生态环境评价和空间要素分析时,为评价单元、统计区域获取参数是必不可少的工作。例如,在对草地资源进行评价时,需要把评价单元内各图斑的数据信息计算后存入评价单元。其中,要解决的关键问题就是参数获取和模型的灵活运算[1-2]。
生态环境评价工作一般采用“小流域范围、行政区范围、评价网格、对象图斑、栅格像元”等作为评价单元[3-6]。其中网格是较为常用的一种评价单元,以构建过程简便快捷为特点。这一方式所需的数据参数可由栅格方法和矢量方法得到。针对栅格数据的处理方法,即将所有数据转成栅格格式再进行操作。这一方法虽然操作简单,但由于单个像素难以表达与结构有关的信息,所以需要对数据进行特殊处理才可参与模型运算。除此以外,矢量在转栅格时,还可能造成信息丢失的现象。如果采用矢量网格为评价单元,存在的问题则包括:(1)当矢量数据取值采取空间分析方式,一个单元格内会包含多个同一地物信息。采用人工方式导出表格进行分类汇总,再通过矢量数据与表格数据字段方式连回的操作是十分复杂的;(2)评价单元取栅格值时,单元格可以轻松获取对应的栅格值,但实际意义并不明显。想要获取评价单元内评价对象(如草地)的高程、坡度、NPP、NDVI等参数的平均值更为复杂,人工操作步骤更为繁琐;(3)模型运算中的数据往往由多个图层或多个指标组成,数据量庞大,如果出现错误则需要从第一步重新计算,这一工作风险需要被重视。
针对矢量数据相交或判别分析后,可能会出现一个单元内存在多个同类对象需要被统计的问题,可以通过数据库Group分类查询的方式解决,即在程序统计后循环连接回单元格;同理,栅格与矢量数据(与评价单元判断后的矢量数据)经过空间统计后,需要分类取加和或平均值,可以利用数据库的Avg与Sum统计函数联合Group分类查询解决这类问题。因此,本文采用C#+OLEDB数据库连接shapefile数据的方式,通过Sum、Avg等函数实现任意单元格的统计与分析,然后通过字段连接方式,将经过计算后的参数加入到评价单元格数据中,从而实现评价参数的快速、准确获取,最后构建数据库式评价模型管理方法,使得评价模型与评价数据实时连动,从而实现高效的模型运算。并在“河北省张承地区生态资源调查及指标体系研究”项目的支持下,在河北省张北县地区开展了实践,应用效果良好。
准备好所需的栅格数据及矢量数据后,首先依据评价方案划定适当大小的单元网格,将矢量数据与其作判别分析后,获取各图斑所属单元格的编码,并计算评价参数数据,结合数据库技术进行字段统计,利用循环算法,通过唯一单元格编码将结果返回评价单元;矢量数据处理完成后,与栅格数据进行区域统计得到新的数据集,通过汇总、取均值等方式获取计算后的栅格参数,借助数据库技术将数据集信息连回评价单元;最后从参数数据库中实时调用计算模型,当参数发生变化时可以实现动态计算和更新,从而得到空间分析成果,为进一步的制图与评价奠定基础(图1)。
图1 技术流程图
常用的评价单元有行政区、流域范围、评价对象图元等,评价网格也同样在各类评价工作中被广泛使用。评价网格是按照一定的纵横间距构建评价单元格,例如ArcGIS的FishNet工具。由于实验区(张北县)范围较小,按乡镇行政区界划分评价单元较不方便,且代表性较低,因此不适合采用这类评价单元;受地理、地貌、地质格局影响,区域内的小流域范围表现为中大边小,且不成规模,因此也不适用此种评价单元;研究区内的草地资源往往大面积分布且多为长条型,以对象图斑作为最基本的评价单元,高程、坡度、坡向、NPP、NDVI等像素级数据取值将不具代表性;而如果采用栅格像元开展像素级评价,作为生态评价重要的各类结构参数不能直接使用,会对评价效率和评价效果造成较大影响。因此,本次研究综合考虑效率、结构性指标采集、空间规律展布等因素,选择采用500m×500m的评价单元格开展生态资源各项评估工作(图2)。
图2 实验区500m×500m评价单元格
首先,生成500m×500m评价单元格,新建“网格编码”字段,按自然增量方法为每个单元格指定唯一编码。然后,将草地资源亚类数据与评价网格作相交分析,获取到每个图斑对应的网格编号,将此矢量数据文件记为Vi。通过编写循环算法,获取每个单元格的草地面积总和等参数,并通过数据库Update方法添加到单元格。
对于栅格数据分析过程,首先将空间分析后的矢量数据Vi与NDVI、NPP等栅格数据进行区域统计,取出每块图斑对应单元格内的“汇总或取平均”栅格值数据,最后利用数据库计算与连接技术将栅格数据返回评价单元(图3)。
图3 评价单元栅格数据取值方法
利用C#编程语言和OLEDB数据库技术,连接shp文件的FoxPro数据库(图4)。将对象数据和单元网格进行空间匹配,联合栅格及矢量数据进行相交分析,应用数据库的Avg与Sum统计函数实现数据加和与平均值的计算,结合Group查询完成参数数据的分类汇总,使用DataAdapter的Fill方法将结果存入数据集,最后借助循环算法完成属性信息连回工作。
图4 评价指标计算算法原理图
由于处理后的各图斑均带有所属单元格的唯一编码属性,想要实现参数与评价单元的高速匹配,就可以应用数据库技术,采用编程方式进行解决。在对接过程中,部分参数需要按类别进行汇总,部分参数需要取均值或一对一更新,还有一些特殊因子需要经过多步计算才能连回评价单元,因此可以构建基于Visual Studio开发平台的空间评价数据关联程序(图5),程序包含分类汇总、取均值、数据更新、特殊因子计算等功能,以实现不同参数的高效运算。
图5 评价数据连回程序界面
为保证模型的灵活性和可变性,将模型参数存入方便操作的Excel数据库中,当用户需要更改评价模型相关指标时,可直接在数据库中进行修改,对模型进行更新。评价时通过OLEDB方式连接Excel,对参数进行实时调用,并连接shp文件,实现模型的动态运算。应用数据库技术进行参数管理,可以大大减少模型更改后的工作量,提高模型运算的高效性和可操控性。
将研究区草地数据与单元网格进行空间匹配和相交分析,为各图斑获取对应的网格编号,取出每块图斑对应单元格内的草地面积和NPP等栅格值数据,返回至评价单元并进行区域统计。
图6为研究区范围内的草地原始数据图,图7为获取后的草地数据密度统计结果图。通过对比发现,两幅图中所体现的草地资源聚集性较吻合,处理前后的数据具有基本相同的分布规律,验证了上述方法的可行性。
图8为研究区原始NPP数据空间分布图,图9为按评价单元进行区域分析后的统计图。通过与原始数据对比发现,依据评价单元进行草地资源的数据取值和区域统计的结果与实际情况较吻合,从结果图上可以直观地看出处理前后的NPP数据具有基本相同的空间特征,验证了该参数提取技术及数据连回方法的可行性和准确性。
为进一步验证数据提取技术、参数连回技术和模型快速计算方法的适用性,构建草地资源质量遥感评价模型(Quality of Ecological Resources by Remote Sensing),简称QERRS模型。
图6 研究区草地资源资源原始数据
图7 获取后的草地数据密度统计结果
图8 研究区原始NPP数据
图9 评价单元NPP数据统计
QERRS模型主要从草地资源质量、资源结构质量和本底条件三项主级指标进行综合评价,在各主级指标下又分设多个次级指标,草地资源质量包括植被覆盖指数(Q1)、植被指数(Q2)、资源比例(Q3);资源结构质量包括资源形状指数(Q4)、自然度(Q5)、资源结构指数(Q6);本地条件包括土壤背景(Q7)、气候条件(Q8)及地形条件指数(Q9)。依据对象分析结果为各级评价因子分别赋予统计权重,形成多级指标评价模型,模型计算公式如下:
其中QERRS为生态资源质量遥感评价指标,Q1-Q9的物理含义及量化方法如表1。
根据上述评价指标,构建Excel模型数据库(图10),通过OLEDB方式进行连接,并联合shp文件进行模型运算。基于C#编程语言,编写模型参数数据库管理与统计程序(图11)。
利用前述方法将高、中、低草地覆盖面积和NPP等参数带回到评价单元,利用公式计算Q1-Q9,再利用模型计算公式,计算草地生态资源的质量,得到研究区范围内草地环境评价结果(图12)。
表1 草地生态资源质量相关指标
图11 评价模型管理与运算程序界面
图12 张北县草地资源评价结果图
模型计算结果所反映的草地资源空间分布特征与生长状况和实际情况基本一致,证实了评价体系的科学性与准确性。而当研究者需要对模型进行更改时,数据提取与快速连回算法可以实现参数的快速、准确提取,实现模型动态计算,使运算结果能够实时更新,具有良好的参考价值和借鉴意义。
本文采用的网格数据获取和评价方式,能够获取一定区域范围内空间统计数据与空间结构数据,避免“大区域取值”不具代表性的问题,可以很好地提高评价精度;相比于利用专业软件提取数据的复杂性和不确定性,结合空间分析与数据库原理的栅格、矢量参数数据的提取技术更为简单且高效,具有快速、可重复性操作的特点;利用C#编程语言和OLEDB数据库技术的快速连回算法,可以实现数据批量计算与统计,在提高工作效率的同时减少了人工分析操作所可能造成的系统误差;张北县的草地资源评价应用实践表明,应用数据库式模型管理与运算的方法,可以提高模型的灵活性,实现模型的动态计算,为评价指标和评价模型的不断完善奠定了技术基础,提高了工作效率,有助于调查人员从繁琐的数据处理中解脱出来,专注数据挖掘研究。