甘桂春, 卢 鹏, 王晓宁
(贵州省林业调查规划院, 贵州 贵阳 550003)
基于ArcGIS Spatial ETL工具的森林资源数据批量处理
——以都匀市林地年度变更数据为例
甘桂春, 卢 鹏, 王晓宁
(贵州省林业调查规划院, 贵州 贵阳 550003)
为更好地完成都匀市林地年度变更工作,使全市森林资源数据得到快速分发并更新。利用ArcGIS和FME软件,自定义ArcGIS Spatial ETL工具的数据转换处理流程模型,自动批量快实现都匀市各乡镇的林地年度变更数据的无损转换。
Spatial ETL; FME; 流程处理模型; 林地年度变更; 空间数据; 都匀市
近年来,随着GIS技术应用的日趋成熟,涉及GIS的空间数据分析处理过程己深入应用于林业行业,特别是森林资源数据的处理[1]。空间数据的分析处理过程由一系列相互联系又具有一定次序关系的空间操作组成,而它们之间又存在着复杂的关系,可能是串、并联等层次结构[2]。在GIS中,通过空间数据处理流程体系框架将多个空间操作贯穿起来,形成一个完整的数据处理模型,这个模型可以被用来自动执行和记录多个分析处理任务,并对空间数据执行一些标准质量和有效性的检查,该过程称为空间信息处理过程(Spatial Process)[3]。自动执行和重复流程是地理信息系统软件具有的强大的空间分析能力,ArcGIS是国内外使用较多的GIS平台之一,对于地理信息数据处理具有丰富的空间分析和处理能力[4]。本文介绍了空间分析建模流程技术的相关概念,并利用ArcGIS Spatial ETL建模工具实现都匀市林地年度变更数据自动转换,进而提高空间数据处理的速度和质量、减少空间数据处理的工作量。
过程概念在各行广泛运用,是为完成某类特定目标,按某种有机联系在一起的一系列任务。空间信息处理过程是一个特殊过程,以空间分析应用作为目的,按空间应用逻辑组织在一起,以空间数据作为处理对象的一系列空间活动的集合[5]。自定义的空间信息处理过程将更有利于实现GIS应用过程的正确建模,便于规划及管理GIS应用工作的优化设计并实施[6]。
一个完整的空间信息处理过程包括3种基本要素:空间活动、过程数据和关系流[7]。空间活动是空间信息处理过程的最基本活动,通常对应一组空间操作组成的一个空间数据分析模型,由计算机软件自动执行[8]。空间活动的逻辑关系构成空间信息处理过程的控制信息流。过程数据则是空间活动处理对象,通常由一定格式的空间数据组成,是前驱空间活动的输出,也是后继空间活动的输入。过程数据的处理流程构成空间信息处理过程的数据信息流[9]。过程关系流是空间活动和过程数据间的连接弧,有一定方向,标志被控制数据的流向[10]。
空间信息处理过程作为一种活动,具有别于其他业务过程的特性[11],主要表现在:
(1)空间信息处理过程是以数据为中心的应用,数据处理直接与过程的形式与逻辑相关;(2)空间操作通常有算法复杂、计算量大、耗时长等特点,输入和输出参数严格定义,参数的数目和类型随操作环境具较强的可变性;(3)活动受条件制约,前后活动间联系紧密,前驱活动输出是后继活动输入,输入和输出的匹配需要满足相应约束;(4)过程活动参数及其执行逻辑等都息息相关的,受空间语义的约束[12]。
Spatial ETL(Extract-Transform-Load的缩写,即数据抽取、转换、加载的过程)工具,从数据源中抽取出所需的数据,经过一系列的转换(数据的标准化、拆分或合并、验证正确性等),最终按照用户定义的规则进行转换的数据仓库模型,将数据自动、批量地加载到目标数据仓库中,即负责完成数据从数据源向目标数据仓库转化的过程[13]。其特点是数据同步和海量,响应时间高速、存储容量大和安全性高[14]。
Spatial ETL工具对数据整合的步骤如下:
(1)构建源数据库,以整合应用平台数据需求为目的;
(2)数据抽取。确定并分析数据源,选择适合方法,在不影响源数据库相关业务系统正常运行的前提下。准确地将需要的数据从源数据库中读取出来;
(3)数据转换。将从各数据源抽取的数据,根据预设规则进行转换、处理,以保证数据有效性;
(4)数据加载。数据加载就是将转换后的数据按照业务规则加载策略自动批量地导入目标数据库中[15]。
都匀市位于贵州省东南部,东与黔东南州丹寨县、黔南州三都县接壤,南与黔南州平塘县、独山县相邻,西与黔南州贵定县毗邻,北与黔东南州麻江县交界,是黔南州州府所在地,地理位置为:107°07′19″—107°46′26″ E,25°51′26″—26°25′39″ N。全市国土面积2 026 km2,下辖18个乡(镇、办事处)、2个国营林场及2个县级自然保护区,共99个行政村。
根据都匀市2013年林地年度变更资料,全市林地总面积为139 681.87 hm2,其中,有林地114 725.74 hm2,占林地面积的82.13%;疏林地2 313.97 hm2,占1.66%;灌木林地20 570.87 hm2,占14.73%;未成林地1 427.32 hm2,占1.02%;苗圃地62.21 hm2,占0.04%;无立木林地250.8 hm2,占0.18%;宜林地312.05 hm2,占0.22%;林业辅助生产用地18.91 hm2,占0.02%。
数据来源:都匀市2013年林地年度变更数据、都匀市行政区划数据;
软件:FME 2008、GIS软件采用ArcGIS 9.3、数据库软件采用Access 2003。
地理实体的数据处理是地理信息数据库建设中极为重要的工作,其地理实体的数据处理方法和质量都是地理信息数据库建设的重要质量指标。本文通过相关的软件技术,实现了都匀市2013年林地年度变更数据和都匀市行政区划数据的批量转换处理,技术路线图见图1。
图1 技术路线图Fig.1 The technological flow chart
(1)创建ArcGIS Spatial ETL工作环境。安装ArcGIS 9.3和 FME 2008,并启动FME将其扩展到ArcGIS中,然后在ArcGIS中点击Extend即集成FME;
(2)建立ArcGIS Spatial ETL工作空间。在ArcGIS工具栏右键点击ArcToolbox,新建New Toolbox添加命名为ETL tool的新工具图标;选择ETL tool右键单击,在弹出的快捷菜单中选择New,在其子菜单下选择Spatial ETL Tool命令;通过创建转换工作空间向导设置相应的选择源数据的格式和目标数据集格式,一步步按照提示便可完成ArcGIS Spatial ETL工作空间的设置,见图2。
图2 创建Spatial ETL模型环境流程图Fig.2 Creating Spatial ETL model environment flow chart
(1)抽取。将源数据中的都匀市2013年林地年度变更数据图层和都匀市行政区划数据图层拖放入工作空间中;
(2)转换。通过定义都匀市2013年林地年度变更数据图层和都匀市行政区划数据图层的分离字段(即乡镇名称);将源数据、目标数据进行映射转换;
(3)加载。点击运行,将数据载入目标数据集,即自动生成都匀市单个乡镇的林地年度变更数据和单个乡镇行政区划数据图层。
通过定义Spatial ETL模型转换参数,将从源数据库中提取数据,并把它转换成所需的投影、格式和视图,然后提供给发出请求的应用程序,再将数据装载进另一个数据库,见图3。
经过ArcGIS 9.3与FME 2008软件的空间数据转换功能有机融合,将读模块、函数、写模块通过转换知识库有机结合,不仅能完成常用空间数据空间位置间的转换,还能结合用户要求完成数据表达以及属性间的转换。空间数据并非单纯的几何要素,其转换涉及的问题相当复杂,本文通过执行预先设置的Spatial ETL模型,可快速地得到都匀市各个乡镇的林地年度变更小班数据和各个乡镇的行政区划数据,结果详见图4。
结果表明:采用ArcGIS 9.3与FME 2008软件批量转换技术有以下优点。(1)FME 2008软件基于语义的转换可以减少信息的丢失,完成大部分的数据处理、入库工作,数据处理后不需在目标软件中再做任何修改;(2)应用FME 2008软件大大提高了林地年度变更空间数据库处理、入库的效率,减少了工作量,保证了林地年度变更工作的顺利进行。
通过结合ArcGIS 9.3和FME 2008软件创建Spatial ETL工具,完成了都匀市2013年林地年度变更数据从县级数据库到乡镇数据库的批量转换,降低了县级工作人员的劳动强度,为更好更快地完成都匀市2013年林地年度变更工作快速地提供准确的数据。我们可根据实际需求量身定制空间数据转换模型,实现不同格式数据之间的互转,可大大提高空间数据处理的效率,最大限度地减少数据库的重复性建设工作,另外利用FME 2008软件的语义转换功能可以实现数百种数据格式互转,几乎可以避免属性信息的丢失,这是一般的GIS软件无法做到的。本文研究的数据转换方法对空间数据加工项目提供了一个很好的思路,也对从事地理信息系统的技术人员具有一定的参考价值。
[1] 甘桂春,肖玲.基于Geodatabase与CASE工具设计林地保护利用规划数据库[J].中南林业调查规划,2011,3(30):41~44.
[2] 白昕.基于FME和ArcGIS的福州市辖区城镇土地调查建库技术研究[J].城市勘测,2010(6):35~38.
[3] 刘三满.基于ETL 工具的数据集成和交换的研究[J].电脑开发与应用,2011,10(24):17.
[4] 周海平,雷昕.基于FME的多元空间数据共享方式探讨[J].信息技术,2003(4):32~34.
[5] 苏建云,黄耀裔,陈文成.基于FME的GIS数据格式转换研究[J].北京测绘,2009,(1):36~39.
[6] 张鹏程,方锋.基于FME的多平台数据转换系统开发及实现[J].地理空间信息,2008,6(2):25~27.
[7] 高勇,邬伦,刘瑜.空间信息处理过程建模研究[J].北京大学学报:自然科学版,2004,40(6):914~921.
[8] 邬伦,刘宇,张晶,等.地理信息系统概论——原理、方法和应用[M].北京:科学出版社,2001:5~9.
[9] 夏兴东,沈娟红.FME在数据转换中的应用[J].现代测绘,2011,34(3):62~64.
[10] 陈军,邬伦.数字中国地理空间基础数据框架[M].北京:科学出版社,2003:15~19.
[11] 许洪波.地理实体的数据处理技术在地理信息数据库建设中的应用[J].北京测绘,2012,3(51):51~52.
[12] WFMC.Terminology and Glossary.Workflow Management Coalition[DB/CD].1999:21~22.
[13] 陈影,程耀东,闫浩文. 利用FME进行GIS数据的无损转换[J]. 测绘科学, 2007, 32(3):75~77.
[14] 张保钢. 时空数据的可视化表达研究[J]. 北京测绘, 2006(3):7~9.
[15] 龚晓晖,朱显红,陈健壮,等. 公路建设项目信息资源整合技术研究[J]. 中外公路, 2012, 2(32):301~307.
(文字编校:杨 骏)
ForestresourcedatabasedonArcGISSpatialETLtoolforbatchprocessing——TakingtheannualchangeofforestlanddataofDuyunCityasanexample
GAN Guichun, LU Peng, WANG Xiaoning
(Forest Inventory and Planning Institute of Guizhou Province, Guiyang 550003, China)
In order to better fulfill the annual Forest land change work distribute and update rapidly the city's forest resource data in Duyun City.Using ArcGIS and FME software,custom data conversion processing models of ArcGIS Spatial ETL tools,automatic batch quickly realize lossless conversion to the annual forest land annual change data of townships in Duyun City.
Spatial ETL; FME; flow processing model; forest land change; spatial data; Duyun City
2014-10-17
中央财政林业科技示范资金其他推广示范项目([2012]TQ05号)。
甘桂春(1979-),男,江西省萍乡市人,工程师,主要从事林业信息工程、林业调查规划等方面的工作。
P 208;F 326.2
A
1003 — 5710(2015)01 — 0074 — 05
10. 3969/j. issn. 1003 — 5710. 2015. 01. 018