张庭
摘 要:集体土地所有权数据入库重复工作急需高效的数据处理方法,处理日常反复修改的数据。结合项目实际需要,使用ArcPy脚本实现批量数据检查、批量出宗地草图、界址点批量生成、导出签章信息,依据导出的属性信息重新映射组合生成的土地调查表,最终达到高效数据处理要求,满足集体土地所有权确权入库工作,该方法为同类数据处理提供了参考价值。
关键词:集体土地所有权 宗地草图 界址点 签章信息
中图分类号:P208
ArcPy Methods and Application of the Storage of Collective Land Ownership Confirmation
ZHANG Ting
(Geological Surveying and Mapping Brigade, Guizhou Bureau of Coal Geology, Guiyang, Guizhou Province, 550001 China)
Abstract:The repetitive work of the data storage of collective land ownership urgently requires efficient data processing methods to deal with the data that is repeatedly modified on a daily basis. Combined with the actual needs of the project, the ArcPy script is used to realize the batch checking of data , the batch output of parcel sketches, the batch generation of boundary points and the export of signature information, and remap the land survey generated by combination according to the exported attribute information, so as to finally meet the requirements of efficient data processing and meet the storage of collective land ownership confirmation. This method provides a reference value for similar data processing.
Key Words:Collective land ownership; Parcel sketch; Boundary point; Signature information
根据《自然资源部关于加快完成集体土地所有权确权登记成果更新汇交的通知》文件,为依法维护农民土地权益,支撑集体经营性建设用地入市等自然资源改革工作,集体土地所有权确权登记成果需要整理入库。数据处理人员在数据收集、整理、成果导出、数据入库过程中,由于缺乏开发技术,往往面临着投入大量时间与精力而重复工作。通过充分利用ArcPy脚本技术,结合地方项目实践,开发批量处理工具,提高数据处理水平,进而可以满足成果汇交要求。
1 数据分析与处理
1.1数据分析
集體土地所有权确权数据入库工作面临着以下问题。
(1)数据量大。各个区县收集到的宗地数据动辄达到上千条记录。数据种类繁多,最终汇交成果的宗地草图数据需影像底图数据、矢量数据,而地籍调查表签章数据则需要多个图层数据,包括年度变更调查数据、批供地等数据。(2)数据错误。由于收集的数据经过叠加、相交等分析后,存在图形边长较短、边出现狭长与尖角等情况,人工无法逐一检查。(3)重复工作。随着集体土地所有权确权数据外业核查工作推进,提交的成果也会随时更新,数据处理的工作人员面临着繁重的工作量。人工数据处理不可避免会出错。因此,急需辅助工具解决大量的重复工作,如辅助宗地草图批量输出等工作。
1.2数据处理
本文依据项目生产流程,结合数据情况以及硬件配备条件,分5步骤对集体土地所有权确权数据处理,如图1所示。
2实现方法
2.1宗地草图
当前,宗地图批量输出有多种出图方法[1],本文借鉴输出宗地图方法,使用ArcPy对模板数据操作,实现宗地草图输出。宗地草图使用ArcGIS的MXD模板数据,在模板里设置好图层顺序,通过单宗集体土地所有权确权图斑、影像底图,对集体土地所有权的宗地号和坐落分别注记符号[2]。单独宗地草图矢量数据需要对每一个集体土地所有权确权图斑数据集进行分割,才能得出单宗图斑。同时,利用单宗矢量图斑扩大栅格影像的范围,并进行裁剪,生成该范围内的矩形影像底图。为方便查找对应关系,裁剪的影像数据和分割的单宗图斑数据都以宗地代码命名。最后通过关联与替换,批量生成宗地草图。
2.2界址点
界址点批量生产方法有多种方式,周玉国[3]使用离几何图形的最小外包矩形最左上角最近点作为起始点,在FME软件中实现批量按顺序生成界址点的方法。许亚等人[4]除了使用最小外包矩形左上角点外,还提出了使用质心方法找出最接近西北角的拐点作为起始点,顺时针编号的方法。本文按周玉国的方法,找出最左上角的界址点作为起始点,按顺时针开始编号。对于带有空洞的多边形,空洞部分使用外部图形最大编号作为起始点,采用随机方式依次编号。
2.3签章信息
签章信息是对界址线位置的描述。目前,Auto CAD平台实现了签章信息的自动提取[5]。首先,利用Arc Py提供的空间接口,以集体土地所有权确权的宗地数据、不动产登记数据、国有林场数据、批供地数据以及行政区划数据等,按照图层重要程度,依次从上到下叠加。上一层数据无数据的区域由下一层数据填充,构建新的图层。其次,以新的图层与下一层数据进行叠加分析,构建新的图层。最后,直至使用行政区划数据填充包含本地区无数据区域以及本地区以外的其他区域后,完整包含了整个区域范围的分析图层数据。使用生成好的界址点数据,重新构建界址线数据,以界址线当一定缓冲区范围进行叠加分析,使用缓冲结果数据提取与该界址线距离为零且面积最大的图形名称,作为界址线签章信息。
3关键技术与实现
3.1 ArcPy脚本技术
由于ArcPy易于掌握,具有强大的空间分析能力,已经被广泛应用于数据批处理[6]。本文采用了ArcPy提供的函数实现对需要入库的数据批量处理,具体方法如下。
(1)数据检查。使用查询游标(Search Cursor),对宗地数据进行遍历,取出宗地代码以及宗地图形。比对该数据中是否有相同的宗地代码,取出图形的拐点,计算两个拐点之间的距离,判断是否满足要求。(2)宗地草图生成。使用ArcPy的Split_analysis函数实现宗地数据的分割,而影像裁剪使用Clip_management函数完成。当完成所有的数据源准备后,即使用MXD制图模板文件,再结合图层的replaceDataSource函数,实现数据的替换,最后达到制图符号规范统一。(3)界址点。界址点成果表构建需要借助界址线,这一步需要CreateFeatureclass_management来创建,并将宗地宗海代码(ZDZHDM)、界址线长度(JZXCD)、界址线类别(JZXLB)、(权属界线协议书编号)QSJXXYSBH、界址线位置(JZXWZ)等字段写入要素的属性中。当两界址点长度被正确获取后,利用xlwt模块实现界址点成果表导出。(4)签章信息。界址线签章的获取利用了ArcPy提供的Erase_analysis函数,依据优先级较高的图层擦除优先级较低的图层,通过Merge_management函数实现这两个数据合并,并使用场图(Field Map)映射图斑名称,当数据处理完成后,进行下一个图层擦除与合并,直至所有需要分析的图层完成擦除与合并。利用Buffer_analysis函数,以集体土地所有权确权宗地面构建缓冲区,将缓冲区数据与上述擦除合并数据进行相交分析,找出缓冲内与界址线距离为零且图斑面积最大的图斑名称作为签章信息。(5)地类名称图斑面积计算。图斑面积的计算使用ArcPy的Intersect_analysis函数作相交分析,对图斑的地类名称(DLMC)字段进行枚举,并将数据归类统计,得出结果。
3.2地籍调查表批量生成
地籍调查表利用了从矢量数据中提取的特定字段至txt文本,文本数据映射到Word对应书签,进行值的填充。本文使用Apose.Word库,在地籍调查表中,将需要填写的字段信息以标签的方式标记,使用C#语言进行编程开发,读取txt文本内容,包含签章、四至等信息,并将该信息填写至Word表。需要注意的是,Word表中签章信息的行数并非固定。由于宗地的界址线数量不同,所以需要动态调整表格的行数。
3.3功能实现
按照功能分步骤执行,数据检查工具使用两个参数分别输入宗地数据以及选择导出报告结果路径,可对集体土地所有权确权数据实现宗地代码重复性,界址线长度以及尖角的检查以文本报告形式輸出。批量导出宗地草图需要选择宗地面数据、临时存储路径以及需要裁剪的草图影像,并通过出图结果输出最后结果。
界址点编号与导出则利用集体土地所有权确权宗地面数据,构建宗地界址点并对其编号,填入制表人、审核人、制表时间用于生成Excel界址点成果表。导出签章信息则利用生成的界址点数据,以及叠加相应图层,如林场、相邻宗地、批供地等矢量数据,分析数据后输出签章属性信息。导出面积统计信息工具则由项目的需要,利用宗地图层数据与三调图斑或变更数据叠加分析、汇总统计得出数值,最后导出结果文件夹。
4应用分析
4.1工具分析
集体土地所有权确权数据处理工具在某地区项目中进行了实践。通过开展数据批量处理工作,解决了因重复修改数据使成果随之变动的问题,实现了自动化处理。工具分析主要具有以下优势。
(1)可配置信息输出与输入。用户在导出签章表信息工具中,可使用文本进行配置。数据处理人员只要在文本中指定与矢量数据相同名称字段,即可输出相应的字段值信息。同时,在生成地籍调查表过程中,只需要使用与文本相同名称标签,即可实现信息导入。
(2)可选择的操作设置。用户可以依据需要设置保留的小数点位数。同时可以依据各个地区收集到的不同数据,调整图层顺序进行叠加分析,用于生成签章信息。
(3)分节点处理。本文使用分节点方式处理数据,除了导出签章信息需要利用界址点工具,生成的地籍调查表需要利用各个步骤所生成的属性数据外,从数据检查、草图生成到其他工具都是各自独立工作。这既可以满足模块化工作要求,又便于及时发现问题,以便处理源数据。
(4)分区域处理。对比目前市面已有的处理软件,本工具可以不用全区域数据参加处理。当计算机性能较低时,可以按乡镇范围进行数据处理,只要在签章信息导出工具中使用的叠加数据为全区域数据,即可满足以乡镇行政范围小量数据处理,并可得出图斑正确的签章信息。
4.2工具应用
使用分割好的宗地数据后,利用ArcPy的制图模块相关接口和配置好的MXD符号的制图模块,通过图层替换,批量生成宗地草图。利用Python的xlwt模块,通过计算Excel相关属性,设置单元格高度,并将属性值填入Excel表格中,便得出界址点成果。同时,工具为项目生成了多种数据成果,包括临时的草图数据、建库使用的MDB数据、DOCX和PDF格式地籍调查表数据等。
5结语
本文基于ArcPy脚本技术,充分利用其空间处理能力,因易于掌握的特点,实现了对集体土地所有权确权数据入库检查、批量生成宗地草图、生成界址点、生成界址线对其编号。成果以Excel的界址点表格、更新四至的矢量Shape File数据以及宗地草图的jpg数据和属性文本txt文件呈现。利用导出的属性数据生成txt文本数据,依据字段映射关系和Word的标签,标注属性数据。宗地草图数据批量构建地籍调查表。开发工具应用于实际项目的数据入库工作,辅助解决了人工重复工作,与人工处理相比大大提高了数据处理速度,其主要表现在节省人工处理地籍调查时间、人工出宗地草图时间。当然,由于数据的复杂性,在数据量较大情况下,本工具只能按步骤执行,不能一次性将成果导出,这就需要工作人员对工具了如指掌。同时,这也要求工作人员在后续工作中根据硬件性能尽量减少过程步骤,结合项目的需要定制功能开发。
參考文献