基于地址匹配的城市行业用地调查研究与实践

2015-06-07 11:24国,张
地理与地理信息科学 2015年2期
关键词:越秀区宗地用地

胡 大 国,张 嘉

(1.广州市房地产测绘院,广东 广州 510030;2.中国土地勘测规划院,北京 100035)



基于地址匹配的城市行业用地调查研究与实践

胡 大 国1,张 嘉2

(1.广州市房地产测绘院,广东 广州 510030;2.中国土地勘测规划院,北京 100035)

选取广州市越秀区作为试点区域,利用数据库规范地名地址数据,以地址匹配为核心实现宗地数据与经济统计数据的融合,调查行业用地利用状况、用地类型、面积与分布,形成顾及地名地址数据特点的越秀区行业用地调查数据库,开展行业经济、用地、从业人员情况统计与分析。研究与实践表明:利用行业基本单位详细地址与地名地址数据匹配开展城市行业用地调查是一有效方法;持续性开展城市行业用地调查有助于政府的经济、用地宏观决策。

土地利用;城市行业用地调查;地址匹配;SQL;空间分析;越秀区

行业用地是指用于产业活动的土地,是开展产业经济活动的空间载体。以城镇地籍调查数据为基础,开展城市行业用地利用状况调查,挂接宗地内的行业用地类型以及相关经济指标,形成包含各类行业信息的城镇地籍调查数据成果,对于摸清不同行业用地类型、面积、强度等情况,掌握重点行业用地的利用水平、潜力规模与分布,为产业结构调整提供基础支撑,为经济社会全面协调和可持续发展提供保障[1],具有重要意义。为此,国土资源部在全国范围内开展了批次城市行业用地调查试点工作,第一批试点城市包括吉林省通化市、山东省德州市、福建省龙岩市、陕西省渭南市、江苏省镇江市和广东省广州市越秀区,力图探索并形成适应不同地域、不同经济社会发展水平的行业用地调查技术体系。

广州市越秀区作为首批6个行业用地调查试点城市之一,是广州市最繁华的中心城区,下辖22条行政街道,面积约33.8 km2,地籍区22个,法人单位和产业活动单位3.4万多个,户籍人口为115万人,在土地利用现状调查及年度土地利用变更调查中均为城市建设用地,地类代码为201[2]。

1 基础数据分析与处理

1.1 数据分析及技术流程

行业用地调查的核心是建立行业基本单位(法人单位、产业活动单位)与宗地空间数据的关联,解决行业经济信息“落地”即空间化问题,从而实现经济统计数据与地籍调查数据两种异构数据的有效融合。结合广州市试点区情况,行业用地调查基础数据主要从国土、统计、公安等相关部门收集,包括1∶500地形地籍图、地籍区数据、行业基本单位、行业经济汇总数据、行业从业人口汇总数据等信息。上述数据存储介质各异,格式不一,空间数据的坐标参考也不尽一致,虽然行业基本单位和宗地数据都具有空间坐落的表达,但两者对同一对象的表达方式和语义描述存在较大差异,导致行业基本单位与其所坐落的宗地实体难以直接关联。

行业基本单位数据和地名地址数据中均有地址信息,利用行业基本单位的详细地址与地名地址数据进行地址匹配,可使行业基本单位具有空间坐标[3,4],然后与宗地进行空间叠加分析,即可实现行业基本单位经济数据与宗地的用地范围、用地面积等情况的关联。对于地名地址数据无法查找到的行业基本单位,实地调查测绘该行业基本单位,并在1∶500地形地籍图上采集地名地址点,补充完善地名地址数据库,再进行地址匹配。主要技术流程如图1所示。

图1 行业用地调查技术流程

行业基本单位与地名地址数据中的地址信息有如下特点:1)地名地址数据为结构化数据,由街道、街坊、街路巷、门牌前缀、门牌号、门牌后缀6个字段组合表示,定义明确、统一,可以利用结构化查询语言(SQL)批量处理。2)行业基本单位的详细地址呈现半结构化特征,以唯一文本信息记录,内容庞杂,描述不规范,存在错别字、中文数字与阿拉伯数字混用、信息冗余等情况,难以进行批量处理。为实现两类数据的高效管理与快速语义匹配,需对其进行数据建库与规范化。

1.2 数据处理

1.2.1 数据库设计 利用实体(Entity)-联系(Relationship)模型设计行业用地调查数据库,实体主要有行业基本单位(点)、宗地(面)、门楼牌(点)和房屋(面);联系主要有多栋“房屋”坐落在一个“宗地”,一栋“房屋”拥有多个“门楼牌”,多个“行业基本单位”具有一个“门楼牌”,其比例关系为1∶N,利用空间关系关联,无需设计单独的联系表。

1.2.2 数据规范化处理

(1)地名地址数据规范化。以实施行业用地调查试点项目为目标,与文献[3,4]所述的地址标准化类似,但不进行地址解析处理,只对核心地址要素的含义、字段类型、长度及其组合进行统一规定,要求简洁明了且易于操作。地名地址数据是具有地理坐标信息的矢量数据,其属性由行政区、街道、街坊、街路巷、门牌前缀、门牌号、门牌后缀、X、Y字段组成。为便于与行业基本单位的详细地址含义相匹配,综合相关属性设计“组合地址(ZHDZ)”字段,组合地址由“街路巷”、“门牌前缀”、“门牌号”、“门牌后缀”组成。

(2)行业基本单位详细地址规范化。主要通过人机交互手工或半手工方式实现,以原始详细地址为基础,新增“提取地址(TQDZ)”字段作为“详细地址”字段的派生字段,以期与“组合地址”进行匹配。派生“提取地址”的主要方法有:1)舍弃详细地址的“广东省、广州市、越秀区”等冗余信息;2)修改详细地址中的错别字;3)将详细地址中的中文数字改为阿拉伯数字;4)删除详细地址中多余的字;5)补充大地名或删除多余的街路巷、楼宇名称、房号。

2 地址匹配与数据关联

地址匹配以数据规范和含义一致为基础,在Access数据库中利用SQL语句匹配,主要步骤如下:1)查询符合条件的记录数,将行业基本单位的 “提取地址(TQDZ)”与地名地址数据库中的“组合地址(ZHDZ)”匹配,查询相匹配的数据;2)更新行业基本单位数据,将“提取地址”与地名地址数据库中的“组合地址”匹配,并将X、Y坐标信息赋值给行业基本单位;3)核查数据更新情况,保证数据更新的内容和数量无差错。

地址匹配完成后,行业基本单位具有X、Y坐标信息,通过ArcGIS的“增加X、Y数据”功能[5],将行业基本单位转换为点状空间数据。在ArcGIS中,行业基本单位、宗地分别为点和面两层数据,利用空间叠加分析[6]实现行业基本单位与宗地1∶N的关联,然后导入Access中进行统计分析。

3 试点区域实践

3.1 行业用地分类

在开展城镇地籍调查时,土地分类通常按土地的批准用途、主要实际用途划分和归类,即一宗地只调查一个主要的利用类别,忽略了同一宗地的多种用地类型。《地籍调查规程》中虽顾及国民经济行业分类调查,但是只填写到大类名称及编码[7],不能反映同一宗地多种经济活动的情况。为解决上述问题,行业用地调查试点依据国民经济行业分类进行用地划分,采用经济活动的同质性原则定义行业用地类型,调查同一宗地的多种经济活动及多种用地类型。国民经济行业分类分为4个层次,即门类20个、大类96个、中类432个、小类1 094个。行业用地调查以小类为基础,统计分析以门类为主。

3.2 行业用地分析

越秀区行业经济数据[8]与用地信息关联,形成空间经济用地信息,可以进行三大产业用地分析、行业用地面积比重分析、单位面积营业收入分析、人均营业收入分析等。

(1)产业用地分析。越秀区无第一产业,第二产业地区生产总值为57.8亿元,用地面积为0.9 km2,用地面积比例为5.3%;第三产业地区生产总值为1 839.3亿元,用地面积为16.0 km2,用地面积比例为94.7%,第二、三产业单位面积地区生产总值分别为64.6亿元/km2、115.1亿元/km2,比例为1∶1.8(表1)。从经济总量、单位用地面积产出量可以看出,第三产业对越秀区经济的贡献最大,居经济行业的核心地位。

表1 产业用地情况统计

(2)按产业营业收入、从业人数统计分析。从门类单位面积营业收入看,每平方米营业收入最高行业为金融业(J门类,40.9万元/m2),其次为建筑业(E门类,12.1万元/m2)、交通运输、仓储和邮政业(G门类,8.4万元/m2)、批发和零售业(F门类,8.2万元/m2)等。结合整个产业的营业收入、从业人员数和用地面积比例看,越秀区第二、三产业营业收入比例分别为10.5%、89.5%,从业人员数比例分别为12.5%、87.5%,用地面积比例分别为5.3%、94.7%,作为广州市的行政、商贸、金融、文化中心,越秀区第三产业用地所占比例相当高,其营业收入、从业人员所占比例均超过85%,用地面积近95%,可见越秀区第三产业发展水平很高(表2)。

表2 产业营业收入及从业人员数现状

4 结论

城市行业用地调查试点中,采用行业基本单位详细地址与地名地址数据匹配,具有准确性高、速度快的特点。精心设计城市行业用地调查试点项目数据库,组合运用Access数据库的查询统计功能和ArcGIS的空间分析功能,有助于行业用地调查试点工作的完成。持续性开展城市行业用地调查[1],与统计部门年度经济普查保持同步,有助于政府的经济、用地宏观决策支撑。

[1] 路晓明,付治河,张高,等.行业用地调查成果应用研究[J].河南科技,2011,10(上):20-21.

[2] TD/T 1014-2007,第二次全国土地调查技术规程[S].北京:中国标准出版社,2007.

[3] 宋子辉.自然语言理解的中文地址匹配算法[J].遥感学报,2013,17(4):795-801.

[4] 胡青,徐建华,王志海.GIS数据库中地址自动匹配方法研究[J].测绘与空间地理信息,2008,31(6):50-52.

[5] 党安荣,贾海峰.ArcGIS 8地理信息系统应用指南[M].北京:清华大学出版社,2003.54-55,291-293.

[6] 陈述彭,鲁学军,周成虎.地理信息系统导论[M].北京:科学出版社,2001.125-126.

[7] TD/T 1001-2012,地籍调查规程[S].北京:中国标准出版社,2012.

[8] 广州市越秀区统计局.2011越秀区国民经济和社会发展统计资料[EB/OL].http://tongji.yuexiu.gov.cn/inc/op_win.jsp?id=12509.2013-12-31.

2014-08-06;

2014-11-05

国土资源部试点地区行业用地调查项目(DCPJ121702-02)

胡大国(1972-),男,高级工程师,注册测绘师,主要从事土地调查和测绘技术管理工作。E-mail:daguoh@21cn.com

猜你喜欢
越秀区宗地用地
盘活越秀区存量老旧物业的对策研究
致敬抗疫情英雄
教师作品选登
城乡建设用地增减挂钩研究进展综述
地籍调查成果在数字时代下的管理研究
城乡建设用地增减挂钩政策的演变
广州市越秀区经济社会发展转型经验对江苏盐城大市区的启示
城乡建设用地增减挂钩的实践与认识
城乡建设用地增减挂钩的实践与认识
基于宗地层次的合肥市产业用地集约利用评价