陈晓东,余劲松弟
(福州大学 数字中国研究院(福建),福建 福州 350003)
地理网格既是统一空间定位的基础,又是多源异构空间数据组织和交换的框架,还是社会经济要素空间分析和管理的新框架[1].近年来,地理网格被广泛用于城市方面,不同于大尺度的地理网格应用,城市网格方面的应用偏向于不规则网格划分,网格划分涉及的空间要素主要包括行政边界、道路、自然要素(如河流)和人文要素(如人口分布)等4类.这些空间要素中的一种或多种进行排列组合,都能进行城市空间网格划分.对于综合应用的网格划分说,一般是以行政边界和道路为基础,综合自然要素和人文要素进行网格细分,例如土地执法监察网格[2]、地理国情监测网格[3]等.
在这类网格划分体系下存在几个问题:一是行政边界具有多级特征,在网格划分中如何选取合适的尺度;二是道路的选取多是基于道路原始等级进行定性的挑选,道路选取存在限制,不能量化选取;三是结合人文要素的网格细分,自动化程度较低,不利于网格的更新.鉴于此,本文将地址模型引入网格划分领域,分析现有网格划分中道路选取涉及的关键指标,提出一种基于地址模型的城市网格划分方法.
道路是路网中的独立个体,具有多种特征和指标,按照不同的特征或指标从路网中选取道路,得到的道路选取结果差异很大.在道路选取时,主要是根据道路的重要程度来进行主次选取,优先选择重要度高的道路[4].针对不同的道路选取需求,从道路的特征体系中选取多项指标,建立道路的综合评估模型,常以道路重要性值来评估.道路重要性定义的模型主要分为3种[5]:几何单指标模型、结构单指标模型和多指标综合模型.几何单指标模型,是指设置单项道路几何指标(如道路长度、道路宽度)的阈值,进行道路的选取.结构单指标模型,是指设置单项道路结构指标(如节点度、邻近中心性、中介中心性)的阈值,进行道路的选取[6-8].多指标综合模型,是指根选取多项道路指标,综合评估道路的重要性,进行道路的选取.
国外对地理网格的研究起步较早,如1929年,Granean开始把网格作为分析自然和地理现象的基本单元[9];Sahr等[10]阐述了以经纬度来划分地球网格的方法;Dutton[11]提出了全球层次坐标(global hierarchical coordinates)方法,通过对地球进行八面体的四分三角形网格逐级划分,形成全球多级网格.Amiri等[12]提出一个基于内接正方体的数字地球框架,其中全球四边形格网是按二叉树剖分而成.
国内对地理网格的应用主要集中在城市管理[13-15]、空间分析[16-17]和资源整合[18-19]等方面.目前,在城市区域内的网格划分方法[20]主要有4种:1)按规则网格的划分,是指将地理空间划分成一系列的,按行列排列的同一大小的网格单元[21];2)按道路街区的划分,是指以城市中重要道路为边界进行地理网格划分[22];3)按行政区划划分,是指以多级行政区划边界为网格边界,按照省-市-区/县-乡镇/街道-社区的逐级划分,再对最低级的行政网格进行规则或不规则网格细分[23];4)按组合要素划分,是指以行政区划和道路为基础,融合人文要素或自然地物,以多要素组合的方式进行地理网格划分[24-25].
纵观城市形成和发展的历史进程,道路的修建影响着城市形态和人类活动,作为城市空间的基础框架,其重要性不言而喻,更被认为是城市的“指纹”[26].道路在其设计和规划过程中,就已被划分为多个不同的道路等级.这些不同的道路等级一般对应不同的行车环境,如道路的行车时速限制、道路上红绿灯的设置间距、道路的宽度及路面质量等许多与行车密切相关的因素[27].
关于道路选取方法的研究更多地集中于对道路几何特征、拓扑特征及空间分布特征的分析.通过各种分析方法,得到道路重要性评价的各项参数,并确定权值进行计算[28].在道路重要性评价中,为避免单指标评价结果的局限性,更多的是采用多指标的综合评价方法.常用的道路特征因素,可分为以下4类[29-30]:1)以道路等级、道路限制速度等为代表的语义特征;2)以道路长度、道路宽度等为代表的几何特征;3)以节点度、接近中心性等为代表的拓扑特征;4)结合道路周边地物的空间分布特征.
在网格划分中,所涉及的道路相关因素主要有面向主次干道划分的几何特征、涉及快速路等的语义特征和包含省道、县道等的行政因素,很少考虑道路的拓扑特征和关联特征.尽管拓扑特征不属于独立的道路个体特征,但从提升道路选取的准确性上,需要从空间分布特征上扩展.空间分布特征可以分为两类:一是道路网的空间分布特征;二是道路周边关键地物的空间分布特征.文中侧重从第2类空间分布特征上,进一步地完善道路选取方法.计算道路周边关键地物的空间分布特征,常以创建道路缓冲区来建立关系,需要考虑缓冲区的范围、缓冲区的交叉归属等问题.相比于以空间关系来计算空间分布特征,文中提出以语义关系来计算空间分布特征的方法,通过解析道路周边相关地物的地址,提取出地物地址中对应或关联最密切的道路,以道路频数值表达,也可以看作是一种关联特征,如图1所示.
图1 道路指标选取
结合不同类型特征的城市道路选取方法[31],以及网格划分中涉及的道路相关因素,文中选取的几何特征指标是指道路长度和道路宽度,语义特征指标是指道路限制速度,关联特征指标是指道路频数值.这样可以实现一种包含道路语义特征、几何特征和关联特征的道路选取方法.
以多指标特征进行道路选取,需要确定多个指标的权重系数,以保证选取方法的科学性和完整性.多指标的定权方法主要有两种[32]:一是功能驱动赋权法;二是差异驱动赋权法.功能驱动的赋权法一般根据决策者或专家对各指标的认知程度来确定权重系数,主观性较强.差异驱动的赋权法认为指标的权重由各指标在被评价对象间的变异程度和对其他指标的影响程度来确定.
常用的差异驱动的赋权法主要有标准差法、离差最大法和熵值法[27].熵值法可根据各指标所提供的信息量的大小来确定各指标的权重,能够反映指标信息熵值的效用价值,具有较高的可信度[33].因此,采用熵值法进行指标定权,有如下5个主要计算步骤.
步骤1计算标准化值si,j.即
(1)
式(1)中:xi,j为第i条道路的第j个指标.
步骤2计算第j项指标下,第i条道路占该指标的比重pi,j.即
(2)
步骤3计算第j项指标的熵值ej.即
(3)
式(1)中:k=1/ln(n);xi,j为第i条道路的第j个指标.
步骤4计算信息熵值冗余度dj.即
dj=1-ej.
(4)
步骤5计算各项指标权重wj.即
(5)
文中提出的采用地址模型的城市网格划分方法,是以地址在长期应用中形成的模型体系为参考的.在分析地址与网格关系的基础上,综合了面向网格划分的道路选取方法,设计了网格划分结构及划分要素的选取方法,实现网格划分体系的优化.
3.1.1 地址与网格的关系 地址与网格看起来是毫不相关的两个概念,但是在城市空间中两者却有着密切的关系.地址是常用的空间位置描述方式,其构成要素对应着城市空间的某一实体;城市网格则是根据一定规则对城市空间的划分,也是对城市空间实体的划分,两者的关系如图2所示.从图2可知:以构成城市空间的两类实体要素为纽带,可以建立地址的构成要素和网格的基础单元之间的关系.
图2 地址与网格的关系
从网格的角度上,城市空间可以被看作多个地块组成的完整空间,它的数学定义分别为
(6)
式(6)中:CCS,CGS,CPS分别表示完整空间、网格空间和实体空间;Ni是自然要素所表达的地块;Si是人文要素所表达的地块,城市空间可以看作由自然要素和人文要素地块构成的完整空间;Gi是网格单元,城市空间也可以看作由网格单元构成的网格空间;Ai是地址的构成要素所表达的实体,城市空间还可以看作由地址要素表达的实体构成的实体空间.
3.1.2 地址模型与网格的关系 中文地址模型包含地址要素及其构成地址的规则[34],地址的组合规则体现了地址要素在空间中的关系.地址数据是空间数据基础设施(SDI)的重要组成部分,其形式为自然语言,是公众交换空间信息最常用的方式[35].地址数据是空间数据位置的主要描述方式之一,对于汇聚、关联和分析空间数据具有重要意义,体现了城市空间中实体的组合方式及关系.近年来,国家和地方逐步加强了地址的规范化管理,制定了一系列关于地址数据、编码和模型的标准文件,如表1所示.
表1 地址参考标准表
由表1可知:地址结构总体上是由大范围区域到小范围区域,再由小范围区域到精确的位置点或面.地址结构和构成要素是复杂的,不同的标准对其的定义也不尽相同,但要素的主体范围是相对稳定的,区别主要在于分层、分级和优先级的差异.行政区划要素和道路要素都属于地址结构的前两个部分,城市空间主体中的任一对象的位置都可以用行政区划、道路和门牌号的形式来表达.即通过行政区划和道路,可以将数据或管理要素划分到不同的空间中.
行政区划边界常用于网格划分中,但因边界的多级特征,使边界尺度的选取具有不确定性,过大或过小的尺度都不利于网格的应用.地址作为最常用的空间位置表达方式,在日常生活中的使用极其频繁,并在长期实践中形成具有实际应用支撑的体系结构,对于行政区划的层次划分有极大的参考价值.在表14个主要地址相关标准中,GB/T 23705-200《数字城市地理信息公共平台地名》、CH/Z 9010-2011《地理信息公共服务平台地理实体与地名地址数据规范》和DB35/T 1765-2018《标准地址编制规范》都只将行政区划划分到乡镇街道级.这说明在实际应用中一般只涉及到乡镇街道级,即在网格划分中行政区划层级划分到乡镇街道级就已经满足绝大多数的应用需求.然而,对于道路划分要素的选取,一般是以道路在城市规划中的重要性来选取,不足以明确道路在具体应用中的重要性,还可能造成划分结果的冗余,不利于后续的应用与分析.不同道路选取下网格划分模拟图,如图3所示.
(a)要素A与道路叠加
道路遍布在整个城市空间,相当于城市的骨架.从道路网中抽取部分道路进行网格划分,有两点需要考虑,即选多少道路和选哪些道路.选多少是选取量、道路比例,以及网格划分密度等方面的问题,这里主要结合图3来探讨如何准确的选取道路的问题.
从图3(b)可知:如果面向A要素,选取主要道路划分网格,因为空间要素的分布是不均衡的,且与不同道路并不一定存在相关性,网格划分会存在冗余和不准确的情况.从图3(c)可知:如果通过A要素涉及的地址信息来获取其中的道路信息,辅助于道路要素的选取,可提升网格划分的质量.
地址模型的构成要素具有多种类型,同类要素之间也存在层次关系,多级网格模型也对应着多级结构和多类构成要素.从网格的角度看,地址模型的构成要素可分为三类,即行政区划要素、道路要素和其他要素(如建筑物).若多级网格模型为由行政区划要素和道路要素构成的两层多级结构,那么行政区划网格就对应着地址模型中行政区划要素对应的行政实体.结合道路要素对行政区划网格的细分,就是以地址模型中道路要素对应的城市空间中的道路实体,与上级网格边界构成闭合多边形,其他要素辅助于多级网格模型划分要素的选取.
3.1.3 地址要素与网格的关系 从几何形态上看,地址要素分为点状、线状和面状地址要素.在城市网格的划分框架中,一般是以面或线进行组织划分,如湖泊、行政边界线、道路中心线等.因此,在分析地址要素与网格关系中,以面状和线状地址要素为中心,探讨其与构成网格的三要素格点、格边和格元之间的关系.文中以行政区划级(省、市、区/县、乡镇/街道)、基础要素级(建筑物群和建筑物)的面状地址要素,和以街路巷中道路为代表的线状地址要素,探讨地址要素与网格要素的关系.
地址要素与格元主要有如下两种关系.1)面状地址要素与格元的关系.指在地址模型中行政区划级(省、市、区/县、乡镇/街道)的地址要素对应着行政区划网格中不同级别的格元,且根据地址要素中行政区划之间层级关系,格元间也存在着对应关系;以建筑物群和建筑物为代表的基础地址要素对应着格元内的面状地理实体,用于辅助格元的划分.2)线状地址要素构成的封闭多边形与格元的关系.其中道路是最基础的线状地址要素.从乡镇/街道网格划分开始,格元是由道路和行政边界,或道路和道路组成的闭合多边形.
地址要素与格边主要有如下两种关系.1)面状地址要素与格边的关系.其中行政区划级的面状地址要素就对应着基础的网格单元,其本身就是多条格边按一定顺序组合而成;在后续的网格划分,以行政区划划分的网格单元边界部分将作为下一层级部分网格单元的格边.2)线状地址要素与格边的关系.道路是城市空间天然的分割线,是城市空间的基础框架,作为格边的重要组成部分,一条道路可能作为一条格边或多条格边.
地址要素与格点主要有如下两种关系.1)面状地址要素和格点关系.其中行政区划级的面状地址要素是由多条格边构成,格点是该类面状地址要素的格边连接点.2)线状地址要素与格点的关系.线状地址要素交叉点、线状地址要素和行政边界的交叉点为格点,格点一般为线状地址要素的起点或终点.
建立网格划分模型需要综合考虑划分空间的特征、网格的表达能力和应用扩展的适应性,以执行最优化的网格划分操作.其中,道路划分要素的选取随着具体应用的变化而不断变化,需要一个额外的模型对道路要素选取方法进行定义.因此,将该网格划分模型分为网格划分结构和道路要素选取两个部分进行研究,模型所涉及的重要参数和变量如表2,3所示.
表2 模型输入参数
表3 模型中间变量
从管理和数据两个层面来看,网格结构可以是单层的,也可以是多层的,多层的网格结构更有利于多层次的应用.但网格结构并不是层次越多,越复杂越好,因此本节结合地址结构来制定网格划分结构.
在以行政区划边界为核心的网格划分中,基本上完全继承了行政区划的结构,将一个城市首先划分为市级-区县级-乡镇(街道)级-社区(村)级4级网格结构,然后基于社区(村)级的网格细分,可以看做是5层的网格划分结构.在以行政区划边界和道路为基础的网格划分中,对于行政区划边界的选取范围,没有明确的标准,一部分划分到乡镇(街道),另一部分划分到社区(村).因此,文中从地址模型的角度,来验证具体到哪一层的行政边界就能满足绝大多数的网格划分需求.
长期应用中形成了具有体系结构和规则的地址模型,它的实例化表现为地址,是一种最常用的,便于人们认识的空间位置描述方式.任何一个空间数据都有其对应的地址信息,基于地址的结构及要素的层次规则,就能实现数据的语义切分.网格划分是空间层次上的划分,对于管理网格或数据网格,都是为了更精确和高效地解决需求问题.因此,地址的语义切分对于网格的空间层次划分具有指导意义.
在地址模型中行政区划要素属于地址结构中的第一大层次,对于一个城市空间的地址来说,可以分为3个层次,如图4所示.地址可作为网格中所有信息的组织和管理的汇集和联系的纽带,通过地址中的行政区划结构来设计网格中的行政区划结构,增强了网格汇聚、关联和整合信息的能力,有利于网格的应用.
图4 地址的三段式结构
道路可以划分单层网格,也可以划分多层网格.理想状态下,基于道路等级就能进行多级网格的划分,道路的等级层次较多,例如GB/T 51328-2018《城市综合交通体系规划标准》中按道路功能可分为8个等级.在现有的多要素组合的网格划分结构中,一般也会将多等级的道路,用于多层的网格划分中,但是道路选取标准不同,有的以主次干道和一般道路等为标准,有的以高速公路、国道和省道等为标准,对同一网格的划分,不同的道路选取会产生不同的网格划分结果.
文中对道路选取方法进行了量化,选择与道路等级关系最密切的指标,综合道路的关联特征,进行道路选取;然后,基于多特征计算的道路重要性值进行道路选取和分层.考虑到网格的深度和区分度,一般将道路分为两层,对于更细尺度的网格划分需求,可根据道路重要性值选取道路,进行网格的细分.
在前面道路选取方法的基础上,建立基于道路多项指标和指标权重计算方法的道路要素选取模型,计算道路重要性值,并将其应用于网格划分中的道路选择和分层.
通过多项指标来构建道路选取模型,破除单一指标或规划建设定级对于道路选取的局限性,在综合现有道路选取方法涉及的几何特征和语义特征两大关键因素,加入面向具体应用地址中计算出的道路频数值,实现更准确的道路选取.因此,以PDR中提取出PRL,PRW和PRS为基础,加入PAD中提取出的PRP,计算PRI,构建道路要素选取模型为
PRI=λ1PRL+λ2PRW+λ3PRS+λ4PRP.
(7)
式(7)中:系数λ1,λ2,λ3和λ4通过熵值法计算,表示各指标的权重.基于以上4个变量计算出PRI,作为道路重要性值,参考各级道路比重信息,以PF来计算PV,实现道路要素的选取和分层.
图5为具体的网格划分流程,有以下4个主要步骤.
图5 网格划分的基础流程
步骤1应用主题的地址数据的处理和解析.该步骤是为了贴合应用主题,确定行政区划网格划分的层级,提取出道路及计算频数,即同一条道路出现的次数.
步骤2基础地图数据准备和处理.包括行政区划数据处理、道路数据处理和辅助图层(如建筑物、山地、水体等)的选取,得到多级行政区划面和边界线,以及多类道路融合的完整道路网数据,要求各类数据要有统一的空间参考系和完整的属性信息.
步骤3道路划分要素的提取方法.参考以道路几何特征为基础的主次干道的道路划分和以速度为基础的道路划分,设计以道路频数值、道路几何特征(长度、宽度)和道路限制速度等4个指标为基础的道路选取模型;然后,通过熵值法分别计算4个指标的权重,根据指标权重和指标值,计算用于道路选取的道路重要性值;最后,参考各级道路比重信息,根据频数分布,确定重要性提取阈值,用于道路的提取与划分.
步骤4根据步骤1中确定的行政划分的层级和步骤3的道路提取方法,从基础地图数据中提取划分要素,依据网格划分结构,进行多级行政区划边界和道路的依次叠加,对于最低级网格划分,可结合辅助图层进行细分,实现两层多级的城市网格划分.
选择的研究区域为福州市鼓楼区,位于福州市市区西北部,为福州全市的经济中心、文化中心、政治中心及现代金融服务业中心,也是福州市初等、中等教育资源最雄厚的区.实验选取的数据包括地址数据和基础地图数据,如表4所示.地址数据是从高德地图中爬取的39 095条POI(point of interest)数据,基础地图数据包括四级行政区划边界、3 146条各级路段和辅助图层的矢量数据.
表4 实验选取的数据
POI数据具有数据种类多、数据数量大,且能够反映城市区域特征等特点.在人口分布、基础设施建设和事件发生较为密集的区域,POI数据的分布也较为密集.因此,文中以POI地址数据为例,实现POI网格划分.
文中通过ArcGIS,MySQL和Python进行数据处理和网格划分操作.首先是进行行政边界的处理.为了建立行政区划网格单元间的关系,在行政区划网格的划分,采用下级行政边界线切割上级行政区划网格单元的方式.执行这项操作,需要将下级的行政区划面转为线,并剔除与上级行政区划网格单元存在相交的边界部分;然后,基于上级行政区划网格单元内部的下级行政区划边界,对该网格单元进行划分.由一个上级行政区划网格单元划分多个下级行政区划网格单元.这种网格单元的划分方式,可以使下级网格单元保留上级网格的属性信息,有利于建立网格单元间的联系.本案例要执行网格操作,需要提取鼓楼区的乡镇街道的内部行政边界,对鼓楼区的空间区域进行划分,得到10个乡镇/街道级的网格单元.
其次,在完成基于行政边界的网格划分后,需要选取道路进行网格的再次划分,而道路选取首先要完成POI地址分析和处理.通过Python调用第三方的工具库,进行POI地址数据的处理,经过地理编码和分词处理后,得到包含标准地址和关键字段信息.关键字段信息包括多级行政区划信息、道路信息、门牌号、建筑物群/建筑物、楼层等信息.根据乡镇/街道名,计算每个乡镇/街道网格内的POI数据总量,发现数据样本在各网格内的分布较为均匀,如图6所示.图6中:N为数据样本数.因此,可以继续进行道路关联特征和道路基础指标的计算,实现面向网格划分的道路要素选取,而不需要考虑因POI在不同的网格单元内分布过度不均,造成道路选取结果分布也极不均衡的情况.
图6 POI数据分布图
道路长度、道路宽度和道路限制速度是文中道路指标体系中的3个基础指标.其中,道路长度可以通过ArcGIS中几何计算得到相对准确的数值,但是道路宽度和道路限制速度就需要道路数据有着对应的属性信息.因此,该方法对道路的质量要求较高.文中道路数据的属性信息比较完整,原始数据就包含了这3项指标.因此,将指标计算的重点转向关联特征.
检查Python处理后POI数据中的道路信息的完整度,对于缺失的道路信息,结合地址结构和地址特征词,通过正则表达式从POI的地址中提取道路信息;然后,根据道路名之间的语义关系,计算道路的频数值,将频数值指标与其他3个基础指标汇总成表,通过Python编写熵值法计算代码,计算4个指标的权重,得到道路频数(c)、道路长度(l)、道路宽度(w)、道路限制速度(v)的权重分别为0.495 701,0.222 723,0.208 422、0.073 153.因此,本实验的道路重要性(RI)计算公式为
RI=c×0.495 701+l×0.222 723+w×0.208 422+v×0.073 153.
(8)
将计算出道路频数值,通过表连接的方式赋值给ArcGIS中的路网数据,在路网数据的属性表中通过字段计算器,得到每条道路的RI值.根据RI值排序提取参与网格划分的道路,结合RI值的频数分布,进行道路分层,实现在行政网格体系下二层的道路网格划分,如图7所示.
(a)一级基础网格(65个) (b)二级基础网格(226个)
从图7(a)可知:基于乡镇街道级行政边界和道路重要性(RI)大于300的道路进行划分,RI值是基于整个道路重要性的频率分布来确定的,并以中位数和高频区间取值进行测试,能把上级网格划分为同级网格间数量相对均衡的RI值为最优值.即选取的划分要素能把上级网格中大部分的网格单元化为数量均衡的低级网格.从图7(b)可知:基于道路重要性(RI)小于300,但大于20的道路进行划分,最低值的确定是依据4个指标和权重计算的,其目的是排除一些4个指标都不突出的道路,缩小道路选取范围,提高选取效率.
针对具体的应用,网格划分要考虑到一些人文要素,例如人口、物件、事件等.一般是在基础网格划分后再结合这些因素,通过人工参与进行网格细分.因此,文中用POI数据作为网格划分关联的人文要素,模拟在同一乡镇/街道网格下,分别按照文中融合POI因素的道路选取和直接按照道路等级选取道路(高速路、国道、省道、县道、市区一级道路)进行网格细分.网格划分的效果对比,如图8所示.
(a)文中方法的网格细分 (b)基于道路等级的网格细分
由图8可知:在同样的乡镇街道网格下,两种道路选取结果对应着两种网格细分结果.在网格划分区域的北部,图8(a)比图8(b)划分的更粗,这是因为鼓楼区最北部由大块的绿地和快速公路组成,POI因素的分布密度较低,不需要划分的过细;在网格划分区域的东部、西部和南部,图8(a)和图8(b)的划分差距较小;在网格划分区域的中部,属于鼓楼区的中心地带,位于三坊七巷和商圈附近,各种POI因素分布密度极高,图8(a)明显比图8(b)划分的更细,这是因为有些道路原始的等级或重要性并不高,无法直接选取进行网格细分.但是,在关联人文要素的网格划分时,这些道路又很重要,如果不能有效地选出来,那么在叠加人文要素的时候,就不可避免的需要人工调整网格,会影响网格划分的效率,不利于网格的更新.
文中在网格划分流程中引入地址模型,进一步地验证了行政区划和道路在城市网格划分中重要性.采用地址模型中行政区划和道路要素的结构和层次进行划分,构建两层多级的网格划分结构,以模型中行政区划要素的划分层级确定行政区划网格的划分层次,以地址模型为基础来解析面向网格应用主题的人文要素地址数据.然后,辅助计算和抽取该应用主题关联的主要道路及其频数,结合道路分级的几何特征和语义特征,构建道路重要性模型,实现定量化的道路选取方法.最后,基于制定的网格划分结构和网格划分要素提取方法,进行两层多级的城市网格划分.
在同一乡镇/街道网格下,分别按照本文融合人文要素的道路选取和基于等级的道路选取进行网格的细分.实验结果表明,在有效约束条件下,文中方法能更有效地融合两类划分要素,并将人文要素信息融入道路选取中,可以实现结合人文要素的自动化网格细分,便于网格的更新.