余晨曦
(1.上海市测绘院,上海 210063)
基于ArcGIS的房屋建筑数据采集与统计分析
余晨曦1
(1.上海市测绘院,上海 210063)
在上海市基础地形数据、航空数字正射影像等数据的基础上,介绍了上海市房屋建筑数据采集的技术流程;探讨了基于ArcGIS平台进行基本统计和空间分析的方法,旨在更详实地了解上海市建筑物分布情况,为城市改造提供宏观决策依据。
ArcGIS;数据采集;空间统计
随着经济活动的日渐繁荣,我国城市化进程高速发展,城市发展和变化日新月异。而城市房屋建筑是人们工作、生产、生活、学习、娱乐和储藏物资的永久性场所,是城市的主要构成要素。它的分布规律以及形态特征反映了城市旧区改造、新城镇建设发展情况,真实记录了城市建设形态发展。
与传统的非空间统计分析方法不同,空间统计方法是将地理空间信息直接融入到数学逻辑中,目前已广泛运用于农业、地质、土壤、水文、环境、经济以及地理等领域[1-6]。本文旨在利用航空影像和基础地形信息采集上海市域内每栋房屋建筑物的地理位置、占地面积、楼层数、高度等信息,并建立城市房屋建筑形态数据库。在此基础上利用空间分析方法进行统计,为城市改造提供宏观决策依据。
上海市房屋建筑形态数据包含上海市市域内每栋房屋建筑的空间位置信息、范围、楼层数和高度信息等。其资料来源为上海市大比例基础地形数据、航空数字正射影像以及航测内业成图数据。
1)基础地形数据。其中的居民地数据可为城市建筑形态数据采集提供上海市域每栋房屋建筑物的图形特征信息和属性信息(房屋建筑高度、楼层数等)。
2)航空数字正射影像。采用现势性好、分辨率高,通过正射纠正的影像数据,用于统一房屋建筑采集的时点。
3)航测内业成图数据。它针对基础地形数据中的准测量区域、数据缺失区域以及现势性较差的区域进行航测立体采集成图,对上述区域中缺失的数据进行补充,包括房屋建筑面和房屋建筑高程点。
城市房屋建筑形态数据采集的主要任务就是将基础地形数据和航测内业成图数据进行融合,并根据最新的航空数字正射影像进行现势性更新,形成最终的城市房屋建筑形态成果。主要流程如图1所示。
1)数据融合。将航测内业成图数据与大比例基础地形数据进行对比,将地形数据库中错误或缺失的范围用航测内业成图数据进行替换。主要工作包括属性一致化处理、数据图层合并、数据接边和房屋建筑面合并等。
图1 房屋建筑形态数据处理流程
基础地形数据和航测内业成图数据由房屋建筑面和房屋建筑高程点构成,需要将高程点的高程属性通过空间位置关联到房屋建筑面上;再对基础地形数据和航测内业成图数据进行属性字段一致化处理,删除不必要的字段,使得各层数据只包含楼层数、建筑高度字段;最后将几个图层合并为一个图层,做好数据接边。对于合并后的数据,将属性完全相同的相邻房屋建筑面进行面合并,以减少极小面、面重叠等拓扑错误。
2)现势性更新。将房屋建筑融合后的数据与最新的航空数字正射影像进行对比,实现现势性更新。对于影像中明显已拆除或消失的房屋,需在成果数据中删除;对于新增房屋,则需圈出相应范围,运用航测内业成图技术进行补测,再对补测数据进行数据融合。
3)数据拓扑检查、异常值处理。检查房屋建筑初步成果中存在的面重叠、面缝隙、极小面等拓扑错误,并进行修改。对于建筑物高度和楼层数属性,发现建筑物高度明显错误的(如高度<2.2 m或单层平均楼高<2 m),在不影响统计结果的前提下,去除相应的属性值,填写缺省值。
基本统计是基于统计单元,统计上海市城市房屋建筑的占地面积、面积占比、构成比、平均楼层等指标,反映上海城市建筑形态空间分布特征。
3.1 统计单元
①行政区划与管理单元:城市中心城区、17个区县、上海市;②规则地理格网单元:100 m×100 m、1 km×1 km规则地理格网单元;③街坊面:城市中心城区由于道路分割形成的街坊面。
3.2 统计指标
按统计单元,上海市城市房屋建筑形态统计的具体指标见表1。
表1 城市房屋建筑形态统计指标
①面积:基于上海平面坐标系,统计单元内面要素的平面面积。②面积占比:统计单元内面要素的面积总和与单元面积的比值。③构成比:同一统计对象内部的构成,即子类占父类的比重。④建筑平均楼层:统计单元内所有房屋建筑楼层的平均值,公式为:
式中,n为统计单元内房屋面个数总和;Sk为第k个房屋面的面积;Storyk为第k个房屋面的楼层数。
在ArcGIS中提供了一系列用于分析空间分布、模式、过程和关系的统计工具,是专门为处理地理数据而开发的。采用空间统计方法对上海市城市建筑形态空间分布的显著特征进行汇总,识别具有统计显著性的空间聚类,评估城市建筑形态聚类或离散的总体模式,并建立空间关系模型,形成相应空间分析专题图成果。
4.1 方向分布统计
4.1.1 统计模型
度量地理分布的空间分析方法主要用于汇总某一分布模式的关键特征,包括平均中心计算、中心要素确定、线性方向平均值、方向分布统计等。利用方向分布统计(标准差椭圆)方法统计高层建筑空间分布的轴线方向。
标准差椭圆以要素分布的平均中心为椭圆中心,分别计算其在X、Y方向上的标准差,从而确定椭圆的长轴和短轴。利用标准差椭圆,可以分析要素的分布是否具有特定的方向。椭圆的分布范围表示要素空间分布的主体区域,方位角(正北方向顺时针旋转到椭圆长轴的角度)反映其分布的主趋势方向,长轴表示要素在分布主趋势方向上的离散程度。标准差椭圆的计算公式[7]为:
式中,σx为标准差椭圆短轴的长度;σy为标准差椭圆长轴的长度;和是平均中心和要素i坐标xi、yi的坐标差。
4.1.2 统计流程和实验成果
利用上海市城市房屋建筑成果数据,提取面要素的几何中心,形成房屋建筑点数据;再根据房屋建筑的楼高和楼层属性,提取楼高>100 m的超高层房屋建筑以及楼层数>10层且建筑高度<100 m的高层房屋建筑。对提取好的超高层房屋建筑、高层房屋建筑点数据,以街道、镇为统计单元进行方向分布统计,形成最终的空间统计结果。统计流程见图2。
图2 方向分布统计(标准差椭圆)流程
图3是以虹口区房屋建筑实验数据为样本,采用方向分布统计方法形成的统计成果。从图中可直观发现虹口区各街道高层房屋分布是有其分布中心和总体趋势方向的。以江湾镇街道和凉城新村街道为例,江湾镇街道的高层及以上房屋建筑的标准差椭圆中心位于江湾镇中心,分布方向总体表现为“西北—东南”;而凉城新村街道的高层及以上房屋建筑的标准差椭圆中心明显位于街道的偏西南方,分布方向总体表现为“东北—西南”。
图3 虹口区高层房屋建筑方向分布统计成果
4.2 热点分析
4.2.1 统计模型
热点分析统计方法主要用于标识具有统计显著性的聚集点,可对数据集中的每个要素计算空间聚集因子(Z得分)。对于具有显著统计意义的热点,要素应具有高值,且被其他同样具有高值的要素所包围。某个要素及其相邻要素的局部总和将与所有要素的总和进行比较;当局部总和与所预期值存在很大差异,而无法成为随机产生的结果时,会产生一个具有显著统计学意义的 Z得分。通过统计获得的Z值,可以分析出高值或低值要素在空间上发生聚类的位置。Z得分的计算公式[8-9]为:
式中,xj为要素j的属性值;ωi,j为要素i和j之间的空间权重;n为要素的总和为要素属性值的平均值;S为要素属性值的标准差,计算公式为:
利用热点分析法,分别统计上海市、各区县房屋建筑的聚集程度,从而分析出上海市以及各区县房屋建筑分布的热点区域。
4.2.2 统计流程及实验成果
按1 km×1 km规则地理格网单元,统计每个格网房屋建筑的面积占比;再利用统计得到的带有房屋建筑面积占比的规则地理格网进行热点分析,得到每个规则地理格网单元代表房屋建筑的聚集程度Z值。Z 值越大,表示房屋建筑聚集的程度就越大;反之亦然;若Z值接近于零,则表示该区域房屋建筑不存在明显的空间聚类。具体流程如图4所示。
图4 房屋建筑数据热点分析流程
以上海市房屋建筑实验数据为样本,采用热点分析方法形成最终统计成果,如图5所示。从图中可知,上海市房屋建筑集中分布的区域主要在上海市中心城区的8个区,包括黄浦区、静安区、长宁区、徐汇区、虹口区、普陀区、闸北区、杨浦区。尤其是内环区域房屋建筑的聚集度比其他区域更大,而杨浦区北部又比其他区域聚集度小。其余郊区房屋建筑集中分布的区域主要在各区县的卫星城中,如嘉定的嘉定新城、南翔、安亭,松江城区、青浦城区、金山的金山卫地区等。以位于图5中右上角的崇明县为例,其房屋建筑集中分布的区域主要在崇明岛上的城桥镇、堡镇以及长兴岛的西南沿岸地区。可见房屋建筑的聚集度与城市化发展具有一定的联系,一般来说房屋建筑聚集度越大的区域,其城市化程度越强。
图5 上海市房屋建筑热点分析统计成果
本文通过研究上海市城市房屋建筑形态数据的采集和统计分析方法,结合ArcGIS平台提供的一系列数据处理和空间统计工具,有效地提高了房屋建筑数据采集的效率;并利用方向分布统计和热点分析等空间统计方法,分析了城市房屋建筑高度分布的轴线方向和分布的聚集程度,真实地反映了城市建设形态发展。
[1] 陈斐,杜道生.空间统计分析与GIS在区域经济分析中的应用[J].武汉大学学报(信息科学版), 2002,27(4):391-396
[2] 马洪超,李德仁.基于空间统计学的空间数据窗口大小的确定[J].武汉大学学报(信息科学版), 2001,26(1):18-23
[3] 胡青峰,张子平,何荣,等.基于Geoda 095i区域经济增长率的空间统计分析研究[J].测绘与空间地理信息, 2007(2):53-55
[4] 张显峰,崔伟宏.基于GIS与空间统计分析的可持续发展度量方法研究:以缅甸Myingyan District为例[J].遥感学报,2001(1):34-40
[5] 罗畏,邹峥嵘.空间统计分析的环境质量评价应用[J].测绘科学, 2012(4):32-34
[6] 宋琳,董春,胡晶,等.基于空间统计分析与GIS的人均GDP空间分布模式研究[J].测绘科学, 2006(4):123-125
[7] Mitchell, Andy. The ESRI Guide to GIS Analysis[M]. RedLands: ESRI Press, 2005
[8] Getis A, Ord J K. The Analysis of Spatial Association by the Use of Distance Statistics[J].Geographical Analysis, 1992,24(3):189-206
[9] Ord J K, Getis A. Local Autocorrelation Statistics: Distributional Issues and an Application[J].Geographical Analysis,1995,27(4):286-306
P208
B
1672-4623(2016)07-0026-04
10.3969/j.issn.1672-4623.2016.07.008
余晨曦,硕士,从事地图制图学与地理信息工程方面的工作。
2015-12-01。
项目来源:现代工程测量国家测绘地理信息局重点实验室开放课题资助项目(TJES1308)。