城市规划大数据的空间化及利用之道*

2014-08-06 09:32
上海城市规划 2014年5期
关键词:城市规划空间分析

牛 强

中国城市规划的大数据时代已经来临。从学术交流来看,2013年开始,中国城市规划年会已经连续两年举办了关于大数据的自由论坛——“大数据时代的城乡规划与智慧城市”和“大数据和城乡治理”,反响非常强烈。从研究机构来看,北京城市实验室BCL、北京西城-清华同衡城市数据实验室UDL、南京大学城市规划设计研究院规划技术协同创新中心等开始先后研究城市大数据,一些自媒体网站如城市数据派UDParty、城市界面CITYIF等先后成立并介绍关于城市大数据的研究成果。从开放数据来源来看,近年来国际上许多知名的开放数据组织开始支持国内数据访问,如开放街道地图OSM、知识共享CC、开放知识基金会OKFN等;中国政府也在有序推进政府信息公开工作,如天地图、北京市政务数据资源网、上海政府数据服务网等;大批互联网公司开始在一定程度上开放自己的数据,或者提供开放的API,如新浪微博、大众点评网、百度等。

学者们利用这些城市大数据进行了卓有成效的研究,取得了传统数据环境下无法企及的成果,而大数据的空间化是开展这些研究的有效途径。

1 城市规划大数据类型

数据收集一直以来在城市规划编研中占据着十分重要的位置,但传统数据收集方式(如实地调研、问卷、统计资料等)存在样本数量小、主观性强、成本高、周期长等缺陷。大数据时代的到来极大地拓展了城市规划数据获取的渠道,为城市规划提供了大量高价值的数据,概括起来可以分为以下7类。

(1)业务运营数据,例如公交IC刷卡数据、水电煤气数据、业务审批数据、出租车GPS轨迹数据、移动通讯数据、金融数据、物流数据、超市购物数据、就医数据等。

(2)普查数据,例如人口普查、经济普查等。

(3)监控数据,例如视频监控、交通监控、环境监控等。

(4)社会网络数据,例如微博、论坛等。

(5)主动感知数据,例如关于温度、湿度、PM2.5等环境的感知数据、手机定位数据等。

(6)遥感数据,例如航空遥感和航天遥感数据等。

(7)GIS数据,例如关于道路、建筑、行政区划的地形数据等。

上述这些大数据都具有典型的5V特征,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。对城市大数据全样本的分析,对于推动城市规划朝着精细化、准确化、科学化方向发展具有革新性的意义。但是这些数据数量庞大、结构多样,利用起来技术难度较大,而空间化技术可以在一定程度上方便它们的利用。

2 城市大数据的空间化

较之其他大数据,城市大数据的一个突出特点是它们大多和空间位置有一定的关系,要么是关于某地的信息,例如某街区的人口、经济、环境等;要么是发生在某地的信息,例如发生在某地的犯罪、通讯、交通等。

城市大数据的空间化就是要把这些信息以空间的方式组织起来,并通过二维、三维地图展现出来,从而方便查看和空间分析。下面介绍几类典型城市大数据空间化的效果。

(1)公交刷卡数据的空间化

公交刷卡数据是典型的大数据,它反映了市民的公交通勤轨迹,基于它可以分析城市的职住分布、居住与就业特征、居民的通勤等。龙瀛等(2012)对北京的公交IC刷卡数据进行了空间化(图1),用于通勤分析、职住分析、人的行为分析、人的识别、重大事件影响分析、规划项目实施评估分析等。

图1 基于公交IC刷卡的北京市中心区通勤

图2 武汉某时段的实时交通量

图3 六普数据空间化得到的2010年人口密度图

图4 2000 年全国县级农业统计数据的空间化

(2)交通量数据的空间化

交通量监测数据的数据量十分巨大,空间化是查阅分析它的有力手段。图2显示了百度地图对城市实时交通量数据的空间化效果。它根据各条道路上的交通量,用不同颜色绘制道路,从而反映出某时段整个城市的交通量分布情况。

(3)人口数据的空间化

全国人口普查数据是典型的大数据,该数据具有普查区信息,标识了其空间位置。毛其智、龙瀛、吴康(2014)对“五普”和“六普”的人口数据按照普查区进行了空间化,得到了全国乡镇和街道尺度的细粒度人口密度图(图3)。它将一条条难以查看的普查数据关联到地图上的普查小区,变成了一幅高精度的人口密度图,图中颜色的深浅变化代表了人口密度的高低。较之传统的粗粒度、大尺度的人口分布图,该方式极大地提升了人口大数据的科研价值和使用效果。

(4)经济普查数据的空间化

经济普查产生了大量高价值的经济数据,除了用于传统数理分析,目前不少学者将其空间化(图4),从而可以开展经济空间分析,包括产业、就业、经济密度等空间分布、产业空间聚类等。

(5)移动终端位置信息的空间化

人类行为数据的采集是研究人类空间行为的关键,但传统问卷和普查的方式工作量极大、效率低、精度不高。当前大数据为这些研究提供了详实的一手资料,其信息主要来源于手机中的LBS(基于地理位置的服务),它通过移动终端和移动网络的配合,确定移动用户的实际地理位置,百度和谷歌根据这类服务主动收集了大量用户的位置信息。这些位置信息可以反映人类活动的时空轨迹。

例如,“百度迁徙”对其拥有的LBS大数据进行空间化,全程、动态、即时、直观地展现2014年中国春节前后人口大迁徙的轨迹与特征(图5)。

(6)社交数据的空间化

社交数据是反映人类活动和联系交往的重要信息。当前网络环境下的微博、博客提供了新型的社交平台,并产生了数量巨大的社交大数据,这极大地弥补了社交数据难以采集的问题。对社交数据的空间化可以反映社交的空间分布以及两地之间的联系强度。因此,目前许多学者利用了微博数据中的位置信息来开展研究,例如王江浩抓取了带有位置信息的微博数据,并以此得到了全国各省市的人类活动强度和区域联系度(图6)。

(7)犯罪数据的空间化

毛媛媛等(2014)对上海市浦东新区某时间段的两起刑事案件根据其发生位置进行了空间化,直观反映出犯罪的空间分布(图7),用于分析其与城市空间环境的关系。

图5 2014年春节期间人口迁徙图

图6 基于带地理位置微博数据得到的江苏省人类活动强度图

图7 犯罪数据的空间化

3 空间化后的利用方法

城市大数据空间化后,信息变得直观,并拓展了分析和利用途径,可以更加有效地支持信息发掘和知识发现。

(1)用于信息内容的空间可视化

“一张图胜过一千句话”,这是对图纸信息表现力的客观评价。城市大数据由于数据量极其庞大,要直观反映其中的内容是非常困难的。而空间化后,用二、三维地图反映其空间分布,用颜色、线型反映信息的内容(如GDP、人口数量、交通量等),繁杂的信息就能变得有序、易懂。如此就可以将大数据中的数字转化为对城市的理解。前述各典型大数据空间化后得到的图纸都是其信息表现力的有力证明。

(2)用于空间分析,挖掘空间知识

城市大数据空间化后,大量的空间分析方法都可以被使用,从而极大地拓宽了分析手段。这些空间分析类型众多,基于分析目的可以分为以下5类:空间特征分析、模式和格局分析、空间关系和成因分析、趋势分析和预测、评价。

1)空间特征分析:通过空间统计、密度分析等方法得到研究对象时空分布和演变的特征。例如对人口普查数据空间化后可以分析其空间分布特征,在对出租车轨迹数据分析的基础上得到出行方式、通勤时间、出行人群识别和比例等。

2)模式和格局分析:通过空间自相关分析、热点分析、空间聚类等方法找到研究对象空间分布的格局和模式。例如对社交网络数据空间化后可以识别城市网络体系、城市间的联系和等级结构,识别不同类型人群及其聚积方式、范围。

3)空间关系和成因分析:通过空间回归分析等揭示变量之间的统计因果关系。例如分析人口空间分布和水电煤气消耗、道路交通量的关系,城市环境质量和经济、人口分布、交通网络之间的关系等。

4)趋势分析和预测:预测是大数据的核心,大数据空间化后可以预测交通拥堵点发生的时间地点、预测环境即将恶化的区域、预测人行为的路径、预测犯罪可能会发生的区域等。

5)评价:按照评价模型,分区域对社会、经济、城市管理、交通、环境、满意度、规划实施等进行评价。

此外,大数据的最大魅力在于隐藏于其中的各类知识,数据挖掘是发现这些知识的重要途径。大数据空间化后,利用空间数据挖掘则可以发掘出空间知识,这正是城市研究的目标之一。空间数据挖掘是指从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系,并发现其中有用的特征和模式的理论、方法和技术,可以找到空间关联规则,对数据进行分类和聚类,归纳出一般规则和模式,发现空间特征、探测趋势等。

(3)用于城市大数据之间的信息集成和综合分析

基于相同空间位置可以在多个大数据之间建立联系,把不同来源的大数据集成起来,为之后的高效数据挖掘和分析做好准备。例如针对同一街道的人口普查数据和经济普查数据,由于具有相同的空间位置,两者可以对应起来,整合成人口和经济大数据。多个大数据联合起来后往往会比单个大数据更具价值,例如把人口和交通大数据联合起来就更容易发现交通和人口之间的关系,找到交通拥堵的原因和防治措施。

(4)用于城市大数据的空间检索查询

面对无比庞大的大数据,传统基于关键词、主题词的检索往往达不到预期效果,因为针对大数据的检索结果往往也会条目众多,而要从中找到目标信息仍犹如大海捞针。对大数据空间化后,可以基于空间位置来检索,其检索精度和效率都相对高得多。用户可以在地图上指定查询的空间位置,例如某条道路、某栋建筑、某个街区等,然后检索得到这个位置上的相关数据,而把不在该位置的其余数据过滤掉,检准率和检全率都比较高,操作相对简单,并且检索结果也能用地图来表达其内容。

4 空间化的方法

根据当前的技术条件,可以采用以下两种方法对城乡规划大数据进行空间化,它们都需要借助GIS平台来实现。

(1)基于大数据中自带或关联的地理坐标信息

部分大数据直接带有或可以关联上地理坐标信息。例如微博签到数据、出租车GPS轨迹数据、LBS(基于地理位置的服务)数据等直接带有地理坐标信息。通用GIS(地理信息系统)平台一般都可以将这些地理坐标转换成地图上的点,并把其他信息附加到点上。例如ArcGIS提供了“创建XY事件图层”工具,根据数据表中每行记录的 X 和 Y 坐标字段创建新的点图,并附上所有其他字段信息。

人口普查、经济普查、公交刷卡等带有标识其空间位置的代码,可以根据空间位置代码关联上普查小区、站点等地理要素,进而获得地理位置信息。以公交刷卡数据为例,如果刷卡记录中有起讫站点的编号(公交车刷卡可能只有上车站点编号),同时手边还有关于站点位置的GIS数据,那么就可以根据共同的站点编号将刷卡记录链接到站点位置GIS数据上,从而实现刷卡数据的空间化。

(2)基于大数据中的地址、地名信息

城市业务部门产生的大数据一般都会带有地址信息,例如水电煤气数据、物流数据等都会带有用户的地址。基于地址数据库和GIS提供的地址匹配功能,可以自动实现其空间化。地理匹配的过程是先对含有地址属性的每个记录和带有地址属性的GIS空间参照要素进行比较,如果找到匹配,GIS空间参照要素上的地理坐标就被分配给相应的记录,从而可以在GIS中作为地图显示并用作进一步的分析。ArcGIS的Geocoding提供了上述功能。

5 结论和展望

当前我国城市规划领域对大数据的关注程度日益高涨,对大数据能带给规划界的成果充满期待,但关于城市大数据的研究才刚刚起步,手段也不够丰富。空间化为城市大数据的研究提供了一条有效途径,是城市大数据可视化的有力方式,是开展大数据空间分析的前提,是实现多源大数据融合的纽带。

当前的GIS平台正在积极支持这一途径,例如ESRI公司提供的GIS Tools for Hadoop能够实现对存放在Hadoop中的大数据进行读取、空间可视化和空间分析。而ESRI的城市瞭望台(Urban Observatory)项目,则正在基于空间将全球55个大城市的大数据整合到一个平台下,通过互动地图将城市大数据转化成对城市的理解。笔者深信,随着越来越强大的空间分析工具的出现,随着智慧城市的推进和越来越多的开放大数据的供给,大数据将会离普通规划师越来越近,终将成为开展城市规划必不可少的技术支撑。

References

[1]龙瀛,崔承印,张宇,等. 利用公交一卡通刷卡数据评价北京职住分离的空间差异[C]//多元与包容——2012中国城市规划年会论文集,2012.LONG Ying,CUI Chengyin,ZHANG Yu,et al. Using Public Transport Smart Card Data to Evaluate Spatial Difference of Jobs-housing Separation in Beijing[C]//2012 Annual National Planning Conference,2012.

[2]毛其智,龙瀛,吴康. 中国人口密度的时空演变与城镇化空间格局初探:2000—2010[R]. 北京城市实验室工作论文,2014.MAO Qizhi,LONG Ying,WU Kang.Spatiotemporal Changes of Population Density and Urbanization Pattern in China:2000—2010[R].Beijing City Lab,Working Paper,2014.

[3]齐丽丽,柏延臣. 社会经济统计数据热点探测的MAUP效应[J]. 地理学报,2012(10):1317-1326.QI Lili,BO Yanchen. MAUP Effects on the Detection of Spatial Hot Spots in Socio-economic Statistical Data[J]. Acta Geographica Sinica,2012(10):1317-1326.

[4]茅明睿. 大数据时代的城市规划[EB/OL].城市数据派论坛, http://www.udparty.com/news.php?act=view&id=443,2014.MAO Mingrui. Urban Planning in the Age of Big Data[EB/OL]. Urban Data Party,http://www.udparty.com/news.php?act=view&id=443,2014.

[5]毛媛媛,丁家骏. 抢劫与抢夺犯罪行为时空分布特征研究——以上海市浦东新区为例[J]. 人文地理,2014(1):49-54.MAO Yuanyuan,DING Jiajun. Study on Spatialtemporal Patterns of Robbery and Snatch:A Case Study of Pudong New Area,Shanghai[J]. Human Geography,2014(1):49-54.

[6]秦萧,甄峰. 基于大数据应用的城市空间研究进展与展望[C]//城市时代,协同规划——2013中国城市规划年会论文集,2013.QIN Xiao,ZHEN Feng. Research Progress and Prospect of Urban Spatial Studies Based on Big Data Application[C]//2013 Annual National Planning Conference,2013.

[7]维克托•迈尔-舍恩伯格,肯尼思•库克耶. 大数据时代:生活、工作与思维的大变革[M]. 盛杨燕,周涛,译. 杭州:浙江人民出版社,2013.Viktor Mayer-Schonberger,Kenneth Cukier. Big Data:A Revolution that will Transform How We Live,Work,and Think[M]. SHENG Yangyan,ZHOU Tao,translate. Hangzhou:Zhejiang People’s Publishing House,2013.

[8]牛强,宋小冬. 城建档案管理中的地理空间序化方法研究[J]. 城建档案,2010(11):53-57.Niu Qiang, Song Xiaodong. The Research on Geographical Spatial Ordering Method in Urban Construction Archive management[J]. The Urban Construction Archives Magazine,2010(11):53-57.

猜你喜欢
城市规划空间分析
新形势下的建筑设计与城市规划
空间是什么?
新形势下的建筑设计与城市规划
隐蔽失效适航要求符合性验证分析
创享空间
生态景观在城市规划中的应用探索
电力系统不平衡分析
城市设计与城市规划一体化探讨
电力系统及其自动化发展趋势分析
QQ空间那点事