基于手机信令数据的上海城市公园供需服务分析

2018-01-05 15:05方家刘颂王德张月朋
风景园林 2017年11期
关键词:信令城市公园街道

方家 刘颂* 王德 张月朋

城市公园是城市游憩系统的重要组成部分,其空间布局合理性直接影响着人居环境品质、公共设施使用公平性、城市居民户外生活质量等,因而成为当前研究的热点。城市绿地系统建设中常以人均公园绿地面积作为衡量公园建设水平,公园服务半径作为评价城市公园空间布局的合理性指标。也有相关研究针对传统指标仅考虑公园数量的局限性进行了修正,使用多指标进行综合评价,如城市居民住宅小区公园绿地可达个数、单位面积公园绿地服务人口数、公园绿地氧气供需平衡[1];景观连接度、功能类型丰富度、层次类型丰富度、物种多样性[2]等。其中,从使用者需求与公园供给的关系角度进行评价,多集中于公园分布的可达性[3]及公园的服务水平[4]等。

当前基于游客需求与公园供给关系的空间布局评价方法有2类:一是基于路网等空间通达性特征及服务区人口特征的公园可达性预测;二是基于小样本的特征游客来源调查,进行公园服务范围判断。可达性评价的方法多样,包括以网络分析法[5-6]、缓冲区法为代表的基于空间距离的可达性评价法;以成本法、加权平均交通成本法为代表的基于成本消耗的可达性评价法;以潜力模型法、Huff模型法[7]、两步移动搜索法[8]为代表的基于地理场效应的可达性评价法等。基于公园现实服务水平的评价多依赖于调查数据,对游客进行较为全面的调查和访谈。以上2类方法的初衷是为了弥补传统物质规划中对使用者行为特征的忽视,从空间的服务效率角度进行评价,为提升规划品质作参考。

但是,公园可达性划分法是对公园服务范围的一种推测,多基于用地空间特征,很少考虑游客实际使用情况。公园小样本客源调查法,由于调查数据数量局限,游客来源很难全面提取,服务范围的准确性很难保证。2类方法的出发点均为用服务范围描述需求,但由于居民对绿地使用时空行为特征复杂,相应数据采集困难、样本量过小、数据信息难以与分析技术相结合,使可达性评价长期建立在对居民行为可能性预测的基础上,很难反映居民的实际使用状况。

如何接近真实地反映游客对城市公园的使用?大数据的出现为发掘居民在城市中的真实行为提供了一种新的探索可能。本研究采用一种典型的大数据—手机信令数据,即通过数量庞大的基站连续不断地追踪手机用户的位置、状态等信息,实现对居民活动比较全面完整的数据记录。这种基于大样本游客的公园使用数据,可以对游客行为进行相对直观的描述,从而弥补了传统可达性划分法与小样本调查法的不足。基于大数据源中游客的空间轨迹,探索公园实际服务供给与使用者对公园需求的关系。

1 数据与方法

1.1 基础数据获取

与传统数据和其他大数据相比,手机信令数据的突出价值在于其近似全样本性、全时性,以及借助定位基站而附带的空间信息,在分析极其复杂的居民行为时最契合需求。考虑到人们对公园的使用受气候影响较大,进行公园游憩研究应选择户外出游适宜度高的数据时段。本文选用的数据时段中,平均气温15℃以上的晴好天气达11天,占全数据覆盖天数的78.6%;且深受上海人民喜爱的顾村公园樱花节在此时段开展,可认为此时段中的公园使用者行为受恶劣天气影响较少,能反映游憩需求。研究中使用的是2014年3月中的某2周(共14天),包括4个休息日和10个工作日的上海2G移动用户的手机信令数据,数据为匿名形式,每当手机与基站进行通信连接时,基站会进行记录,产生一条信令数据记录。每条信令数据包含用户ID、时间戳、基站位置编号、事件类型(如接打电话、接发短信、位置更新)等信息,本研究使用的数据日均记录到上海1 600~1 800万个不同的手机识别号(约占2014年上海2 415万常住人口的70%),日均手机信令记录总数约6~8亿条。

1.2 数据筛选

在初步“过滤”出在上海有稳定居住地和工作地数据的基础上,针对上海公园游客进行筛选的步骤如下。

1)选择对象为公园周边基站中有记录的样本。若样本已被基站记录,则说明该样本曾到达该公园。

2)选择第1步结果中0∶00—5∶00时段手机处于静默状态的样本,即选择出能识别出居住地位于上海的样本,并能根据其来源地识别空间位置。

3)选择第2步结果中有地理信息记录的样本,即识别出无信息缺失的有效样本。再继续进行精细化筛选,目的是选择在开园时间出现的样本,排除样本中路过、周边居住、工作记录人群,得出接近现实情况的公园游客记录。

4)选择第3步中在6∶00—18∶00时段,即公园开园时间段内有记录的样本,并选择其中记录间隔2h及以上的样本,即排除停留时间过短的路过公园附近的人群。

5)排除静默时间段在基站范围内的样本,即0:00—5:00时段内处于关机状态的居住在公园附近的样本。

6)排除 1周内连续 5天中 10∶ 00—16∶00时段内出现在第5步筛选后样本中的工作人口样本。最后得出相应公园本批数据中能筛选出的最多游客记录,时间跨度为连续的14天。将识别出的数据与现实人口数据与公园游客量进行比对检验。

手机信令数据在对个体行为轨迹记录上存在时间与空间上的局限性。如对于不同用户,记录时间间隔不一,且普遍为1~2小时;使用基站位置表示用户位置,在空间上会有一定的偏移,从几百米(市区)到数千米(郊区)不等。因此,适合进行城市手机信令数据研究的空间研究尺度通常在街道及以上范围。考虑到基站信号与采集准确性,本研究以上海主城区为研究范围,并去除白鹤镇等4个数据缺失的街道区域。以面积大于10hm2的城市公园,及知名度较高的、规模接近10hm2的公园为研究对象。由于基站空间位置间隔约为中心城区500m,远郊区2 000m,按照基站分布为网格形式进行估算,其面积识别精度为2.5hm2~4km2;本研究筛选的研究对象面积均在此空间范围内,识别的数据精度与空间尺度相匹配;且研究对象与筛选数据的来源地均未涉及数据缺失区域,可支撑游客往返于公园与居住地之间的空间范围记录与数据精度。

1.3 数据可信度验证

将上述识别结果在街道层面进行统计,得到全市各街镇的可识别居住人口,与上海第6次人口普查数据中的各街镇常住人口数进行相关性检验,发现手机信令数据识别结果与人口普查数据的居住人口数相关系数为0.904,具有较高的相关性。且在空间分布上也具有一定的相关性,可认为识别结果较为可靠[9]。选择游客识别记录较多、现实游客量大、区位便利的共青森林公园和游客识别记录较少、现实游客量少、区位偏远的古华园作为验证代表,且分别选择相应的3月日均记录与年均记录,进行比对验证,目的是拟在不同时间段中寻找样本具备代表性的证据。结果显示:共青森林公园2014年3月日均游客量7 098人,识别出2014年3月14天日均游客记录1 178人,占现实游客量的16.6%。古华园2014年日均游客量为4 778人,识别人均游客数为691人,游客识别率为14.4%。对于不同类型的公园,在不同时间维度上检验显示手机信令数据得到的数据与现实游客量的占比具有一定的稳定性,说明识别出的样本数具有一定的代表性。

1.4 研究方法

数据处理阶段,主要使用Microsoft SQL Server等数据库管理软件进行数据的筛选、合并、清理、查询等工作;运用Microsoft Excel软件对各类数据进行处理、汇总、分析。通过空间坐标关联,将获取的地理坐标点状信息落实到ArcGIS 空间分析平台[10],实现活动空间的可视化[11]。借助ArcGIS 的空间提取功能,提取不同属性的空间活动与城市用地,并通过栅格化处理、核密度分析、分区统计、3D模拟等分析方法,对游客来源地进行统计分析。

2 由上海大型城市公园“实达性”反映出的公园服务需求

2.1 上海大型城市公园分布现状与使用概况

本研究以分布于上海陆域的大型城市公园为研究对象(图1)。2014年上海共有10hm2以上的城市公园40座,由于东平国家森林公园位于崇明岛,上海辰山植物园、上海大观园、老港镇桃博园由于相对高票价的原因,不能较客观地体现上海居民游憩需求;浦东金海湿地公园处于闭园状态。此外,黎安公园、新虹桥中心花园、临江公园受公园基站位置设置影响,可识别出的数据量过少,但由于其区位的特殊性,对公园的整体需求格局并不会产生较大的影响;因此,以上8座公园未纳入本研究范畴。研究选择除去以上8座公园之外的32座有数据支持的上海大型城市公园为研究对象,根据其地理坐标分布可见此类公园多集中在中心城区,且分布密集。

1 上海大型城市公园分布现状Large park distribution situation in Shanghai

2 手机信令数据显示的上海大型城市公园游客来源地分布情况Distribution situation of large park visitors' origins dentified by mobile phone signaling data in Shanghai

2.2 上海大型城市公园的“实达性”分析

如图2所示,由手机数据筛选出368 516条记录,每条记录可在GIS平台中生成相应的点,每个点可代表一个游客的来源地,从该图中可直观地判断大型城市公园游客在来源地的聚集程度。从总体趋势上看,中心城区、南部新城与大型居住区游客聚集度高;浦西比浦东聚集度高。

如图3所示,根据基于游客记录产生的点数据,进行核密度分析,可得出每个公园游客的居住地—即对游客来源地更加准确的聚集情况描述。此类描述是将游客数量与空间范围二者进行综合表达的结果。选择使用“分位数”法进行核密度分析,即将游客数量分成6类,并反映至相应空间范围中。本研究将去过某大型城市公园的游客居住地,即游客来源的范围,称为某公园的“实达性”①。排除缺失数据区域,从总体空间分布来看,绝大多数大型城市公园的“实达”范围围绕公园周边呈均质梯度分布,与服务半径覆盖面具备一致的空间特征。某些游客来源区块较为特殊,其周边虽无公园,但显示出了游客来源地的聚集斑块。如泗泾地铁站、汇泾生活购物中心、沈家浜、顾家沙等区域,这些区域均为人口密度较大、生活设施便利的区块。

2.3 基于“实达性”的出游率反映出的街道公园需求

传统数据中,可通过某居住单元的出游率表达该空间的出游意愿,即出游需求。本研究使用某街道去过公园的游客数据除以该街道能识别出的手机信令数据总量,得出该街道单元的出游率来表达游客公园使用需求。根据出游率统计(图4),4.87%为出游率的均值,可将此出游率值作为游客公园使用需求高低的分界点,从而分别统计出游客需求高低的街道数量和名称。

2.4 以街道为空间单元的公园供需关系分析

根据出游率可将街道空间划分为高低2类。根据大型城市公园供给情况,街道空间也可被划分为高低2类,即街道空间中有大型城市公园的为高供给类,无则为低供给类。以街道空间为标准,将高低需求街道情况与大型城市公园高低供给情况进行图面叠合,即可得出“高需低供”、“高需高供”、“低需高供”、“低需低供”4类空间区域。从4类空间来看,“高需低供”与“低需高供”区域均明显表现出了供需不平衡;双高区为游客需求释放好,且可能得到满足的热点区域;双低区为公园需求释放不好,且公园供给不佳区域。根据供需关系建立的4类区域的分配比例来看,双低区域占比79%,为绝大多数;高需低供区域占比10%,占比例最少,若优先发展,集中资源进行建设,将较容易突显建设效果。高需低供区域是最需增加公园的区域,主要涵盖岳阳街道、洞泾镇、马桥镇、车墩镇等地区(图5)。

3 公园服务供需关系分析

3.1 基于供需分析的新建公园建议

将最需增加公园的高需低供区域,与现有区、社区级公园进行再次叠加(图6),可发现该区域街道中现有公园的数量现状;按照数量高低进行排序,可拟定新建公园的建设秩序(图7)。其中,金杨新村街道、洞泾镇、马桥镇、车墩镇、上海工业综合开发区、潍坊新村街道区域中现有区、社区级公园最少,是新建公园时应最优先选择的区域。吴淞镇街道、岳阳街道、泗泾镇区域中有区、社区级公园,这些区域在新建公园时优先级排第二②。

3 基于手机信令数据分析的上海大型城市公园“实达性”范围Ranges of "real" service areas of large urban parks in Shanghai based on mobile phone signaling data anlysis

4 基于手机信令数据分析的街道空间单元的公园游客出游率统计Emissiveness of park visitors in Shanghai street space units based on mobile phone signaling data anlysis

5 基于游客需求与公园供给关系分析的4类街道空间Four types of street space units based on the anlysis of the relationship of park visitors'demand and park supply

6 高需街道区域与上海大型城市公园的叠加关系The superposition relation of high demand street space units and large urban parks in Shanghai

7 高需低供街道空间与区级社区级公园叠加关系The superposition relation of high demand and low supply street space units and parks of district and community level

8 4类区域与《上海市城市总体规划(2016-2040)》新建公园区位叠合The Superposition relation of four types districts and new parks in "Shanghai Master Plan 2016-2040"

3.2 建设时序与数量分配建议

根据基于供需特征进行划分的4类区域建设公园的优先级进行排序,由高至低为:高需低供区、双高区、双低区、低需高供区。将高需低供区中优先建设公园区域与《上海市城市总体规划(2016-2040)》中新建公园的区位进行比对(图8),筛选出淞南公园为最优先建设的公园。

同理,双高区中优先建设的公园为:嘉宝、青松、广富林、淞南、庄行、蓝桥公园。

双低区中优先建设的公园为:嘉北、青北、川沙南、浦江、浦南、廊下、张堰、漕泾、申隆、临港公园;低需高供区中优先建设的公园是:青西、海湾森林、老港、滨海公园(表1)。

4 结论

基于上海市2014年手机信令数据,通过阈值的设定和调整,筛选出到访过上海32个大型城市公园的游客匿名记录,并根据其时空位置追踪其来源地,划分公园接近真实的空间服务范围,即“实达性”。基于GIS平台,通过“实达性”范围内的游客样本数据与上海街道空间单元的空间连接,计算各街道的公园出游率,将街道区域根据出游率划分为高低需求区。结合上海不同级别公园的区位与街道的叠合情况,将上海被大型城市公园服务的区域划分为高需低供、高需高供、低需高供、低需低供4类,并对每类区域的公园服务特征进行了评价。

从公园服务供需情况划分出4类城市特征区域的分析视角重新认识城市空间,可为以公园系统为纲的户外游憩综合服务体系规划提供依据。对照《上海市城市总体规划(2016-2040)》(以下简称总规)发现位于高需低供,即亟需增加公园服务的区域公共活动中心有:城市副中心吴淞、花木、南桥;地区中心松江老城、泗泾镇、张扬路;这些区域中的公园可考虑优先发展,并结合定位与特性将公园建设融入生活设施的完善与生活空间的打造中。高需低供区域,与总规中黄浦江生态走廊建设中的松南片区、青松生态走廊中的广富林及周边片区有很大的重叠度,可见在进行生态保育的前提下,应首要关注该区域中的居民对公园需求与稀缺资源保护之间可能出现的矛盾。此外,根据总规中的大型新建公园选址与4类供需区域的叠合,对新建大型公园的选址与建设优先级可提出建议。参照4类区域中的服务现状,结合周边用地情况,可将总规中建设城乡公园体系的理念落实到供需层面进行细化:区级、社区级公园服务作为基础,以大型公园提供的特殊服务为特点,以特征空间、自然人文资源、特殊设施等,作为引领这些公园发展的目标,以供需现状为基础,优化公园体系结构。

表1 新建公园优先级Tab. 1 Priority of Newly-built Parks

研究表明,基于带有个人时空轨迹特征的新数据源,可为游客的现实公园需求与行为分析提供新思路,并为进行需求的量化分析提供了可能。研究使用手机大数据,自下而上分析城市居民对公园的使用情况,并与公园供给情况结合形成供需分析,辅助规划理念的精准实施。

注释:

①是本研究相对“可达性”提出的概念,可达性”是基于对游客来源可能性的预测。

②本研究所用数据为2014年,至今已有3年时间。3年期间,上海市重点建设的公园及覆盖区域主要有:嘉定区上海汽车博览公园、奉贤区四季生态园、杨浦区新江湾城公园以及宝山区智力公园;外环绿道、黄浦江滨江绿道;中央绿轴公园。嘉定、奉贤、宝山公园邻近文中所提新建公园优先区域,其他多位于中心城区,与研究体现的公园建设需求有一定的契合度。

③图1改绘自2012年上海城市用地现状图;图2~8为作者自绘;表1为作者自绘。

[1]吴娇娇. 城市公园绿地空间布局评价与多目标优化研究[D].广州:华南农业大学,2016:65.WU Jiaojiao. Research on Urban Park Service Assessment and Spatial Layout Optimization[D]. Guangzhou: South China Agricultural University, 2016: 65.

[2]蔡迎霞.城市绿地系统空间合理性评价[D]. 株洲:中南林业科技大学,2012:66.CAI Yingxia. Spatial Rationality Evaluation of Urban Green Space System[D]. Zhuzhou: Central South University of Forestry and Technology, 2012: 66.

[3]Van Herzele A; Wiedemann T. A monitoring tool for the provision of accessible and attractive urban green spaces[J].Landscape and Urban Planning, 2003, 63(2): 109-126.

[4]樊英姿. 基于GIS的城市生活空间中公园绿地的服务水平研究[D]. 上海:上海师范大学,2016:87.FAN Yingzi. Study on the Service Level of Green Park Space based on GIS in Urban Living Space—a Case of Shanghai City[D]. Shanghai: Shanghai Normal University, 2016: 87.

[5]李小马,刘常富. 基于网络分析的沈阳城市公园可达性和服务[J]. 生态学报,2009(3):1554-1562.LI Xiaoma, LIU Changfu. Accessibility and Service of Shenyang's Urban Parks by Network Analysis[J]. Acta Ecologica Sinica, 2009(3): 1554-1562.

[6]陈书谦,戴冬晖,卜晓丹. 基于网络分析法的公园绿地可达性研究[C]//城乡治理与规划改革—2014中国城市规划年会论文集(07城市生态规划). 2014:1-11.CHEN Shuqian, DAI Donghui, PU Xiaodan. Park and Green Space Accessibility Research Based on Network Analysis Method[C]// Urban and Rural Governance and Planning Reform—2014 Proceedings of the Annual Conference of Chinese Urban Planning(07 Urban Ecological Planning),2014: 1-11.

[7]鄢进军. 基于Huff模型的城市公园绿地系统规划布局探讨[D]. 重庆:西南大学,2012.YAN Jinjun. Urban Public Park System Distribution's Optimization Basing on the Huff Model[D]. Chongqing:Southwestern University, 2012.

[8]高兴. 基于两步移动搜寻法的山地城市公园绿地布局探讨[D]. 重庆:西南大学,2016.GAO Xing. Research on Mountainous City Green Space Layout Based on Two-step Floating Catchment Area Method[D]. Chongqing: Southwestern University, 2016.

[9]钟炜菁.基于手机信令数据的上海中心城区城市活动空间分类与特征研究—时间与信令类型视角的探索[D]. 上海:同济大学,2017.ZHONG Weijing. Research on the Classification and Characteristics of Urban Activity Space in Shanghai Central City Based on Mobile Phone Signaling Data: From the Perspective of Time and Signaling Event[D]. Shanghai:Tongji University, 2017.

[10]戴代新,谢民. 公众参与地理信息系统在风景园林规划中的应用[J]. 风景园林,2016(7):98.DAI Daixin, XIE Min. The application of Public Participation Geographic Information Systems in Landscape Architecture[J]. Landscape Architecture, 2016(7): 98.

[11]方家,王德,谢栋灿,等. 上海顾村公园樱花节大客流特征及预警研究—基于手机信令数据的探索[J].城市规划,2016,40(6):43.FANG Jia, WANG De, XIE Dongcan, et al. Research on Dynamic Change and Early Warning of Large Tourist Flow Based on Mobile Signal Data Analysis: A Case Study of Gucun Park Sakura Festivalin Shanghai[J]. City Planning Review, 2016, 40(6) : 43.

猜你喜欢
信令城市公园街道
我将打扫城市公园
热闹的街道
SLS字段在七号信令中的运用
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
浅析城市公园中的景观设计
论城市公园设计
浅析城市公园种植设计
热闹的街道
风居住的街道