机器学习与社区生活圈规划:应用框架与议题*

2021-09-27 05:08:02张文佳李春江罗雪瑶柴彦威ZHANGWenjiaLIChunjiangLUOXueyaoCHAIYanwei
上海城市规划 2021年4期
关键词:生活圈时空机器

张文佳 李春江 罗雪瑶 柴彦威 ZHANG Wenjia,LI Chunjiang,LUO Xueyao,CHAI Yanwei

0 引言

近年来,随着新型城镇化的推进以及城市规划和城市发展观念的转变,“以人为本”、重视居民需求和生活质量的社区生活圈规划得到学术界和规划界的关注。社区生活圈规划研究以居民在社区及附近的日常生活供需匹配作为研究对象,是时空行为研究在社区规划领域的创新性应用。然而,目前关于社区生活圈的研究仍然是传统居住区公共服务设施配置研究的延续,对于社区生活圈内的居民需求和居民时空行为关注不足。总的来说,社区生活圈规划研究在概念界定、范围划定、职能归属、规划方法和实施模式等方面仍处于讨论和探索阶段,亟需大量研究关注[1]。

在社区生活圈规划研究所面临的诸多问题中,传统的数据分析方法无法适应时空行为日益复杂、行为轨迹数据日益丰富的需要,有必要引入新方法来挖掘行为需求,理解时空行为模式,并指导规划编制。其中,机器学习算法结合了统计学和计算机科学的优势,其监督学习(supervised learning)与无监督学习(unsupervised learning)算法已被广泛应用于时空大数据特征挖掘分析,如分类、聚类、异常值分析、模式识别、因果推断、决策预测等。因此,以机器学习算法为基础的分析框架可以更为精准、高效地挖掘社区生活圈中居民的时空行为模式,实现不同社区行为模式的迁移,为社区生活圈规划提供指导。

本文将系统梳理现有机器学习在时空行为预测、模式挖掘和行为与环境非线性关系等方面研究的前沿进展,以及社区生活圈规划研究面临的难点与挑战;然后,结合社区生活圈规划研究的难点与机器学习技术的最新进展,提出机器学习方法在城市社区生活圈规划研究中的应用框架;最后,以“基于时空行为需求预测的社区生活圈划分方法”和“基于非线性阈值效应的社区生活圈设施配置规划”两个研究案例,对机器学习方法在社区生活圈物质空间规划研究中的应用进行阐释。

1 研究综述

1.1 社区生活圈规划研究现状与面临的挑战

既有研究在社区生活圈概念和内涵界定、范围划分方法与设施评价和优化等方面取得了一定的成果,但是在社区生活圈规划研究的理论、技术方法和实证上仍面临诸多挑战。

现有研究对于社区生活圈概念的认识基本一致,可以概括为居民在社区周边日常生活所涉及的空间范围以及满足其日常生活需求的时空资源的集合[2]。社区生活圈的内涵逐渐从单一的物质空间走向物质空间与行为空间、社会空间的融合[3];社区生活圈规划不仅包括公共服务设施配置的优化,还包括社会空间和社会治理的提升[4]。在新型冠状病毒肺炎(以下简称“新冠肺炎”)疫情背景下,最新研究也将防灾减灾、健康、安全等要素融入社区生活圈,以提升社区生活圈规划韧性和应对突发公共安全事件的应急能力[5],[6]106。不过,已有研究以理论探讨为主,尤其在将社会空间、安全空间融入社区生活圈方面仍然缺乏具体的实证研究支撑。

社区生活圈空间范围的划分方法也是近期研究的重点和规划的技术难点与前置条件。大多数研究和规划将社区生活圈的空间范围等同于居民步行的可达范围,并综合考虑人口规模、用地面积和行政管理边界等要素划分社区生活圈边界[7],[8]1703,[9];也有学者通过识别设施完备性和计算设施密度进行划分[10-11]。然而这类基于空间和设施的方法未能将居民日常生活考虑在内,背离了社区生活圈概念。近期,部分研究基于个体行为调查数据或手机信令大数据,通过识别生活空间、分析居民行为需求来划分生活圈[12],[13]3,[14]。此类方法能较好地满足社区生活圈“因地制宜”、响应居民需求的基本要求,但也存在数据获取成本高的问题。

最后,公共服务设施是社区生活圈的核心与基本出发点,已有研究在指标优化、可达性分析、规划布局、特殊人群等方面积累了较多成果。相关研究主题包括新版《城市居住区规划设计标准》设施配置指标评价和优化[15]33,社区生活圈体系与设施配置要求[16],生活圈设施供给与居民差异化需求之间的匹配关系分析、评价与规划应对策略[8]1708,[17-19],不同人群对各类设施的步行可达性计算和评价[20-21],以及基于老年人群步行能力和特殊需求分析的社区生活圈设施布局与配置建议[22-23]等。总体上,社区生活圈公共服务设施评价和优化的相关研究较多,但对设施和居民之间复杂的非线性关系认识不足,同时在设施调整建议方面缺乏对“量”的考虑,而更多是“少”和“多”的基本判断。

综上所述,虽然目前关于社区生活圈的研究取得了一定的成果,但已有研究在概念内涵、划分方法和公共服务设施评价与优化上仍然存在不足,在理论、方法和实证上仍然面临挑战[24]。首先,近期研究开始意识到社区生活圈不仅包含物质空间层面,还包括社区交往生活圈和社区安全生活圈,但仍然缺乏与之相关的理论框架,以及与之相关的实证研究。其次,关于社区生活圈划分方法,以及与之相关的时空行为调查、分析和预测技术还需进一步探索。最后,在公共服务设施评价和优化方面,已有研究对设施和居民之间的非线性关系关注不足,难以提供设施量的优化建议。

1.2 机器学习方法在时空行为研究的前沿进展

精细化、动态化的社区生活圈规划研究依赖于基于居民个体时空行为数据的采集、分析、模拟、评估和预测。随着个体行为数据收集的时空间粒度越来越精细,获得海量个体数据的成本越来越低(如手机信令、浮动车GPS数据等),传统的针对个体时空行为的计量分析方法面临的挑战越来越大,难以适应精细化生活圈规划研究的分析使用。因此,生活圈时空行为需求的精细化研究需要能够高效快速地分析时空行为大数据的机器学习方法。而当前机器学习算法辅助下的时空行为研究已经在个体出行行为的决策预测、个体与群体行为模式挖掘以及个体行为与建成环境关系分析等方面取得一定进展。

1.2.1 个体出行行为的决策预测

机器学习算法已被应用于个体出行行为的决策规律与预测研究上[25]。其中,一类研究集中在个体时空行为需求的预测分析上。这类研究可以归纳为分类决策问题,例如个体在不同时空间环境下是否会使用某类设施、选择何种交通方式出行。传统分析多构建离散选择模型(Discrete Choice Model,DCM)展开研究[26]。而近年的研究开始使用神经网络算法(Neural Network Algorithm,NNA)[27-28]、基于决策树的集成学习算法(Ensemble Learning Algorithm,ELA)[29-30]、支持向量机(Support Vector Machine,SVM)[31]等机器学习方法。研究发现,机器学习方法打破了以往经典回归的线性假设,预测精度有很大提升,同时可以快速高效地处理大数据[32-34]。此外,也有研究对个体出行目的地进行识别和预测,例如使用贝叶斯分类器(Bayes Classifier)、隐马尔科夫模型(Hidden Markov Model,HMM)、基于自助法(Bootstrapped Decision Tree,BDT)和剪枝法(Decision Tree with Pruning,DTP)的决策树进阶算法等,对不同出行方式的出行目的地选择或下一个目的地进行预测[35-39]。

1.2.2 个体与群体行为的模式挖掘

机器学习算法还被广泛应用于时空行为轨迹的模式挖掘分析。时空行为模式包括个体长时序行为的规律性与周期性挖掘[40]、惯常行为分析[41]、突变点挖掘等[42],以及群体行为模式识别、聚类与异常行为分析等[43]。尽管目前的行为模式挖掘算法仍存在对多维数据的处理能力不足、对长时间序列结果动态性的探测不足、对多类型时空行为数据处理的精度参差不齐等问题,但已有方法为深入理解个体时空行为模式、不同人群的日常活动出行模式及其与社区和城市空间的互动关系提供了分析基础。

1.2.3 个体行为与建成环境的互动关系

少数研究开始利用机器学习算法,探讨建成环境与个体行为之间的非线性联系,并通过分析阈值效应对社区生活圈的设施配置和土地利用提供规划建议。这区别于传统分析基于线性、独立同分布样本的统计模型假设,可以深入挖掘变量间可能存在的多种非线性关系。已有研究采用梯度提升决策树等机器学习方法,验证了社区建成环境与小汽车出行距离[44]114、到公交站点的步行距离[45]、电动车出行距离[46]等存在非线性关系和阈值效应。这些研究一方面可以探讨社区生活圈规划过程中应该优先考虑哪些建成环境的调整,另一方面提供配置社区设施与土地利用指标的数量建议。这些往往是定性分析或传统计量统计方法无法直接回答的问题[47]。

2 机器学习方法在社区生活圈规划研究中的应用框架

结合社区生活圈规划研究面临的挑战与机器学习方法在时空行为研究中应用的前沿进展,本文提出机器学习方法在社区生活圈规划研究的应用框架。社区生活圈的概念内涵与时空行为紧密相关,因此,运用机器学习方法首先应该指向对社区生活圈居民的时空行为分析,包括个体行为模式挖掘、群体行为模式聚类、行为与空间非线性关系分析和行为预测等,进而运用在社区生活圈规划的不同议题上,具体可以从社区生活圈的物质空间、社区交往生活圈和社区安全生活圈3个维度,分别对其中不同的研究议题展开分析(见图1)。

图1 机器学习方法在社区生活圈规划研究中的应用框架Fig.1 The framework of the application of machine learning techniques in community life circle planning research

2.1 基于机器学习方法的社区生活圈物质空间研究

物质空间是社区生活圈在现实世界的基础和载体,对社区生活圈物质空间的规划是实现可持续人居环境建设、提高居民生活质量的重要环节。其中,社区生活圈空间范围的划分和公共服务设施配置的优化是机器学习应用于社区生活圈物质空间维度的两个重要应用方向。机器学习方法为从时空整合角度进行个体需求分析及引导社区生活圈物质空间规划提供了基础。

在空间范围划分方面,可以利用较长时间维度的居民出行活动数据,进行居民时空行为模式挖掘和预测,从而获得居民惯常行为特征,并探测其与社区生活圈的互动关系,由此从需求视角出发划定不同层级社区生活圈的空间范围。

公共设施配置优化方面,可以利用非线性建模方法,分析居民出行行为与土地利用的多元非线性关系与阈值效应,从而获得更为精细化的土地利用空间配置策略。此外,通过对居民长时间维度行为模式和生活方式的观测,探测社区生活圈内设施的时空资源与居民时空需求之间的动态匹配关系,从而在时间维度上优化设施资源利用方案,实现时空行为规划与管理的创新。

2.2 基于机器学习方法的社区交往生活圈研究

居民的社会交往和互动及其形成的社会网络,共同组成了社区生活圈的社会空间。社会空间是打造和谐宜居社区生活圈、提升居民幸福感的重要非空间因素。其中,促进社会交往和融合能够增强社区归属感和凝聚力,有助于维持社区的服务水平和再生产能力,是营造社会空间的重要维度。已有研究多从静态角度,利用居住分异等指标探索不同人群的融合程度,但缺乏对居民活动过程中交往和融合的时空动态探讨,且研究结果难以与社区社会空间营造相结合[48]。因此,相关研究可以利用模式挖掘和社群探测等技术手段,分析不同群体的时空间行为特征和活动模式特征,从行为交互角度进行社会排斥、活动空间交互、社会包容等方面的研究,探索多主体联合和行为决策机制,并结合其与社区组织和社区空间的互动关系,提出促进社区生活圈中各类人群融合和交往的政策建议。

2.3 基于机器学习方法的社区安全生活圈研究

社区生活圈作为城市空间最基本的组织细胞,同时也是应对重大突发公共事件的“防灾减灾基本单元”,应当具有突发事件应急响应、过程中社区资源调配和事后秩序迅速恢复的能力。2020年突如其来的新冠肺炎疫情更是印证了提升社区层面的突发公共卫生应急事件处置能力的必要性。已有研究指出,社区生活圈的规划建设应考虑韧性和健康等理念[6]105。社区韧性强调社区在城市生态和社会环境快速变动过程中适应不确定性风险的能力,应当结合丰富的时空行为模式挖掘和预测技术,探索基于居民日常活动出行的韧性评估,如针对个体或多主体的动态环境风险源暴露分析和基于“突发事件前、中、后”的居民时空行为模式稳定性的设施配置分析,实现精准防控和土地利用规划调整[49]。

此外,为构建可持续、健康的社区生活圈,可在探索居民时空行为模式的基础上,分析个体的出行结构特征及其影响因素,从而提出能促进居民体力活动的健康生活圈设施规划建议。

3 机器学习方法在社区生活圈物质空间研究的应用案例

3.1 基于时空行为预测技术的社区生活圈划分研究

社区生活圈空间范围的划分是社区生活圈规划研究的技术难点和前置条件[13]1。基于居民行为需求进行空间划分是社区生活圈规划的基本要求,但行为数据获取成本较高,导致相关方法难以推广。机器学习方法可以在一定程度上解决上述问题:通过学习有行为数据社区生活圈的划分结果与社区空间信息和人口结构特征的关系,进而对其他社区居民行为需求进行预测,并基于预测结果划分生活圈(见图2)。

图2 基于时空行为需求预测的社区生活圈划分方法框架Fig.2 The framework of the community life circle delineation method based on the estimation of spatiotemperal behavior demand

具体来说,首先,为了简化讨论,以用地地块为分析基本单元,居民时空行为需求表征为对社区周边15 min步行可达范围内所有地块的需求水平,具体可以使用活动日志调查中居民前往不同设施所在地块的时长、GPS调查中居民在该地块上停留的GPS点数量,也可以采用高精度的热力图数据或手机信令数据进行估算。进一步以中位数为界将地块划分为“高需求”和“低需求”地块。此外,考虑到居民对不同用地类型的需求模式不同,可以根据用地分类标准区分为公共服务设施、商业服务设施、绿地公园、居住和其他5类用地类型,分别构建预测模型。其中,公共服务、商业服务和绿地公园作为社区生活圈中重要的服务要素,也是供需匹配分析的重点。

其次,获取成本相对较低的地理环境数据和社区人口结构数据作为输入的自变量。比如地块距社区中心的距离、面积、商业设施数量、公共服务设施数量,以及社区年龄、教育和户口构成情况等。具体可以根据实际工作需要进行增减。

再次,考虑到地块被分为“高需求”和“低需求”两类,机器学习中常用的分类算法,比如神经网络算法、基于决策树的集成学习算法和支持向量机等,可以被作为构建时空行为需求预测模型的基本算法。在实际工作中,可以通过对比不同算法的预测误差,选择误差最小即预测正确率最高的模型作为不同用地类型的最终预测模型。

最后,在构建需求预测模型后,输入无行为调查数据的社区人口和地理环境信息,便可以获得该社区居民对其步行可达范围内所有地块的需求水平,进而划分出包含行为信息的社区生活圈范围。Li等[50]基于上述思路,以北京市清河街道15个社区为例构建了基于行为需求预测的社区生活圈划分方法,结果显示该方法具有较高的预测精度,同时划分方法还为下一步设施规划和选址提供参考。

3.2 基于非线性建模技术的社区生活圈设施配置优化研究

合理评价社区设施与土地利用配置,并对相关规划指标提供数量建议是实现社区生活圈规划精细化的重要环节[15]34。以居民出行行为特征为依托进行设施配置评估符合社区生活圈规划“以人为本”的需求导向,然而现有大多数定量研究采用传统统计学方法研究居民时空行为和社区建成环境的互动关系,难以提供精细、准确的土地利用和设施配置有效范围。机器学习中的非线性模型放宽了严格的因变量与自变量间的线性关系假设,使得两者之间的关系不局限于固定的斜率系数,而是呈现为不断变化的非线性形态,从而更细致地刻画自变量对因变量的影响,为研究个体时空行为和社区建成环境之间的非线性关系和阈值效应提供基础,从而得到设施配置、土地利用面积比例等指标的合理范围(见图3)。

图3 基于非线性机器学习模型的社区生活圈设施配置优化研究框架Fig.3 The framework of the land use optimization in community life circle based on nonlinear machine learning model

具体而言,首先,确立并计算社区生活圈内的建成环境指标。在传统建成环境与出行行为相关研究的基础上[51],选取有效的社区生活圈建成环境指标,主要包括人口密度、街区设计、社区尺度可达性、土地利用混合度、区域可达性、公共交通可达性等维度。其中,社区尺度可达性变量多用设施密度代替,而设施类型的选取应与现有规划文本相对应,从而使结果更好地指导规划实践。依据现有规划文本,5 min、10 min、15 min社区生活圈分别对应300 m、500 m和1 000 m的步行范围。因此,根据收集的人口和地理环境数据,以社区或个体为中心建立缓冲区,计算不同尺度社区生活圈内的建成环境指标,以表征不同尺度的社区生活圈内设施和土地利用现状。

其次,在收集居民行为数据的基础上,确立并计算社区生活圈设施评估的行为目标导向。以人为本的社区生活圈强调便捷、绿色的可持续行为,将居民出行行为简化为机动车出行距离、步行或骑行比例等指标,从而探索能够引导更高可持续行为比例的社区生活圈建成环境。

再次,使用机器学习非线性模型拟合社区生活圈建成环境(自变量)对居民行为指标(因变量)的影响。常用的非线性机器学习模型包括决策树、随机森林、梯度提升决策树、支持向量机等。本文以梯度提升决策树模型为例,说明算法构建过程:该算法基于决策树模型改进,即每轮迭代构建一棵决策树,同时采用负梯度下降的方式找到损失函数最小时的一系列参数,最终得到由若干决策树加合而成的总模型。具体来说,通过控制决策树的棵数、学习深度、学习速率等参数,估计目标函数,即M棵决策树的加权总和以使损失函数最小。其中,M是决策树的棵树,αm是第m棵决策树b(x;θ m)的权重,θm为第m棵树的一系列参数。

非线性机器学习模型提供了变量重要性的排序,即各个自变量对于减少每轮迭代中损失函数贡献的汇总。这一排序能够显示哪些自变量对于解释因变量是更重要的。此外,相应算法提供了因变量随着自变量变化的边际变化曲线,如图4展示了美国奥斯陆15 min社区生活圈内的人口密度对每周机动车出行距离的非线性影响,当人口密度达到3 000人/km²时,对降低机动车的出行距离有明显影响,也即提供了合理的人口密度设置范围。

图4 人口密度与机动车出行距离的非线性关系Fig.4 The nonlinear relationship between vehicle travel distance and population density

最后,从非线性机器学习模型中得到社区生活圈建成环境各指标的合理范围,并与现有规划文本相比较,从而评估现有规划文本指标的合理性并提供优化策略。

4 结语

伴随着城市发展的人本转型与对社区规划和社区治理的重视,社区生活圈规划愈发成为学术研究与规划实践的前沿和热点,也是我国国土空间规划体系创新的重要组成部分。目前社区生活圈规划研究以公共服务设施配置优化为主,规划实践仍然延续居住区规划的传统思路,对于社区生活圈内的居民需求和居民时空行为关注不足。本文通过梳理社区生活圈规划研究和规划的不足以及机器学习方法在时空行为应用的前沿,提出机器学习方法在社区生活圈的应用框架,并以社区生活圈划分和设施配置优化为例对机器学习在社区生活圈物质空间方面的创新应用进行阐释,以期为更精细、更适应居民差异化需求的社区生活圈规划提供借鉴。

猜你喜欢
生活圈时空机器
一段从“幼儿生活圈”开始的特别时光——浅谈促进小班幼儿开学适应的共育策略
幼儿100(2023年36期)2023-10-23 11:41:34
呼和浩特市中心城区生活圈划分研究
机器狗
环球时报(2022-07-13)2022-07-13 17:18:39
跨越时空的相遇
机器狗
环球时报(2022-03-14)2022-03-14 18:19:44
镜中的时空穿梭
广州周边:价格洼地!“一小时”生活圈 7字头置业广州后花园
房地产导刊(2020年6期)2020-07-25 01:31:22
玩一次时空大“穿越”
未来机器城
电影(2018年8期)2018-09-21 08:00:06
时空之门