运迎霞 王善超 马 超 王 杰 任利剑
健康是影响未来经济和社会发展的重大议题。从20世纪90年代开始,美欧等发达国家已经开始关注社区社会经济因素和居住环境条件等对居民健康的影响,一直到本世纪前叶,世界主要发达国家都一直积极致力于通过改善建成环境为人群健康提供积极影响的研究。2011年,国际科联(ICSU)宣布有明确的证据显示部分疾病的发病率与建成环境因素之间存在显著关联,提议各国积极采取措施,通过优化建成环境改善公共健康[1]。
在目前所有公共健康问题之中,肥胖是主要问题之一[2]。我国大城市肥胖率连年攀升,肥胖人口数为世界之最。到2018年,北京市肥胖率全国最高,达25.9%,超重率33.4%[3]。肥胖会带来巨大的经济与社会损失,我国每年因肥胖造成的经济损失已经高达数百亿元[4];同时每年因肥胖而并发的糖尿病、心脏病、脑卒中等慢性病每年更是夺取数以百万计的生命[5]。伴随着我国40多年来的改革开放,城市的工业化、城镇化、人口老龄化、生态环境及生活方式的不断变化给人民健康带来挑战。大城市地区作为建设活动最密集和环境变化最剧烈的地区,与居民生活最为密切的生活圈建成环境要素的变化也对居民的建康状况的变化产生最为直接的影响[6]。
为了探索肥胖问题的成因,包括公共健康、疾病预防、宏观经济等多个学科和领域都在努力探索,在城市规划领域则更多地探讨环境要素的布局、设计等方面对居民体力活动的影响。城市内的建成环境与肥胖之间的关联已经建立[2],社区环境可以影响居民的肥胖程度,环境可能通过对体力活动和健康饮食具有的传导性或抑制作用,进而影响超重和肥胖[7]。在生活圈建成环境研究的理想语境下,应该从物质空间环境、经济环境、社会文化和政治环境来衡量建成环境[8]。单纯就物质空间的研究理论方面,塞维奥(Cerveor)等人在描述理想生活圈建成环境的基础上将环境要素总结为密度(density)、多样性(diversity)和设计(design),也就是被人熟知的“3D”要素[9],后来又将目的地可达性(destination accessibility)和换乘点距离(distance to transit)加入并发展为“5D”要素[10]。尽管5D之间有一定重叠,但是它仍然是目前较为有效的理论模型[11]。
国际主流研究多通过利用体力活动作为研究环境要素和居民肥胖关系之间的媒介要素,基于5D要素的研究视角,一般认为较高的密度、多样性和可达性能够促进体力活动从而减少肥胖的发生,其具体量化指标包括:人口密度、土地使用混合度[12]、交叉口密度和数量[13-14]、道路连通度[13]等。良好的道路及场所环境设计(步行友好性感受、舒适性[15]等)和更近的换乘点距离同样有利于增加居民的低致胖行为的可能性[12-13],进而帮助控制肥胖状况。休闲环境影响居民日常生活中是否有机会参加运动或锻炼,决定居民日常能量消耗,从而影响体重状态。另有研究指出,公园、水系、绿色空间等[16]休闲娱乐设施的可达性和品质在抑制肥胖、减缓身体质量指数上升方面具有一定影响。随着居民年龄的增长,他们进行体力活动的意愿会下降,在室内花费更多的时间,并且减少与建成环境之间的互动,并且男性比女性会进行更多的体力活动[17]。
尽管国际上有相当多的研究已经探明社区环境中的哪些要素会对当地居民的肥胖情况产生影响,然而,由于人种、文化、社会发展阶段、经济发展水平等诸多要素的不同,特定环境特征影响特定人群的超重和肥胖状况风险尚不明确。城市不同,建成环境对居民肥胖情况出现的影响不同,有些相邻的省份甚至相邻的社区之间也会存在显著差异[18]。有针对性的对不同城市的城市生活圈建成环境与其居民肥胖发生的相关性研究对于整个社会肥胖预防工作是十分有必要的。
北京是按省级单位统计肥胖率最高的地区[3],与之相关的慢性病患病率也居高不下,肥胖严重影响了北京市居民的健康生活的质量。选取石景山区作为案例区域。石景山区位于北京西部(图1),面积84.5 km2,人口59万人(2018年)。居民肥胖率为26.87%,高于北京市的25.8%的平均水平。研究使用的评估生活圈建成环境的基础数据为北京市测绘地图,评估居民肥胖程度的基础数据为北京市某三甲医院居民健康登记数据。共采集居民健康数据8 941份,年龄范围18—99岁,将样本数据按照ArcGIS地理编码导入,将结果与前文中获取的居住小区详细信息进行匹配,舍弃无法地理编码与匹配不成功数据,共获得有效样本8 635个,涵盖80个居住小区,覆盖石景山区居民数量的1.51%。根据社会学调查一般抽样比例的评定[19],可以认为本次抽样为石景山区具有代表性的全样本。出于对居民隐私和相关法律法规条款的考虑,本次研究仅提取居民的住址、身高、体重、年龄、性别等必要信息,并且全部为匿名数据。
对于居民肥胖情况的度量采用传统的BMI度量的方式,即居民BMI=体重(kg)/身高2(m2)。BMI是目前国际上通用的衡量人体胖瘦程度以及是否健康的一个标准。世界各地对肥胖程度的判断有所差异,数值如表1所示,我国对肥胖程度的判定依据来自我国相关医学标准,即将BMI大于28的个体判断为肥胖。
表1 BMI肥胖程度分级方法Tab.1 BMI obesity degree classification method
对生活圈的网络距离覆盖范围进行确定。根据2018版城市居住区规划设计标准中15 min出行生活圈、2018年北京市[20]以及全球相同等级城市[21]的居民出行调查数据以及石景山区老龄化程度及其发展趋势研判等资料,分析生活圈实际覆盖范围:城市居住区规划设计标准中规定15 min生活圈覆盖半径为800 m左右;但是2018年北京、伦敦的居民出行调查数据的数据显示,按照月均统计,居民每次步行的出行距离约为670 m[20-21];同时考虑到石景山区老龄化程度及其发展趋势,根据北京市老龄工作委员会办公室公布的数据,石景山区老龄化程度排名北京第二[22],已经接近进入深度老龄化地区,并会在未来几年来更进一步发展。相对于中青年来说,老年人的步行速度更慢,因此其活动范围也更小。考虑到近几年石景山区人口年龄结构的变化趋势,对15 min生活圈确定的800 m范围适当缩小更贴合当地实际。因此确定以居住小区几何中心为出行起点的出行半径为700 m。将通过中国某大型地图网站爬取的居住小区边界导入ArcGIS,按照700 m网络距离(图2)为出行半径扩展,根据道路中心线、自然地貌、被调研者所居住的小区边界等为界线,将研究区域划分为80块图幅(图3)。
5D的环境量化指标是从宏观层面对环境进行量化的指标体系,在实际操作过程中对环境的精确描述则需要在5D的基础上进行指标体系更进一步的细化。因此在二级指标的选择上,通过文献综述发掘已有研究成果并结合石景山区的实际情况,选择5D环境量化的二级指标指标,即密度(用家庭所在街道总人口、生活圈总户数、生活圈所在街道人口密度等量化),多样性(用生活圈POI点数量、生活圈POI混合熵、生活圈POI点密度等量化),可达性(用生活圈公园覆盖数、生活圈水系数量、可步行街道交叉口密度、可步行街道交叉口数量、街道弯曲度、街道中间性等量化),设计(用街道步行设施评分、街道自行车设施评分等量化)和换乘点距离(用地铁覆盖率量化)。量化后的环境指标共5大类15小类变量,环境要素可能直接或间接地(通过可能会因个体差异而改变)影响居民的肥胖发生风险,这些变量先前已证明与居民的肥胖有关[7,23-24],如表2所示。
由于对生活圈建成环境的描述没有固定的标准[25],研究所采用的5D环境要素包含但不限于上述变量,在此仅作为一个开源框架体系。表2中所列举生活圈建成环境要素特性分为主观评价要素和客观测量要素。生活圈内居民对环境的感知评价记录为主观评价要素,直接收集的或通过对现有土地利用数据集计算获得的则记录为客观测量值要素。而将量化的生活圈建成环境要素叠加医疗机构提供的居民肥胖状况登记数据,得到“居民健康—生活圈建成环境”综合数据集,该集合包含8 635个体与15个环境变量组成的有效样本集,交叉后得到8 635×15的BMI与生活圈建成环境判断矩阵。
表2 居民健康+生活圈建成环境数据集Tab.2 resident health + built environment data set
采用机器学习的分类方法判断建成环境要素对肥胖的贡献度。传统的多变量因子计算分析,多采用因子分析法及其优化算法,但该方法存在参数设置复杂、需人为设置和调整大量超参数等不足,过多的人工干预与判断变量重要性关系也会带来算法的系统性误差。随着机器学习(Machine learning)在工程领域的应用,机器学习及其优化算法逐渐成为高维度参数分类的主力算法。机器学习具有表征学习能力,可以利用较少的超参数处理复杂的分类模型[26]。同时,以随机森林(Random Forest)为代表的算法采用预训练方法缓解易陷入局部最优的问题,并且可以规避传统分析方法过多人为干预的问题,给多变量的分类计算带来更高的准确度。
在随机森林算法运算过程中,首先需要明确模型中mtry和ntree两个关键参数。mtry在一定程度上决定分类精度,即指定节点中用于二叉树的变量个数;ntree指决策树的数量,即决策树分裂节点的候选空间变量个数。根据以往文献同量级数据的实验经验,确定最终计算参数:mtry=7,ntree=2 000。模型Error分布与ntree关系如图4所示。
表3 各影响因子贡献度与相关性排序Tab.3 contribution and relevance ranking of each impact factor
研究发现居民对自行车设施的评分、地铁覆盖率、可步行性街道交叉口密度、可步行性街道交叉口数量等四项要素对居民BMI的影响是正相关,其他的环境要素均为负相关。在所有负相关的建成环境要素中,街道中间性对肥胖的影响贡献度最高,高达19.26,生活圈水系数量贡献度最低为0.41。可达性要素对居民肥胖影响最大,其中街道中间性与街道弯曲度对于肥胖的影响贡献度分别为19.26和18.44;多样性要素对居民肥胖影响高低不一,其中生活圈POI混合熵对于肥胖的影响贡献度为18.31,生活圈POI点数量对于肥胖的影响贡献度为13.47;密度特征对于肥胖的影响贡献度总体不高,其三项指标,家庭所在街道总人口、生活圈总户数、生活圈所在街道人口密度的贡献度分别为14.81、12.17、8.86;在所有影响因素最后的是换乘点距离要素,地铁覆盖率对于肥胖的影响贡献度为8.63;可达性要素中生活圈公园覆盖数为3.66、生活圈水系数量为0.41。
研究采用机器学习算法来探究诸多变量之间的关系,在医疗数据的处理上引入了空间算法,深度发掘了隐藏在数据背后的信息。经实验,石景山区生活圈建成环境的诸多变量与居民个体的肥胖水平具有相关性,研究结果证实,密度、多样性、可达性、设计(主观评价)、换乘点距离等5D环境要素均对生活在其中的居民肥胖程度产生影响。在各个要素中可达性要素中的街道中间性和街道弯曲度对居民肥胖影响贡献度最大,设施布局要素中生活圈公园覆盖数和生活圈水系数量对居民肥胖影响贡献度最小。
可达性要素方面,街道中间性与街道弯曲度两个指标分别代表了街道在小区域中城市活力的大小和街道安全性的高低,与目前已有研究结论一致,街道连通度与可达性越高、街道车速越低、居民安全感越高则居民BMI越低;可达性的另外两个要素,可步行街道交叉口密度和可步行街道交叉口数量与BMI呈正相关,该结果与目前已有研究结论有差异。经分析,可能的原因是,更高的交叉口密度和数量会增加街道机动交通量。因我国前些年空气质量问题频发,使得居民更加关注空气质量,交叉口更多的街道意味着更多的低速机动交通,并且会带来更多的空气污染,空气污染会通过影响居民的生理和心理方面的指标,进而影响居民的体重情况。这也与杰瑞特(Jerrett)等发现的在微观尺度上空气污染会影响居民体重,使得居民BMI升高[27]的结论相一致。另一个可能的原始是石景山区的老年人较多,是北京市老龄化率排名第二名的区,更多的道路交叉口可能会对老年人过街造成障碍,从而降低老年人出行意愿并使其BMI升高。
可达性要素中对自然环境要素可达性的生活圈公园覆盖数与生活圈水系数量两个指标对居民BMI贡献度最小。城市中的滨水环境一般与公园绿地一同出现,与以往的研究中公园覆盖水平会降低居民肥胖发生的结论方向一致,但是在本研究中这两个要素的贡献度略低。
密度特征方面,有较多居住人口和较高人口密度的生活圈会有更高的BMI,这与我国香港地区已有的一些研究冲突。这种差异可能来源于香港超高的人口密度和多山地、多台阶的自然条件。与香港对比,北京市石景山区的人口密度并不高,地形也较为缓和,因物质空间环境不同而导致的居民体力活动情况不同导致两地研究结果会有不同。居民对街道步行设施评分越高则BMI会越低,根据居民心理活动推测,更高的街道步行设施评分表示居民对街道环境更满意,会更倾向于在街道上活动,从而主动增加体力活动而降低BMI。
在多样性方面,土地混合使用度越高则居民BMI越低。混合度高的地块拥有更多的商场、文化设施、医疗设施等吸引设施,对居民出行更具有吸引力,丰富的设施通过吸引居民出行而增加体力活动从而减轻肥胖程度,这与以往研究结论相一致。
良好的生活圈环境会增强居民在出行中的步行与骑行体验,进而更多地鼓励人们出行。但是设计要素较难用环境量化的方式进行评判,而更多的倾向于环境使用者的感受。因此我们采用居民的主观评价来量化设计要素。通过居民对生活圈环境要素感受的打分,我们发现街道步行设施评分与居民BMI呈负相关,街道自行车设施评分与居民BMI呈正相关。但是单纯从骑行作为身体运动的角度来探讨其与肥胖的关系,可能会忽略环境要素与BMI之间复杂的内在关系,因此在这里仅讨论其中一种可能的原因:步行与骑行同为低致胖行为,但是对居民BMI的影响却有差异,可能的原因是目前我国共享单车的普及化率较高,可能原本需要进行步行出行的短途出行会被骑行部分替代,从而降低体力活动的强度并增大BMI。
到换乘点距离要素用地铁覆盖率量化。在本研究中该要素与居民BMI呈负相关,这可能也与石景山区老龄人口较多有关。根据实地调查,该区域地铁站点的无障碍设施不足,过多的台阶会极大得增加老年人出行的不便利性,进而降低其进行体力活动的意愿,从而影响BMI。
比之前的量化研究[28,29]更进一步的是,本研究创新地以生活圈5D建成环境指标来量化描述物质空间环境。本次研究报告了5大类15个小类生活圈建成环境要素对居民肥胖的影响,为将来对肥胖问题的政策干预和环境干预提供了更直接的证据。
使用医疗机构的居民身高、体重等健康数据至关重要。医疗机构的居民健康数据样本量足够大(N=8941,占石景山区总人口的1.5%)并能够进行分层分析,以探讨不同的生活圈建成环境要素与居民肥胖之间的关联,并可以创建地图来可视化肥胖高发区域以便于后续健康干预政策的提出;专业医疗数据的引入也可以有效避免自我报告调查的偏差以提高研究的精准度。在后续的研究中,可以在环境要素量化上引入更多变量以检验不同建成环境要素对居民肥胖的影响贡献度,并且通过更加细分的统计,分析各个年龄段居民使用相同环境和不同环境而带来的体重变化。继续与医疗机构合作,通过连续时间段健康观测数据与建成环境连续变化数据可以为促进体力活动和健康饮食的循证干预计划提供可操作的信息[30]。
通过机器学习算法大批量地识别城市中可能导致居民肥胖的致胖因素已经成为可能。北京市石景山区与与欧美国家研究得到的能够导致居民肥胖的生活圈环境要素略有不同。国际上越来越多的研究关注到通过改变社区物理环境来降低肥胖率,我们建议可以通过增加街道中间性与连接度、扩充建设生活圈中各类设施的种类和数量保证生活圈中功能混合以减轻居民的肥胖程度。