基于就医活动推断的老年人公交就医可达性研究

2024-03-03 01:02翁剑成张云飞林鹏飞李文杰
交通运输系统工程与信息 2024年1期
关键词:服务半径公交站点

翁剑成,张云飞,林鹏飞,李文杰

(北京工业大学,a.交通工程北京市重点实验室;b.信息学部,北京 100124)

0 引言

截止2022 年底,北京市60 岁及以上常住人口占比已达到21.3%,并且部分中心城区已提前步入重度老龄化社会。随着老年人身体机能逐渐下降,就医出行成为他们典型的日常生活活动之一。目前许多城市推行老年人免费乘坐公交政策,为老年人提供了出行福利[1]。以北京为例,60周岁及以上老年人可持老年卡免费乘坐地面公交。公交已成为老年人日常生活中最重要的机动化出行方式[2]。因此,准确评估老年人公交就医出行可达性对于提升公交系统适老化水平具有重要意义。

可达性是反映用户使用医疗服务设施便利程度的重要方法。付晓等[3]分别基于地铁刷卡数据和出租车GPS(全球卫星定位系统)数据提取行程时间,采用引力模型对比小汽车、小汽车与地铁换乘、地铁与步行这3 种交通模式下南京市玄武区综合医院的时空可达性。吴娇蓉等[4]利用百度地图API(应用程序编程接口)提取老年人到医疗卫生等活动点的真实出行距离,基于改进的潜能模型提出一种生活服务设施综合可达性评价方法。Kotavaara等[5]采用GIS(地理信息系统)软件的网络分析功能计算不同区域乘坐公共交通到达最近医疗设施的平均出行时间,以此作为反映就医可达性的指标,结果表明,居住在城市偏远地区的人们就医可达性较低。

两步移动搜寻法(Two-step floating catchment area method,2SFCA)分别以供给点和需求点为中心,以极限出行成本阈值为服务半径进行两步搜索,以每个需求点的搜索半径内所有供给点的供需比之和表示每个区域的可达性[6]。相比于引力模型、潜力模型等,2SFCA 进一步考虑了供需点之间的空间相互关系和距离衰减效应来评估服务设施资源的可获得性,更符合实际情况[7],因此被广泛应用于就医可达性的研究中。CHEN等[8]将通过百度地图API获取到的公交出行时长作为出行成本,将医院床位数代表供给服务设施的能力,采用2SFCA评估了南京市老年人获得医疗服务的可达性并准确判定出医疗资源短缺的地区。Xing等[9]利用高德地图API获得私家车和公共交通的出行时间,基于改进的2SFCA分析了长沙市三甲医院不同时段的可达性,结果表明,私家车可达性要高于公共交通,高峰期间两者的可达性均显著降低。Boisjoly等[10]基于公共交通GTFS(General Transit Feed Specification)数据和2SFCA分析了加拿大8个大都会区域的公交就医可达性,结果表明,郊区弱势群体的可达性较差。

现有研究基于2SFCA 对公交就医可达性开展了较深入的研究,但通常采用区域人口数表征该区域就医需求,并利用在线地图API等获取出行时间反映出行成本进而计算潜在可达性;没有充分结合智能卡数据对乘客实际就医需求精细化分析,缺乏对老年人等特定弱势群体的关注,同时在线地图API 无法反映公交运行过程的时间波动对可达性的影响。另外,现有研究多采用单一的床位数衡量医疗服务能力,无法反映医院的综合实力,同时较少考虑不同等级医院服务半径的差异,与居民倾向于付出更多时间成本去获得高等级医疗服务的事实不符。

本文利用老年卡数据和公交到站时间数据等多源数据构建公交出行链,提出基于公交出行链的老年人就医活动推断方法,在公交站点尺度获取老年人实际就医需求和就医出行时长。综合考虑就医出行时间衰减效应,不同等级医院的综合服务能力和有效服务半径差异对2SFCA 方法进行改进。基于改进的2SFCA方法分析北京市六环内老年人公交就医实际可达性及其时空分布特征,以期为改善老年人的公交就医可达性提供支撑。

1 数据基础

本文以北京市六环内的区域为研究对象,该区域集中了全市大部分的常住人口和医疗资源。数据基础包括2019 年9 月的北京市公交智能卡数据和公交实时到站时间数据,以及公交线路属性数据、医院属性数据和POI(兴趣点)数据。北京市公交智能卡数据由北京市交通运行监测调度中心提供,覆盖北京市六环内约910 条公交线路,平均每天刷卡记录数约593万条,每条数据记录了乘客的卡号、卡类型、上下车刷卡时间、上下车站点、线路名称、车辆编号等信息。在预处理过程中删除下车时间早于或等于上车时间的记录,上下车站点相同以及交易不完整等异常记录,删除的记录约占数据总量的8.3%。基于卡类型字段筛选老年卡刷卡记录,同时为了保证分析结果准确性,选取满足研究周期内出行天数大于12 d,出行次数大于16次的约282600名老年公交“常乘客”作为分析对象,老年卡样例数据如表1所示。

表1 老年卡数据样例Table 1 Samples of elderly card data

公交实时到站数据由北京市交通运行监测调度中心提供,主要包含公交车辆编号、线路编号、线路名称、方向、站点名称、公交到站时间等信息,数据样例如表2 所示。将公交到站时间数据与老年卡数据通过站点名称、车辆编号和时间戳进行关联匹配,计算得到当前车次与相邻上一车次的到站间隔时间,用于反映乘客站点等待时间波动对就医可达性的影响。

表2 公交实时到站数据示例Table 2 Samples of real time bus arrival data

公交线路属性数据主要包括线路名称、站点名称和站点经纬度等信息。基于2019年北京市卫生健康委员会发布的医院清单,删除儿童医院、整容医院、妇产科医院等与本文研究无关的医疗机构,共选取364所医院,其中一级医院183所,二级医院84 所,三级医院97 所。通过查询医院官方网站获取每所医院地址、床位数和各科室数量等基础信息。住宅类POI数据通过高德地图API获取,包含了每个住宅类POI 的名称、地址和经纬度信息,在本文的研究范围内约有1.9万个住宅类POI。

2 基于公交出行链的老年人就医活动推断方法

大多数老年人就医活动过程主要包括乘公交前往医院、就医和乘公交返回家中这3个阶段。为了提高就医活动推断的准确性,降低换乘对推断结果的影响,本文首先基于老年卡数据构建公交出行链,然后根据出行链识别老年乘客居住地位置,在此基础上,结合就医活动特性和时空约束推断就医活动出行。

2.1 公交出行链构建

老年人在乘坐公交出行时可能存在换乘行为,本文通过识别潜在的换乘行为将同一出行目的的多次刷卡记录合并为一次出行。将每位老年人所有的公交刷卡数据按上车时间升序排序,依次计算当前刷卡记录的下车时间与相邻上一条刷卡记录上车时间的差值,以及相应两个站点之间的欧式距离。将换乘时间和换乘步行距离阈值分别设置为20 min[11]和500 m[12],构建老年人公交出行链。根据公交出行链计算老年乘客每次出行的累积乘车时间和累积换乘时间。

2.2 老年乘客居住地识别

ZOU等[13]研究发现,通常情况下公交乘客每天第一次出行的上车站点与最后一次出行的下车站点相同,且分布在其居住地附近;每天第一次出行的上车站点与前一天最后一次出行的下车站点相同。基于上述规律,提取老年乘客每天第一条出行链的上车站点和最后一条出行链的下车站点,统计站点的频率分布,将其中频率最高的站点作为该老年乘客的居住地站点。若存在两个及以上频率相同的站点,则比较每个公交站点500 m缓冲区内住宅区POI占比,选取占比最大的站点作为该老年人的居住地站点[8],其计算公式为

式中:Ps为公交站点s缓冲区内住宅区POI 占比;Hs为公交站点s缓冲区内的住宅区POI总数;Xs为缓冲区内的POI总数。

2.3 就医活动出行推断

基于公交出行链和老年乘客的居住地位置,结合空间约束、医院停留时间约束和就医频率约束等识别就医出行。

(1)空间约束

就医出行符合往返行程对称性和单一出行目的性,即就医行为具有优先性和特殊性,一般情况下不会与其他出行活动同时进行,且在完成就医后大概率返程直接回到始发地[14]。因此,针对老年乘客p的出行链u和相邻出行链u+1,出行链u的出行起点和出行链u+1 出行终点与乘客p的居住地站点s的欧氏距离应同时小于步行距离dwalk,可表示为

式中:d(⋅)为计算两者之间的欧氏距离。

同时,出行链u的下车站点和出行链u+1上车站点与同一医院j的欧氏距离应同时小于步行距离dwalk,可表示为

(2)医院停留时间约束

已有研究表明,就医时长通常在50~300 min[12],根据相邻两条出行链可以计算老年乘客在医院的停留时间,该值应介于最小停留时间Tmin和最大停留时间Tmax之间,可表示为

(3)就医频率约束

由于就医活动属于偶发性出行,老年人短期内连续多天前往医院就医的概率较低,因此周期内老年乘客p乘坐公交的就医出行频率应小于阈值Fc,可表示为

式中:为老年乘客p的就医出行链数量;为老年乘客p的公交出行链总数。

综上,同时满足上述约束条件的公交出行链则为就医活动出行链。结合已有研究总结各个约束条件的参数设置如表3所示。

表3 就医活动出行推断参数设置Table 3 Inference parameter setting for seeking healthcare activity trips

3 基于改进2SFCA 的就医可达性度量方法

为实现老年乘客实际就医可达性度量,本文在传统2SFCA基础上提出一种基于多级服务半径和高斯距离衰减函数2SFCA的实际就医可达性度量方法。首先,计算任意居住地和医院之间的实际出行时间矩阵;其次,基于医院基础信息计算其综合服务能力;最后,根据医院等级设置多层级的服务半径阈值,基于就医出行链统计不同区域的实际就医需求,并引入高斯距离衰减函数反映距离衰减效应,采用改进的2SFCA 方法计算老年人公交就医可达性。

3.1 出行成本矩阵构建

现有研究通常采用乘客乘车时间或者路径规划API的出行时间构建出行成本矩阵,但上述方法并不能反映公交实际运营服务水平对可达性的影响,因此本文引入公交到站时间数据并估计老年乘客在公交站点的等待时间,采用乘车时间、换乘时间和站点等待时间之和表示乘客实际就医出行时长。为了便于后续可达性计算和可视化展示,本文将研究区域共划分为15702 个500 m×500 m 网格,将公交站点和医院按其经纬度在网格上投影,以网格为单元计算出行成本。老年乘客从居住地网格i至医院网格j的实际就医出行时长为

式中:为出行链u的乘车时间;为出行链u的换乘时间;为出行链u中乘客在出发站点的平均等待时间,本文采用到站间隔的1/2 作为老年人在出发站点的平均等待时间,即

式中:为出行链u中当前车次与相邻上一车次的到站间隔时间。

将研究周期内居住地网格i与医院网格j之间所有就医出行链的实际出行时间取平均值作为出行成本,构建实际就医出行成本矩阵,即

式中:Qi,j为研究周期内需求点网格i与医院网格j之间所有就医出行链的数量。

3.2 医院综合服务能力计算

现有研究通常采用医院的床位数反映医院的服务能力,评价指标过于单一,因此为全面评估医院的实际供给能力,本文采用医院的床位数量、科室复杂程度、专科科室比例这3项指标共同表征医院的综合服务能力,即

式中:Bj为医院j的床位数;Pj为医院j中专科科室的比例;Cj为医院j的科室复杂程度。由于Bj、Pj和Cj的单位不同,需要对以上变量归一化处理。

专科科室比例Pj为医院j的专科科室占该医院总科室数的比例,即

式中:为医院j中专科科室z的数量;Kj为医院j的科室总数。

科室复杂程度Cj反映了医院所能提供的医疗服务的多样性程度,采用信息熵计算,即

式中:分别为医院j的内科、外科、医技科室和其他科室这4类科室的数量;m取值1~4,分别表示内科、外科、医技科室和其他科室。

3.3 实际可达性计算

2SFCA 方法是度量公共设施服务可达性的常用方法,但该方法存在以下不足:首先,2SFCA方法采用二分法处理距离衰减,即在搜寻半径阈值范围内的可达性相同,而在搜寻半径范围之外则完全不可达,忽略了在搜索半径内老年人就医出行意愿会随着出行时长的增加而逐渐下降的趋势;其次,2SFCA方法针对不同设施采用单一搜索半径设置,无法反映医院的等级规模对居民就医行为的影响,事实上不同医院的服务覆盖范围会因医院功能、设施及技术力量等不同而有所差异。

本文对2SFCA 进行以下两点改进:首先,采用多层级服务半径对一、二、三级医院的服务半径进行区分;其次,采用实际就医需求并引入距离衰减函数表征医院网格与居住地网格之间的距离衰减作用。改进后的2SFCA方法计算步骤如下。

Step 1 搜索以医院网格j为中心,以该医院的服务半径Tl(l为该医院的等级,可取一、二、三级)为阈值,搜索所有阈值内可达的需求点网格k,将每个需求点网格k内所有就医出行链数量作为该网格的就医需求Dk,则医院j的供需比Rj为

式中:Dk为网格k的实际就医需求;Tk,j为研究周期内网格k到医院网格j的平均就医出行时长;Tl为医院j所对应的服务半径,可通过实际就医出行时间确定。基于就医出行成本矩阵绘制不同等级医院就医出行时长的频率直方图和累计百分比曲线,如图1 所示,分别选取93%位对应的出行时长55,55,70 min作为一、二、三级医疗设施的服务半径。

图1 不同等级医院就医出行时长分布Fig.1 Distribution of travel time for seeking healthcare in different levels of hospitals

Step 2 以居住地网格i为中心,分别以一、二、三级医院的服务半径Tl为阈值,搜索在阈值Tl内所有可达的特定等级医院网格j,引入距离衰减函数对供需比进行加权求和,依次得到居住地网格i到一、二、三级医院的可达性,再将不同等级医院的可达性求和得到居住地网格i的就医可达性Ai,该值越大,说明该区域老年人乘坐公交就医的可达性越好,即

式中:f(Ti,j)为距离衰减函数。本文选取常用的高斯距离衰减函数f(Ti,j)作为衰减函数,衰减速率与多层级服务半径Tl有关,f(Ti,j)计算公式为

4 结果分析

基于老年公交“常乘客”的出行链数据,根据就医活动识别推断方法共获得171041条就医活动出行链,然后融合公交到站数据构建出行成本矩阵并基于改进的2SFCA 模型计算老年人公交就医可达性。

4.1 就医出行需求分布

统计老年人公交就医出行的出发时间分布,结果如图2所示。出发时间整体呈现上、下午双峰的分布特征,且上午时段的出行需求远大于下午出行需求。上午高峰集聚特征更为明显,就医需求主要集中在7:00-10:00,最大峰值出现在上午8:00;而下午各时段分布相对分散,峰值出现在13:00。

图2 出发时间分布Fig.2 Distribution of departure time

提取每个居住地网格内老年人就医出行链总数作为该网格的就医需求总量,采用Jenks 自然间断法将其分为4 类,得到老年乘客需求的空间分布,如图3所示。老年人公交就医需求空间分布呈现明显的由城市中心向外逐渐减少的趋势。三环以内中心城区的老年人口分布密度大,公交线网密度较高,导致该区域公交就医出行需求相对较高。而四环以外的望京、回龙观、天通苑等大型居住社区,老年人就医需求同样较大。公交就医需求较低的区域主要分布在五环至六环之间的城市外围区域,该区域老年人口密度相对较低,且公交服务水平显著低于城市中心区域,因此老年人乘坐公交就医出行需求较低。

图3 老年人就医需求量空间分布Fig.3 Distribution of demand of elderly for seeking healthcare

4.2 就医可达性分析

根据老年人就医需求的时间分布特征分别选取就医高峰时段(7:00-10:00)和就医平峰时段(10:00-13:00),采用改进的2SFCA 方法计算网格老年乘客就医可达性,结果如图4所示。网格的颜色越深,表明该区域的就医可达性越好。从整体上看,高峰和平峰的就医可达性均呈现中心城区的医疗可达性普遍较高,且由中心向四周可达性逐渐降低的趋势。在城市外围不同区域的医疗可达性上也存在异质性,五环路外的东部和西部区域可达性较好,而五环路外的北部、东北部区域的可达性相对较差。

图4 就医可达性空间分布Fig.4 Spatial distribution of healthcare accessibility

三环路内的中心城区可达性普遍较高。该类区域医疗点分布集中,医疗设施资源丰富,拥有27家三级医院(如北京协和医院),17 家二级医院,34家一级医院,医院层级结构完善,能满足居民不同的就医需求。此外,该区域公交线路网密集、公交服务频率较高,老年人公交出行相对便利,因此可达性高。

五环外的东部和西部区域(例如石景山、通州)可达性较好,上述区域因靠近城市中心,作为高可达性的外延区域,老年人可以享用到城市中心区域提供的医疗服务。此外,该区域也有11 家二级医院,能够满足居民的基本就医需求。同时该区域公共交通条件较为完善,有利于老年人乘坐公交就医出行,因此可达性较好。

五环外的北部和东北部区域(如天通苑和望京区域)可达性较差,上述区域老年人就医出行需求旺盛,但医院分布密度相对较低且三级医院分布极少,以一、二级医院为主,由于服务覆盖范围较小和医疗能力有限,该区域的老年人通常需要前往距离较远、位于中心城区的三级医院就医。此外,这些区域公交线路网覆盖不足,老年人需要换乘多条线路才能抵达医院,导致公交就医出行时间较长,从而导致公交就医可达性较低。为改善上述区域老年人公交就医可达性,一方面建议管理部门提升优质医疗资源的服务能力,实现区域医疗资源均衡布局;另一方面需要针对老年人集聚的社区优化公交线路和服务并完善社区、医院周边的慢行设施,以提升老年人乘坐公交就医出行的便利性、安全性和舒适性。

根据二环路至六环路的位置将研究区域划分为5个区域,为更直观地反映不同区域就医便利程度的差异,统计分析不同环路内不同网格的就医可达性分布情况,结果如图5所示。高峰及平峰时段就医可达性均表现出从内部到外部呈现先上升后下降的趋势。其中,二环路与三环路之间区域的可达性平均值最高,分别为2.48,2.53;而五环路与六环路之间区域的可达性均值最低,分别为0.68,1.01,表明该区域的老年人在就医过程中面临较大的困难,需要更长的出行时间才能获得所需的就医服务。通过对比就医高峰和就医平峰两个时段的可达性分布,可以观察到各个环路在高峰时段的老年人就医可达性平均值明显低于平峰时段的可达性平均值。

图5 高峰及平峰时段不同环路之间可达性分布Fig.5 Distribution of accessibility among different ring roads during non-peak and peak hours

为深入探究不同时段的道路运行状况与公交服务水平对老年人公交就医可达性的影响,计算同一网格内就医平峰时段可达性与就医高峰时段可达性差值,结果如图6所示。可以看出,高平峰时段可达性下降较明显的网格区域主要分布于二环与四环之间的海淀部分区域以及五环外的回龙观区域,上述区域同样为老年人就医需求较大的区域。

图6 可达性差值分布Fig.6 Distribution of accessibility differences

针对上述两个区域,采用回归分析探究就医可达性分别与前往一、二、三级医院的实际就医出行需求、就医出行时长之间的关系,由标准化系数的绝对值大小可以对比各变量的相对影响程度,结果如表4所示。针对回龙观区域,对就医可达性变化影响最显著的3 个变量分别为到一、二、三级医院的出行时长,出行时长的增加会降低就医可达性。建议在该区域的高峰期间增设从社区至医院的老年人就医公交直达专线,或提高该地区的公交线路服务频率来减少老年人乘车时间、站点等待时间和中途换乘次数,以缓解该区域老年人就医可达性较差的问题。针对海淀部分区域,可达性的变化主要与一级、二级医院的出行时长以及三级医院的就医需求显著相关,建议针对一、二级医院提升公交服务供给水平、积极倡导分级就诊,进而缓解该区域三级医院高峰期间的服务压力,以提高该区域老年人就医可达性。

表4 回归分析结果Table 4 Regression analysis results

5 结论

为探究老年人公交就医出行实际可达性及其时空分布特征,本文以公交老年卡数据和公交到站时间数据等多源数据为基础,基于就医活动特性和时空约束识别就医活动出行链,以反映不同区域的实际就医出行需求,并提取老年人每次就医出行的乘车时间、换乘时间和站点等待时间,构建就医出行成本矩阵,以刻画公交实际运营水平对就医可达性的影响。综合考虑医院等级规模差异采用医院的床位数量、科室复杂程度、专科科室比例这3 项指标综合表征医院的服务能力,采用多层级服务半径对一、二、三级医院的服务半径进行区分,使用实际就医需求和距离衰减函数反映医院网格与居住地网格之间的距离衰减作用,构建基于改进2SFCA的老年人公交就医可达性计算方法。以北京市六环内区域为例,分析了老年人公交就医的实际可达性时空分布特征。

研究结果表明,北京市六环内就医可达性整体呈现出由中心向外围递减的趋势,其中二环路与三环路之间区域的可达性最高,该区域医疗资源充足且公共交通系统相对完善,老年人乘坐公交就医出行相对便利;城市外围区域的可达性整体较低且空间分布也存在空间异质性,五环路外的东部和西部区域可达性较好,而五环路外的北部、东北部区域的可达性相对较差,该区域缺乏高等级医院且公交服务水平较低,老年人需要换乘才能抵达。各个区域就医高峰时段(7:00-10:00)的老年乘客就医可达性平均值均明显低于平峰时段(10:00-13:00)的可达性平均值,高平峰时段可达性下降较明显的区域分布于二环与四环之间、五环外北部的部分区域,主要是因高峰时段交通拥堵和公交运行可靠性下降使得出行总时间延长导致的。

针对老年人公交就医可达性较差的区域,一方面建议管理部门提高医院的服务能力并优化区域优质医疗资源分布的均衡性;另一方面建议通过优化公交系统间接改善医疗设施的可达性和空间分布的不公平性,例如优化公交线路和提高高峰期间公交服务频率和可靠性,特别是针对就医需求较高的区域可提供社区至医院就医直达专线,减少老年人乘坐公交的在途时间和换乘次数。本文可以为提升老年人就医出行可达性和公交系统适老化水平提供支撑,未来将考虑其他出行方式(如步行、自行车及私家车等)综合分析老年人就医可达性时空分布特征。

猜你喜欢
服务半径公交站点
一元公交开进太行深处
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
19万个北京充电桩建设提速充电服务半径小于5公里
等公交
首届欧洲自行车共享站点协商会召开
怕被人认出
电子商务冲击下城市分区中心商业中心的服务门槛人口与居住密度研究
基于成本约束的冷链物流配送网络规划
探究不同类型公路货物运输的经济服务半径