李 华,潘晓芳,杨 林,3,王 璐,万 波,3
(1. 国土资源部土地整治中心,北京 100035; 2. 中国地质大学信息工程学院,湖北 武汉 430074; 3. 国家地理信息系统工程技术研究中心,湖北 武汉 430074)
医疗设施作为为人们提供基本医疗保障的基础服务设施,其空间结构布局的合理性及资源配置的有效性成为关系地区公共安全与社会稳定的重要因素[1]。在医疗设施合理布局与规划研究中,服务半径是衡量医疗设施的服务质量、服务水平、服务范围大小的重要指标之一[2-3],也是医疗设施可达性研究的基础条件。因此,医疗服务半径及服务范围相关研究成为关注的重点。
由于人们出行对交通网络的依赖性,在公共设施服务范围规划时大多参考研究区域内道路通行的速度标准,以设施为中心,设置一个合理的极限出行距离或出行时间作为服务半径。例如,步行15 min、公共交通30或60 min,或者步行1.5 km、公共交通10 km等[4-9]。这种设置方式能够从一定程度上满足研究的需求,却较少考虑使用者的实际情况。
调查问卷或医院注册病人数据获取是设施实际使用情况的最直接方式。罗晓菊等利用调查问卷数据分析了医疗设施的服务范围[10];陈锐等利用注册病人数据分析了医疗设施的服务半径[3,11-13]。然而,调查问卷需要消耗大量的人力物力及时间,注册病人数据则因为涉及病人隐私而难以获取。因此,这些研究大多只能反映单个医疗设施的用户分布及服务范围,难以从城市级别对设施的整体布局的合理性进行度量。
随着GPS技术的发展,安装在出租车上的GPS设备在车辆运动过程中产生了数据量庞大的轨迹数据,利用这些轨迹数据提取隐含的设施使用人群,并利用这些个体的活动空间模拟近似真实的地理环境成为一个很有希望的研究方向[14]。根据滴滴媒体研究院和CBNData公布的《2016智能出行大数据报告》,约有9.23%的出租车出行与医院相关[15]。这说明,出租车能够从一定规模上代表城市医疗设施访问人群的分布情况。因此,本文利用出租车轨迹数据,对医疗设施的服务半径进行研究,为评价医疗设施空间分布的合理性及未来医疗设施选址、城市规划提供指导意义。
出租车GPS轨迹数据主要包含车牌号码、时间、坐标、角度、速度、载客状态等属性。根据车辆载客状态(0表示空车,1表示载客)识别出隐含个体出行的子轨迹信息[16-17],并提取出个体出行子轨迹的上客点(pick-up point,PUP)和下客点(drop-off point,DOP)。
通常基于轨迹的研究将载客状态由0到1或有1到0变化时,将变化前或变化后的轨迹点作为PUP或DOP。研究发现,车辆载客状态由0变为1或由0变为1的过程中,如果2个轨迹点的间隔过大或行驶方向发生了较大的变化,会导致PUP或DOP的提取产生明显的误差。因此在PUP和DOP的提取过程中采用增加轨迹点间隔约束的方法来提高PUP和DOP的准确性。具体方法为:
将2个载客状态由0变化为1或由1变化为0的相邻2个轨迹点分别标记为P1和P2。
约束条件1:令Time(P1,P2)表示P1到P2的行驶时间,则设定Time(P1,P2)≤1 min,即两点之间的时间约束不大于1 min。
约束条件2:令Angle(P1,P2)表示P1到P2的角度变化,则设定Angle(P1,P2)≤45°,即两点之间的角度变化约束不大于45°。
约束条件3:令Distance(P1,P2)表示P1到P2的距离,则设定Distance(P1,P2)≤200 m,即两点之间的距离约束不大于200 m。
然后,根据P1、P2经过的道路网络,将其中间点作为PUP或DOP的位置。
凸包是一个包含了给定二维有限点集的最小凸边界。根据医疗设施的位置建立合适的缓冲区,将落入缓冲区的DOP对应的子轨迹作为访问医疗设施的用户轨迹,对应的PUP作为用户的来源。访问一个设施所有的PUP点即为该设施的用户来源,那么,一个设施所有PUP形成的凸包即表示该设施的服务范围。如图1所示,p0,p1,…,p12分别表示设施的PUP,点集{p0,p1,…,p12}所形成的凸包为红色多边形。
图1 基于PUT的凸包
凸包叠加是所有设施服务范围空间移位后的叠加。将每个设施的凸包多边形进行空间上的移位,将设施位置移至同一点坐标,得到叠加的凸包多边形。如图2所示。叠加后的凸包多边形用于分析医疗设施服务半径的整体情况。
图2 凸包的叠加
本文试验选择深圳市为研究区域,如图3所示。深圳市共设6个市辖行政区(福田区、罗湖区、盐田区、南山区、宝安区、龙岗区)。截至2013年末常住人口数约为1063万人,土地面积约为1997 km2,平均人口密度约5323人/km2(数据来源:深圳市2014年统计年鉴)。
图3 深圳市行政区划图
深圳市6个行政区55个街道的人口数据来源于2010年第六次全国人口普查主要数据公报;医疗设施选择深圳市POI中提取三级以上18家大型医院为研究对象,各医院的位置从百度地图获取;GPS轨迹为深圳市16 000余辆出租车2011年11月3—18日产生的大约200万条轨迹点数据,其样例格式见表1。
表1 出租车轨迹数据样例
利用基于轨迹点间隔约束的上下客点提取方法,共筛选出大约27万条载客子轨迹(见表2)。主要信息包含车牌号、上车时间、上车地点、下车时间、下车地点等。
表2 基于出租车GPS轨迹提取的子轨迹信息
大量的载客子轨迹包括各种目的的出行,如商场、景点、医院、酒店等。提取目的地为医疗设施的子轨迹的方法是:以医疗设施为对象分别建立100、200、300、400 m缓冲区,不同大小的缓冲区与DOP叠加后发现, 200 m缓冲区范围内下客点聚集程度较高,因此本文选择200 m的缓冲区来提取医疗设施的DOP(如图4所示),并将DOP对应的PUP位置作为医疗设施的病人来源。
图4 医院的DOP选取
将每个医疗设施的PUP作为构造该医疗设施凸包的点集,利用“最小几何边界”功能,构造出每个医疗设施的凸包,如图5所示。根据1.2基于凸包叠加分析方法,选择“按属性选择—医院ID—编辑要素—圆形”操作,把所有医院都标注到其对应的凸包上;然后选取一个医院为基准点,将所有的医院移动到基准点处,即将所有凸包叠加到同一个中心,得到叠加的凸包多边形,如图6所示。
图5 医疗设施的凸包
图6 医疗设施凸包的叠加
通过不同距离范围内的医疗设施数量与用户数量的分布及其对应关系分析医疗设施的服务半径。
3.1.1 基于医疗设施数量的出行距离分析
为了分析研究区域内医疗设施的服务半径分布情况,本文首先将基于矢量的凸包叠加多边形转为栅格格式,若像元属于1个医院,则将栅格的输出像元值设为1;然后对栅格进行镶嵌求和;最后输出的像元值即为“可以覆盖到每个像元的医院个数”,如图7所示。
图7 基于栅格像元的医疗设施凸包叠加图
根据凸包叠加后的像元值,通过不同距离内的医疗设施数量分析用户出行距离的分布情况。统计三级医院数量与用户出行距离之间的对应关系,以医院为中心,在3~33 km范围内,以3 km为间隔生成多环缓冲区,建立出行距离与医疗设施数量之间的对应关系,如图8所示。从图8中曲线的变化趋势可以看出:3~9 km的距离范围内医院的平均数量下降幅度较大,从18减小至9,减小量为9个;9 km以后医院平均数量下降幅度趋于平缓,减小量在0~2之间。由此可以看出,深圳市大部分三级医院的用户出行距离在9 km以内。
图8 不同出行距离与医院数量的对应关系
3.1.2 基于上客点数量的用户出行距离分析
访问医疗设施的用户数量与医疗设施之间的距离也是医院服务半径的一个重要指标,以1 km为间隔,统计深圳市三级医院的用户数量与其出行距离之间的关系,同时建立上客点数量与用户出行距离之间的对应关系,如图9所示。从统计图中可以看到折线在3、6及9 km处发生了较大的转折,并且9 km之后曲线的变化速率持续缓慢,对应的PUP数量趋向为0。这也说明,深圳市三级医院用户的来源主要分布在9 km以内,与3.1.1中结论一致。
3.1.3 医疗设施服务半径分析
四分位法是一种常用的度量统计值集中趋势的方法,试验中获取的医疗设施的PUP总数为15 461,那么
9 km范围内的PUP个数占PUP总数的百分比为14 451/15 461=93.5%;
6 km范围内的PUP个数占PUP总数的百分比为13 233/15 461=86.6%;
4 km范围内的PUP个数占PUP总数的百分比为11 504/15 461=74.4%。
图9 上客点数量与出行距离之间的对应关系
本文采用上四分位数,即占总PUP数量75%距离范围内的用户出行距离作为医疗设施的服务半径。即以PUP数量占74.4%的出行距离4 km为深圳市三级医院实际的服务半径。
以4 km为服务半径,建立深圳市三级医院的实际服务范围,如图10所示的圆形缓冲区。笔者发现,这些缓冲区形成的服务范围在福田区与罗湖区出现大量重叠,而宝安区、盐田区和龙岗区的三级医院的缓冲区服务范围却远远不能覆盖这两个区域。这说明从深圳市三级医院实际服务范围的空间分布而言,福田区和罗湖区的可达性最强,宝安区、盐田区与龙岗区可达性较弱,特别是盐田区和龙岗区,严重缺乏三级以上高等级医疗设施。医疗分布的不平衡现象导致了可达性分布的不均衡现象。
除了从服务范围上分析医疗设施布局的合理性之外,本文还从人口的分布与医疗设施的就医门诊量是否吻合的角度来分析医疗设施布局的合理性,采用质心分析法对人口密度质心和医院质心的空间分布情况进行计算与分析。
提取各个街道区多边形的几何中心作为其人口密度定位点,基于人口密度的质心计算公式为
(1)
式中,(Xp,Yp)为人口密度质心的坐标;(xi,yi)为第i个街道几何中心坐标;pi为第i个街道的人口密度;m表示研究区域内的街道总数。
基于年门诊量的医院质心计算公式为
(2)
式中,(Xh,Yh)为三级医院质心的坐标;(xi,yi)为第i个医院的坐标;hi为第i个医院的年门诊量;n表示研究区域内医院的总个数。
得到的人口密度质心与医院的质心分布如图10 所示。医院质心在人口密度质心的西北方向,计算得知二者之间的距离约为2 km。由此可知三级医院质心与人口密度并不重合,但也距离不远。说明深圳市三级医院空间分布虽然呈现出极大的不平衡性,总体上却与人口的分布比较吻合,但仍需作出改进与调整。
图10 深圳市三级医院服务范围、医院质心及人口密度质心分布
传统的公共服务设施服务半径均是基于理论的方法,缺少实际用户访问数据的验证。本文提出了基于出租车GPS轨迹,通过凸包叠加分析的方法研究医疗设施的服务半径,并以深圳市三级医院为研究对象,验证了该方法的有效性。研究表明,深圳市三级医院的访问人群基本位于9 km范围内,4 km是比较合理的服务半径。从三级医院在各行政区域的空间分布来看,深圳市三级医院布局呈现出较大的不均衡性,福田区和罗湖区服务范围基本覆盖整个区域,且空间上叠加严重,体现出就医可达性较强,而盐田区与龙岗区的服务范围却远远未能覆盖本区面积,呈现出极低的就医可达性。然而通过质心分析法综合人口的分布状况,结果显示深圳市三级医院空间分布与人口密度相差不远。
本文从大数据角度对医疗设施服务半径问题进行了研究与验证,但也存在一些不足,如仍然只是从空间角度出发分析居民的就医行为,没能考虑政策或习惯等非空间因素的影响;另外,质心分析中以年门诊量为唯一的参考因素,研究指标不够丰富,以后的研究中应加入其他属性信息。