牛成英 张颖 闫新宇
摘要:结合人口统计数据、POI数据、土地利用数据以及遥感影像数据,对公共医疗服务设施选址问题进行分析,提出通过熵权法综合空间可达性水平和随机森林选址推荐度计算空间区域选址推荐得分的计算方法。研究结果表明:兼顾设施供给能力、常住与流动人口医疗需求,兼顾资源分布与公共设施公平性,融合空间可达性和选址推荐度计算医疗设施推荐指数更能表现现有医疗资源的覆盖与缺失情况。最后以该方法分析兰州市主城区域内医疗资源配置合理性作为实证。该方法可为其他区域和其他类公共设施选址相关研究提供参考依据和理论基础。
关键词:多源数据;空间可达性;随机森林;熵权法;选址推荐;医疗设施布局优化
中图分类号:TU984文献标志码:A文章编号:1673-5072(2024)03-0302-09
医疗设施作为基本公共服务设施的重要主体,其布局既要满足公平性,使得居民能够均衡、平等地享受医疗服务,又要保证设施有较高利用率,不浪费公共资源。基于多源数据的医疗设施布局优化,意图在融合地理信息数据、政府统计数据、反映居民生产生活的各类居民行为数据基础上,从多视角更准确地探索医疗设施分布规律,更科学地分析其配置合理性并提出针对性解决方案,更好地平衡居民医疗需求与设施资源利用率。
可达性是衡量医疗设施公平性的重要指标,均衡的可达性水平是实现空间公正的基础。设施可达性根据设施服务能力和用户潜在需求刻画设施的服务潜力[1]。常用的可达性测量方法根据网络特征的差异分为两类:(1)拓扑网络,有基于矩阵的拓扑法,通过整体可达性矩阵与最短距离矩阵运算来获取节点和网络的可达性水平[2];(2)几何网络,主要有距离法、累积机会法、等值线法、引力模型法、概率法、频率法、平衡系数法、时空法、效用法等[3]。距離法使用“距离越小”作为可达性越好的唯一指标,在距离法基础上发展的累积机会法和等值线法,通过交通出行便捷程度来衡量可达性水平,均未考虑各点间的相互作用及空间效应随距离衰减等因素。引力模型及其延伸出的概率法和频率法,较全面地考虑了影响可达性的多种因素,但在参数定义上存在主观性,并且对不同需求点之间的相互竞争以及阈值设置等方面考虑不足[4]。两步移动搜索法(2SFCA)在引力模型中加入“空间阈值”的概念,从公共空间获得机会累计值来衡量其可达性,能更好地识别出可达性低值区,并且在实际使用过程中可以根据需求引入基尼系数[5]、高斯衰减函数[67]、多元交通模式[8]等进行改进。总结已有文献发现,现有研究大多数仍是基于地理对象间的欧式距离来度量是否空间可达,且较少考虑人口规模产生的影响。
医疗设施的利用率由于数据限制难以直接量化,但得益于互联网技术的发展,研究者可以从居民行为数据以及周边其他类设施布局中对其进行挖掘。早期的设施布局优化问题与Weber问题类似,都是从选址的角度通过构建最优化模型来解决。城市高速发展期内,医疗设施布局策略处在“保量”阶段,主要通过新建设施满足城市扩张人口涌入带来的医疗需求。但近年来,医疗设施布局已从“保量”过渡到“保质”阶段,逐步进入精细化研究,布局策略转向关注资源分配合理性,医院等级带来的可达性差异或医疗资源强弱带来的吸引力差异以及不同地理条件下居民所处的空间位置等因素进入研究视野,研究者逐渐关注总量达标但局部“供不应求”或“供过于求”的现象,医疗设施优化策略转向如何最大化现有医疗资源的服务能力[6,910]。随着大数据与机器学习算法被广泛应用于最优化问题,研究者也将它们引入了选址规划研究中[8,1112]。但总结当前研究,基于空间可达性的医疗设施选址和布局优化,大多只基于居民居住区数据和医疗设施数据,单一考虑医疗设施与需求点间的空间距离和供需关系,不关注医疗设施外的其他各类设施与医疗设施间的相互影响以及暗含的流动人口和医疗设施利用率信息[1314],一定程度上无法契合城市现状。
考虑融合普查数据中的常住人口信息和人文活动相关的全类别POI数据信息,综合人与设施间的供需关系、设施间的相互影响以及人口活动暗含的设施利用情况,并在空间上将研究区域网格化处理,缩小研究单元人口规模差异带来的影响,结合“空间可达性水平”和“随机森林推荐度”分析医疗资源配置合理性,一方面可以融合多源数据,由数据驱动减少人为干涉,另一方面综合多方因素进行判断并设计优化方案,能在满足居民医疗需求的同时最大化医疗资源利用率。
1研究方法
医疗设施布局以人为本,本文基于各类建筑物位置及人流量进行研究,融合遥感影像数据、POI数据、土地利用数据以及人口统计数据,将研究区统一划定为边长500 m的网格对公共医疗服务设施选址问题进行分析,并结合土地利用情况给出优化建议。具体运用以下方法。
1.1 空间可达性水平测度2SFCA从供需关系变动的角度对设施空间可达性进行评价,操作过程可以概括为同时考虑“供给”和“需求”进行两次搜索的过程。为了体现空间距离增加导致的供需能力下降,选用高斯混合函数改进2SFCA来描述该衰减现象,输出所有网格在空间距离上的可达性水平。
第一步,以供给为中心,服务极限距离d0为半径建立搜索域,计算供需比Rj。
式中:G(dkj)为考虑空间摩擦问题的高斯衰减函数,G(dkj)=e-0.5×(dkjd0)2-e-0.51-e-0.5, j∈(1,2,…,m)为供给点,k∈(1,2,…,n)为需求点, dkj为供需距离,且dkj<d0,Sj为设施供给水平总量,Dk为每个人口栅格中的人口数量。
第二步,以需求为中心,服务极限距离d0为半径建立搜索域,将域内供给设施的供求比加和得到基于距离关系的空间可达性水平SAk:
1.2 随机森林选址推荐度随机森林是基于决策树构建得到的集成学习方法,适用于解决高维非线性分类问题,能处理大量输入数据并有效避免过拟合,利用此方法基于全类别POI数据,输出所有网格医疗设施选址推荐度[15]。
研究区内POI数据集U={U1,U2,…,Un},对应分类标签集X={T;O1,O2,…,Oj},其中T为目标设施。设定属性A={A1,A2,…,Ak},通过遍历样本信息熵h(X)和各类标签信息增益g(X,A),实现信息增益最大化。通过递归、迭代构建决策树模型hi(X),利用Bootstrap重抽样方法抽取多个样本,l轮训练后得到分类模型序列{h1(X),h2(X),…,hl(X)},对分类结果采用简单多数投票法,最终得到随机森林选址推荐度SRk。
式中:H(X)=argmaxT∑li=1I(hi(X)=T),Ck(H(X))为全部分类器个数,Ck(Hh(X)=T(X))为T标签下分类器个数。
1.3 医疗设施选址推荐指数SAk来源于人口数据,代表常住人口的医疗需求满足程度,其数值越高表明现有医疗资源越充足,相应网格的选址推荐指数越低。SRk来源于POI数据,代表着流动人口的医疗需求,其数值越高表明当前医疗资源需求越高,相应网格推荐指数越高。
两类数值从不同角度描述了同一网格的医疗资源现况。本文对同一网格同时考虑SAk和SRk,利用熵权法根据数据离散程度计算两者的指标权重ω1、ω2,对标准化后的SAk*和SRk*线性加权,计算最终选址推荐指数。
式中:k∈(1,2,…,n)为网格点,Zk表示同时考虑“需求”和“需求满足度”后,每个网格建议拥有医疗设施的可能性大小,其值越高表明该网格内应该配备更多的医疗资源。
2实证分析——以兰州市主城区为例
2.1 研究区域与数据处理
2.1.1研究区域
本文关注兰州市的医疗设施资源分配情况,考虑数据可获得性和人口密度,选取城关、七里河、西固和安宁4个行政区代表的主城区作为研究区域(图1)。研究区域行政边界矢量数据从全国地理信息资源目录服务系统中下载分割得到,以街道为最小行政区域单位。
由图1可以看出,研究区域地形整体呈现依山傍水态势,黄河自西向东穿城而过,呈现出“南北两山夹一河”的山谷地形。市区东西狭长,约30 km,南北较窄,最窄处仅5 km左右,具有带状盆地城市特征。兰州市主城区依河而建、依河而生,七里河区和西固区分别位于主城区南部和西部,路网密度相对较低;城关区地处东北部,区域内道路密度高,经济相对发达,是兰州市的政治、经济及文化中心。
2.1.2数据来源调用高德地图API,使用计算机技术爬取2023年1月兰州市城关、七里河、西固、安宁4个区的全类别POI数据,共计125 753条,分为购物服务、餐饮服务、商务住宅等24个大类(一级类别)。每条POI数据均包含WGS1984坐标系下的经纬度、点位名称及具体地址等信息。
人口分布栅格数据(2020)从World Pop网站(https://hub.worldpop.org/)爬取,栅格分辨率为1 000 m,地理坐标系为WGS1984。人口普查数据来源于2021年兰州市统计局发布的《兰州市第七次人口普查公报》,以街道为最小行政区域单位。遥感影像数据从BIGEMAP(http://www.bigemap.com/)爬取,以WGS1984为坐标系,经过行政区域矢量数据裁剪修正,行列栅格数分别为5 825、2 883个。
2.1.3数据预处理为了可达性测算更精确,以人口普查数据对人口分布栅格数据进行修正,制作兰州市主城区实际人口栅格数据。首先以区内63个街道为最小单位构建数表,第七次普查各街道人口数量记为Bi,对人口数表、人口栅格数据、街道矢量数据进行区域分析,计算人口分布栅格数据中各街道人口总数(Wi),得到人口修正系数: Ii=Bi/Wi, (i=1,2,…,63)。将Ii与街道矢量图连接转换为栅格,并与爬取到的人口分布栅格数据相乘得到5个城区实际人口栅格数据。修正后平均误差由27.3%降为0.01%,说明修正后的数据能准确反映人口空间分布情况。
我国医疗服务设施有以下4类:医院、基础医疗服务设施、特殊公共健康设施以及其他医疗设施。其中,医院分为一級、二级和三级;基础医疗服务设施包括城市、乡镇两个部分,城市系统由门诊诊所和社区卫生服务中心组成,乡镇系统由村卫生站和乡镇卫生院组成。研究中对 “医疗保健服务”POI数据修剪降重,删除动物医疗场所、医疗保健用品销售店等无法直接对居民提供医疗服务的设施点,并根据《甘肃省医疗年鉴》对比剩余1 221条数据,将所有医疗设施分为三个等级。其中,一级包含大型三甲医院和综合医院,二级包含中小型专科医院和大型社区医疗服务站,三级为卫生院、诊所等小型医疗服务机构。
兰州市位于北纬36°03′、东经103°40′,为减少投影坐标系不同带来的偏差,测算得到研究区的中央经度为东经103°66′,并以WGS1984为基础设定中央经度,构建兰州市主城区投影坐标系。
2.2研究结果与分析
2.2.1 基于改进2SFCA的医疗设施空间可达性测度
参考兰州市交通情况和“城区15分钟步行健康圈”目标,分别将一、二、三级医疗设施的极限服务半径d0设定为40、20、5 km,以此将研究区划分网格后根据医疗设施POI数据和修正后的人口栅格数据计算缓冲区。采用改进的2SFCA方法计算人均Rj和居民在空间距离成本下的医疗设施SAk。为分类研究医疗设施在兰州市不同区域之间可达性的相对情况,基于平均分配原则对可达性情况分级如表1,空间连接后可视化展示如图2。
结合可达性指数与网格地理位置可知,城关区西部、七里河北部以及安宁区东部核心街区可达性最好,是兰州市的经济文化中心,人口密度大,一级医疗设施个数最多。可达性较好的区域大部分是城郊,人口密度较大,有12个一级医疗设施。可达性中等的区域空间上分布在城乡结合处,主要位于城关区东北部、七里河区中部及西固区东部,有三级医疗设施33个。可达性较差的区域位于西固区中部、城关区东北部和七里河区中南部,主要是距离城市较近的乡镇,虽然区域内有3个一级医疗设施,但医疗设施总数较少,为15个。可达性最差的区域位于七里河区南部和西固区西部高海拔山地乡镇,属于研究区边缘位置,仅有1个二级医疗设施和7个三级医疗设施。
由图2来看,研究区医疗设施可达性水平由中心城区向外衰减,中心城区整体较好,城郊及乡镇地区可达性较差,现有医疗资源确实存在分布不均衡现象,需要根据居民实际需求进行布局优化以最大化“医疗需求满足度”和“设施利用率”。
2.2.2基于随机森林算法的医疗设施选址推荐度测算医疗需求与区域内人口活动信息密切相关。鉴于流动人口可以由购物、餐饮、公司企业等社会活动轨迹综合反映,并且流动人口分布情况一定程度上可以反映医疗设施实际使用情况,因此考虑引入医疗设施以外的其他类设施参与分析,用全类别POI数据挖掘城市内人口信息。调用高德地图API,爬取2023年1月兰州市城关、七里河、西固、安宁4个区内的全类别POI数据。目标设施T(即医疗设施)修剪后剩余1 221个样本。为避免信息重叠,剔除POI数据中地名地址信息、室内设施、通行设施3类,随后将数据归为6大类,具体划分情况见表2。
按表2分类后,将其他类POI数据与医疗设施POI数据合并构成全样本POI数据集。按边长500 m将研究区域划分为3 883个网格后,通过构建掩膜排除黄河等无法建设设施的水体。将POI数据与网格进行空间连接,确定每个POI数据所处网格以及网格内包含的各类设施数量。结果表明3 883个网格中,空白网格占2 559个,384个网格内含有医疗设施,940个网格内只存有其他类设施。
使用Python软件构建随机森林,生成的每个决策树随机抽取30%样本作为训练集,70%作为测试集,设定生成树上限为400个。训练生成决策树321棵,此时分类评价指标ROC得分(即测试得到数据和标签分类的平均精确度)为0846 1。为进一步提高分类精度和算法效率,通过固定变量交叉验证方式实现参数优化,得出随机森林模型最佳分类计算方法为基尼指数,最佳决策树个数为215棵。为防止过拟合,最大深度为3层,剪枝处最小样本为10个,分支节点最小样本为120个。优化参数后最终ROC得分为0897 7,表明模型有较好的分类精度与预测能力。各类标签对构建的随机森林模型特征贡献度见表3。
贡献度排名第一、二位的分别是“住宅与科教设施”“日常服务与娱乐设施”,都是城市中的常住人口密集地,符合医疗设施分布与常住人口密集度呈正相关的客观规律。特征贡献度排名三、四的“销售与购物场所”“餐饮服务场所”都是流动人口密集地,主要建立在商圈和交通便利地区,代表着流动人口与交通要素在医疗设施选址中的重要地位。
基于全样本POI数据集,利用所得随机森林模型计算预测结果,各网格的推荐指数以概率形式呈现,概率越大,推荐指数越高。在应用随机森林算法进行分类时,一般认为推荐指数低于50%即不建议推荐。但公共设施布局需要考虑公平性,扩大推荐指数范围可以扩大公共设施的区域覆盖率,进而提高公平性。不同推荐指数范围下,研究区网格推荐结果如表4。
表4显示,推荐指数最高的网格(第一类)共有325个,空间上此类网格密集分布在市区经济繁华且人口密度高的区域,这与已有医疗设施的分布点高度重合。推荐指数较高的网格(第二类)共31个,其中已有医疗设施网格占45%,分布在城区内相对偏远区域以及乡镇中心。推荐指数适中的网格(第三类)共42个,其中已有医疗设施网格占31%,空间上此类网格分布在各区分界处,距城中心较远,但人口密度相对较高。推荐指数较低的网格(第四类)共25个,其中已有医疗设施网格占24%,空间上此类网格多分布在城市边缘工业区以及乡镇周边。推荐指数最低的网格(第五类)共57个,大多分布在城乡结合处及乡镇中心,还有部分在海拔较高的山区。
2.2.3 融合空间可达性和选址推荐度的医疗设施选址推荐指数为了设计医疗设施布局的最佳优化方案,考虑结合医疗设施空间可达性水平和随机森林预测选址推荐情况,综合判断网格的医疗资源合理性。利用熵权法确定空间可达性水平和随机森林推荐度权重分别为ω1=0.114 7和ω2=0.885 3,由式(4)得到每个网格的最终选址推荐指数Zk。采用自然间断点分级法识别Zk的分类间隔,最終将其分为5类,具体分类区间及各区间内网格数量、医疗设施、可达性水平、随机森林推荐度如表5,各类网格空间分布如图3。
表5中,SRk来源于全类别POI数据,SAk来源于人口统计数据和医疗设施POI数据,而Zk则由两者结合得到。医疗需求越高且现有医疗设施可达性相对越差的网格,推荐指数越高。从Zk的分类区间来看,其与SRk分布趋势一致,说明该方法确定的推荐指数契合流动人口的医疗需求。而SAk的分布则出现多数重叠,结合图2和图3来看,左上(西固区西侧)及右下(七里河区南侧)边缘山区区域可达性指数在0.68以上,但采用融合方法计算后医疗设施推荐指数较低(0.065至0.190),符合该区域常住人口较少且分散的现状,说明以往仅根据可达性判断医疗需求是有局限的,融合空间可达性和选址推荐度的方法更符合实际人口医疗资源缺失情况。
Zk从固定人口和流动人口、医疗需求满足度和利用率两个纬度,直观说明了网格内医疗资源分配情况。结合图1中的地形和路网分析,图3中红色、紫色网格集中在右上侧黄河两岸中心城区,零散点为乡镇中心区域,人口密度高导致医疗需求较高,是设计优化方案时重点关注的地区。黄色、绿色和蓝色网格Zk得分在0.37以下,该部分区域主要为高海拔山地,人口密度很低,数值差异主要由空间可达性差异引起。
2.3医疗设施优化方案
结合网格推荐指数与各级医疗设施POI点数量分析研究区医疗资源配置合理性。如表5所示,第一、二类网格是推荐指数最高的区域,共计352个,但其中有55个网格目前没有医疗设施。该区域内人口密集,推荐指数在0.38以上,建议尽快新增三级医疗设施应急,然后逐步增加医疗资源投入提升设施等级,扩大设施服务能力。第三、四、五类网格推荐指数较低,尤其第四、五类3 460个网格覆盖了绝大部分山区(图3绿色、蓝色区域)。研究区内共有59个一级医疗设施,资源有限,但第四类网格人口密度较低却占有4个一级医疗设施,建议将其逐步转移至上述第一、二类待优化区域,最大化一级医疗设施的服务能力。
结合图3、表5与遥感影像数据,依次对比医疗设施推荐指数和医疗资源分布现状,考虑到城区、乡镇由于地理位置不同导致人口分布、土地类型差异明显,分别以城乡分类辅以可达性水平和土地利用情况为4个行政区内的医疗设施设计具体优化方案。
2.3.1 中心城区优化方案兰州市中心城区为城关区中部、七里河区北部和安宁区的东部,整体处在东北方向,即图3中红色、紫色网格所在位置。对该区域而言,选址推荐指数与人口密度最高,基本不涉及耕地、农田,若规划合理,该区域内不应存在推荐得分很低的区域。但结合医疗设施POI点发现,该区域有部分网格医疗资源不足且推荐得分很低,将这些异常网格按常住、流动人口数量分为3类,以每一类中的一个具体案例结合遥感影像数据进行分析(图4)并给出优化建议。
第一类网格处于空间位置拥挤的老旧小区,常住人口多,流动人口少。以网格“1445、1446”为例,其处于城关区拱星墩街道,区域内仅有1个三级诊所,但其可达性指数分别为0.88、0.84,旁边是城关区主干道东岗路,交通便捷。这类区域无法新建较大的医疗设施,但居民去往一、二级医疗点较方便,建议新增三级医疗设施以满足日常医疗需求。
第二类网格为大型流动人口活动区域。以网格“1603、1604、1605、1606”为例,其紧邻兰州西站,小区属于旧厂房翻新在建,同时也是地铁二号线在建路段,目前没有医疗服务点。针对这类在建区域,建议新增二级医疗设施以满足现有大量流动人口和今后新增常住居民的医疗需求。
第三类网格为企业厂房,常住与流动人口数量均较大。以网格“2993、2774、2715、2716”代表的兰州石化公司为例,其处于陈坪街道北部,厂房内无医疗服务点,但周围网格医疗条件较好,可达性指数在0.83以上。针对该类区域,建议新增三级医疗服务点,或安排固定频次班车去往周边医疗设施,保障日常性医疗服务和突发性医疗需求。
2.3.2 乡镇优化方案
相比可达性水平较好、流动人口较多的城区,乡镇人口稳定,布局更看重固定医疗服务点。结合现有遥感影像分析,研究区域内网格“809”(七里河区西果园镇)和“2838”(西固区达川乡)(图5)的推荐指数分别为0.42、0.51,医疗资源需要优化。
西果园镇属于农业镇,常住居民年龄较大,但镇上仅有3个小型诊所;达川乡没有医疗服务点,且可达性指数仅为0.22,仅隔壁区内有1个三级卫生院,医疗配置不合理。以医疗配置较为合理的网格“2920”(西固区东川镇)为例,东川镇为典型工业镇,人流量大且工作种类导致人员易受伤,因而辖区内设有一级医疗点来满足居民需求。因此,建议西果园镇和达川乡避开耕地、农田位置,新增二级医疗服务设施。
4总结
结合公共设施空间可达性和随机森林选址推荐度,同时考虑了常住人口、流动人口的医疗需求和医院实际的使用情况,融合人口普查数据、全类别POI数据、遥感影像数据挖掘人流量及医疗设施分布特征,并用劃分网格和对城区、乡镇分开处理的方式减小人口分布差异带来的影响,设计医疗设施布局优化方案。以兰州市主城区内4个行政区为例,验证了该方法计算出的推荐指数更能代表区域内的医疗资源覆盖和缺失情况,据此设计的优化方案更贴合实际;并且在优化方案中,对不同特征的区域以典型案例结合分析,设计方案更具实践参考性。
本文围绕供需点的空间距离测度可达性,路网因素的影响考虑较少,与现实可达性情况可能会存在偏差。另外,通过随机森林进行选址推荐对数据量要求较大,POI数据量充足的网格预测精度表现较好,但还存在少数网格内POI数据不足的情况。未来研究将关注多源数据融合方法,充分考虑路网数据、人类活动轨迹数据等,提高医疗设施选址优化能力。
参考文献:
[1]张亚,刘纪平,王勇,等.顾及就医出行行为的医疗设施潜在与实际可达性对比研究[J/OL].武汉大学学报(信息科学版),2023.(2023-04-20)[2023-06-14].https://doi.org/10.13203/j.whugis20220269.
[2]OKELLY M E,GRUBESIC T H.Backbone topology,access,and the commercial Internet,1997-2000[J].Environment and Planning B Planning and Design,2002,29(4):533-552.
[3]陈洁,陆锋,程昌秀.可达性度量方法及应用研究进展评述[J].地理科学进展,2007,26(5):100-110.
[4]杨新刚,夏斌,王子帅.县域乡村地区义务教育设施空间分布及可达性分析:以安徽省寿县为例[J].西华师范大学学报(自然科学版),2024,45(3):284-292.
[5]杨莉,任海洋,王敏.南京市医疗资源空间分布均衡性与可达性研究[J].信阳师范学院学报(自然科学版),2022,35(1):63-71.
[6]任家怿,王云.基于改进两步移动搜索法的上海市黄浦区公园绿地空间可达性分析[J].地理科学进展,2021,40(5):774-783.
[7]刘丹丹,陈延辉,叶杰豪,等.基于改进高斯两步移动搜索法的医疗设施可达性评价[J].河南科技,2022,41(22):12-16.
[8]覃事娅,郄苗苗,尤昊宇,等.基于改进两步移动搜索法的长沙市医疗服务设施可达性研究[J].重庆建筑,2023,22(4):44-48.
[9]高岩辉,杨晴青,李继园.城市医疗机构分级可达性与空间公正研究:以西安市为例[J].地域研究与开发,2023,42(1):68-74.
[10]田玲玲,张晋,王法辉,等.公平与效率导向下农村公共医疗资源的空间优化研究:以湖北省仙桃市为例[J].地理科学,2019,39(9):1455-1463.
[11]戈好雨.基于機器学习的无人零售商店选址及其销量预测研究[D].南京:南京大学,2020.
[12]张嘉琪,杜开虎,任书良,等.多源空间大数据场景下的家装品牌线下广告选址布局研究[J].武汉大学学报(信息科学版),2022,47(9):1406-1415.
[13]汪晓春,熊峰,王振伟,等.基于POI大数据与机器学习的养老设施规划布局:以武汉市为例[J].经济地理,2021,41(6):49-56.
[14]赵卓文,吴勤书,张时智.面向基本医疗服务的空间可达性城乡差异分析[J].江苏科技信息,2023,40(13):71-74.
[15]黄钦,杨波,徐新创,等.基于多源空间数据和随机森林模型的长沙市茶颜悦色门店选址与预测研究[J].地球信息科学学报,2022,24(4):723-737.
Layout Optimization of Urban Medical Facilities Based on Multisource Data:
A Case Study of the Main Urban Area of Lanzhou
NIU Chengying,ZHANG Ying,YAN Xinyu
(School of Statistics,Lanzhou University of Finance and Economics,Lanzhou Gansu 730020,China)
Abstract: In accordance with the demographic data,POI data,land use data and remote sensing image data,this paper analyzes the location problem of public medical service facilities and proposes a calculation method of recommendation score for site selection that combines the spatial accessibility index and random forest recommendation index by entropy weight method.The research results show that this method has better performance in reflecting the coverage and lack of existing medical resources by combining the spatial accessibility and location recommendation because it takes into account the supply capacity of facilities and the medical needs of permanent residents and floating population,and gives consideration to the distribution of resources and the equity of public facilities.Finally,this method is employed to analyze the rationality of medical resources allocation in the main urban area of Lanzhou as an example.This method can provide references and a theoretical basis for the site selection research of other areas and other types of public facilities.
Keywords:multisource data;spatial accessibility;random forest;entropy weight method;location recommendation;layout optimization of medical facilities