学区尺度下小学生通学事故风险评估及影响因素

2021-02-27 08:14戢晓峰张琪
交通运输系统工程与信息 2021年1期
关键词:学区深圳市密度

戢晓峰,张琪

(昆明理工大学,交通工程学院,昆明650504)

0 引言

通学出行在城市出行活动中占据越来越重要的地位,使通学问题成为研究热点[1]。通学相关研究主要集中于通学模式、通学行为分析,如Smith[2]指出步行校车既能缓解城市交通拥堵,又能促进孩子的身体健康,提升安全意识。张蕊等[3]以儿童通学调查问卷为基础,基于结构方程构建以家庭为单位的儿童通学模型。Jorge 等[4]利用克里格回归法分析通学距离与通学方式的关系,指出欧氏距离和步行距离是决定步行通学的最佳预测因子。

随着通学研究的不断深入,通学安全开始受到重视。Huertas 等[5]基于西班牙儿童活跃通学问卷调查数据分析得到,通学交通安全是影响儿童活跃通学的主要因素。Roya 等[6]以通学调查问卷为基础数据指出,通学安全性较差会致使父母使用小汽车接送儿童上下学。Haruhiko 等[7]基于日本47 个县的儿童参与交通事故数据发现,儿童通学事故中死亡和重伤人数在不同地区有较大差异。Sun等[8]基于儿童通学出行问卷数据,基于二元Logistic 回归模型得到安全感知对儿童活跃通学具有积极影响。Rahman 等[9]对学校周边通学区域进行微观交通仿真发现,降低车速和减少车道数能显著降低学校区域事故风险。

通学安全逐步成为通学领域的研究热点,现有研究大多使用问卷调查数据或实地观测学校区域数据对通学安全进行评估,基于城市交通系统大数据的实证研究较为鲜见。我国大多城市为儿童能更好接受公共教育,教育管理部门根据实际需要,在一定的地理空间范围内打破行政区划界线划分了学区,故急需开展学区尺度下通学安全研究。基于此,本文采集学区尺度下的城市交通事故数据和道路运行数据,构建城市通学事故风险评估模型,进一步分析其影响因素,以深圳市中心城区为例进行实证分析,以期为交通安全与教育管理部门开展通学安全管理提供理论依据。

1 评估指标体系构建

1.1 通学事故风险评价指标

通学事故风险一方面与通学环境中的危险程度有关,另一方面与小学生在危险环境中的时长相关[10]。衡量通学环境危险程度时,选取交通事故数、死亡人数、受伤人数、事故财产损失、道路长度等5个因素为评价指标[10]。通学个体在危险环境中时长由通学距离与运行速度共同决定。相关评价指标及定义如表1所示。

1.2 通学事故风险影响因素

为探究影响学区尺度下通学事故风险的关键因素,结合既有研究[11]和本文研究目标,以学区为基本研究单元,选取学区划分面积、小区密度、小学密度、高等级道路密度、远距离通学小区比例、学区距城中心距离6个因素,采用随机森林模型探究其对通学事故风险的影响。各类变量的定义如表2所示。

表1 通学事故风险评估指标体系Table 1 School commuting accident risk evaluation index system

表2 通学事故风险影响因素指标体系Table 2 Index system of influencing factors of school commuting accident risk

2 通学事故风险评估模型构建

2.1 通学事故风险评估模型

为实现学区尺度下通学事故风险评估,综合考虑通学环境中事故发生可能性及事故严重程度。以通学路径上发生的交通事故数、严重程度及道路长度综合度量道路暴露度,即

式中:Ei为研究区域内i类等级道路的暴露度,将深圳市中心城区道路分为快速路、主干道、次干道、支路4类;Ui为i类等级城市道路研究时间内交通事故发生总次数;Ii为事故死亡人数;Ri为事故受伤人数;Gi事故财产损失(万元);Li为i类等级城市道路长度(km);α为死亡事故权重;γ为受伤事故权重;β为财产损失权重。借鉴既有研究[12]对权重α、γ、β进行选取,设定α=2.0 ,γ=1.5 ,β=1.0。

将小学生在不同道路环境中的暴露度与暴露时长积分后求和得到小学生通学事故风险,将单一学区内小学生通学事故风险取平均得到学区通学事故风险,即

式中:Sm为学区m的通学事故风险值;ti为小学生使用小汽车在i类等级城市道路的通学暴露时长(min);qm为学区m内部小区数量。

2.2 随机森林模型

随机森林(RF)模型通过bootstrap 重采样技术从原训练样本集中随机抽取并生成训练样本子集,根据训练样本集生成多个决策树并组成随机森林。对于分类问题,结果由最多投票数获得;对于回归问题,结果由单个树的预测平均值决定。样本未被抽取的概率P为

式中:N为样本的总数量。当N→+∞时,样本未被抽取的概率为

3 实证分析

3.1 研究对象及数据采集

3.1.1 研究区域

深圳市是全国性经济中心和国际化超大城市[13]。深圳市道路机动车密度位列我国大中城市第一,全市日均交通事故数和日均死亡人数处于较高水平。本文以道路机动车密度较高且交通事故频发的深圳市中心城区为研究对象,研究区域包括南山区、福田区和罗湖区3个行政区。深圳市教育局将深圳市中心城区划分为144 个学区,共包含173所小学,学区资源划分如图1所示。

图1 深圳市中心城区学区及小学分布Fig.1 School divided district and primary school distribution in central city of Shenzhen

3.1.2 研究数据采集

为评估学区尺度下小学生通学事故风险并探究其影响因素,采集深圳市中心城区行政区划数据,2016-2017年交通事故数据,学区划分数据,以及道路运行数据。

(1)行政区划数据。深圳市中心城区行政边界、城市道路等数据来自于开源数据平台OpenStreetMap。其中,城市道路包括快速路、主干道、次干道和支路。

(2)交通事故数据。采用深圳市2016-2017年交通事故数据,共计15966 条,包括简易事故程序和非简易事故程序,交通事故记录中包括死亡人数、受伤人数、财产损失,以及事故的经纬度。

(3)学区划分数据。利用Python编程在深圳市政府数据开发平台中获取学区划分数据,深圳市中心城区学区平均面积为1.77 km2,最大学区面积为25.5 km2,最小学区面积为0.11 km2。

(4)道路运行数据。以出租车在中心城区道路上的平均运行速度作为道路实际运行速度,该数据每5 min更新一次,采集时长共4 h。采集时段为上午7:00-9:00,下午16:00-18:00,共采集90118 条道路运行状态数据,涵盖深圳市中心城区所有道路。

3.2 通学事故风险评估结果

为获取深圳市不同等级道路的道路暴露度,将事故数据和道路数据进行空间匹配,获取各级道路在研究时段内发生的交通事故。根据式(2)计算得到不同等级的城市道路暴露度,如表3所示。由表可知,深圳市中心城区道路暴露度的大小依次为城市快速路、主干道、次干道和支路。

利用ArcGIS 构建基于城市道路的网络数据集,得到基于小学生通学的OD 成本矩阵,以小学生在学区内部小学通学为原则,筛选得到学区尺度的通学路径。分析深圳市中心城区道路运行状态数据,得到上、下学通学路径运行速度相差并未超过5 km·h-1,故将上、下学路径运行速度取平均作为道路运行速度。根据道路状态运行速度与通学路径匹配获得通学时间,以各等级道路暴露度与小学生在该等级道路通学时间积分求和得到小学生通学事故风险。将学区内所有小学生暴露风险取平均值得到学区通学事故风险。

表3 不同等级城市道路暴露度Table 3 Different grades of urban road exposure

以学区为通学事故风险评估的基本空间单元,按自然间断点法将深圳市中心城区通学事故风险划分为4类,如图2所示。

图2 深圳市中心城区学区划分通学风险Fig.2 Central city school district zoning school commuting accident risk in Shenzhen

由图2可得:高暴露风险学区9个,占比6.3%,主要聚集于南山区北部和罗湖区北部;较高暴露风险学区31个,占比21.5%;较低暴露风险学区41个,占比28.5%;低暴露风险学区63个,占比43.7%。南山区中南部和福田中部学区通学安全性最高。

3.3 通学事故风险影响因素

本文基于深圳市中心城区144 个学区通学事故风险样本数据,以学区通学事故风险为因变量,以小学密度、学区面积、小区密度、远距离小区比例、高等级道路密度和距城中心距离等影响因素为解释变量,运用随机森林模型分析解释变量对学区通学事故风险的影响。按3∶7 划分测试集和训练集进行模型预测,得到预测模型准确率为85.9%,模型预测精度较高,说明随机森林回归方法能较好解释自变量对学区通学事故风险的影响,预测结果如图3所示。

为探究解释变量对学区通学事故风险的具体影响,根据随机森林分类算法得到学区暴露风险的影响因子重要度排序,如图4所示。

图3 随机森林回归模型预测精度Fig.3 Prediction accuracy of regression model random forests

图4 学区暴露风险影响因素重要度排序Fig.4 Ranking of school divided district exposure risk influencing factors in importance

由图4可得,小学密度、学区面积、小区密度、远距离小区比例、高等级道路密度和距城中心距离分别能解释37.15%、22.86%、17.01%、10.50%、6.29%、6.21%的学区通学事故风险。小学密度和学区面积对暴露风险的影响程度最高,距城中心距离的重要性最低。

为获取学区尺度下通学事故风险影响因素,进一步对各因素进行分析:

(1)小学密度是影响通学事故风险的主要因素。学区内部小学密度较大,小学生可以在学区内部所有学校入学,而非距离最近的学校,导致通学距离增加,进而增加暴露时长影响通学事故风险。

(2)学区面积是影响通学事故风险的重要因素。学区面积较大使小学生通学时长和使用高等级道路的可能性增加,进而增加通学事故风险。

(3)住宅小区密度是影响通学事故风险的显著因素。由于通学出行的时间高度聚集性,小区密度较大使短时间内在通学路径上聚集通学车辆,导致通学路径产生拥堵,影响小学生暴露在危险环境中的时间,增加通学事故风险。

(4)远距离通学小区比例是影响通学事故风险的相关影响因素。远距离通学小区所占比例越大,长时间通学出行的小学生比例越大,学区平均通学事故风险也随之增加。

(5)高等级道路占比是影响通学事故风险的因素之一。高等级道路适用于中长距离的通学出行,基于学区划分的通学出行大大减少了中长距离的通学出行比例,即使学区内部高等级道路占比较大,使用其通学的小学生仍较少,故高等级道路占比对通学事故风险存在较小影响。

(6)距城中心距离对通学事故风险的影响最低。由于小学生通学存在学区划分,小学生在通学出行中的范围均在学区内部,与城市中心未产生通学出行联系,故学区所处位置对通学事故风险的影响并不显著。

3.4 通学安全管理启示

为提升学区尺度下小学生通学安全保障水平,根据上述研究结论得到考虑学区划分的通学安全管理启示为:尽量按照“一学区一校”原则对学区进行划分,并适当减少划分学区内部的小学数量;学区面积作为通学事故风险的重要影响因素,应严格控制其规模大小;在小区密度较大的区域应增加学区数量,合理分配单个学区内部的小区密度;应适当考虑远距离小区的占比,以实现学区的合理划分。

4 结论

本文考虑学区尺度下城市通学安全问题,采集城市全样本交通事故数据和道路交通状态数据,构建学区通学事故风险评估模型,以深圳市中心城区为例,对学区尺度下的通学事故风险进行评估,并结合随机森林模型定量分析通学事故风险的影响因素。结果表明:

(1)基于交通事故和道路长度构建城市道路暴露度评估方法,揭示了深圳市中心城区道路暴露度随道路等级降低而减小。

(2)小学密度和学区面积为学区通学事故风险的主要影响因素,分别能解释37.15%和22.86%学区暴露风险值。距城中心距离对暴露风险的影响最小,解释率仅为6.21%。

猜你喜欢
学区深圳市密度
深圳市鑫钻农牧科技有限公司
『密度』知识巩固
密度在身边 应用随处见
深圳市朗仁科技有限公司
深圳市元征科技股份有限公司
加强乡镇学区建设 提高幼儿园管理水平
深圳市元征科技股份有限公司
推进学区化集团化办学 促进教育均衡发展
“玩转”密度
密度应用知多少