卢达聪,唐 翔,李 刚
(广西交通设计集团有限公司,广西 南宁 530029)
高速公路由于车速快、交通量大等特点,发生事故与伤亡的概率是其他等级公路的三倍以上[1];截至2021年4 月,我国高速公路交通事故万车死亡人数为1.80人,同年万车死亡人数美国为1.20 人,德国为0.07 人,我国交通事故发生概率显著高于西方,且致死率高达74%[2-4]。为简化信息管理流程,提供符合道路安全理论体系的数据,从而加强事故分析能力,提高高速公路安全管理水平,国内外均建立了相关的道路交通数据库。
在国外,美国建立了NMVCCS、GES 和FARS 等数据库,FARS 对外开放并提供交通情况查询等功能,并建立了具有信息集成、管理和分析功能的数据库[5-8]。欧盟国家共同建立了道路交通事故数据库CARE[9],统计事故类型、国籍、人员信息、事件类别以及车辆类型等的事故信息数据[10]。
国内存在如SH-NDS、CIDAS和TAIS等交通安全数据库,但大多仅做简单分类采集,缺乏统计分析能力且难以共享。我国于2013 年开启第一个自然驾驶项目“上海自然驾驶研究”[11],获取了3 年的自然驾驶数据采集,共采集16万千米的驾驶数据,构件SH-NDS数据集[12]。
目前我国道路交通数据库信息量大,项目全,但数据的可操作性不强,难以支持深度的道路安全性分析研究,从而导致道路的安全性较差。本文从高速公路的安全评价基础信息的解析和分析出发,以广西山区高速公路为调研对象,获取高速公路相关基础信息数据,最终得到道路安全基础信息体系,并设计了高速公路基础信息数据库。
用于分析高速公路安全性的数据大体分为传统数据、新数据、颠覆性技术数据三大类。
1.1.1 传统数据
传统数据一般可以分为五大类[13]:事故数据、道路数据、交通流数据、补充数据以及其他与安全有关的数据。
事故数据是进行安全研究所需的基本数据类型,主要包括编号、地点、时间、严重程度、事故类型、行驶方向、酒精程度、事故人员以及车辆信息和事故描述等信息。道路数据主要包括关于道路的几何设计和运行特性的信息,包括路段长度、线形、路面状况等信息。交通数据主要指道路上交通流的信息,主要包括交通密度、交通组成、速度分布、年平均日交通量等信息。补充数据是指面对常规无法获得、存在缺失或者精度不够的数据,研究人员可以通过卫星地图、实地考察等方式进行补充和完善的数据。补充数据主要包括但不限于表1。
表1 补充数据主要要素
其他与安全有关的数据包括:引文记录、医院数据、驾驶数据、土地使用、人口密度、交通冲突、天气及降水数据、路面摩擦系数、车辆登记和驾驶记录等内容。
1.1.2 自然驾驶数据
自然驾驶数据是指车辆通过配备传感器,在无外界干扰的条件下通过传感器收集得到的数据,这些数据可以帮助研究在自然环境中的驾驶行为。
1.1.3 颠覆性技术数据
颠覆性技术是指一种显著改变消费者、行业或企业运营方式的创新技术。例如利用智能手机等颠覆性技术可以提供大量的数据,包括地点、司机开车时发短信的时间和地点、行驶速度等相关安全信息。
事故修正因子(CMFs)被广泛应用于各种道路事故预测方法与模型[14]中,经过多年的信息数据积累以及实践应用,具有较高的可靠性。本文根据CMFs 信息要素,对高速公路基础数据库进行补充和完善。在HSM[15]中,将CMFs 的特征信息要素分为道路路段特征信息要素、平面交叉口特征信息要素、立体交叉特征信息要素、特殊设施和几何特征要素以及道路路网特征信息要素五大类。由于我国高速公路不设置平面交叉,且道路路网要素的研究对象一般为路网复杂的城市道路,高速公路并不适用,故本文不考虑平面交叉口以及道路路网特征要素。
各要素随着高速公路等级不同而采取不同的设计值或设置方案,下面将结合CMFs 中的各个要素、现行的标准规范[16-20]及我国高速公路现状进行对照,筛选出符合我国高速公路现状的安全信息要素,见表2~表6。根据安全信息要素建立高速公路安全信息识别指标要素体系,并将高速公路安全信息转化为具有高操作性和可识别性的数据集。
表2 CMFs道路横断面信息要素
表3 CMFs道路线形信息要素
表4 CMFs标志标线信息要素
表5 CMFs天气及照明要素
表6 CMFs立体交叉信息要素
本文选择广西多条山区高速公路为调研对象,对广西多条山区高速公路的安全相关信息数据进行采集。采集数据的方法有以下四种:
①相关部门获取安全信息资料。
从相关部门得到的安全信息资料,主要为Excel 统计数据以及Word统计报告文档,主要记录时间、天气状况、路线名称、事故车辆行车方向、事故发生具体位置桩号、所属路段、所属地区、事故类型、事故原因及过程简要描述、伤亡人数及严重程度。
②道路设计文件中的道路信息资料。
道路数据提供了关于道路的几何设计和运行特性的信息,主要包括电子设计图、设计说明书以及设计参数表等文件资料。
③通过爬虫技术获得的网上发布的事故信息及天气气象资料。
本研究选择道路实时路况信息发布网站(http://m.bestunion.cn/lk/)和天气网(https://lishi.tianqi.com/),通过程序获取以上两个网站上的信息数据,从而对数据进行补充和修正。
④现场调研照片及视频资料。
对于通车运营时间较长的高速公路,现今路段线形可能发生了部分的改变,特别是路段上的交通安全设施,对于这些因素,通过实地调研,拍摄图片及视频等资料对其进行补充。
收集完关于高速公路的信息后,对高速公路安全相关的基础信息进行分解,根据事故特征信息要素、事故发生路段的道路线形特征要素、路段交通流特征要素、道路设施特征要素、道路地理环境特征要素等建立高速公路安全信息识别指标要素体系,然后按照相似的安全信息类别进行归纳与整理,将高速公路安全信息转化为具有可操作性和可识别性的数据集,其框架思路如图1所示。
图1 安全信息识别方法框架
建立高速公路安全信息数据体系要具有相关的描述参数、数量统计参数;要建立各要素与各类基础安全信息之间的从属关系,并应用于数据库系统的查找与编辑功能。根据以上思路,得到了高速公路安全信息识别编码表,见表7~表9。
表7 事故特征要素信息识别编码
表8 道路特征要素信息识别编码
表9 环境特征要素信息识别编码
本研究基础信息数据库为数据库系统框架的底层结构,类型为关系型数据库,采用SQL Server 平台进行创建与管理[21],基础信息数据库的逻辑结构要综合考虑基础数据表的结构设计和数据表之间的关系。
4.1.1 基础信息数据表结构
根据高速公路基础信息数据库内不同数据特征,以“X 省X 高速XX 数据”的形式对基础数据进行储存,见表10。
表10 高速公路基础信息数据表
4.1.2 基础信息数据库数据组织及逻辑结构关系
基础信息数据表的构成为:高速公路基础信息表、事故基础信息表、道路平面元素信息表、道路纵断面元素信息表、交通流信息表、道路标志标线信息表、道路构造物信息表、道路气象信息表。为满足数据库的运行效率,基础数据库的逻辑结构关系整体上看,由于高速公路具有唯一性,因此将以上数据统一关联到高速公路基础信息表中。
为保证基础数据库中数据的安全与稳定,需要保证对基础数据库中的数据进行科学的管理,主要工作包括数据的检查、拷贝和更新工作。
4.2.1 数据的检查
数据的检查工作由数据库管理员进行操作,当用户与客户端对数据库进行输入、增减、修改等编辑操作后,管理员对新修改提交的数据进行查看,确保数据准确无误后将其更新备份至后台数据库内。
4.2.2 数据的拷贝
由数据库用户或其数据平台的工作人员具体数据应用要求,数据库或系统管理员将相应的数据提取整理,并提交给用户。系统用户在获取数据后,按照自身的实际需要应用到各自的平台与管理系统中,进行具体的数据分析和计算操作。
4.2.3 数据的更新
在对广西多条高速公路的调研中得出,运管部门对基础资料与统计信息的储存管理主要以电子文档的形式,数据缺乏较为科学的管理,使得数据存在部分缺失、重复、冗余等问题。故应建立统一的数据储存管理模式,将原始数据信息的记录、存储以及传输等工作标准化,加强数据库对安全基础信息的更新效率。
对于视频类、图片类数据,由于此类数据文件量多,其存入数据库所占内存空间大,传输时间长,会影响数据库性能,故对此类信息资料应采取及时提取转化、定量定期删除的方案,既保证资料信息不会丢失,又减少数据库存储负担。
对于文档类、图纸类数据,在完成上述信息的储存后需对原始图纸与文档数据进行保留。
本文研究成果如下:
①通过高速公路安全相关基础信息数据的解析以及基于CMFs 数据体系的安全要素关联性分析,理清了高速公路安全相关基础信息结构层次,发掘了符合国内高速公路道路条件,且安全事故相关性较强的信息要素。
②通过对大量高速公路基础信息资料的集成、分类与整理,结合安全评价数据的需求与高速公路安全基础信息结构层次,形成了高速公路安全信息识别编码体系。
③建立了由事故特征信息要素、道路特征信息要素及环境特征信息要素构成高速公路安全基础信息要素体系,进行了高速公路基础数据库的结构设计。
本文在一定程度上能为建立面向安全评价的高速公路信息服务平台等数字化项目提供依据,但由于本研究的数据体系仅纳入道路安全相关的传统信息数据,对于新技术下的高速公路安全信息(例如众包数据、驾驶员心生理数据等),由于采集及数据结构组织的困难而没有考虑;由于对数据库技术掌握有限,在数据库的可靠性、稳定性方面缺乏深入的研究。这些不足之处还需进行进一步的研究工作来完善。