基于多源数据的交通事故检测方法的研究

2019-06-25 02:33段泓序
中国科技纵横 2019年9期

段泓序

摘 要:通过实时采集交通数据,提取可以反映交通事故的特征,从而自动检测交通事故加快相关部门采取措施,不但可以缓解由事故带来的交通拥堵,也可以有效的减少环境污染和能源浪费。固定检测器数据稳定、浮动车数据覆盖率高,因此,结合两种数据研究一种在城市道路上可以快速、及时有效检测交通事故的方法是非常有必要的。本文首先针对人工播报的事故地点存在自然语言描述与空间地理信息系统描述的不一致性,设计了一种交通事故定位方法。然后在基础维度、时间维度和空间维度对交通事故进行了属性分析和提取,针对不同的道路交通运行情况选用不同的属性集合,建立可以对异常点进行识别的孤立森林模型。最终设计了基于异常值得分的事故检测算法。

关键词:多源交通数据;交通事故检测;孤立森林

中图分类号:U491 文献标识码:A 文章编号:1671-2064(2019)09-0251-03

0 引言

城市道路交通事故不仅关系到人们的生命和财产安全,也关系到城市发展和社会长治久安,渐渐成为了政府和大众关注的重点问题,世界各国对于交通事故检测方法的研究投入了极大的精力。因此,将计算机技术应用在交通领域上,及时快速的检测出城市道路上发生的交通事故,辅助相关部门及时启动救援和交通疏导工作,成为了本文的研究内容。

浮动车数据覆盖率高,上传周期短,但是数据波动性大,固定检测器数据虽然上传周期没有浮动车快,但是数据较稳定,而且测得的流量数据准确[1]。因此本文希望结合浮动车数据处理得到的路况数据、车辆行驶轨迹数据和由固定检测器采集到的占有率数据,针对城市快速路研究并实现出一种基于多源交通数据的交通事故自动检测方法。

1 相关工作

交通事故检测的数据来源一般是各类固定检测器和移动检测器,通过对数据的处理分析,判断是否发生事故。异常对象所具有的属性值会明显不同于数据集合的整体期望或其它数据的属性值[2]。

常用的异常点检测方法有基于统计、基于距离、基于密度和基于聚类的异常检测方法等。基于统计的异常检测算法在不同地点和不同时间分布的不一致,导致其使用存在局限性;基于距离和基于密度的异常点识别算法的时间复杂度在大数据量下较高;基于聚类的方法对于确定类别的个数和每个类之间数据量的大小确定比较困难[3]。通过对问题进行分析,本文确定了使用基于孤立森林的检测模型来实时检测交通事故。

2 方法

本文使用基于孤立森林模型的异常点检测方法来检测交通事故,需要对交通事故进行分析,确定事故检测需要使用的属性,通过历史数据并结合提取出来的属性集合,训练好孤立森林模型并进行检测,整体研究思路如图1所示。

2.1 交通事故空间定位方法

首先根据事故文本播报信息中的地点信息对POI(point of interest)信息进行筛选,得到事故地点的中心坐标,对坐标进行地图匹配,计算该坐标到路链的垂直距离,得到固定半径范围内的路链;对电子地图内的所有单向行驶的路链,计算车流方向,获取道路等级,组成POI索引表。

对于某一起播报信息,提取事故地点和车流方向;在构建的POI索引表中先查找事故地点,再根据车流方向和道路等级进行筛选,最终获得匹配路链。

2.2 交通事故属性分析

事故的发生会导致交通属性指标产生变化,超过合理的波动范围,本文从基础属性,时间属性,空间属性三个维度进行分析。

2.2.1 基础属性

当路链的历史路况都是非拥堵状态时,一旦发生交通事故,当前路链速度波动超过正常范围,此时特征为当前路链速度vl,t。当路链的历史数据都是拥堵状态时,路链速度数据基本不产生波动,但由于当前路链发生事故,后继路链由于车流量的减少速度呈现上升状态,所以此时特征为后继路链速度。

在交通流稳定的周期内,固定时间通过某条固定路链的出租车数目变化不大,属性为nl,t。

未发生事故时,路链上下游占有率数据都保持稳定;发生事故后,路链上游因为车辆排队造成拥堵使占有率变高,路链下游因为车流量的减少畅通使得占有率变低。当路况为非拥堵状态时,提取属性路链上游占有率和路链下游占有率;当路况为拥堵状态时,路链上游占有率基本不会变化,但是下游占有率会因为车流量的减少而减小,所以只提取属性。

2.2.2 时间属性

在事故发生后,时间上表现为交通事故的持续时间。

测试选取了2017年6月的交通台播报的事故数据共191条。将播报的事故定位到路链号,浮动车数据含有路链平均速度的路况数据,出租车轨迹数据和占有率数据。

模型会对每条交通数据计算异常值得分,图2是一段道路100条数据的异常值得分情况,路链号以数字代替。

根据不同的异常值得分阈值判定部分FAR和DR对应关系如表1所示。在兼顾DR和FAR的值时,当异常值得分=0.5时,检出率为86.3%,误警率为1.3%。

4 结语

本文的方法不依赖数据的统计分布形式,且对于拥堵和非拥堵路况使用的属性不同,最终得到检测率87.3%,误警率1.3%,因此可以认为本方法具有显著的优越性与良好的适用性。未来若能考虑多方面因素设计出多道路類型的事故检测方法,将进一步扩大事故检测方法的使用范围,同时可以考虑使用异质的交通数据,采用更深层次的融合来适应模型。

参考文献

[1] 吕卫锋,诸彤宇.给中国增一个骄傲——解析基于浮动车的动态交通信息服务系统[J].中国交通信息产业,2007(08):136-137.

[2] 余柳,于雷,戚懿,等.基于浮动车数据的城市快速路交通事件检测算法研究[J].交通运输系统工程与信息,2008,8(4):36-41.

[3] B.R.Preiss.Data Structures and Algorithms with Object-Oriented Design Patterns in Java[M]. Wiley,1999.