基于GA-BP神经网络算法和粗糙集理论的交通事故黑点模型*

2011-08-17 09:37李巧茹程长广
关键词:黑点交通事故编码

李巧茹 程长广 陈 亮

(河北工业大学土木工程学院1) 天津 300401) (河北省土木工程技术研究中心2) 天津 300401)

0 引 言

国内外对交通事故黑点已有较多认识和研究,存在着多种多样的鉴别方法和理论,例如比较早的事故数法、事故率法、事故数-事故率法、质量控制法等[1].近些年又出现了成因分析法,动态聚类分析法,模糊统计分析法,灰色关联分析等[2-3].1997年,J.S.CHEN和S.C.WANG提出了鉴别危险路段的临界率法,该方法能够确定事故多发点改善的优先次序[4-6],但是随着经济的发展与出行者对安全要求的提高,临界率也不断发生变化.裴玉龙,丁建梅等提出了突出因素法[7];过秀成等提出了成因对应分析法[8-9];张鹏等提出了粗糙集应用于交通事故黑点的成因分析[10];刘安业,王要武等提出基于BP神经网络的事故多发点鉴别方法[11].这些方法有的忽略了,有的没有考虑动态因素的影响,有的原始数据巨大不易实现.

总之,上述研究或者仅考虑突出因素而忽略了不显著因素的影响,或者仅考虑静态道路环境而忽视了考虑动态因素的影响,GA-BP神经网络算法以及粗糙集理论在黑点预测模型中都分别被采用过,但这两种理论单独使用都存在着各自的缺点,如模型中仅考虑静态道路环境,原始数据量巨大,预报精度低等.针对上述情况,提出一种基于BP神经网络与粗糙集理论相结合的单元交通事故预测模型,并进行实证分析.两种理论的结合应用提高了对事故黑点的预报精度,对降低伪报警率起到有效作用.

1 研究方法

道路交通事故主要的影响因素包括驾驶员的因素(驾龄、驾驶习惯、违规率等)、车的因素(车辆类型、质量水平、车速等)、天气因素等,可划分为静态因素与动态因素两类.本文采用“二阶段”预测方法,对事故黑点进行预测.

1)第一阶段 采用基于遗传算法的BP神经网络算法,分析道路环境与事故率的关系,从静态因素入手预测道路交通事故黑点样本集合.具体指标选取交通流量、车道数量、道路线形、车道宽度、平曲线半径、道路纵坡及道路交叉情况.

2)第二阶段 采用粗糙集算法,选取动态因素在事故黑点样本集合中建立触发预警级别的事故规则模型.具体指标选取天气、车辆速度、饱和度、车型、照明情况.

2 建立模型

首先,通过对区域内干线公路网按照交叉口、路段、特殊设施等进行单元划分,对各个单元的事故记录、道路几何参数、交通参数与环境因素等进行描述,分析事故历史数据,建立事故预测模型.

其次,对事故黑点预测指标进行选择.根据事故黑点定义,如果把以某一长500 m的路段内一年内发生事故的次数定义为该路段事故率,那么该事故率可以表征该路段的行车危险程度.根据该路段至少3 a平均每年发生的事故次数作为衡量行车危险程度的标准,分析所要研究的津围公路各单元内发生的事故数资料,以事故数3为划分等级的标准,见表1.当安全等级为3级危险时,该单元即为此道路的一个事故黑点.

表1 年均事故次数与道路安全等级的关系

2.1 基于遗传算法的BP神经网络预测模型(第一阶段)

将神经网络与遗传算法结合起来,形成一种杂交算法GA-BP算法,可以达到优化网络的目的.BP神经网络采取的权值更新方法为最速梯度下降法,其缺陷是容易陷入局部极小、收敛速度慢,因此论文借助遗传算法来训练优化初始权值,训练时先由遗传算法进行全局寻优,将搜索范围缩小后,再利用BP网络误差反传算法来训练,得到精确的权值,最后利用网络的泛化能力对输入的样本进行预测[12].

将上述模型用天津市津围公路的交通事故统计数据进行验证.该区域车流量较大,事故高发,具有一定代表性.津围公路起点桩号K12+510,终点桩号K145+963,全长133.453 k m,设置500 m长度为一个单元,可分成267个单元.收集自2007~2009年3 a的道路交通事故数据,并进行分析.

选取0.5 k m作为单位路段长度,将影响事故率的因素分为10项,如图1所示.车道数量分为单向1车道编码为1、单向2车道编码为2、单向3及以上车道编码为3;道路方向编码天津到围场方向确定为0,反向为1;道路线形编码分为平直为0,弯曲1;道路标志编码分为清晰为0,一般为1,模糊为2;单元内若有交叉口编码定为1,否则为0;平曲线半径分为3个区间,半径(0,500 m)编码为0,(500,1 500 m]为1,(1 500 m,++)为2;道路纵坡分为3类,纵坡(0,2%]编码为0,(2%,4%]为1,(4%,++)为2;若有紧急停车带编码为1,否则为0;若单元内有村庄等建筑物,编码定为1,否则为0;分析路面质量时,采用公路技术状况指数(maintenance quality indicator,MQI)来区分公路技术状况等级,MQI指标的值域为0~100.公路技术状况分为优、良、差3个等级.其中优的MQI值为(90,100],编码为0,良的 MQI值为(60,90],编码为1,差的 MQI值为(0,60],编码为2.

图1 静态因素变量及其等级编码

以2007年天津市津围公路交通事故统计数据为例,随机抽取80组预测样本,采用Matlab软件编写计算程序.其中前70组作为训练样本,后10组作为检验样本.在样本的训练过程中,取初始种群M=70,交叉概率Pc为0.7,变异率Pm为0.01,终止进化代数Kmax为400,隐层节点确定为8个,初始权值与阈值取值范围(-1,1),取神经网络的学习率η为0.7,误差Emin为0.01.

预测结果分析:用训练完毕且已掌握了“知识信息”的网络进行预测时,只需将待测路段的各影响因素资料输入网络,通过正向计算输出各单元输出值即可得到预测结果见表2,预测准确率为90%.

表2 基于GA-BP神经网络的道路交通事故黑点预测结果

2.2 基于粗糙集算法的预测模型(第二阶段)

在第一阶段的预测过程中,从道路环境状况出发,分析道路环境的突出因素与事故率的关系,预测道路交通事故黑点样本,而未考虑其他因素的影响,例如驾驶员的因素(包括驾驶员驾龄、驾驶习惯、违规率等)、车的因素(车辆类型、质量水平、车速等)、天气因素(包括雨、雪、雾、风等).第二阶段预测是在第一阶段工作的基础上,叠加非道路影响因素,利用粗糙集理论进行二次建模,最终得到事故预测模型.

根据粗糙集原理,在信息系统S=<U,R,V,f>中,属性子集P,Q⊆R,知识Q 以依赖度k(0≤k≤1)依赖于知识P,记作P⇒kQ,当且仅当:

在决策信息系统T=<U,C∪U,V,f>中,条件属性a∈C,则a相对于决策属性集D 重要性sig(a)定义为

假设属性集子集C,由C得到的分类为D,当从属性子集C中去掉属性a后,其分类必定发生变化,则定义sigC-{a}(a)为属性a的重要度[3],即

该重要性表达在当前信息条件下,条件属性对决策属性的重要程度.

3 实证分析

对第一次建立的模型所得到的事故黑点进行分析,假设某一黑点单元内发生了11起交通事故,对这11起事故的动态因素(如车辆速度、光照条件、天气情况、驾驶员构成、交通量、车种构成等)进行具体分析,得到该路段单元非道路动态突出因素,并确定各突出因素发生黑点的编码等级.根据具体情况确定其在何种情况下为事故黑点.

在2007津围公路事故数据中,某一事故黑点路段收集了8件典型事故案例,对其中的原因进行了初步的分析,其中的原因可以看成是利用粗集理论决策的条件集,其非道路动态因素分为车辆速度、光照条件、天气情况、车种构成、饱和度(交通量)、风速等6个方面,记为C={x1,x2,x3,x4,x5,x6},以事故的严重程度作为决策集,记为D={y}.其中,x1为车辆速度(0表示不超速,1表示违章超速);x2为光照条件(0表示白天光照充足,1表示夜间有光照,2表示夜间无光照);x3为天气情况(0表示良好,1表示恶劣,如风、雨、雪、雾、沙尘等);x4为车种构成(0表示小型车,1表示大中型车);x5为饱和度(0表示饱和度C≤1,1表示饱和度C≥1);x6为风速(0表示三级及三级以下,1表示三级以上六级及六级以下,2表示六级以上);y为事故的严重程度(0表示轻微事故,1表示一般事故,2表示重大事故),见图2.由此得出决策表,见表3.

图2 动态因素变量及其等级编码

表3 黑点路段事故诱因分析决策表

根据重要度公式计算表中属性的重要性.得到条件属性x1,x2,x3,x4,x5相对于决策属性y比较重要,其中违章超速的重要度最高,而条件属性x6即风速对决策属性y不重要,可以忽略.由此可以得到表4.

表4 黑点路段事故决策表

续表4

根据大量事故数据的统计分析,得出如下规则:在没有超速违章的情况下(即x1为0),决策属性为0表示五项编码之和为0或1或2,决策属性为1表示五项编码之和为3或4,决策属性为2表示五项编码之和为5;在有超速违章的情况下(即x1为1),决策属性为0表示五项编码之和为0或1,决策属性为1表示五项编码之和为2或3,决策属性为2表示5项编码之和为4或5.决策属性y为2(即可能发生重大事故时)系统将会预警.

根据上述分析,可确定该单元在决策属性为2所对应条件属性的情况下为事故黑点.此时该路段发生交通事故的概率比较大,可以向该路段的道路使用者发出预警.交通事故黑点的条件属性较多,例如车辆速度、光照条件、天气情况、驾驶员构成、交通量、车种构成等等,能否获取准确的条件属性状态将对事故黑点的判断产生极其重要的影响.

4 结束语

采用GA-BP神经网络与粗糙集理论相结合开发了单元交通事故预测模型,两种理论的有机结合与应用能够克服各自的缺点.驾驶员构成、天气照明情况、交通量、车种构成、车速等这些对道路交通事故显然具有直接影响的因素,在第一阶段预测模型中部分因素很难量化,将其代入第二阶段的粗糙集模型中进行分析,将道路的静态突出因素与非道路的动态突出因素有机结合,以准确预测事故黑点的目的.在预先建立的静态模型基础上考虑动态因素建立动态模型的方法,可以减少数据库的样本量,大大提高预测精度.

如何准确获取条件属性将对模型产生很大影响,因此在以后模型应用过程中,应根据各地道路的具体情况选择准确全面的条件属性影响因素.

[1]刘玉增,张殿业.基于遗传算法的交通事故黑点排查方法[J].交通运输工程与信息学报,2005,3(2):1-7.

[2]秦利燕,邵春福,赵 亮.道路交通事故宏观预测模型[J].武汉理工大学学报:交通科学与工程版,2009,34(1):154-157.

[3]邵祖峰.道路交通事故黑点路段整改措施及其确定方法[J].森林工程,2008,24(5):39-42.

[4]Bruce A W,timothy D C.Evolving space filling curves to distribute radial basis functions over an input space [J].IEEE Transactions on Neural Networ ks,1994(5):15-23.

[5]Wong Jinn-Tsai,Chung Yi-Shih.Rough set approach for accident chains exploration[J].Accident Analysis& Prevention,2007,39(3):629-637.

[6]Mannan M S,SC M,Kar I M M.Road accidents in metropolitan Dhaka,Bangladesh [J].IATSS Research,1999,23(2):91-94.

[7]裴玉龙,丁建梅.鉴别道路交通事故多发点的突出因素法[J].中国公路学报,2005,18(3):99-103.

[8]肖 慎,过秀成,徐建东.模糊聚类法在公路交通事故黑点成因分析中的应用[J].交通运输系统工程与信息,2002,2(3):40-43.

[9]潘昭宇,过秀成,盛玉刚.灰色关联分析法在公路交通事故黑点成因分析中的应用[J].交通运输工程与信息学报,2008,6(3):96-101.

[10]张 鹏,张 靖,刘玉增.粗集在交通事故黑点成因分析中的应用[J].电子科技大学学报,2007,36(2):267-270.

[11]刘安业,王要武,张 磊.基于BP神经网络的道路交通事故多发点鉴别新方法[J].土木工程学报,2008,41(6):108-111.

[12]孙科达.基于GA的BP神经网络道路交通事故预测模型研究[D].杭州:浙江工业大学信息工程学院,2008.

猜你喜欢
黑点交通事故编码
白菜长黑点还能吃吗?
茄子四种『黑点子』病巧防治
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
不同寻常的交通事故
预防交通事故
《全元诗》未编码疑难字考辨十五则
救命的黑点
子带编码在图像压缩编码中的应用
果蔬上长了黑点还能吃吗
Genome and healthcare