航道内实时船舶交通流航行风险主动评估

2016-05-25 00:37张树奎肖英杰苏文明
关键词:检测器贝叶斯航道

张树奎,肖英杰,苏文明

(1. 江苏海事职业技术学院 航海学院,江苏 南京 211170;2. 上海海事大学 商船学院,上海 201306)

航道内实时船舶交通流航行风险主动评估

张树奎1,2,肖英杰2,苏文明1

(1. 江苏海事职业技术学院 航海学院,江苏 南京 211170;2. 上海海事大学 商船学院,上海 201306)

为主动评估航道内实时交通流航行风险,并对交通事故状态做出预警,利用高斯混合模型和最大期望算法构建了贝叶斯网络。基于长江草鞋峡水道内船舶检测器数据和交通事故数据,学习和训练贝叶斯网络的结构和参数,构建了贝叶斯网络分配器。分别对8组船舶交通流数据建立贝叶斯网络分类模型,结果表明:采用交通事故发生前20~40 min内、且距离事故地点最近的2个船舶检测器的数据构建的模型分类效果最优,正确率为78.13%。最后通过与BP神经网络和K近邻两种估计算法比较,证明了BN模型预测效果更优,是一种较好的实时交通流航行风险评估方法。

交通工程;航道;交通事故;贝叶斯网络;风险;主动评估

0 引 言

水路运输作为一种最经济、最环保的运输方式,在综合运输体系中起到了非常重要的作用,港口航道是水路运输的主骨架,作用不可替代。据统计,仅江苏沿江港口2010年船舶货运量就达到9.4亿t,货物吞吐量是密西西比河的2倍,莱茵河的3倍,已连续多年居世界内河货运量首位。另一方面,航道内偶尔发生的船舶交通事故不仅造成人员伤亡和财产重大损失;同时,由于发生溢油、漏油等重大恶性事故,环境治理带来的经济损失难以估计。

国内外关于船舶交通事故的研究多基于历史数据的回归统计分析[1],关注点在于事故发生后的判断,而对事故发生前的航道内船舶交通状态(船舶流量、船舶速度和航道占有率)和事故发生的相互关系研究较少。研究表明,船舶交通运行状态与船舶事故风险存在着关联关系[2],特别是短期内的船舶交通流量变化对交通事故的发生影响较大。因此,针对实时交通流量航行风险的评估成为近年来研究热点[3],但成果较少,研究重点多集中在利用不同的数学建模方法来分析和预测航道内船舶交通事故的风险[4-5]。由于在数据采集的时间、地点及规模方面各不相同,且缺少同样数据环境下的对比分析,研究结果有待进一步验证。

笔者利用船舶交通事故数据和相对应的船舶交通量检测器数据(或VTS监测数据)建立预测模型,用以预测航道内发生船舶交通事故的风险并判断可能发生事故的交通条件。交通条件分为两种:可能发生事故的交通条件和不会发生事故的交通条件。预测模型的输入是交通事故发生前的航道内船舶交通状况数据,预测模型的输出是发生交通事故的风险,根据输出结果判断是否可能发生事故。通过事前主动预测,一方面可以通过VTS或巡逻船对有关船舶驾驶员进行预警,消除事故隐患,另一方面,对于航道管理部门优化救助方案等也具有重要的参考价值。

贝叶斯网络在不确定知识表达和推理领域优势明显,是最有效的理论模型之一,广泛应用于工程领域。近年来,该模型在交通事故分析、流量预测等方面表现出很好的效果[6-7]。笔者利用船舶交通量检测器事故检测数据和VTS事故监测数据以及事故营救后整理的数据,分析了航道内船舶航行状态与事故潜在风险的关系。通过运用贝叶斯网络模型对航道内实时船舶交通流航行风险进行预估,并与BP神经网络和K近邻两种模型算法的结果进行了比较分析。

1 研究数据

笔者主要研究航道内船舶交通状态(主要包括船舶交通流密度、船舶平均速度及航道平均占有率等)对交通事故风险的影响。考虑到数据采集的可靠性和便利性,选择长江南京河段的草鞋峡水道作为研究航道,草鞋峡水道全长11.7 km,平均约每2 km放置一个船舶检测器。

船舶交通事故数据由VTS监控系统和海事局通航处信息中心获取。由于每起船舶交通事故的信息需要与对应的时间和地点的船舶检测信息一一对应起来,因此获取大量的船舶交通事故数据非常困难。经过对船舶检测器检测数据和船舶交通事故的质量控制和筛选后,目前采用2013年3月—10月间草鞋峡水道中发生的58起船舶交通事故数据,每起事故的数据均包含事故发生的时间、地点、事故类型以及当时的天气状况等信息。

船舶交通流运行数据来源于船舶检测器和VTS监控中心,数据每20 min采集一次,运行数据主要包括船舶交通流密度、短期内交通流密度的变化、船舶平均速度、速度变化率以及航道平均的时间占有率等。为了比较真实地反映交通事故发生时航道内的交通状况,每起事故的相关信息只提取于事故发生地附近的4个船舶检测器或VTS监控系统,船舶检测器的分布如图1。4个船舶检测器根据需要分为2种组合,一种组合包括所有4个船舶检测器(上游2、上游1、下游1、下游2),另一种组合仅包括离事故发生地点最近的2个船舶检测器(上游1、下游1)。

图1 交通事故地点船舶检测器分布Fig.1 Arrangement of ship detectors at traffic accident site

事故发生的前后时间分为5段,分别用1,2,3,4,5表示。划分方法如下:时间段1表示事故发生后0~20 min;2表示事故发生前0~20 min,3表示事故发生前20~40 min;4表示事故发生前40~60 min;5表示事故发生前60~80 min。由于时间段1是事故发生后的时间,所以不能作为事故风险预估,只可作为事故检测。另外,交管中心也需要一段时间来判断事故将要发生并采取应对措施,所以,时间段2中的检测数据建立的评价模型只具有参考价值,只有采用时间段3,4,5中的相关检测数据建立的评估模型对主动安全预估才有实际意义。由于每起交通事故都对应4个船舶检测器分别在4个时间段内检测的数据,通过2种组合的船舶检测器分别与4个时间段的组合,得到8组输入数据,利用这8组数据分别进行建模,得到8个不同的模型,以ModelX-Y命名这些模型,X表示船舶检测器数量,Y表示时间段。

因为对航道内船舶交通状态进行分类为有可能会发生交通事故和可能不会发生交通事故两种结果,因此,在收集发生交通事故条件下的航道检测数据时,也要收集未发生交通事故情况下的航道检测数据。根据A.Pande等[8]的研究成果,事故数据与非事故数据比例在1∶10附近时,既能够满足建模所需的数据量,又能够基本反映交通事故实际发生与否的航道内交通状态比例,所以,在不同的船舶交通条件下,随机采集了未发生事故数据600余条。

2 贝叶斯网络

贝叶斯网络主要由两部分组成:一个有向无环图与一个条件概率表。有向无环图表示一系列随机变量的联合概率分布,图中每个节点代表一个随机变量,有向边代表变量间的条件依赖,其强弱由条件概率表体现;条件概率表中的值与有向无环图中的节点一一对应。贝叶斯网络能够分析大的变量之间的相互关系,并根据贝叶斯定理的学习与统计推断功能,实现数据的预测、分类、因果分析等采掘任务。

贝叶斯网络的构建包括3个方面:利用变量和变量取值范围描述所研究的领域;利用图形的方式表达结构学习以及学习变量之间的依赖关系;用条件概率分布表表示参数变量之间的分布函数。经过上述3个过程的多次迭代、反复进行,最终建成一个贝叶斯网络。

基于高斯混合模型(Gaussian Mixture Model,GMM)的最大期望(Expectation Maximization,EM)算法的优点是能够有效应对研究数据的缺失[9]。由于航道内船舶交通状况的信息采集可能存在缺失情况,因此笔者采用该算法来构建贝叶斯网络,GMM用于描述输入变量,EM算法用于参数学习。

2.1 高斯混合模型及最大期望算法

GMM采用多个高斯函数线性组合表示数据概率密度函数,在有效样本充分条件下,GMM能模拟和任意逼近任何形状的分布[10]。GMM由多个子高斯分布组成,子高斯分布几何特征由其均值μi和协方差矩阵Ui决定。令M维矢量X={X1,X2,…,XM}来表示一组船舶交通量数据的不同变量,数据的概率分布由N个子高斯概率密度函数的线性组合近似模拟,其表达式为

(1)

对于H={Xi,μi,Ui},有

(2)

为使GMM性能与样本数据达到最佳拟合,需要对GMM进行训练学习,以便获得参数η。研究表明,参数估计的较好方法是最大似然估计,X={X1,X2,…,XM}对η的似然估计为

(3)

采用最大似然估计,目的是发现一组新参数η*,使其满足p(X|η*)≥p(X|η)。通过EM算法可以求得η*。为得到η*,需引入辅助函数:

(4)

(5)

表示每个子高斯分布的后验概率。在求解η*过程中,如果满足条件G(η,η*)≥G(η,η),则有p(X|η*)≥p(X|η),最后求得估计参数如下:

(6)

(7)

(8)

参数学习过程分两步:利用目前参数和网络结构计算各子高斯分布的期望后验概率;基于第一步的期望值,计算新的最大参数分布η*,用新的参数代替原有参数,重复上述步骤,直到所估计的参数达到局部最优。

2.2 贝叶斯网络分类器的构建

研究表明:使用MATLAB实现贝叶斯网络分类器的构建是一种较好的方法[11],构建分3步完成。

第一步:数据输入。将船舶交通流数据、交通事故数据及非事故数据输入到贝叶斯网络,并随机确定训练样本和测试样本,两者数据比例为1∶1,用以保证模型检验的可靠性。

第二步:分类器训练。利用训练样本数据和EM算法训练并构建分类器。

第三步:分类器的应用。将已经构建好的分类器的推断引擎和测试数据输入到分类器,其输出就是测试样本属于各类别的后验概率。为提高分类结果的准确率,具体分类时,可以根据实际观察确定一个合适的安全阀值,如果某后验概率大于安全阀值,则认为其对应的测试样本是交通事故数据,反之,则认为是非交通事故数据。

2.3 模型检验

由于交通事故数据较少,非交通事故数据较多(两者比例接近1∶10),因此不能采用整体数据分类正确率来判断模型的优劣,这是因为即使模型把整个数据都分类成非交通事故,其正确率可达90%。所以笔者采用整体数据分类正确率、交通事故数据分类正确率以及非交通事故数据分类正确率3个评价标准来检验贝叶斯网络的有效性。其中交通事故数据分类正确率等于分类正确的交通事故数据与总交通事故数据的比值,非交通事故数据分类正确率等于分类正确的非交通事故数据与总的非交通事故数据的比值。由于交通事故发生的危害性较大,因此评价标准优先考虑交通事故数据分类正确率。

为了得到较优的分类模型,笔者在对8组相关数据分别建模时,对每组数据均测试12次,并求得各组数据分类结果的平均值和标准差,根据平均值和标准差来判断模型的优劣。

3 模型分类结果

将草鞋峡水道内发生的58条交通事故和600条非交通事故数据分成8类交通流量组合,对这8类组合分别构建贝叶斯网络模型并分类,分类结果如表1。

表1 8组数据组合下的分类结果Table 1 Classification of 8 group data in different combinations

从表1可以看出,分类器对交通事故的分类正确率较为理想,最高正确率达到81.24%,平均正确率也超过71%。从不同模型分类结果看,模型Modelt2-1和模型Model2-2分类正确率高于其它模型,表现为其分类正确率分别达到81.24%和78.13%。由于模型Model2-1的数据是时间段1内发生的,不具有实际利用价值,所以模型Model2-2的交通事故分类正确率结果最优。即建立最优的贝叶斯网络模型所采用的数据应来自时间段3即交通事故发生前20~40 min内、而且是距离交通事故地点最近的两个船舶检测器。与此同时,分类器的非交通事故正确率和整体正确率也都比较高,说明所建模型科学合理,具有一定的使用价值。通过对表1中的数据进行比较,可以看出,就分类效果而言,贝叶斯网络分类器对交通事故的分类采用2个船舶检测器的数据比采用4个的要好,而对非交通事故和整体分类采用2个或4个区别不明显。由于交通事故分类的正确率更具有研究意义,所以模型Model2-2为最优模型。

需要指出的是,由于判断交通事故是否发生需要首先确定一个合适的安全阀值。为得到此阀值,笔者对贝叶斯网络模型的数据结果进行了敏感性分析。结果表明安全阀值越大,非交通事故分类正确率就越高,而交通事故分类正确率就越低。当安全阀值大于0.09时,交通事故数据分类正确率开始有明显降幅,而非交通事故分类正确率增幅仍不明显,因此,分类器设置的安全阀值是0.09。

4 与其它模型分类结果比较

为进一步验证贝叶斯网络分类模型的有效性,笔者选取目前常用的分类算法进行比较。常用算法主要有BP神经网络和K近邻两种,它们已经被广泛应用于交通流量与交通事故的预测研究之中[12]。

运用BP神经网络和K近邻对第2节中的数据进行分类,并将分类结果与贝叶斯网络的分类结果进行比较,见表2。为方便读取3者结果的差别,表3中只给出了分类结果最优的4组模型组合。

表2 3种算法的结果比较Table 2 Comparison of results by three calculation methods

由表2可知,贝叶斯网络分类器对交通事故分类的正确率明显高于BP神经网络算法和K近邻。由于交通事故数据和非交通事故数据量的不平衡,加之样本总量较少,使得BP神经网络K近邻在样本学习方面不充分,无法发挥其优势,因而获得的分类正确率偏低,而贝叶斯网络在这方面有相对优势。

5 结 论

笔者旨在探究航道内实时船舶交通流量数据与交通事故的关系,并根据实时船舶检测器数据进行事故风险动态预估,从而实现通航安全管理的主动性,为改善航道通航安全提供一种新的理论方法,结论主要有:

1)利用GMM的EM算法,构建了贝叶斯网络模型,运用该模型对不同船舶检测器和时间段组合的8组数据进行分类,结果表明采用交通事故发生前20~40 min内、且距离事故地点最近的2个船舶检测器的数据构建的贝叶斯网络分类效果最优,其交通事故预测正确率达到78.13%。

2)运用BP神经网络算法和K近邻对同样数据进行分类,并与贝叶斯网络分类结果比较,结果表明贝叶斯网络对交通事故预测的正确率高于BPNN和KNN,但对非交通事故预测的正确率却低于二者。

[1] 王宝阔.船舶交通事故量灰色预测应用研究[J].中国航海,2011,34(1):59-62. WANG Baokuo.Applied research of grey prediction for marine traffic accidents[J].NavigationofChina, 2011,34(1):59-62.

[2] 黄常海,高德毅,胡甚平,等.基于Aprior算法的船舶交通事故关联规则分析[J].上海海事大学学报,2014,35(3):18-22. HUANG Changhai,GAO Deyi,HU Shenping,et al.Association rule analysis of vessel traffic accidents based on Apriori algorithm[J].JournalofShanghaiMaritimeUniversity,2014,35(3):18-22.

[3] OH C,OH Jun-seok,RITCHIE S G,et al.Real-time estimation of freeway accident likelihood[C]// 80thAnnualMeetingofTransportationonIntelligentTransportationSystem.Washingtong,D.C.:2011:262-276.

[4] PARK E S,LORD D.Multivariate poisson-lognormal models for jointly modeling crash frequency by severity[J].TransportationResearchRecord:JournaloftheTransportationResearchBoard,2007,2019:1-6.

[5] 方琴,李永前.K近邻短期交通流预测[J].重庆交通大学学报(自然科学版),2012,31(4):828-831. FANG Qin,LI Yongqian.OnK-nearest neighbor short-term traffic flow prediction[J].JournalofChongqingJiaotongUniversity(NaturalScience),2012,31(4):828-831.

[7] SUN Shiliang,ZHANG Changshui,YU Guoqiang.A bayesian network approach to traffic flow forecasting[J].IntelligentTransportationSystem,2006,7(1):124-130.

[8] PANDE A,ABDEL-ATY M.Assessment of freeway traffic parameters leading to lane change related collisions[J].AccidentAnalysisandPrevention,2006,38(5):936-948.

[9] 孙剑,孙杰.城市快速路实时交通流运行安全主动风险评估[J].同济大学学报(自然科学版),2014,42(6):873-879. SUN Jian,SUN Jie.Proactive assessment of real-time traffic flow accident risk on urban expressway [J].JournalofTongjiUniversity(NaturalScience),2014,42(6):873-879.

[10] 杨文浩,费晓昕,张绪进.北江白石窑水利枢纽上游引航道布置及通航条件研究[J].重庆交通大学学报(自然科学版),2014,33(1):70-74. YANG Wenhao,FEI Xiaoxin,ZHANG Xujin.Layout of upstream approach channel and navigation condition for Beishiyao water conservancy in Beijiang River[J].JournalofChongqingJiaotongUniversity(NaturalScience),2014,33(1):70-74.

[11] SCHUBERT M,NIELS P H,ARILD R,et al.Risk assessment of road tunnels using Bayesian networks[J].SocialandBehavioralSciences,2002,124(4):231-238.

[12] ZHENG Weizhong,LEE D H,SHI Qixin.Short-term freeway traffic flow prediction:Bayesian combined neural network approach[J].JournalofTransportationEngineering,2006,132(2):114-121.

Proactive Evaluation on Sailing Risk of Real-time Ship Traffic in Waterway

ZHANG Shukui1,2,XIAO Yingjie2, SU Wenming1

(1. Navigational College, Jiangsu Maritime Institute, Nanjing 211170, Jiangsu, P. R. China;2. Merchant College, Shanghai Maritime University, Shanghai 201306, P. R. China)

:In order to assess sailing risk of real-time ship traffic in waterway and give early warning of accident, the Bayesian network was built by using Gaussian mixture model and maximum expectation algorithm. Through our study and training about Bayesian network structure and parameters and based on the data from ship detectors and the record of traffic accident occurred in Caoxiexia waterway of Yangtze River, BN distributor was established. BN classification models in relation to 8 group data of ship traffic flow were set up respectively. Results show that the model using data taken from the two ship detectors closest to traffic scene within 20 to 40 minutes just before occurrence of accident generates optimum prediction results with accuracy up to 78.13%.The result of comparison among BN, BP neural network and K close neighbor proves that BN prediction model generates a more accurate prediction result and is thus a good method of risk evaluation of sailing ships in real-time.

traffic engineering; waterway; traffic accident; Bayesian network; risk; proactive evaluation

10.3969/j.issn.1674-0696.2016.02.31

2015-01-16;

2015-03-04

交通运输职业教育科研项目(2013A03);中国交通教育研究会课题(20140233)

张树奎 (1973—), 男, 安徽阜阳人,副教授,博士,主要从事港口、海岸与近海工程方面的研究。E-mail: zhangshkfy@163.com。

U695.2

A

1674-0696(2016)02-151-05

猜你喜欢
检测器贝叶斯航道
基于贝叶斯解释回应被告人讲述的故事
厦门港航道通过能力建模及应用
基于二次否定剪切选择的入侵检测方法*
车道微波车辆检测器的应用
一种柱状金属物质量检测器的研究
新航道
英语高能高分 就上新航道
基于贝叶斯估计的轨道占用识别方法
一种雾霾检测器的研究与设计
基于互信息的贝叶斯网络结构学习