袁 王永东
济南大学西校区(250022)
道路交通系统是一个耦合系统,由道路和人共同组成,不但具有非线性、开放性,而且处于动平衡状态。道路交通系统是由多种要素组成,但是并非所有要素都是相互兼容、相互调节的,也有不调节和不兼容的,这就造成了系统存在一定的失效率,导致交通事故频发。从宏观角度来治理道交通,就需要借鉴相关系统的基本性质并进行分析,找出容易发生交通事故的地点和位置,对其进行重新设置和建设,以保证道路交通的安全。
所谓聚类分析方法,就是将整个道路交通系统中的时间周期和特定路段进行合理安排和组织,最后进行分析。这样有特定目标、特定评价及相应鉴别方法的鉴别方式,可以更好的地鉴别频发事故的地点。
当然,曾经也有许多比较传统的鉴别方法,如CRM、ZIP模型等。这些模型包含的参数很多,如散步泊松分布参数等。传统的鉴别方法需要利用一定的事故统计数值作为相对的模拟数据。但是在现实生活当中很多事故都是随机的,无法进行有效的分类和区域划定,若纯粹的运用传统的鉴别方式对事故多发地进行鉴别,很难反映出其空间分布的具体位置及效应规律。相比来看,在同一区内用聚类方法进行判断和鉴别,更容易找出其中的共通性。交通事故发生的地点和时间具有很大的随机性且非常分散,若想对其进行实际和深入性的挖掘,需要应用一定的分析方法对其进行鉴别分析。
而这种鉴别分析的方法称为k-means。kmeans应用起来非常简便,计算的速度也比较快,适用于大数据,有较高的效率。k-means需要与其他算法、模型结合使用,也适合用于大数据的相关细节内容,在特定分析及参数估计方面有绝对的优势[1]。
k-means的基本思想是在空间范围内以一个中心K为点进行相应的聚类,最终对靠近K点的相应对象进行各种分类。这样计算之后,再通过重复迭代的方式对每种聚类中心的值进行相应的归类,最后得到结果:
1)c作为类别的样本集合,将所有的规整化一后整体反应在各别象限内,选择一个适当的初始中心作为c个类。
2)对于任意一个样本,将第k次代入求c的中心距离。样本所在的地方与中心c的最短距离就是中心所在的类。
3)以求平均值的方法对整个类种的中心值进行重新评定和计算。
4)运用类聚的中心在利用上述的二和三两种方法进行更新计算,直到目标满足相应函数,最后减少不查确定待次数做到迭代结束,并最后得出结论。
其中给定的第i个事故点样本点xi是多维事故属性向量,其所属类为
对于整体数据的分析来说,一起事故的数据众多,若想对数据进行精准化划分和处理,应对相关数据进行一个初步的整理和确认,以便保证相应数据的准确度和精准度,最大限度地减少显著差异数据。对于缺少经纬度信息的相应数据,应采用特殊的事故信息分析方式对事故的地点进行相应的匹配,并在地图上进行标识。该种方式可以对其进行一定的经纬度坐标确定。考虑市区内的地域和道路交通分布状况,将整个事故多发地点进行区域性划分和统计,在GIS地图点进行排列,得出事故多发地域的总体分布状况,并以此作为参考系数进行相应的聚类中心分析。在整个相应的程序系统内进行多次聚类中心数值分析和迭代数值分析。在区分事故的检疫情况上,可以按照事故的频发次数和交叉路口常年事故指标相似度进行聚类[2]。
交叉路口作为整个道路的路段,是事故频发区域,被鉴定为主次路干的低级城市道路相互交叉形成的路段。这样的路段事故黑点的激化交叉和梯形交叉所占比例较少。有个别交叉路口的交通事故高于一般的交通路口,这样的路口等级较高,承载的交通流量较重。在接警处,其相邻的交叉路口间距较小,以至于形成易发事故的黑点类型。对于交通事故频发的解决方案,可以在道路交通系统中寻找出相应的事故高发地,并提前落实事故的解决方案。在容易发生事故的地点进行一定的设施建设,有针对性地治理和改善,实施物理隔离或者是重新设置相应的标志警戒线,增加一定的沟渠设计,保证路段通顺。
文章内容根据某城市的一年内交通事故的数据进行相应的聚类和事故分析处理。利用可视化分布图对整个事故高发点进行了特征分析,得到了有关的分布结果。这样的方法可以有效地挖掘出城市道路中潜在的事故高发地,帮助相应的管理机构提早作好预防措施,对该地点进行管理和控制,以便提前作好相应措施,保证整个城市的道路安全。