李月明,郑贵省,车亚辉,王 元,王 鹏
(1.军事交通学院 研究生管理大队,天津300161; 2.军事交通学院 基础部,天津 300161)
● 基础科学与技术Basic Science & Technology
区域路网路面性能的模糊聚类分析
李月明1,郑贵省2,车亚辉1,王元1,王鹏1
(1.军事交通学院 研究生管理大队,天津300161; 2.军事交通学院 基础部,天津 300161)
为划分路面性能等级和显示路网路面性能水平分布状况,考虑路网路面性能的模糊性,采用模糊聚类相关理论的应用方法,通过路网内不同段落路面性能各项测试参数的模糊C均值聚类分析,对不同道路的路面性能参数进行分类。通过聚类结果比较分析,直观地体现了路网内不同段落路面性能的状况分类情况。并以2007年浦东新区某公路路网路面使用性能检测数据进行计算,验证了该方法的有效性。
路网;路面性能;模糊聚类;分类分析
公路网是交通运输系统中最为基本和普遍的运输网络,它的基本性能直接决定了运输能力的强弱,因此,研究路网中路段路面性能是评价路网运输能力的重要方式。目前,有关路网路面性能参数评估的方法主要是通过相关的路面性能评价机制对各路段进行测评,然后依据评估标准对测评结果进行化类分析,确定公路网中不同等级公路的比例及分布等[1]。有关路面性能评价一般采用路网养护相关技术规范中分项和综合评价指标评价方法[1],这是一种对路面性能参数等级分类定性的“硬化分”,这种方法评测出的路面性能结果具有“很强的确定性”。实际上,路面质量和损坏状况的评价以及各项使用性能参数的评级标准会有一定主观色彩,对路面性能状况的等级评估结果并不是确定的,对等级的划分界线也没有明确的概念[2],因此,路面性能等级的评估界线上具有模糊特性。同时,在所处环境因素及本身结构性能的复杂影响下,路面性能状况具有不确定性[3]。因此,应用模糊聚类分析路网路段的性能参数状况是非常有研究意义的。利用模糊聚类分析的方法,使用Matlab软件对相关路面性能进行聚类,将路网内不同路段路面性能状况相似度较大的聚为了一类,从而使路面性能不同的路段被区分出来,达到划分路面性能等级和显示路网路面性能水平分布状况的研究目的。
聚类就是依据事物某些属性,将具有较大相似性的事物归为一类,使类间事物属性相似程度达到最大,类间相似程度最小[4]。经典数学理论中的聚类方法是依据某种标准将待聚对象严格划分为一类。但是在人类社会和各科学领域中,人们所遇到的量除了具有确定性之外还有不确定性,不确定性又包含随机性和模糊性[5]。模糊数学的思想最早是在1965年由美国加利福尼亚大学的扎德教授在《模糊集合》这篇论文中提出的[5],之后模糊思想不断发展,Dunn在1973年提出了模糊C均值聚类算法,Bezdek J C在1981年对这一算法进行完善并应用到实际中[6]。目前,聚类的方法主要有层次聚类法、划分聚类法及基于网络和密度的聚类算法3类。本文采用划分聚类法,这种方法需预先指定聚类数目或聚类中心,经过不断迭代逐步降低目标函数的误差值,使目标值达到一致收敛,聚类结束,如K均值(C均值)聚类算法[4]。本文介绍的模糊C均值聚类算法就是基于此种算法并结合模糊理论改进的适合用于类属模糊的聚类算法。
1.1基于模糊等价矩阵模糊聚类的一般步骤
(1)数据标准化。讨论被分类对象的全体U={x1,x2,…,xn},通过m个指标对其中的每个对象特征进行表示,xi={xi1,xi2,…,xim},i=1,2,…,n。得到原始数据的矩阵X为
(1)
对模糊矩阵进行数据标准化,以便能够使其满足数据在[0,1]上的要求。在此处选用平移——标准差处理样本数据。
(2)
再对数据进行归一化处理:
(3)
式中x'lmax、x'lmin分别为x'il中最大值和最小值。
(2)建立模糊相似关系。相似关系通过建立在U上的相似矩阵R表示,而R的计算方法一般选用相似系数法、数量级法、最大最小法、算数平均法、集合平均方法、绝对值指数法及绝对值减数法[4]。
(3)建立等价关系。等价关系不仅包括反射性和对称性,而且要满足传递性。上文建立的R是相似矩阵,一般只具备前两个性质,而不具有传递性,所以要通过一些改造使其具有等价关系。一般通过平方法求R传递闭包R*:先使R自乘改造为R2,再自乘得R4,如此继续下去,直到R2k=Rk=R*的时候停止。此时R*满足传递性,于是模糊相似矩阵R就被改造成一个模糊等价关系矩阵R*。
1.2模糊C均值聚类(FCM)算法的实现
模糊C均值聚类(FCM)算法和普通C均值聚类算法不同的是增加特征函数uj(xi)为第i个样本对于第j类隶属程度。
本文是基于目标函数的聚类算法,使得目标函数达到最小。FCM把n个样本xi{i=1,2,…,n}分为c个模糊类别,并计算每个类的聚类中心,使得目标函数达到最小。xi{i=1,2,…,n}是n个样本对象组成的对象全体,c是根据需要提前设定的类别数目,mj(j=1,2,…,c)则为聚类中心。
设目标函数为
(4)
式中b是一个常数,与聚类结果的模糊程度有关,b值越大,分类越模糊,通常设置b大于1,但一般不超过2,以免结果不具真实性。其中:
(5)
在式(2)下求式(1)的极小值,令Jf对mj和uj(xi)的偏导数为0,可得必要条件为
(6)
(7)
FCM迭代过程如下:① 设定初始聚类数目c及参数b,目标函数迭代精度ε;② 初始化各个聚类中心mj(j=1,2,…,c);③ 根据式(7)计算隶属函数矩阵;④ 根据式(4)计算目标函数,Jf<ε,则算法停止,否则,返回步骤③。
2.1路网路面性能评价指标及实例数据
路面性能评价就是对相关的各项指标进行定量、定性分析,揭示现有公路网存在的问题,为规划近、远期公路网服务。评价的首要工作是选择评价指标,指标选择和指标量化的合理性、全面性以及科学性直接决定评价结果的准确与否。经过分析比较,选取的指标主要有:路面强度系数(SSI)、路面状况指数(PCI)、行驶质量指数(RQI)、横向力系数(SFC) 。以2007年浦东新区某公路路网路面使用性能检测数据为例进行计算(见表1)。
2.2数据预处理
根据模糊聚类的要求,为消除不同量纲对数据的影响,必须对样本进行数据预处理[5]。采用上面提到的平移——标准差方法,依照式(2)、(3)处理样本数据,使用Matlab编程归一化处理后的数据矩阵为
表1 浦东新区某公路路网路面使用性能检测数据
2.3模糊C均值聚类
根据上述标准化的数据矩阵,对各线路进行模糊C均值聚类,结合实际研究需要和模糊C均值聚类算法的要求,设定初始聚类中心数目为3,隶属度矩阵的指数为2,隶属度最小变化量为10-5,运算结果如下。
聚类中心:
隶属度矩阵:
上面的聚类中心矩阵C是一个3×4的矩阵,每一行是一个类的中心坐标。隶属度矩阵U是3×15的矩阵,每一列是一个路线属于3个类的隶属度。比如第一列元素有0.901 1、0.063 8、0.035 0,代表路线S1属于第一类的隶属度是0.901 1,属于第二类的隶属度是0.063 8,属于第三类的隶属度是0.035 0,显然第一类的隶属度最大,所以可以把路线S1归为第一类,其他路线的分类与此相似。
从上面的隶属度矩阵中查找每一列的最大值的行标就能够确定每条路线的所属类别,这样能很清楚地知道每条路线的分类类属:
Ⅰ类:{ S1,S2,S3,S4,S12,S13};
Ⅱ类:{ S7,S8,S9,S10,S11,S14,S15};
Ⅲ类:{ S5,S6}。
本文以2007年浦东新区某公路路网路面使用性能检测数据为例,结合模糊C均值聚类的方法对其进行聚类分析,解决路网路面性能状况分类评价的模糊性和不确定性,使划分不再是“硬化分”,可以根据实际情况和需求进行划分,从而使评价结果更加符合客观性和全面合理性。通过实例分析可知,将模糊聚类分析的方法应用在路网路面性能评估上是可行的。将分类结果的差异与按照规范规定的处于同一性能水平内的各路段路面的状态参数进行对比,使在对路面进行维护保养时的优先顺序能够更加合理。
[1]交通部公路科学研究院,上海市公路管理处.公路技术状况评定标准:JTG H20—2007[S].北京:人民交通出版社,2007.
[2]沈海生.沥青路面性能非线性模糊评价及预防性状护最佳时机研究[D].合肥:安徽建筑大学,2015.
[3]张丽娟,凌建明,祝云琪.基于灰色模糊聚类法的路网路面使用性能评价[J].同济大学学报(自然科学版),2010,38(2):525-256.
[4]杨纶标,高英仪,凌卫新.模糊数学原理及应用[M].5版.广州:华南理工大学出版社,2011:79.
[5]谢季坚,刘承平.模糊数学方法及其应用[M].4版.武汉:华中科技出版社,2014:2.
[6]贾继德,孔凡让.发动机连杆轴承故障噪声诊断研究[J].农业机械学报,2005,36(6):89 -90.
(编辑:史海英)
Fuzzy Cluster Analysis on Road Performance of Regional Road Network
LI Yueming1, ZHENG Guixing2, CHE Yahui1, WANG Yuan1, WANG Peng1
(1.Postgraduate Training Brigade, Military Transportation University, Tianjin 300161, China;2.General Courses Department, Military Transportation University, Tianjin 300161, China)
To obtain the performance levels of the roads and their horizontal distribution in road network, this paper classified the performance parameters of different roads. During the process, the fuzziness of the performance is considered, FUZZ Clustering theory is applied and all the test parameters of the road performance in different sections are analyzed through fuzz C-means clustering. The road performance of different sections is reflected directly. The validity of this method is verified by the test data of the road network in Pudong New Area in 2007.
road network; road performance; Fuzzy Cluster; classification analysis
2015-10-10;
2016-04-25.
李月明(1990—),男,硕士研究生.
郑贵省(1975—),男,博士,副教授,硕士研究生导师.
10.16807/j.cnki.12-1372/e.2016.07.020
U491.1
A
1674-2192(2016)07- 0087- 04