张亮亮,贾元华,牛忠海,廖 成
(北京交通大学,北京100044)
交通状态划分的参数权重聚类方法研究
张亮亮,贾元华*,牛忠海,廖 成
(北京交通大学,北京100044)
由于交通流量、速度、占有率或密度等参数在交通状态划分中作用不同,本文提出了基于参数权重聚类的交通状态划分方法.根据交通参数数据的相似性,应用基于加权欧氏距离的相似性度量方法构建了交通参数评价函数,并用梯度下降法极小化评价函数对交通参数权重进行求解.将交通参数权重应用于模糊C均值聚类算法(FCM),得到基于参数权重的FCM道路交通状态划分方法.应用提出的模型对选取的实际交通参数数据进行交通状态划分,并与基于欧式距离的FCM状态划分结果对比.研究结果表明,本文提出的方法提高了交通状态划分精度,更接近交通实际运行状况.
城市交通;交通状态划分;参数权重;模糊C均值聚类
交通运行状态划分是城市道路网采取合理交通控制与管理措施的基础,对缓解道路交通运行压力,提高路网运行效率具有重要的意义.迄今为止,国内外研究人员利用交通流量、速度、占有率或者密度等基本交通参数对交通状态划分进行了大量研究,研究成果为交通状态判别提供了技术支持.最初,Herman和Prigogine[1]将交通状态划分为两类——拥挤状态和畅通状态,其它状态划分方式大都是在这两类状态的基础上进一步细分;Kerner[2]提出了三相位交通流理论,并将交通流定性划分为自由流、同步流和宽移动阻塞三个相位;关伟和何蜀燕[3]利用实测数据将城市快速路交通流的状态划分为四类:自由流、谐动流、同步流和堵塞流.由于交通状态具有模糊特性,Christiane和Thomas[4]、陈德望[5]、王璇和翁小雄[6]等利用模糊理论方法对道路交通状态进行分类.近年来,国内外研究人员认为不同交通参数对交通状态的影响不同,初步研究了不同交通参数对交通状态判别的影响.陈德望[5]得出在速度很高、速度很低或者占有率很大的情况下,可以直接判断交通状态,其它情况需要根据流量、速度、占有率等交通参数综合判断;张心哲和关伟[7]通过对流量、速度、密度等交通参数的某一个参数权重取值为1,而其它参数权重取值为0时,采用k-means方法进行状态划分,并得到密度是交通状态划分的关键参数.由于国内外研究人员在交通状态划分时忽略了不同交通参数对其状态划分的影响,即使考虑到不同交通参数对状态划分的影响,也缺乏对交通参数权重的定量计算方法.因此,本文从交通参数数据相似性入手,通过相似性度量方法构建交通参数评价函数来定性研究交通参数权重,将参数权重引入到模糊C均值聚类方法,应用基于参数权重的FCM方法对交通状态进行划分,并进行实证研究,以期提高交通状态划分精度,为交通智能控制与管理提供技术支持.
模糊C均值聚类方法[8]是聚类方法的一种.模糊C均值聚类是一种基于目标优化的聚类方法,通过迭代使样本距离模糊聚类中心的距离加权和最小,设定目标如式(1)所示.
式中 U是每个数据点与相应聚类中心的隶属度;vc为第i个模糊聚类中心;μij∈[0 ,1]表示第 j个数据点属于第i个聚类中心的隶属度;dij为第i个聚类中心与第 j个数据点的欧式距离;m∈[1 ,∞]是一个加权指数,随着m的增加,聚类的模糊性增大;且式(1)满足
FCM算法的具体步骤为:
步骤1给定聚类类别c,模糊加权指数m,设定迭代停止阀值ε,算法的迭代次数为bmax,初始化隶属度矩阵.
步骤2计算模糊聚类中心.
步骤3更新模糊聚类隶属度矩阵U(b+1).
步骤4选择某种合适的矩阵范数比较U(b),和U(b+1),如果‖U(b+1)-U(b)‖≤ε,系统达到稳定,终止迭代;否则令b=(b+1)转到步骤2继续执行.
数据间的相似性是聚类的基础,根据数据间的相似性,可以计算不同聚类属性的权重值.目前,最常用的相似性度量方法有欧式距离、相关系数法等.考虑到交通流量、速度、占有率等参数对其运行状态分类的作用不同,本文采用一种加权欧氏距离对数据相似性进行度量.
式中 β是[0,1]区间的一个常数,通过调整 β能够使得 ρ(pωq)的值均匀地分布在[0,1]内,β可按如下公式计算.
式中 dpq为普通欧式距离,而式(4)中d(pωq)是基于属性权重的欧式距离,d(pωq)计算公式如下:
式中 ω=(ω1,ω2,…,ωm)是与输入属性相对应的一个权重向量;ωk是描述k维属性在聚类中重要性.通过调整ωk的值,数据ρp与数据qq间的相似性不断变化.当ω=(1 ,1,…,1)时,所有属性的重要性相等,数据间的相似度基于普通的欧式距离dpq.当权重不全等于1时,数据间的相似度就是基于权重的相似度.当ωk=1时,第k维属性在聚类中发挥其全部的作用;ωk的值越小,该属性在聚类过程中发挥的作用就越小;当ωk=0时,该属性在聚类过程中不发挥任何作用.
基于以上分析,本文通过极小化评价函数E(ω)对各交通参数权重进行求解[9].E(ω)计算公式如下:
为了极小化评价函数E(ω),本文采用梯度递减算法进行求解,该算法的具体步骤如下:
Step 1根据公式(5)确定β的值.
Step 2在 [0,1]内 初 始 化 权 重 ω= (ω1,ω2,…,ωm).
Step 3计算权重的修正量
Step 4η是学习率,可以通过下式计算η的值.
Step 5当ωj+Δωj>0 时 ,更 新 权 重ωj=ωj+Δωj.
Step 6重复Step 3,Step 4,Step 5直到收敛,即E(ω)的值小于给定的阈值,或者迭代的次数达到用户设定的阀值.
由于参数权重的引入,FCM算法的度量方式由传统的欧式距离变成基于参数权重的欧式距离,得到了基于参数权重的模糊C均值聚类方法(fuzzy c-means clustering based on weight Euclidean distance,WFCM),因而WFCM算法的目标函数定义如下:
根据式(12)、式(13)、式(14)就可以得到基于参数权重的模糊聚类算法,该方法的计算步骤仍为模糊C均值算法的四步.
要正确对道路交通状态进行划分,交通状态数据不仅要包含自由流状态、宽移动阻塞状态,还应包括两者之间的同步流状态.本文选取北京市四环路2013年3月17日至23日一周内多个断面的车道检测数据.数据采样周期为2分钟,每个车道包含5 040组数据,每组检测数据包含流量、速度、占有率等参数.
将流量、速度、占有率三参数组成三维向量,计算各向量间的欧式距离,并根据式(5)求得β=0.37.在此基础上,利用相似性度量公式构建评价函数E(ω),并将流量、速度、占有率三参数赋予相同权重ω=(0.33,0.33,0.33),应用式(8)~式(11)计算E(ω )的值,且当E(ω)收敛时终止迭代,此时E(ω)的值为0.416,以及得到流量、速度、占有率三个参数的权重ω=(0.13,0.19,0.68).将参数权重引入到FCM聚类方法,并用该方法将交通划分为自由流、同步流和宽移动阻塞3个状态,得到三种交通状态的聚类中心;同时,运用未改进的FCM聚类方法对交通状态进行划分,得到三种交通状态的聚类中心.两种聚类方法的聚类中心和聚类图如表1,图1和图2所示.
表1 两种状态划分方法的聚类中心Table 1 Cluster center by two measurements
图1 基于欧式距离的FCM交通状态划分结果Fig.1 Results of classification by FCM based on Euclidean distance
图2 基于加权欧式距离的FCM交通状态划分结果Fig.2 Results of classification by FCM based on weight Euclidean distance
从图1可以看出,当占有率小于20%时,基于欧式距离的FCM状态划分结果包含自由流和同步流,但根据道路交通实际运行情况,占有率小于20%时,属于自由流状态;该方法宽移动阻塞状态的占有率约为35%-80%,与实际交通状态的宽移动阻塞状态的占有率在40%以上;同时,基于欧式距离的FCM聚类方法划分的各种交通状态界限不明显.从图2可以看出,基于交通参数权重状态划分的各种状态与实际运行状况基本相符,且各种交通状态的分界线明显.通过流量、速度、占有率参数得到的交通状态聚类结果表明了本文所构建模型的有效性.
为了验证构建的状态划分模型在不同时段交通状态判别中的应用效果,本文选取一个断面6:00~12:00交通参数数据(图3),并判别不同时段交通状态.先将自由流状态量化为1,同步流状态量化为2,宽移动阻塞状态量化为3,然后根据WFCM和FCM得到的模糊聚类隶属度矩阵分别确定各时段的交通状态,如图4所示.
图4 交通状态判别结果Fig.4 Identification results of traffic state
从图4中可以看出两种划分方法对不同时段的交通状态判别结果不同.本文提出的方法得到10:12~10:48时段该断面交通状态属于自由流,而FCM方法得到的交通状态有同步流和宽移动阻塞.结合图3中流量、速度、占有率三参数曲线,可以确定该时段交通状态属于自由流.因此,通过对比两种状态划分结果表明:本文构建的基于参数权重的交通状态划分方法比基于欧式距离的FCM状态划分方法效果好,能够提高交通状态判别的精度.
交通运行状态划分是交通状态判别的基础,是正确选择交通控制和诱导策略的核心技术.考虑到不同交通参数在交通状态划分中的作用不同,本文给出一种基于交通参数权重的状态划分方法.
(1)通过基于加权欧氏距离的相似性度量方法构建了参数评价函数对交通参数进行求解,得到各交通参数权重.基于实测交通参数数据,得到流量、速度、占有率3个基本交通参数中,占有率对交通状态划分影响最大.
(2)以北京市某一区域路网为例,进行了实证研究,并与未改进的FCM聚类方法对比.研究结果表明,本文提出的方法能够对交通状态进行划分,且划分结果与道路交通实际运行状态基本相符,提高了交通状态划分效果.
[1] Herman R,Prigogine I.A two-fluid approach to town traffic[J].Science,1979,204:148-151.
[2] Kener B S.Three-phase traffic theory and highway capacity[J].Physica A:Statistical Mechanics and its Applications,2004,333:379-440.
[3] 关伟,何蜀燕.基于统计特性的城市快速路交通流状态划分[J].交通运输系统工程与信息,2007,7(5):42-50.[GUAN W,HE S Y.Phase identification of urban freeway traffic based on statistical properties[J].Journal of Transportation Systems Engineering and Information Technology,2007,7(5):42-50.]
[4] Christiane S,Thomas A.Classification and prediction of road traffic using application-specific fuzzy clustering[J].IEEE Transactions on Fuzzy Systems, 2002,10(3):297-308.
[5] 陈德望.基于模糊聚类的快速路交通流状况分类[J].交通运输系统工程与信息,2005,5(1):62-67.[CHEN D W.Classification of traffic flow situation of urban freeways based on fuzzy clustering[J]. Journal of Transportation Systems Engineering and Information Technology,2005,5(1):62-67.]
[6] 王璇,翁小雄.基于模糊C均值聚类的快速路交通流相态划分[J].交通信息与安全,2009,27(1):149-152.[Classification of three-phase traffic flow of urban expressway based on fuzzy c-means clustering[J]. Journal of Transport Information and Safety,2009,27 (1):149-152.]
[7] 张心哲,关伟.城市快速路路段交通流状态评估方法[J].北京交通大学学报,2009,33(6):47-51.[JANG S C,GUAN W.A Method to estimate traffic flow state of urban freeway road section[J].JournalofBeijing Jiaotong University,2009,33(6):47-51.]
[8] Bezdek J C.Pattern recognition with fuzzy objective function algorithms[M].New York:Plenum Press,1981.
[9] Yeung D S,WANG X Z.Improving performance of similarity-based clustering by feature weight learning [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):556-561.
Traffic State Classification Based on Parameter Weighting and Clustering Method
ZHANG Liang-liang,JIAYuan-hua,NIU Zhong-hai,LIAO Cheng
(Beijing Jiaotong University,Beijing 100044,China)
Considering the different effect of each traffic parameter(traffic flow,speed,occupancy or density)on traffic state classification,the method is proposed to classify traffic state of urban traffic based on the parameter weighting.According to the similarity measurement method,a parameter evaluation function is put forward to give each parameter a parameter weighting based on weighted Euclidean distance,and minimize the function using the gradient method.After obtaining parameter weighting values,this paper uses the weighted Euclidean distance to replace the common Euclidean distance in Fuzzy C-means Clustering (FCM).Finally,we classify the traffic state using the proposed methodology,the traffic parameter data come from the road network,and comparing to the method of FCM.The results show that the proposed methodology which classifies the traffic state classification is more consistent with actual conditions.
urban traffic;traffic state classification;parameter weighting;fuzzy c-means clustering
2014-06-10
2014-09-28录用日期:2014-10-08
国家自然科学研究基金项目(71340020).
张亮亮(1986-),男,江苏徐州人,博士生. *
yhjia@bjtu.edu.cn
1009-6744(2014)06-0147-05
U491
A