城市轨道交通行人通道交通状态识别研究

2016-05-22 02:19韦凌翔李高峰蔡志理邵海鹏
关键词:正确率分类器行人

陈 红,韦凌翔,李高峰,蔡志理,邵海鹏

(1. 长安大学 公路学院,陕西 西安 710064;2.盐城工学院 材料工程学院,江苏 盐城 224051;3. 山东交通学院 交通与物流工程学院,山东 济南 250023)

城市轨道交通行人通道交通状态识别研究

陈 红1,韦凌翔2,李高峰1,蔡志理3,邵海鹏1

(1. 长安大学 公路学院,陕西 西安 710064;2.盐城工学院 材料工程学院,江苏 盐城 224051;3. 山东交通学院 交通与物流工程学院,山东 济南 250023)

提出了一种基于支持向量机,利用行人交通流参数,实现城市轨道交通人行通道处交通状态识别的方法。采用FCM算法实现了4种行人交通状态的聚类分析与定义;建立SVM多类分类器模型。并分别采用线性可分和非线性两种SVM分类器以及多项式、高斯径向基、sigmoid等3种核函数,应用于行人通道交通状态识别中,进而通过实际采集数据集合,对其有效性进行对比分析。研究表明:设计的算法具有良好的识别性能,RBF核函数SVM模型的总体识别效果相比最好,正确率均在85%以上,说明行人交通参数在该核函数转化的高维空间具备良好的线性可分;线性可分对畅通状态识别效果相对最好,正确率为98%;多项式核函数对稳定状态识别效果相对最好,正确率为93%;sigmoid核函数的总体识别效果相比最稳定,正确率均在85%~92%。

交通运输工程;轨道交通;状态识别;支持向量机

0 引 言

随着经济的快速发展以及城市化进程的不断加快,城市轨道交通系统在我国很多城市逐步建设运营[1]。由于城市轨道交通系统具有运量大、速度快、准点性高等其他交通方式无法替代的优势,使其成为了城市公共交通系统的重要组成部分[2]。

自1969年到2014年初,城市轨道交通系统在我国的北京、上海、广州、南京、西安等20余个城市已经建成运行。《2012年—2013年中国城市轨道交通发展报告》中指出:截至2013年5月,全国运营的城市轨道交通总里程达2 518.6 km,在建城市轨道交通里程有2 975.58 km。通过在长期与大规模的轨道交通建设中的不断摸索以及其技术的不断进步,我国城市轨道交通在投资、建设、运营和管理等方面不断发展并走向成熟和完善。开展城市轨道交通站点行人通道处交通状态分级与识别的相关研究有助于建立应急处置、信息发布等应急运行机制,进而提高地铁线路行人疏散能力以及为乘客提供更为舒适的乘车环境,从而达到提升城市公共交通系统服务水平的目的[3-4]。

国内外学者以及研究机构,在城市轨道交通站点等人流集散区通道处的行人交通特性等方面,取得一定的研究成果,如美国《道路通行能力手册》(Highway Capacity Manual,HCM,2010)中提出的行人道平均人流服务水平标准(lever of service, LOS);LI Yifan等[1]借助仿真软件对行人通行设施的瓶颈处的拥堵-疏散过程进行了建模,并据此评估了行人通行设施的交通拥堵状态和服务水平;XU Xinyue等[4]基于马尔科夫链以及排队论的相关理论,对轨道交通站点的乘客交通状态特性进行了研究分析,并且辅以实例验证;CHENG Huan等[5]基于行人流理论,对地铁站疏散设施(出口、楼梯、通道等)建立与交通状态相关的紧急疏散能力评估模型;NAI Wei等[6]对轨道交通站点不同通行设施的行人的步行特性以及步行交通状态进行了对比分析;J.SHAH等[7]对行人通行设施紧急状态下的乘客服务水平以及所处的交通状态进行了调查分析。以上研究的重点主要集中在行人交通状态特性以及行人服务水平分级等,并未对行人交通状态分类与识别算法实现方面进行深入研究。如何对依据行人交通参数数据对行人交通状态进行分类和识别是亟待解决的问题。

在现代智能交通管理系统中,各种判别算法经常被用来进行交通状态实时判断。现有的检测分类算法主要有4类,包括直接比较算法、时空预测算法、模式识别算法、人工智能算法等[8-9]。支持向量机(人工智能算法)是Vapnik等人根据统计学理论提出的一种新的通用学习方法,它是建立在统计学理论的VC维理论和结构风险最小原理的基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。与其他传统方法相比,能够较好地解决小样本、非线性、高维数和局部极小点等实际问题[10]。SVM框架是当前最流行的监督学习分类器之一[11]。

笔者在相关研究的基础上,提出一种基于支持向量机的利用行人交通参数实现行人交通状态识别的方法。该方法首先采用FCM算法实现4种行人交通状态的聚类分析,得到交通状态数据集;然后建立SVM多类分类器模型,并分别采用线性可分和非线性两种SVM分类器以及多项式、高斯径向基、sigmoid等3种核函数,应用于行人通道交通状态识别中,进而通过实际采集数据集合对其有效性进行对比分析。

1 行人交通状态参数的提取与分类

1.1 交通状态特征参数提取

在交通工程学以及行人交通特性的研究中,行人步行速度、行人密度以及行人流量是反映行人流特征的重要参数[12]。城市轨道交通通道、公交站台等待区域、城市交叉口行人过街设施以及大型活动的行人集散区等不同区域内,特定时段行人流在这些参数方面表现出不同的特性[10,13]。因此,笔者选取单位时间内进入观测区域的行人平均步行速度、行人平均密度以及行人平均流量3个特征参数,对相应计算公式进行适当修订,以符合调查方案的实际可操作性。据此构建三维样本的空间,相关指标定义如下,具体行人参数观测区域示意如图1。

图1 行人参数观测区域示意Fig.1 Observation area schematic of pedestrian parameters

1.1.1 平均步行速度

平均步行速度为单位时间(min)内,行人通过观测区域的平均速度计算如式(1):

(1)

1.1.2 平均密度

行人平均密度为在单位时间内,单位面积的行人数量,人/m2,计算如式(2):

(2)

1.1.3 平均流量

行人平均流量为在单位时间(min)单位通道宽度(m),通过检测线A和B的平均人数计算如式(3):

(3)

1.2 交通状态聚类分析方法

根据选取的行人平均步行速度、行人平均密度以及行人平均流量3个基本特征参数,得到行人交通状态三维空间。行人交通状态聚类分析就是根据空间中样本分布,将距离相近的样本划归成一类。其原则是使得类间距离尽可能大,而类内样本间距离尽可能小,从而得到畅通状态、稳定状态、拥挤状态和阻塞状态4种行人交通状态的划分方法。模糊C-均值算法[14-16](fuzzy C-means, FCM)是一种泛化的分区聚类方法模糊C-均值聚类算法。其通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。

对笔者选取的行人交通状态三维空间,假设第i个三维观测值为xi=(xi1,xi2,xi3),分别表示行人平均步行速度、行人平均密度以及行人平均流量,N个行人流参数观测值的集合记作X,X表示一个N×3的矩阵:

(4)

FCM 算法基于最小化如下目标函数[14]:

(5)

(6)

2 模型的构建与步骤设计

SVM分类器的工作原理如下[10-11]:对于线性可分的问题,设定划分训练集的初始超平面,并根据最大间隔原则对其进行优化,确定最终的决策超平面(决策函数),从而使得训练集中的样本能够正确分类。对于近似线性可分问题,可通过引入松弛变量,来“软化”线性可分问题对优化间隔的要求,即允许有不满足约束条件的样本点存在,并引入一个惩罚参数加以适当限制,从而将近似线性可分问题转化为线性可分问题进行求解。对于非线性可分问题,可通过一个非线性核函数将输入向量映射到高维线性特征空间,将非线性可分问题转换为线性可分问题进行求解。

2.1 SVM多类分类器模型的构建

行人交通状态识别是一个多类分类问题,由于传统的支持向量机方法在分类问题上只考虑了二值分类的问题,所以需要扩展SVM建立多个支持向量机分类器。运用间接法构造SVM多类分类器,通过组合多个二分类器来实现多分类器的构造,即在k个样本中,分别选取2个不同类别构成一个SVM子分类器,相当于将4个拥堵的多类问题转化为多个两类问题来求解。据此构建3个SVM二分类器为:{畅通状态,稳定状态},{稳定状态,拥挤状态},{拥挤状态,阻塞状态}。

构建训练样本集为

(7)

(8)

(9)

(10)

(11)

定义Lagrange函数[L(w,b,a)]为

(12)

(13)

(14)

这样,式(10)的优化问题转化为对偶问题:

(15)

(16)

0≤αi≤C,i=1,2,…,l

(17)

通过对式(16)求解,其中C为惩罚参数,得到最优分类函数为

(18)

b*的求解可通过任选一个支持向量,由式(11)约束方程(此时去等号)求出。

2.2 SVM多类分类器模型计算步骤设计

1)选取行人交通状态参数的训练样本集

5)对于非线性可分的行人通道交通状态,需要在式(15)中引入一个实现线性映射的核函数K(xi,xj):

6)选择不同的核函数K(xi,xj),可构成不同的行人通道交通状态分类SVM,将K(xi,xj)代入式(18),得到行人交通状态分类SVM决策函数形式为

7)分别构造线性可分和非线性可分的行人通道交通状态的决策函数f(x),推断任一输入行人交通状态X3对应的输出状态Y。

2.3 SVM分类器核函数的选择

对于近似线性可分和线性不可分问题,可采用增加松弛变量或采用合适的核函数,通过非线性变换将低维的输入空间映射到高维的特征空间,从而将非线性可分问题转换为线性可分问题进行求解[10,17]。目前,在分类问题方面常用的核函数主要包括多项式核函数、径向基( RBF)核函数、sigmoid核函数3种[17]。因此,笔者分别采用线性可分和非线性2种SVM分类器以及多项式、高斯径向基、sigmoid这3种核函数应用于行人通道交通状态识别中,并对其有效性进行对比分析。具体核函数计算公式如下。

1)多项式核函数

K(xi,x)=[q(xi,x)+1]d

(19)

2)径向基( RBF)核函数

(20)

3)sigmoid核函数

K(xi,x)=tanh[v(xi·x)+c]

(21)

式中:x为目标输入向量;xi为训练样本集中第i维的输入向量;q,d,c,g,v均为对应核函数的参数。

3 实例分析

3.1 参数采集方案

为了准确获取行人交通参数的时空特性数据,笔者采用录像机记录的视频信息进行数据采集的方法,即录像采集法。录像采集法是目前行人调查中广泛采用的调查方法,具备存储便捷,可以重访获取细节信息的优点[18-19]。为保证调查位置全面覆盖不同拥挤度的通道行人特性,选取西安市轨道交通2号线的换乘站点(北大街站)、客流集散较大站点(钟楼站、小寨站)共计3个站点的行人通道为调查对象。为了得到调查行人通道在运行时段的交通参数的时空分布数据,并考虑其参数的调查需要确定一个连续渐变的时段,因此,行人密度观测的时间为工作日(周三)和非工作日(周六)晚高峰17:00—19:00。确定目标车站的行人通道后,选取行人通道内一段宽W(以通道宽度作为观测区域的宽度),长L的区域作为拍摄区域,为便于在视频数据提取时更准确判断出行人是否处于该区域,边界尽量选择有明显标识的边线。

3.2 数据归一化处理

对调查得到的原始数据按照式(1)~式(3)计算出相应的行人交通参数,提取有效数据286条,为避免样本数据存在量纲或某一维数据值过大而导致SVM训练错误,用式(22)将三维的行人交通数据进行归一化到[-1,1]区间:

(22)

参数原始值;ti,min,ti,max分别为第i(i=1,2,3)维行人交通参数原始值的最小值和最大值。

3.3 行人交通状态的划分

根据式(5)、式(6)中FCM算法,对归一化后的286条有效数据进行多次迭代,得到4种交通状态的聚类中心如式(23),各类样本在状态空间中的分布情况如图2。

图2 4种行人交通状态数据样本的分布Fig.2 Data sample distribution of four kinds of pedestrian’s traffic status

(23)

式中:m1,m2,m3,m4分别为畅通、稳定、拥挤和阻塞状态聚类中心;mvf与式(6)含义相同。

矩阵中每一行分别对应4种交通状态聚类中心的行人平均步行速度、行人平均密度以及行人平均流量。

3.4 有效性检验与分析

为了更好地考察算法的总体分类识别效果,对有效性检验步骤设计如下:①对归一化后的286条有效数据样本按照行人交通状态的划分得到畅通、稳定、拥挤和阻塞4种状态的样本数分别为:50,65,78,90;②为了有效对比4种状态的分类的正确率,随机从4种状态中各选取50个数据样本作为有效性检验数据样本;③分别随机从4类状态有效性检验数据样本各选出20个样本作为训练集合,其未选中的样本作为测试集合;④按照SVM多类分类器模型计算步骤对SVM模型进行训练,然后用测试集合对已训练完成的模型进行测试,得到不同分离器下4种行人交通状态分类的正确率(其中,稳定状态和拥堵状态的正确率为其与相邻状态分类结果正确率的均值),如图3。

图3 4种行人交通状态不同SVM分类器的正确率Fig.3 Accuracy of different SVM classifiers of four kinds of pedestrian’s traffic status

由图3可以看出:①整体上看,所设计的算法具有良好的识别性能,RBF核函数SVM模型的总体识别效果相对最好;线性可分对畅通状态识别效果相对最好;多项式核函数对稳定状态识别效果相对最好;sigmoid核函数的总体识别效果相对最稳定。②从4种状态的正确率上看,畅通状态线性可分的分类识别正确率(98%)明显高于其他分类器;稳定状态多项式核函数、RBF核函数SVM分类器的分类识别正确率(93%,91%)高于另外两种SVM分类器;拥挤状态RBF核函数、sigmoid核函数SVM分类器的分类识别正确率(94%,92%)高于另外两种SVM分类器;堵塞状态RBF核函数SVM分类器的分类识别正确率(96%)高于另外3种SVM分类器。③从4种SVM分类器的正确率上看,线性可分核函数可以较好地识别畅通状态,其识别正确率为98%;多项式核函数对稳定状态的识别效果最好,正确率高达93%;RBF核函数对4种状态的整体识别效果最好,正确率分别为85%,91%,94%,96%,说明行人交通参数在RBF核函数转化的高维空间具备良好的线性可分;sigmoid核函数对4种状态识别效果稳定,正确率在85%~92%,对拥挤状态的识别正确率最高为92%。

4 结 论

1)选取行人平均步行速度、行人平均密度以及行人平均流量反映行人步行状态,并根据该指标以及结合FCM算法将通道处行人拥挤度划分为畅通、稳定、拥挤和阻塞4种状态,不仅反映了行人流中的重要参数,同时可以作为行人交通状态有效识别的特征参数。

2)通过对比不同SVM分类器的分类识别效果,证明所设计的算法具有良好的识别性能,RBF核函数SVM模型的总体识别效果相比最好,正确率均在85%以上,说明行人交通参数该核函数转化的高维空间具备良好的线性可分;线性可分对畅通状态识别效果相对最好,正确率为98%;多项式核函数对稳定状态识别效果相对最好正确率为93%;sigmoid核函数的总体识别效果相比最稳定,正确率均在85%~92%。

3)笔者研究成果为城市轨道交通系统建立行人拥堵预警、应急处置和信息发布等应急运行机制提供了科学方法和数据支撑。

[1] LI Yifan,CHEN Junmin,JI Jie,et al. Analysis of crowded degree of emergency evacuation at “bottleneck” position in subway station based on stairway level of service[J].ProcediaEngineering,2011,11: 242-251.

[2] WAN Jiahui,SUI Jie,YU Hua. Research on evacuation in the subway station in China based on the combined social force model[J].PhysicaA:StatisticalMechanicsandItsApplications,2014,394: 33-46.

[3] 刘小明,胡红.应急交通疏散研究现状与展望[J].交通运输工程学报,2008,8(3):108-115. LIU Xiaoming,HU Hong. Research status and prospect of emergency transportation evacuation[J].JournalofTrafficandTransportationEngineering,2008,8(3): 108-115.

[4] XU Xinyue,LIU Jun,LI Haiying,et al. Analysis of subway station capacity with the use of queueing theory[J].TransportationResearchPartC:EmergingTechnologies,2014,38: 28-43.

[5] CHENG Huan,YANG Xiaohuan. Emergency evacuation capacity of subway stations[C]// 8thInternational Conference on Traffic and Transportation Studies(ICTTS),Changsha,China,2012. London: Elsevier,2012: 339-348.

[6] NAI Wei,DONG Decun,CHEN Shuai,et al. Optimizing the usage of walking facilities between platform and concourse layer in L-shaped interchange metro station[J].Procedia-SocialandBehavioralSciences,2012,43: 748-757.

[7] SHAH J,JOSHI G J,PARIDA P. Behavioral characteristics of pedestrian flow on stairway at railway station[J].Procedia-SocialandBehavioralSciences,2013,104: 688-697.

[8] 刘妍.短时路段行程时间分布预测方法研究[J].重庆交通大学学报(自然科学版),2015,34(2): 108-111. LIU Yan. Prediction research on travel-time distribution of short-term path[J].JournalofChongqingJiaotongUniversity(NaturalScience),2015,34(2): 108-111.

[9] 黄艳国,许伦辉,邝先验. 基于模糊 C 均值聚类的城市道路交通状态判别[J]. 重庆交通大学学报(自然科学版),2015,34(2): 102-107. HUANG Yanguo,XU Lunhui,KUANG Xianyan. Urban road traffic state identification based on fuzzy C-mean clustering[J].JournalofChongqingJiaotongUniversity(NaturalScience),2015,34(2): 102-107.

[10] WANG Jin,SHI Qixin. Short-term traffic speed forecasting hybrid model based on chaos-wavelet analysis-support vector machine theory[J].TransportationResearchPartC:EmergingTechnologies,2013,27: 219-232.

[11] MIYAMOTO S,ICHIHASHI H,HONDA K.AlgorithmsforFuzzyClustering:MethodsinC-MeansClusteringwithApplications[M]. Berlin: Springer,2008.

[12] SHAH J,JOSHI G J,PARIDA P. Behavioral characteristics of pedestrian flow on stairway at railway station[J].Procedia-SocialandBehavioralSciences,2013,104: 688-697.

[13] 武小康,周利锋. 行人仿真在轻轨车站应急疏散领域的应用[J]. 重庆交通大学学报(自然科学版),2012,31(4): 772-776. WU Xiaokang,ZHOU Lifeng. Application of pedestrian simulation software on the emergency evacuation at light rail station[J].JournalofChongqingJiaotongUniversity(NaturalScience),2012,31(4): 772-776.

[14] KANZAWA Y,ENDO Y,MIYAMOTO S. Indefinite kernel fuzzy c-means clustering algorithms[M]//ModelingDecisionsforArtificialIntelligence. Berlin: Springer,2010: 116-128.

[15] COLETTA L F S,VENDRAMIN L,HRUSCHKA E R,et al. Collaborative fuzzy clustering algorithms: some refinements and design guidelines[J].IEEETransactionsonFuzzySystems,2012,20(3): 444-462.

[16] MIYAMOTO S,ICHIHASHI H,HONDA K.AlgorithmsforFuzzyClustering:MethodsinC-MeansClusteringwithApplications[M]. Berlin: Springer,2008.

[17] ESTE A,GRINGOLI F,SALGARELLI L. Support vector machines for TCP traffic classification[J].ComputerNetworks,2009,53(14): 2476-2490.

[18] RUSH T,PRZYBYLA J,MELCHER D,et al.VideoAnalysisandAnalyticalModelingofActualVehicle/PedestrianCollisions[R].[S.l.]:SAE Technical Paper,2014.

[19] CORREIA A R,WIRASINGHE S C,DE BARROS A G. Overall level of service measures for airport passenger terminals[J].TransportationResearchPartA:PolicyandPractice,2008,42(2): 330-346.

Pattern Recognition of Traffic Condition of Urban Rail Transit Pedestrian Passage

CHEN Hong1, WEI Lingxiang2, LI Gaofeng1, CAI Zhili3, SHAO Haipeng1

(1. School of Highway, Chang’an University, Xi’an 710064, Shaanxi, P.R.China;2.School of Material Engineering, Yancheng Institute of Technology, Yancheng 224051, Jiangsu, P.R.China; 3. School of Traffic & Logistics Engineering, Shandong Jiaotong University, Ji’nan 250023, Shandong, P.R.China)

A method based on support vector machine (SVM) was proposed, which used the pedestrian’s traffic flow parameters to realize the pattern recognition of traffic condition of urban rail transit pedestrian passage. Clustering analysis and definition of four kinds of pedestrian traffic status was realized by FCM algorithm, and multiple SVM traffic status identification model was established. Linear and nonlinear SVM classifiers were adopted respectively, and polynomial kernel function, radically Gaussian kernel function and sigmoid kernel function were also adopted in the pattern recognition of pedestrian passage traffic condition. Furthermore, the comparison analysis on the effectiveness was carried out through the actually collected data collection. The results indicate that the proposed algorithm has good recognition performance. With the comparison of overall recognition performance, RBF kernel function SVM model is the best one and its correct rate is over 85%, which indicates that the pedestrian traffic parameters are well linearly separable in the high-dimensional space of the kernel function conversion. Linear separability has relatively best performance in smooth state recognition, and the correct rate is 98%. Polynomial kernel function has relatively best performance in steady state recognition, and the correct rate is 93%. With the comparison of overall recognition performance, sigmoid kernel function is relatively most stable one, and the correct rate ranges from 85% to 92%.

traffic and transportation engineering; rail transit; pattern recognition; support vector machine (SVM)

10.3969/j.issn.1674-0696.2016.03.28

2015-03-18;

2015-04-13

国家自然科学基金项目(50808021);陕西省交通运输厅科技项目(10-07R)

陈 红(1963—),女,湖南湘潭人,教授,博士,主要从事交通运输规划与管理方面的研究。E-mail:hongchen82@126.com。

韦凌翔(1991—),男,山东曲阜人,硕士,主要从事交通数据挖掘与建模分析方面的研究。E-mail:sdjtwlx@126.com。

U491

A

1674-0696(2016)03-134-07

猜你喜欢
正确率分类器行人
毒舌出没,行人避让
门诊分诊服务态度与正确率对护患关系的影响
路不为寻找者而设
基于实例的强分类器快速集成方法
我是行人
生意
品管圈活动在提高介入手术安全核查正确率中的应用
曝光闯红灯行人值得借鉴
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器