高速铁路列控系统车载模式显示识别研究

2016-05-09 03:31:07甘庆鹏
铁道学报 2016年3期
关键词:列控控系统识别率

袁 磊, 甘庆鹏, 付 强

(1. 北京交通大学 轨道交通控制与安全国家重点实验室,北京 100044;2. 北京交通大学 轨道交通运行控制系统国家工程研究中心, 北京 100044)

高速铁路CTCS列车运行控制系统(简称列控系统)车载设备通过人机界面DMI(Driver-Man Interface)向司机实时显示距离监督信息、速度信息、补充驾驶信息、运行计划信息、监控信息等,信息显示方式包括:文字、数字、图案、颜色、标尺、图形等。[1]目前,列控系统的第3方测试(如:互联互通测试、产品认证检验测试、现场联调联试等)多采用人工观察DMI显示判断系统内部工作状态,效率低下。实现对列控车载设备DMI显示信息的自动识别,可更全面、准确的获取列控系统内部状态,从而有效提高列控系统第3方测试的准确度和效率。

目前国内外针对列控系统DMI显示信息自动识别的研究相对较少。张勇等[2]采用改进的字回溯切分法实现单个字体切割,采用统计模式和结构模式相结合的方法提高对数字、字母和汉字的识别率。但该方法只有在保证车载DMI界面清晰稳定的基础上,才能获得高识别率。除针对DMI信息显示识别外,与文字识别相关的研究,即光学字符识别(OCR)[3],主要是基于图像以及所需要识别的字符提取不同的特征再进行分类或者模板匹配。如文献[4]在基于图像预处理的前提下利用尺度不变特征转换(SIFT)方法提取特征点,再通过隐马尔科夫模型(HMM)进行模板匹配实现汉字识别。文献[5]利用多分辨率工具提取特征并结合欧几里得距离进行手写的英文识别。基于OCR的研究为DMI信息的自动识别提供了参考,但由于安装在动车组上的DMI设备以及图像采集设备因列车运行而产生抖动、光照环境变化以及DMI显示信息本身像素较少等因素,使得基于DMI图像的信息识别有别于一般的OCR识别并具有一定的难点。

本文以DMI显示的列控车载设备工作模式的分类识别为例,在通过图像预处理分割出列模式文字显示区域后,用二维主成分分析(2DPCA)方法提取模式主要特征,再利用SVM进行分类,其中SVM的参数通过改进的粒子群算法PSO[6]进行优化,最终实现对列控车载设备工作模式DMI显示的准确识别。实现流程见图1。

1 列控车载模式及图像特征提取

列控车载系统在不同运行阶段所承担的安全防护功能不同,而列控车载模式正是系统当前所承担的安全防护功能的标识。车载模式向司机表明了列控系统和司机之间的安全职责的划分,是系统重要的状态信息之一。CTCS列控系统车载模式包括待机、完全、引导、目视、调车、休眠、隔离、冒进、冒后、部分、机信、LKJ等模式[6]。车载模式信息在DMI显示屏上的B7区以文字方式向司机显示。车载DMI显示分辨率一般为640×480像素,B区大小为280×300像素,B7区大小为36×36像素。车载模式信息显示字体为幼圆,字体大小推荐为16 lb,颜色为白色(RGB值255、255、255),背景色RGB值为3、17、34[6]。车载模式信息在DMI上的显示位置见图2。

然而对列控系统在运行线上进行黑盒测试时(如联调联试、型式试验等)只能通过摄像机或照相机等设备实时采集DMI的图像显示。同时,采集DMI显示信息时的周围环境具有不确定性,会影响图像采集的质量。例如环境明暗变化、环境中运动物体在屏幕上形成的光影、列车运行引起晃动影响对焦、为避开司机操作对显示屏幕的遮挡而从侧边对显示图像进行采集等。这些都导致了采集信息的失真。图3为车载模式在DMI上显示的实际采集结果示例,该采集图像采用摄像机采集并截图得到,摄像机位于司机驾驶室内,从DMI屏幕右侧约45°对图像进行采集。信息采集时列车最高速度310 km/h。

图3中,由于显示信息实时采集过程中受到晃动影响对焦、光线明暗变化以及图像分割等造成图像中文字位置、大小等不一致,影响分类。因此,首先需要对图像进行滤波、增强、分割及规整化等预处理,见图4。

( 1 )

( 2 )

式中:φ∈Rm×r。

( 3 )

2 基于改进的PSO参数寻优的SVM分类

为了对提取的特征进行分类,采用在解决小样本、非线性及高维模式识别中表现出许多特有的优势支持SVM 算法[8]。SVM最初来源于线性可分的2分类问题,通过寻找最优超平面将样本数据进行分类。数学上,2分类SVM方法可以描述为下面2次规划问题的求解

s.t.yiwT·xi+b≥1-ζi

c≥0ζi≥0,i=1,2,…,l

( 4 )

式中:c是惩罚参数;ζ是松弛变量;l为样本数。通过求解其对偶问题可以得到分类判别函数

( 5 )

Kxi,xj为核函数, 使在低维空间非线性不可分的特征变量投影到高维空间中变为线性可分。其中,径向基核函数(RBF)在不同维数、不同样本数情况下均表现出较好的学习能力,应用比较广泛。[9]因此,本文采用径向基核函数作为SVM的核函数。其形式为

K(x,y)=exp[-γ‖x-y‖]

( 6 )

对于多分类问题,可以将其分解为2分类问题进行处理,如进行1类与其他类划分的“1对多”方法、为任意两个类建立分类器的“1对1”方法以及利用二叉决策树的方法。构建基于RBF核函数的SVM分类器(RBF-SVM)后,需要决定最优参数(c,γ)。

参数的选取不一样,SVM的分类效果就有一定程度的不同[10]。若在参数范围内以穷举法搜寻最优参数,则运算效率低下,因此本文提出一种改进的PSO算法以获得最佳的(c,γ)参数对。

PSO算法最早由Kennedy与Eberhart提出[11],是1种启发式的全局搜索优化算法。假设在d维的目标搜索空间Xmin~Xmax中有n个潜在问题解组成1个粒子群S={X1,X2,…,Xn},其中d维向量Xi(i=1,2,…,n)表示第i个粒子在搜索空间中的位置,通过求解目标函数得到群中每一粒子的个体解(个体适应度)Pi及群体最佳解(全局适应度)Pg,然后每个粒子按下式更新位置

( 7 )

式中:k表示迭代数;w为惯性参数,权衡全局与局部搜索能力;c1,c2是一个常数,代表学习因子;r1,r2是两个均匀分布于[0,1]之间的随机参数。PSO作为一种群体智能算法,由于简单且易于实现,因而在优化领域得到广泛的应用。但是基本的PSO算法容易存在容易陷入局部极值的缺点[12],因此为了提高算法性能,在Eberhart等人的研究[13]的基础上,对惯性常量w进行优化。考虑到粒子Xi具有不同范围的不同变量,本文将w定义为一个d×d的自适应变化的对角系数矩阵

w=diag(w1,w2,…,wd)=

( 8 )

( 9 )

式中:rand表示[0,1]内的随机数,随机矩阵R=diag(rand1,rand2,…,randd)。

在本文中,需要优化的参数为Xi=[ci,γi]T,适应度值RBF-SVM对训练样本的正确分类率。

3 实验与分析

首先对比PCA降维、2DPCA降维以及不降维情况下模式识别效果。样本数据为经过二值化预处理得到的20×30像素二值图像,共574个测试样本。进行不同降维处理后,结果见表1。

表1 PCA、2DPCA降维识别结果

从表1中可见,降维到同样维数时(原来维数为600,降维至200),2DPCA降维方法相比PCA方法虽然提取的主成分个数较少且主成分累计贡献率较小,但样本识别率基本一样。同时可见采用两种降维方法与不降维时识别率相差不大,因此在样本数量很大时,可以采用2DPCA来降低SVM模型处理数据的规模。

对网格寻优与粒子群算法寻优这两种SVM参数寻优方法进行对比,选取测试样本数为574个,重复测试次数为10次。结果见表2。

表2 网格寻优、PSO算法识别结果

从表2中可见,网格寻优方法平均运行时间要远大于PSO算法,因为其类似于穷举法,需遍历网格中的所有点,所以效率较低。从识别效果来看,两种寻优算法基本一样。综合考虑,应优先选取PSO算法。

进一步对比PSO算法改进前与改进后的效果,本文以下式作为适应度测试函数

(10)

当(x,y)→(0,0)时f(x,y)趋于极值1。该函数具有许多局部极值点。

应用基本的PSO算法寻找最大值(最佳适应度)的结果见图5。可见在迭代次数为80代左右后,适应度值在非常长一段时间内没有变化,说明算法陷入了局部极值点,直到450代左右才跳出局部极值点,找到最大值(0.990 03),很明显算法耗时过长。在算法的种群初始化数据不变的前提下,应用本文提出的改进的PSO算法对式(10)寻优的结果见图6。很显然,算法没有陷入到局部极值中,并且能够很快的收敛找到最大值(0.995 86),说明了本文提出的对PSO算法的改进是具有明显效果的。因此,采用该改进的PSO算法对RBF-SVM参数寻优。

本文以完全模式、部分模式、目视行车模式、待机模式、冒进模式、冒进后防护模式等6种模式为训练和测试样本。其中,以RBF-SVM分类器对180个训练样本的再分类的准确率为适应度值,以经过改进的PSO算法对两个参数(c,γ)的寻优见图7。

从图7可见,改进了的PSO算法使得适应度值在第3次迭代时便获得了100%的适应度值,确定的(c,γ)参数对为(18.34,0.01)。

在确定了RBF-SVM参数后,如果采用对应于图4(a)的对图像分割后填充的归一化大小方式,提取特征向量后通过SVM分类识别的结果见表3。

表3 列控工作模式识别结果

可以看到,某些类别的识别率并不理想,如对目视工作模式的识别率只达到了67.6%。主要原因在于当变换得到用于特征提取的图像较小时(如20×30像素),则文字区域更小,图像更加模糊,即使提取主要特征后也不利于分类。而若变换成更大的图像,由于冗余信息黑色像素较多,图像降维后仍然使得SVM的分类效率较慢。而如果采取割出文字区域后直接归一化同样大小后(如20×30像素)再进行特征提取、训练分类,则识别效果可以得到明显提升,见表4。

表4 列控工作模式识别结果

为了更直观地表示表4的分类结果,给出了分类的混淆矩阵,见表5,表示表格第一列(类别)中的工作模式分类的结果。

表5 列控工作模式识别的混淆矩阵

从表4可见,经过SVM分类后,基本上各个工作模式都能够正确识别,测试574个样本的基础上,平均识别率达到了98.3%。而通过表5的混淆矩阵可以看到,部分模式有1个样本错误的分类成了目视模式,而目视模式则分别有3个样本错误分类成了完全模式、6个样本错误分类成了待机模式。主要的原因在于,当获取的图像中文字不够清晰时,在进行二值化处理后就有可能得到形态与其他模式类别相近的图像,最后对分类造成影响。尽管如此,总体的识别率仍然很高。

4 结束语

本文研究了列车运行控制系统DMI显示的列车工作模式的分类识别,对分割出来的显示工作模式的区域利用2DPCA进行特征提取后,利用RBF-SVM进行分类,其中RBF-SVM的参数用改进了的PSO算法进行了优化,实现了列车工作模式DMI显示的正确识别。实验表明,通过本文的方法达到了平均98.3%的识别率,对DMI图像其它显示信息的识别与设备自动化测试具有参考意义。

参考文献:

[1] 唐涛.列车运行控制系统[M].北京:中国铁道出版社,2012.

[2] 张勇,覃燕,李凯,等.CTCS-3级列控系统车载设备人机界面信息的识别方法[J].中国铁道科学,2010,31(4):92-99.

ZHANG Yong, QIN Yan, LI Kai, et al.The Method for Recognizing Driver Machine Interface Information of the Onboard Equipment in CTCS-3[J]. China Railway Science,2010,31(4):92-99.

[3] DEEPA B, KUMAR S S. Optical Character Recognition: An Overview and an Insight[C]//Proceedings of 2014 IEEE International Conference on Control, Instrumentation, Communication and Computational Technologies. New York:IEEE, 2014:1361.

[4] WANG Zhenyan.Chinese Character Recognition Method Based on Image Processing and Hidden Markov Model[C]// Proceedings of 2014 IEEE Fifth International Conference on Intelligent Systems Design and Engineering Applications (ISDEA). New York:IEEE, 2014: 276-279.

[5] PATEL D K, SOM T, SINGH M K. Multiresolution Technique to Handwritten English Character Recognition Using Learning Rule and Euclidean Distance Metric[C]//Proceedings of 2014 IEEE International Conference on Signal Processing and Communication (ICSC). New York:IEEE, 2013: 207-212.

[6] 中国铁路总公司文件.铁总运[2014]30号CTCS-2/3级列控车载设备人机界面(DMI)显示暂行规范[Z].北京:中国铁路总公司,2014.

[7] LI X, PANG Y, YUAN Y. L1-norm-based 2DPCA[J].IEEE Transactions on Systems, Man, and Cybernetics. Part B, Cybernetics: A Publication of the IEEE Systems, Man, and Cybernetics Society, 2010, 40(4): 1170-1175.

[8] VAISHNAV A P, GANATRA A P, BHENSDADIA C K. Support Vector Machine Classification Methods: A Review and Comparison with Different Classifiers[J].Data Mining and Knowledge Engineering, 2011, 3(1): 45-52.

[9] 王泳, 胡包钢.应用统计方法综合评估核函数分类能力的研究[J].计算机学报, 2008, 31(6): 942-952.

WANG Yong, HU Baogang. A Study on Integrated Evaluating Kernel Classification Performance Using Statistical Methods[J]. Chinese Journal of Computers,2008, 31(6): 942-952.

[10] 林升梁,刘志.基于RBF核函数的支持向量机参数选择[J]. 浙江工业大学学报, 2007,35(2):163-167.

LIN Shengliang,LIU Zhi.Parameter Selection in SVM with RBF Kernel Function[J]. Journal of Zhejiang University of Technology, 2007,35(2):163-167.

[11] POLI R, KENNEDY J, BLACKWELL T. Particle Swarm Optimization[J]. Swarm Intelligence, 2007,1(1): 33-57.

[12] 唐俊. PSO算法原理及应用[J].计算机技术与发展, 2010(2):213-216.

TANG Jun. Principle and Application of PSO Algorithm[J].Computer Technology and Development, 2010(2): 213-216.

[13] SHI Y, EBERHART R C. Parameter Selection in Particle Swarm Optimization[C]// Proceedings of IEEE 7thAnnual Conference on Evolutionary Programming.New York:Springer-Verlag, 1998:591-600.

猜你喜欢
列控控系统识别率
关于DALI灯控系统的问答精选
列控联锁数据管理分析平台的研究与探索
联调联试中列控系统兼容性问题探讨
列控中心驱采不一致分析及改进方案
基于类图像处理与向量化的大数据脚本攻击智能检测
计算机工程(2020年3期)2020-03-19 12:24:50
便携式列控中心测试设备设计与实现
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
列控数据管理平台的开发
高速公路机电日常维护中车牌识别率分析系统的应用