杨树旺
(中铁第一勘察设计院集团有限公司,陕西西安 710043)
伴随计算机及信息技术的发展,以全自动驾驶车辆为代表的新技术为城市轨道交通注入新的活力。为提高全自动驾驶车辆检修作业的信息化水平,完善车辆检修基地的信息化建设,将全自动驾驶车辆基地自动驾驶区综合管控系统所产生的监测数据与对应车辆进行绑定,即可形成特定车辆的专属“病例”档案,便于检修管理决策以及车辆性能改进。而要实现上述目标,就必须完成车辆编号的自动识别。
车辆编号自动识别技术的实现主要经历了射频技术与电子标签结合、图像识别技术等阶段,但由于涉及车辆结构改造以及易受异物影响等原因,使用效果均不理想。随着大数据技术的发展,深度学习技术逐渐在车号识别研究领域有所应用。胡路路、张亮等采用目标检测算法、文字检测网络(Connectionist Text Proposal Network,CTPN)模型实现了车辆编号的识别,准确率超过95%。但该种方法模型迭代次数极高,需要大量的样本数据提高识别准确率。
本文基于深度学习、目标检测、机器视觉和光学字符识别(Optical Character Recognition,OCR)等技术,研发新型车号识别系统。该系统利用车辆标志与编号相对位置固定的特点,大幅减少模型训练所需的样本数量。
深度学习是机器学习的分支,是一种以人工神经网络为架构,对资料进行表征学习的算法。本系统使用的深度学习技术框架为Darknet。Darknet深度学习框架支持中央处理器(Central Processing Unit,CPU)和图形处理器(Graphics Processing Unit,GPU)计算,且支持开源计算机视觉库(Open Source Computer Vision Library,OpenCV)和共享内存并行编程(Open Multi-Processing,OpenMP),同时Darknet框架具有结构清晰,源代码查看、修改方便的优点。
目标检测是计算机视觉及影像处理中的术语,指的是让计算机去分析1张图片或者1段视频流中的物体,并标记出来。本系统使用YOLO目标检测算法,其算法示意图如图1所示。YOLO算法将输入图像缩放成统一大小的尺寸,利用整张图片作为输入进行特征的提取,将最后的特征图划分为S×S个网格,每个网格可以看成是1个候选框,每个候选框包含了4维位置坐标信息和1维目标类别置信度,然后分别对每个网格进行目标分类和边框回归,实现目标搜索。
机器视觉是配备有感测视觉仪器(如自动对焦相机或传感器)的检测机器,可用于检测产品缺陷、判断并选择特定物体,或用于测量尺寸等,大量应用于工厂自动化检测及机器人产业中。
OCR是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。本系统使用开源算法Tesseract。支持Tesseract 的Leptonica组件有着优越的图像分析性能,保证文字识别的精度。除此之外,Tesseract还具有多平台的可移植性,拥有庞大的Unicode字符识别库。OCR 检测与文本识别主要包含图像预处理、版面分析、图像切分、特征提取与模型训练、识别后处理等,其流程如图2所示。
基于上述技术,本文研发的基于深度学习目标检测的车号识别系统主要由高速摄像头、光电反射车感器、边缘计算机及信息传输模块组成,工作流程如图3所示。
(1)在列检库司机登车平台端部,采用可调节吊杆机构吊装车号识别摄像机,使其能够在车辆经过时在同一画面中拍摄到车辆的标志(LOGO)和车号,车号识别摄像机安装位置如图4所示。在该股道车辆入库位置部署1台边缘计算机和1个光电反射车感器,地铁车辆经过时触发车感器,边缘计算机通过车感器检测到车辆到来,触发摄像头录制短视频。
(2)边缘计算机内置检测程序,使用深度学习目标检测技术逐帧检测视频是否拍到车辆LOGO,如果没有检测到则判定为车感器误触发;如果检测到车辆LOGO,则通过检测程序计算得到LOGO在图像上的位置和像素尺寸大小。
(3)根据车头正面LOGO与车号之间的相对位置和大小比例关系(预置在检测程序中),基于机器视觉技术计算出车号在图像上的位置和大小,找到车号位置,图像裁减后使用OCR算法进行文本识别,得到车号数据。由于摄像头不可能安装在车头正前方,车号图像会有变形,裁减车号位置的图像后,可通过透视变换矫正图像,以改善图像变形对识别结果的影响。
(4)边缘计算机按照通信协议要求将车号数据、车感器被触发的时间以及边缘计算机编号通过网络发送给上级服务器。上级服务器据此形成特定车辆的位置记录。
地铁车辆的车头部分标识了车辆编号及车辆LOGO,如图5所示。不同车辆的车号不同,但LOGO的位置及形状固定不变。系统在策略上的与众不同之处在于,不直接识别车号,而是先识别出LOGO,根据LOGO与车号之间的位置关系,找到车号所在区域,然后再识别车号。由于LOGO是固定不变的目标,相比车号的识别准确度会更高,深度学习时所需要的样本更少,训练速度更快。
依托南宁地铁那洪车辆基地的建设,实施全自动驾驶车辆基地作业综合管控系统。其中停车列检库的车号识别系统安装完毕后,在现场进行为期2个月的调试测试,数据统计结果如图6所示。
由图6可知,测试前期识别成功率曲线波动较大,成功识别车号数量较少;随着调试过程的推进,识别成功率逐渐上升,并趋于稳定,但仍有个别数据波动产生。通过故障分析显示,个别股道未能成功识别车号的原因均为车感器未被触发、摄像机未拍摄录像等硬件设备原因,除此之外,在硬件设备正常运转、摄像机正常工作的其余股道,车号识别系统均正确识别出所在股道的车辆车号。在调试后期,系统的识别准确率也趋于稳定。
当前国内城市轨道交通发展迅速,本文从全自动驾驶车辆基地自动驾驶区综合管控系统的实际需求出发,综合深度学习、目标检测、机器视觉以及光学字符识别技术,利用地铁车辆车号与车辆标志相对位置不变的特点,开发了地铁车辆的车号识别系统。经过现场安装测试,证明其能够成功识别车辆编号,准确率及可靠性均达到使用要求,可为解决传统地铁车辆检修基地车号识别问题提供有效的解决方法,为持续推进车辆基地运用检修管理信息化提供有力保障。