杨力川
(四川大学计算机学院,成都610065)
随着私人汽车保有量不断上升,交通标志的识别这一领域开始凸显越来越大的影响力。交通标志识别是智能交通系统的重要内容,在无人驾驶和驾驶员辅助系统中具有重要的应用以及发展前景,并且为自动或半自动驾驶车辆提供有用的道路信息。
交通标志识别的内容主要有交通标志图像检测、特征的提取以及最后的分类。而在较为复杂的自然场景中,各种外部因素使得准确又较快地完成交通标志识变得有不小难度。
因此,在当下智能交通发展的趋势下,需要借助更为科学和先进的工具来进行交通标志识别。交通标志识别的传统方法在精确度和速率已经不足以达到当前无人驾驶系统的需求。而依靠图像的颜色和形状特征来匹配的方法固然简单方便而且速度快,但识别率和精确度难以达到实际的要求。而基于深度学习的交通标志识别方法则不同,在识别目标的同时进行训练,双管齐下有效地提高了识别精度并且减少了耗费时间,能够在复杂自然情况下较为有效地提高交通标志的识别正确率,成为交通标志识别的新兴热门领域。
交通标志识别是实现智能驾驶的重要一环。所谓的标志识别就是通过车内的摄像设备捕获到的图像信息,来对这些标志进行设别,然后再把这些信息反馈给驾驶员,做到及时提醒,进而保证行驶安全。例如,当驾驶员劳累、注意力分散、情绪波动、走神、或受到雾霾等外在自然因素,此时驾驶员依靠自己的肉眼不能快速并且准确获得相关的交通标志信息,高效准确的交通标志识别技术就变得相当有必要。
随着神经网络和深度学习的发展,交通标志识别也开始运用相关的技术。卷积神经网络(Convolutional Neural Network,CNN)是深度学习的核心部分。CNN在检测性能和准确率方面都比传统检测识别有优势,尤其是遇到复杂情况下的交通标志检测,包括物体遮挡、拍摄角度、形状改变、天气因素之类的,在这些情况下进行交通标志识别仍然是目前研究的难点部分,还需要进一步的发展。
早期的交通标志识别方法基本大概由两部分组成。一类是基于颜色、形状视觉信息等进行识别,另外一类是基于特征提取与机器学习进行识别。
这类方法主要通过对目标图像相关特征进行提取,进而把图像中的交通标志志进行图像分离并且检测出来,接着进行分类,虽然这种方法的检测速度比较快,但是正确率就相应的偏低。这种算法的核心是对图像的颜色空间进行选择,大部分颜色空间特征是RGB,当亮度发生变化时,就不能单一的选择RGB,解决的方法也有很多。包括调整通道的比值或者是对RGB值进行处理,再或者将其转至另外的颜色空间(HIS、HS等)中进行处理。
朱双东等人[1]把图像从RGB模型转化成HSI模型,然后再从H通道值中提取出红色,随后用模板LOG提取边缘,最后用BP网络来对图像进行处理。初秀平等人[2]将图像从RGB颜色模型转换到色度-饱和度-亮度的HSV颜色模型,并对图像进行分割,最后在进行二值化处理。再例如Paclik等人[3]将目标从RGB模型转为HSI模型,通过选择合适的阈值来获得所需的颜色,进而进行识别检测。C.Y.Fanga等人[4]提出了一种依据人类的眼球结构的识别系统,通过对图像的红黄蓝信息的提取来检测,黑色和白色信息来识别。朱国康等人[5]针对图像中的标志大小不一和位置不一定的情况,对目标的多种特征进行融合,他们先对样本进行相应的预处理,再对图像进行裁剪,提取相应区域的颜色,最后对颜色形状等特征进行分类检测,完成标志识别。这些根据颜色以及形状特征的交通标志识别方法尽管在准确性方面进行了不少的优化,但是面对某些特殊情况,如标志受到破坏时,再使用这类方法的效果就不是很好,识别所需时间较长,效率偏低。
此类算法核心内容是抽取被训练图像中目标区域的特征,再对其进行训练,将分类器进行特征匹配,来完成交通标志的识别工作。这种方法的难点在于找出那些最重要的特征,当无法准确判断所需的特征是否满足要求时,人们会偏向多取特征,甚至不做分析,将无用的测量值用作分类特征,造成的结果不仅是耗时,而且对结果造成巨大影响。这类方法需要先对测量值分析,获得有效的特征识别,并且再保证一定分类精度下,减少特征的维数,让分类器的分类变得快速准确且高效。
支持向量机(Support Vector Machine,SVM)是其中重要的一环,它在速度和准确率上都表现出令人满意的一面,SVM分类器参与的检测能够满足大部分基本的需求。张兴敢等人[6]通过卷积变换获得图像的特征,其中输入层采用滑动窗口计算卷积,接着把激活函数作为输出,得到数个特征图,单个特征图也是由多个图卷积得到的,这样得到的实验结果的准确率明显提高。Creusen等人[7]通过有向梯度直方图(HOG)算法针对大规模全景数据集上的交通标志检测,该算法在特征向量中加入颜色信息进行扩展。而这一举措显著提高了检测性能,HOG算法性能很高,此外,他们也提出了一种新的迭代向量机训练模式处理图片,优点是能够降低内存消耗并且提高背景信息效率。
Huang等人[8]提出了一种由方向梯度变量直方图(HOGv)和极值学习机(ELM)算法训练分类器的检测方法。提取的HOGV的特征在冗余和特定细节间有良好的平衡关系,而基于ELM的分类器又在输入层和隐藏层之间实现随机特征映射,带来的好处就是不需要逐层调整,所以可以满足大部分特征提取的精度要求。这几种方法要进行分类识别需要分类器,效率并不是很高。
卷积神经网络(CNN)作为深度学习的重要组成部分,在检测识别领域获得了许多成果,学者将其用于交通标志识别领域,让这个领域进入一个新的里程碑。与上面两种交通标志识别方法不同的是,CNN可以在训练的同时提取特征,即一边提取一边训练,双管齐下,有效提高检测和训练效率,并且检测性能上也不落后甚至更优于传统交通标志识别。Schmidhuber等人[9]运用CNN识别交通标志,得到了非常高的正确率。其正确率达到99.46%。他们使用了一个快速的,完全参数化的GPU实现的深度神经网络。在监督学习下,训练了不同组合而成的单个多列,再一次地提高了识别正确率,并且也降低了对光照以及对比对变化的敏感度。Jin等人[10]则通过一种铰链损失随机梯度下降(HLSGD)方法训卷积神经网络(CNN)。HLSGD经过评估,具有更快和更稳定的收敛性,最好的结果是有99.65%的识别率,具体是通过编写一个图形处理单元包来训练多个CNN并集成最终分类器。Ren等人[11]提出依赖候选区域算法(RPN)的检测网络,共享完整的图像卷积特征,从而实现了近乎无成本候选区,并且把相关过程放在GPU上运行,在目标检测领域达到了很高的检测正确率和较快的速度。伍晓晖[12]则从小目标交通标志识别入手,在精度方面在已有的Tiny-YOLOv3交通标志检测算法上进行了改进,加深特征金字塔图层,具有比较好的鲁棒性。并且增加网络的宽度和深度,用批量归一化处理样本,再一次提高原网络的精度。
虽然基于深度学习的目标检测方法在国内外已经取得不少的成果,但是将这类方法还没有大规模使用,还有很大发展空间。
本文介绍了基于深度学习的交通标志识别相关的研究和技术,解释了其技术的核心内容,并举出传统交通识别的相关研究,对比分析,剖析其优缺点。在深度学习、神经网络出现后,在目标检测和识别方面有巨大优势,交通标志识别也因此向前迈进了一大步。随着越来越多的目光投向这个领域,基于深度学习的交通识别适用面也越来越广,研究人员对其中神经网络的优化工作也越来越重视,识别的准确率也就越来越高。相信在不久之后,基于深度学习的交通标志识别会广泛应用,无人驾驶和自动驾驶也就更进一步了。