张丽艳,张伟,龙美芳,刘鑫
(大连交通大学 电气信息工程学院,辽宁 大连 116028)*
交通标志识别是无人驾驶领域的关键技术之一.如何及时准确的识别出路面标志是该领域研究的重点.Huang[1]等人提取交通标志的HOG特征,使用机器学习算法识别交通标志,缩短了识别的时间.Keren Fu[2]将交通标志形状特征和超像素的距离图相融合的方式识别交通标志,识别的效果得到了改善.Yuan[3]等提取交通标志的全局颜色特征和局部边缘特征,再选取SVM分类器识别,识别效果较好.M.K.Hu[4]在1961年提出了不变矩的概念,是一种提取灰度图像特征的方法,后来在交通标志识别方面得到了较好的应用.本文将HOG特征与不变矩特征相互结合给出了一种路面标志识别的方法.
路面交通标志的分类识别流程[5-10]分为两大部分,即训练部分及测试部分.训练样本是训练图像的特征数据,对图像特征提取时通过实验来选择特征提取的算法.通过使用测试集对训练的识别模型进行测试来调整分类器的参数,构建优良的分类器系统.路面交通标志识别原理框图如图1所示.
图1 基于支持向量机的路面交通标志识别原理框图
M.K.Hu[4]在1961年提出了不变矩的概念,并在此不变矩的基础上构造了7个不变矩,被称为Hu不变矩,主要是利用二阶和三阶的归一化中心矩导出了如式(1)~式(7)的七个不变矩组(Φ1~Φ7),它们在图像平移、旋转和比例变化时保持不变.
Φ1=η20+η02
(1)
Φ2=(η20-η02)2+4η112
(2)
Φ3=(η20-3η12)2+3(η21-η03)2
(3)
Φ4=(η30+η12)2+(η21+η03)2
(4)
(5)
(6)
(7)
Hu不变矩具有平移、灰度、尺度、旋转不变性,是一种高度浓缩的图像特征.但由于七个不变矩的变化范围很大且可能出现负值的情况,所以本文选择对七个Hu不变矩进行取对数运算,如式(8)所示.
Hk=lg10|Φk|(k=1,2,…,7)
(8)
提取路面交通标志图像的H1~H7作为路面交通标志的Hu不变矩特征值.
PHOG是分层的梯度方向直方图(Pyramid Histogram of Oriented Gradients,PHOG),也称为金字塔方向梯度直方图,是在HOG特征的基础上发展起来的,对图像局部区域的梯度方向的一种描述.HOG相较于其他的特征描述方式有很多优越性.首先,HOG操作的部位为图像的局部方格单元,所以图像光学形变和几何形变不变性保持良好.其次,在方向较精细的抽样和较强的局部光学归一化等条件下对图像特征的检测效果较优良.HOG特征提取算法的实现流程和示例如图2所示.
特征向量f={x1,x2,……,xn}
PHOG特征[10-11]的提取是在HOG特征基础上将图像尺寸固定,对图片进行不同尺度的划分:第一层,只有1个区域;第二层:分为2*2个区域;第三层:分为4*4个区域;……在同一划分尺度图里面,每个区域算出一个HOG特征,按顺序进行拼接,得到当前尺度图的HOG特征.把所有尺度图的HOG特征进行拼接,就得到整个图像空间尺度金字塔的PHOG特征.当把不同尺度上得到的HOG连接起来时,要把其归一化.因为小尺度中的HOG任意一维的数值很可能比大尺度中任意一维的数值大很多.PHOG相对于HOG可以检测到图像不同尺度的特征,表达能力更强,有较强的抗噪性能和一定的抗旋转能力.
Hu不变矩特征是对图像的高度浓缩,所以Hu不变矩可以快速的获取目标的大致轮廓特征,但是对图像局部的,细节的地方描述的不够好.PHOG是对图像局部区域的梯度方向的一种描述,是方向较精细的抽样.由此可以看出可以把两种特征提取算法进行组合,从而利用组合的特征对图像的特征进行描述.因PHOG提取到的特征向量维数越大,对图像的描述性越好,但图像特征的提取时间也增加了,且提取的特征向量维数越大图像信息会有冗余,识别准确率反而降低.所以本文提出将Hu不变矩特征和低维的PHOG特征相融合的特征提取算法,融合后的特征中的Hu不变特征可以快速的提取图像的大致形状特征,然后用低维的PHOG特征用来对图像细节特征进行补充.期望用得到的融合特征[Hu+PHOG]提取图像特征时,既能很好的对图像进行描述,又能保证特征提取的实时性.
本文算法仿真的软件环境是Matlab R2014a, 电脑配置为:Inter(R)Core(TM)i5-2450M CPU 2.50 GHz,内存为4.00 GB.对融合特征[Hu+PHOG]进行路面标识识别,采用的的多分类支持向量机的核函数是LibSVM中高斯核函数,惩罚因子C为1进行仿真.仿真的实验样本采用正常光照下车载摄像头拍摄的视频帧中获得的的交通标志为750幅目标图像,其中有菱形减速标志、人行横道标志、右拐标志、直行及右拐标志和直行标志5种,每种图像各150幅,其中100张用来训练,另外50幅用来测试.本文采用不同维数的Hu不变矩特征和不同维数的PHOG特征串联成融合特征[Hu+PHOG]维数据.为了对融合特征对路面交通标志目标图像的提取效果进行衡量,引入测试集样本识别准确率R和识别时间T.其中测试集样本识别准确率R的表达式(9)所示.
(9)
式中,m表示测试集样本中五种路面交通标志中被正确识别数量,M为总的测试样本数量,本实验中M值为250.识别时间T为从750幅样本集中第一幅图像输入开始,到得到识别准确率为止.
仿真结果如表1所示.
表1 三种特征提取路面交通标识识别结果
由表1可知,随着支持向量机中的特征维数变大,识别时间增加,表中的识别时间是识别250幅图像的时间和.而识别率逐渐提高,但是当维数过大时又出现了识别率的下降,因为对于特征维数本文考虑识别率和识别时间选取了22维,即7维的Hu不变矩和15维的PHOG特征.因为支持向量数目即特征维数越小,算法复杂程度越小,进行训练和检测的运算量越小,反之亦然.所以在本文算法中将支持向量的数目作为SVM的性能指标来衡量特征维数对识别效果的影响.识别错误的标志主要是因为由于磨损导致路面交通标志模糊所致.对于这种标志可以采用预处理的方式提高标志边缘特征,从而提高整体算法的识别率.
本文给出了一种融合特征的路面交通标志识别方法,该方法的识别率可以满足实际应用需要,此外,该方法的识别时间也可以满足实时识别的性能要求.因此本文方法具有实际应用的价值.