黄有望 白新国
摘 要: 针对当前警示标志识别正确率低、识别速度慢等不足,提出基于视觉传达的警示标志识别方法。首先提取警示标志识别的一些特征,然后结合人的视觉传达感知设计一些规则,最后采用神经网络实现警示标志识别,并通过具体实验测试该方法的有效性和优越性。测试结果表明,所提方法提高了警示标志识别的正确率,有效改善了警示标志识别的速度,而且警示标志识别效果明显优于当前其他警示标志识别方法。
关键词: 视觉传达; 警示标志; 识别方法; 识别正确率; 识别速度; 神经网络
中图分类号: TN911.73?34; TP181 文献标识码: A 文章编号: 1004?373X(2018)11?0129?04
Warning signs recognition method based on visual communication
HUANG Youwang1, BAI Xinguo2
(1. College of Apparel & Design, Xian Polytechnic University, Xian 710048, China;
2. College of Computer Science, Xian Polytechnic University, Xian 710048, China)
Abstract: Aiming at the shortcomings of low recognition accuracy and slow recognition speed of warning signs, a warning signs identification method based on visual communication is proposed. The characteristics of warning signs recognition are extracted, and combined with the human′s visual perception to design some rules. And then the neural network is used to realize the warning signs identification. The effectiveness and superiority of the method were verified with specific test. The test results show that the method can improve the recognition accuracy and recognition speed of the warning signs, and its recognition effect is better than that of other warning signs recognition methods.
Keywords: visual communication; warning sign; identification method; recognition accuracy; recognition speed; neural network
隨着经济的迅速发展,城市化进程速度不断加快,城市道路和建筑越来越复杂,出现了许多警示标记,这些警示标记可以帮助人们迅速离开危险环境,以便更好地保护人身安全与财产安全。因此,对警示标记进行准确识别具有十分重要的意义[1?3]。
针对警示标记识别问题,学者们提出了许多有效的警示标记方法,在警示标记识别的研究中,首先要提取警示标记识别特征,然后采用相应的方法对警示标记进行分类和识别[4?6]。当前警示标记特征很多,如形状特征、颜色特征等,单一特征一般无法获得性能较优的警示标记识别结果,因此当前主要采用多个特征实现警示标记。警示标记识别常用神经网络或者支持向量机进行,其中支持向量机的学习速度比较慢,导致警示标记识别的效率低,而神经网络的学习速度虽然快于支持向量机,但是识别效果有待进一步提升[7?9]。但是以上的警示标记识别方法忽略了人的视觉特点,导致警示标记识别不稳定,而且误识率比较高。视觉传达是一种新型技术,可以根据人的视觉对警示标志进行设计,有助于改善警示标志识别效果[10]。
针对当前警示标志识别正确率低、识别速度慢等不足,提出一种基于视觉传达的警示标志识别方法。测试结果表明,本文方法提高了警示标志识别的正确率,有效改善了警示标志识别的速度,而且警示标志识别效果要明显优于当前其他警示标志识别方法,具有更高的实际应用价值。
人们在生活中,通常通过视觉感知90%的信息,不同人感知方式、视觉效果差异很大,因此可以通过视觉传达技术帮助警示标志识别。色彩从情绪以及机能干扰人们的心理状态,使得人们在行为上做出不同的反应,同人们的生活环境以及文化素质等相关。不同人对差异色彩间的关联性,形成差异的冷暖、硬柔等体验,进而影响人们对警示标志的感受状态。差异色彩环境中人的情绪存在较大的波动,如红、橙、黄是暖色,其可刺激人们的视觉,调度人的兴奋点,则在交通导向标识以及警示标志中通常采用这些暖色。青、蓝、紫是冷色,能够使得人们的情绪保持稳定,这类颜色大都应用到医院、工程和办公领域。在警示标志识别过程中,人们对不同色彩以及形态产生不同的心理反应,基于心理反应内的相似性设计合理的警示导向符号以及视觉效果,对于提高警示标志的识别效果具有重要作用。
强弱光照作用会干扰人眼视觉,对比度低于3[∶]1的物体是反射光的最佳环境。正常光照环境下,距离55 cm是观测目标事物的最佳距离。如表1所示,研究的水平分割性能从中心到四周大幅度降低。融合光照和导向设计规划警示标志,能够实现视觉传达的审美性能。分析人们视觉感知领域获取的详细数据,可对基于城市视觉传达的警示标志进行科学的设计,对警示标志的大小、高度以及部署位置实施合理规划,对警示标志的高度、视距以及字体大小和颜色等元素实施控制,可以提高用户对不同警示标志的识别效率和准确度。
由于警示标志是一种图像,图像的采集受到外界因素的影响,导致图像质量不高,警示标志有时不清楚,需要对警示标志进行预处理,具体步骤如下:
背景建模是指从图像中提取警示标志的目标区域,采用视频帧差方法实现警示标志的提取。设警示标志图像序列为[{Ii(x,y)},i=1,2,…,N,][(x,y)]表示警示标志的像素位置,[i]表示警示标志的帧序,[N]为警示标志的帧总数,那么警示标志图像之间的帧计算公式为:
[CDMi(x,y)=d, d≥T0, d 式中:[d=Ii+1(x,y)-Ii(x,y);][T]表示警示标志的差分阈值。 在提取警示标志的区域后,将有用的警示标志分割出来,采用时域差分法对警示标志进行标分割,即: [F(I,B)=1-2×(I+1)×(B+1)(I+1)+(B+1)× 2×(256-I)×(256-B)(256-I)+(256-B),] [0≤f(I,B)<1, 0≤I(x,y)≤255, 0≤B(x,y)≤255] (2) 式中:[B]表示警示标志的像素值;[I]为当前警示标志帧的像素值。 采用二值化方法对分割后的警示标志进行处理,消除警示标志噪声,即: [Mx,y=1,f(Ixy,Bxy)≥T0,otherwise] (3)2.2 提取警示标志的特征
2.2.1 提取警示标志的LBP特征
LBP算子常为一个矩形区域,包括1个中心和8个邻域像素,它们都有自己的灰度值。首先比较全部邻域像素与中心点的灰度值,根据比较结果标记为“1”或者“0”,所有的“1”和“0”组成一个矩阵,该矩阵刻画灰度变化,具体工作过程如图1所示。
扩展LBP算子为:
[LBPP,R=P=0P-1sgP-gc2P] (4)
式中:[gc,][gP]为中心和邻域像素的灰度值;[P]表示邻域的像素个数;[R]表示半径。
同时可以得到:
[sgP-gc=1,gP-gc≥00,otherwise] (5)
对LBP特征值做如下处理:
[LBPriP,R=minROR(LBPP,R,i) i=0,1,2,…,P-1] (6)
式中ROR为移位操作符。
对于一幅警示标志图像,提取其纹理特征,对它们的直方图进行归一化操作,结果如图2所示。
灰度共生矩阵可以描述警示标志的纹理特征,[Oxyz]表示一个三维坐标,其中,[z]轴表示警示标志图像的灰度标,[Nx]表示警示标志的图像总像素数值,具体如图3所示。
从一个像素点[i]开始,其相邻像素数为[j,]它们之间的距离为[d,]角度為[θ,]那么它们在警示标志中同时存在的概率为:
[P(i,j,d,θ)=(x,y)f(x,y)=i,f(x+dcosθ,y+dsinθ)] (7)
采用同质区(HOM)、角二阶矩(ASM)、熵(ENT)和非相似性(DIS)构建警示标志的灰度共生矩阵,具体为:
[HOM=ijp(i,j)1+(i-j)2ASM=ijp(i,j)2ENT=ijp(i,j)log p(i,j)DIS=iji-jp(i,j)] (8)
BP神经网络的工作步骤为:
1) 输入神经元节点[i]的输入与输出一样,即有:
[Oi=Xi] (9)
2) 隐含层神经元节点[j]的输入和输出为:
[netj=iωjiOi+θjOj=f(netj)=11+exp(-netj)] (10)
式中:[ωji]表示隐含层连接权值;[θj]为隐含层的阈值。
3) 输出层神经元节点[l]的输入和输出为:
[netl=jωljOj+θlOl=f(netl)=11+exp(-netl)] (11)
式中:[ωlj]表示输出层的连接权值;[θl]为输出层的阈值。
设采集到的数据为:[(XP1,XP2,…,XPN)→][(TP1,TP2,…,TPN)],[P]为样本总数,那么输出结果的均方误差和可以描述为:
[W=1PP12l(TPl-OPl)2] (12)
权值[ωlj]与[ωji]满足的变化方式为:
[ωlj(K+1)=ωlj(K)+ηδlOjδl=f(netl)(Tl-Ol)] (13)
[ωji(K+1)=ωji(K)+ηδjOiδj=f(netj)lωljδl] (14)
式中:[K]为迭代次数;[η]为学习速率。
基于神经网络的警示标志识别原理:首先采集警示标志识别图像,并进行一些预处理;然后结合人的视觉传达感知特点,提取警示标志识别的相关特征,最后采用神经网络实现警示标志识别,具体如图4所示。
为了分析本文所提的警示标志识别方法的有效性和优越性,选择没有引入视觉传达的警示标志识别方法进行对比实验,每一种方法均运行10次实验,统计它们的警示标志平均识别率,结果如表2所示。
从表2可知:
1) 没有引入视觉传达的警示标志识别方法的实验结果较本文方法要低,获得了比较低的警示标志识别率,表明其警示标志识别的误识率比较高。这是因为该方法无法正确描述警示标志的类型,无法准确区分出不同类型的警示标志,因此实际应用价值受限。
2) 相对于对比方法,本文方法的警示标志识别结果得到了明显改善,大幅度提高了警示标志识别率,这表明本文方法的警示标志误识率得到了有效的控制。这是因为本文引入了视觉传达方法,提取的警示标志特征可以更好地描述警示标志的类型,从而建立理想的警示标志识别分类器,可以全面描述警示标志的类型,获得了更加理想的警示标志识别结果,对比结果表明引入视觉传达有助于提高警示标志的识别效果。
统计对比方法和本文方法的警示标志平均识别时间,结果见图5。对图5的警示标志识别时间进行对比和分析,可以发现本文方法的警示标志识别时间明显缩短,这表明本文方法的警示标志识别速度更快,提高了警示标志识别的效率,可以应用于处理速度比较快的警示标志识别环境中,实际应用价值更高。
警示标志识别是当前研究的热点,为了解决当前警示标志识别正确率低、识别速度慢等缺陷,提出基于视觉传达的警示标志识别方法。采用具体实验测试了本文方法的有效性和优越性,结果表明,本文方法提高了警示标志识别的正确率,有效改善了警示标志识别的速度,而且警示标志识别效果要明显优于当前其他警示标志识别方法,具有更高的实际应用价值。
参考文献
[1] MALDONADO?BASCON S, LAFUENTE?ARROYO S, GIL?JIMENEZ P, et al. Road sign detection and recognition based on support vector machines [J]. IEEE transactions on intelligent transportation systems, 2007, 8(2): 264?278.
[2] GAO X, PODLADCHIKOVA L, SHAPOSHNIKOV D, et al. Recognition of traffic signs based on their colour and shape features extracted using human vision models [J]. Journal of visual communication and image representation, 2006, 17(4): 675?685.
[3] 谷明琴,蔡自兴,何芬芬.基于形状标记图和Gabor小波的交通标志识别[J].智能系统学报,2011,6(6):526?530.
GU Mingqin, CAI Zixing, HE Fenfen. Traffic sign recognition based on shape labeled graph and Gabor wavelet [J]. Journal of intelligent system, 2011, 6(6): 526?530.
[4] 秦香英,黄亚飞,刘伟铭.基于不变矩和小波神经网络的标志识别方法[J].长沙交通学院学报,2005,21(2):84?88.
QIN X Y, HUANG Y F, LIU W M. A method of signs recognition based on invariant moments and wavelet neural network [J]. Journal of Changsha Jiaotong University, 2005, 21(2): 84?88.
[5] 王进,熊虎.ALPSO?SVM道路限速标志识别[J].计算机科学,2012,39(11):226?229.
WANG Jin, XIONG Hu. Road speed limit identification based on ALPSO?SVM [J]. Computer science, 2012, 39(11): 226?229.
[6] 何耀平,徐丽珍.自然场景下交通标志的自动识别算法[J].微计算机信息,2010,26(4):161?163.
HE Yaoping, XU Lizhen. Automatic recognition algorithm for traffic signs in natural scene [J]. Microcomputer information, 2010, 26(4): 161?163.
[7] BUI?MINH T, GHITA O, WHELAN P F, et al. A robust algorithm for detection and classification of traffic signs in video data [C]// Proceedings of 2012 International Conference on Control, Automation and Information Sciences. [S.l.]: IEEE, 2012: 108?113.
[8] 谷明琴,蔡自兴.基于无参数形状检测子和DT?CWT的交通标志识别[J].计算机研究与发展,2013,50(9):1893?1901.
GU Mingqin, CAI Zixing. Traffic sign recognition based on nonparametric shape detector and DT?CWT [J]. Computer research and development, 2013, 50(9): 1893?1901.
[9] HE K, SUN J, TANG X. Single image haze removal using dark channel prior [J]. Pattern analysis and machine intelligence, 2011, 33(12): 2341?2353.
[10] 张静,何明一,戴玉超,等.综合颜色和形状的圆形交通标志检测方法[J].计算机工程与应用,2011,47(2):233?236.
ZHANG Jing, HE Mingyi, DAI Yuchao, et al. Circular traffic sign detection method of integrated color and shape [J]. Computer engineering and application, 2011, 47(2): 233?236.