不变矩特征在数字验证码识别中的应用∗

2018-07-10 09:18
舰船电子工程 2018年6期
关键词:粗糙集字符轮廓

赵 杰

(商洛学院电子信息与电气工程学院 商洛 726000)

1 引言

验证码具有技术简单、易实施和传输数据小的优点,故而被很多网站尤其是论坛性质的网站大面积使用来防止自动化程序(如论坛自动灌水机)进行大批量的恶意行为。验证码技术也常用于辅助预防和阻止垃圾邮件群发等行为[1]。常用的验证码识别方法主要有模板匹配、字符结构、字符形状等方面[2-4]。这类方法缺点是对倾斜和字符的大小比较敏感,经过特殊处理后这些缺点可得到一定改进。文献[5]提出基于外部轮廓的方法,将图像分割成相应若干单个数字图像,然后对分隔出来的单个数字图像外部轮廓的上、下、左、右4个方向进行特征计算,最后依据所计算得到的外部轮廓方向是否具有突变、左斜、右斜、圆弧等特征来对它们进行识别。基于机器学习的方法近年来研究较多,如利用神经网络、基于支持向量机等来进行识别验证码[6~8],此类方法较传统方法在识别率上有所提高,但较为复杂,有时会出现“过学习”现象。此外,还有基于粗糙集的彩色验证码图像识别方法[9],根据字符颜色、大小和位置关系,使用粗糙集方法将验证码字符分割出来,再利用Adaboost进行训练、识别。无需太多样本,识别率较高,但对有一定几何形变的字符识别率不高。不变矩是指物体(目标)在进行平移、缩放、旋转等几何变换后基本保持不变的矩统计量。目前,不变矩已成功应用于目标识别、数字水印等很多领域[10~11],但在验证码识别应用很少。本文利用矩不变量来进行数字验证码识别,以常用的几何不变矩(Hu矩)为例给出相关仿真结果,最后对算法进行总结讨论。

2 几何不变矩的基本原理

区域 f(x,y)的(p+q)阶矩定义为

其相应的中心距定义为

其中,为重心坐标,(xˉ,yˉ)是目标区域灰度质心。 f(x,y)的归一化(p+q)阶中心矩定义为

由此,可以得到下列七种不变矩,它们对平移、旋转、以及尺度变换都具有几何不变性[12]:

3 基本过程

在识别之前需对验证码图像进行一系列预处理操作,整体流程如图1所示。

一般数字验证码图像中的数字个数保持常量,较易分割,为进行后续数字分割,首先对图像进行初步去噪。然后对图像进行二值化,对数字进行定位、分割,在实际处理中,为了保证分割效果,可在分割之前再次对噪点进行滤除。数字定位好后,可提取验证码图像中各数字的不变矩特征进行识别。

4 仿真测试

实验仿真通过Matlab完成,为便于直观观察结果,构建GUI界面。载入验证码图像后界面如图2所示;对验证码图像进行初步去噪、数字定位、归一化操作,结果分别如图3、图4、图5所示。

5 结语

本文利用图像的几何不变矩特征对数字验证码进行识别,以Matlab软件作为测试平台,并搭建GUI界面进行测试。实验结果表明了不变矩在识别数字验证码方面的可行性。而且该方法可以很容易地扩展到英文字母或字母数字混合验证码的识别中。该实例也可以方便地在相关课程教学中使用。

[1]吕霁.浅谈验证码的识别[J].河北能源职业技术学院学报,2015,15(1):72-74.

[2]王虎,冯林,孙宇哲.数字验证码识别算法的研究和设计[J].大连理工大学学报,2007,43(32):86-87.

[3]Kang C Y,Zhang W,Zhang T.Research and design of digital validation image recognition algorithm based on contour features[C]//International Conference on Ma⁃chine Learning and Cybernetics. IEEE, 2008:3022-3025.

[4]朱绍文,陈光喜.一种简单的基于字符形状的验证码识别技术[J].桂林电子科技大学学报,2010,30(1):59-62.

[5]潘大夫,汪渤.一种基于外部轮廓的数字验证码识别方法[J].微计算机信息,2007,23(25):256-258.

[6]佟树成.支持向量机在验证码模式识别中的应用研究[J].电脑知识与技术,2017,13(9):166-167.

[7]陈超,毛坚桓,刘寅等.基于卷积神经网络的铁路货运网站验证码识别[J].指挥信息系统与技术,2016,7(4):91-96.

[8]刘欢,邵蔚元,郭跃飞等.卷积神经网络在验证码识别上的应用与研究[J].计算机工程与应用,2016,52(18):1-7.

[9]陈令.基于粗糙集的一类彩色验证码识别研究[J].信息网络安全,2012,(6):26-28.

[10]Abdeslam Hmimid,Mhamed Sayyouri,Hassan Qjidaa et al.Image classification using a new set of separable two-dimensional discrete orthogonal invariant moments[J].Journal of electronic imaging,2014,23(1):378-392.

[11]Upneja R.Accurate and fast Jacobi-Fourier moments for invariant image recognition[J].Optik-International Jour⁃nal for Light and Electron Optics,2016,127(19):7925-7940.

[12]张伟,何金国.Hu不变矩的构造与推广[J].计算机应用,2010,30(9):2449-2452.

猜你喜欢
粗糙集字符轮廓
基于隶属函数的模糊覆盖粗糙集新模型
局部双量化模糊粗糙集
变精度多粒度粗糙集的信任结构
一种优化的手写字符自动分割算法
论高级用字阶段汉字系统选择字符的几个原则
字符代表几
图片轻松变身ASCⅡ艺术画
多粒度犹豫模糊粗糙集*
跟踪导练(三)
儿童筒笔画