毛晚堆 刘海敬 孔偌琳
摘要:将考生试卷扫描成图像的过程中,难免会出现试卷图像的倾斜,继而影响后续试卷信息的识别结果的准确度以及识别精度。为提高试卷处理的工作效率,通过对试卷图像进行倾斜校正,以节省返工时间或手动处理时间。为此本文结合具体环境,通过初次检测与深度检测相结合的方法,在确保时间效率的情况下提高检测的准确度,实验表明,该方法能快速准确测量出试卷图像的倾斜角度。
Abstract: In the process of scanning the test paper into images, it is inevitable that the image of the test paper will be tilted, which will affect the accuracy and recognition accuracy of the subsequent information of the test paper. In order to improve the efficiency of paper processing, by tilting the paper image to save rework time or manual processing time. For this reason, in combination with the specific environment and through the combination of initial detection and depth detection, the paper improves the detection accuracy in consideration of the time efficiency. Experiments show that this method can quickly and accurately measure the tilt angle of examination paper images.
关键词:倾斜校正;Hough变换;网上阅卷
Key words: tilt correction;Hough transformation;online marking
中图分类号:TP391 文献标识码:A 文章编号:1006-4311(2018)35-0230-02
0 引言
網上阅卷系统中文本图像的自动识别与处理技术的发展越来越成熟,而对文本图像识别的准确率和效率的要求也越来越高。在考生试卷的扫描过程中,不可避免地会出现试卷图像的倾斜,而试卷图像的倾斜给后续试题分割带来困难,影响阅卷老师评阅试卷。
目前图像倾斜检测方法有Hough变换法、基于投影的方法、最近邻聚类的方法、基于小波变换的方法。其中基于Hough变换的方法通过检测图像中直线从而估计出倾斜角,取得了很好的精度[1]。
1 Hough变换
Hough变换利用图像空间和参数空间点-线对偶性质,将共线的点变换为相交于同一点的曲线,将直线提取问题转化为计数问题[2]。
Hough变换不仅抗噪能力较强,而且具有较强的鲁棒性,在较低的信噪比下也能得到较好的效果,但其较高的时间复杂度和空间复杂度影响了它的使用。
一些科研工作者根据具体的应用环境,提出基于Hough变换算法的改进方法以适应环境要求。邱力为等人提出基于两点组合原理的Hough变换直线检测算法,能够有效克服参数空间的量化误差,具有较高的检测精度以及较低的内存消耗等优点,但在信噪比较高的情况下检测精度较低[3];瞿洋等人使用了变分辨率金字塔的策略,不仅减少了算法的计算量,而且也提高了算法的抗噪能力[4];芮挺等提出采用轮廓跟踪方法去除牌照图像中和校正无关的所有冗余信息并采用分级检测的策略,最大程度减少校正过程的运算量,提高算法运行速度[5];梁添才等人提出对图像进行水平轨迹线平滑处理后再采用分级Hough变换的思想实现倾角的检测[6]。
2 试卷倾斜校正算法
考生试卷中存在大量的文本信息和边框线,其中文本走向或表格线的方向则反映出整个文本图像的倾斜角度。在本文所涉及的环境下,只需检测出倾斜角度信息,则可对倾斜试卷进行校正处理。根据图像数据,图像出现倒置或90°倾斜,通过其他方法处理即可。
本文在Hough变换检测直线原理的基础上,结合研究环境,采用初次与深度相结合的方法进行倾角的检测。倾斜校正方法如下:
①计数变量n的初始值为0。将标准试卷图像两者分别在x轴和y轴进行投影,可得到图像分别在x轴和y轴的投影分布区间;将标准试卷图像投影在x轴左起第一个大于阈值Rs的坐标记为x1,并将最后一个小于阈值R0坐标记为x2。将标准试卷图像投影在y轴左起第一个大于阈值R0的坐标记为y1,并将最后一个小于阈值R0坐标记为y2。
②若计数变量n的值小于等于1,转③,否则转⑨;
⑦)利用倾斜校正算法计算图像的倾斜角度,并将计数变量n的值增1,并对图像进行旋转处理,然后转②;
⑧倾斜校正程序结束;
⑨将考生试卷作为特殊试卷手动处理,结束。
在待检测区域中每隔t个长度选取一个点作为待检测点,并将待检测点的坐标存入数组pos中。定义两个数组angArr和graArr,变量i初始值为1。
①如果i ④i=i+1,转②; ⑤遍历angArr和graArr两个数组,找出出现次数最多的数值,若存在多个值出现次数相同,将多个值从小到大进行排序,计算相邻两个值之间的差距a,若a小于等于阈值m,则取这多个值的中间值为倾斜角度,否则t=t/2,转①; ⑥结束。 3 实验结果与总结 为检测算法效果,本文对1385份考生试卷进行了总体测试,在实际环境下检测准确率在98%以上,优于目前若干个商业软件。 本文提出的基于改进Hough变换的试卷图像校正方法,通过初次检测与深度检测相结合的方法,在追求高准确度的要求下也达到节省时间的目的。实验结果表明,该算法实现了试卷倾斜角度的检测和校正。 参考文献: [1]刘侃.基于分层随机Hough变换的文本图像倾斜检测[J].中国体视学与图像分析,2010,15(4):382-386. [2]谢忠红.采摘机器人图像处理系统中的关键算法研究[D].南京:南京农业大学,2013. [3]邱力为.直线参数检测的快速哈夫变换[J].北京航空航天大学学报,2003,29(8):741-744. [4]瞿洋.Hough变换OCR图象倾斜矫正方法[J].中国图象图形学报,2001,6(2):178-181. [5]芮挺.车牌识别中倾斜牌照的快速矫正算法[J].计算机工程,2004,30(13):122-123. [6]梁添才.基于Hough变换的列车客运票图像倾斜校正[J].华南理工大学学报,2007,35(5):35-40.