程 红,王志强,白新伟
(中国人民解放军空军航空大学特种专业系,吉林长春 130022)
航拍胶片注释信息阈值分割算法研究
程 红,王志强,白新伟
(中国人民解放军空军航空大学特种专业系,吉林长春 130022)
航拍胶片注释信息对后续的图像处理非常重要,但是曝光不均、相机抖动或者胶片数字化产生的畸变都会导致注释信息产生背景模糊、泛白、灰度不均等现象,这给注释信息标识符的分割和识别带来很大困难。该文提出了一种基于CASDA与Niblack相结合的阈值分割算法,能够有效解决传统分割方法存在的字符分割断裂问题。实验证明,该算法能够在保证注释信息准确分割的同时兼顾处理速度。
阈值分割;图像增强;CASDA法;Niblack法
航拍胶片的注释信息中记录着航拍中重要的飞行姿态参数和成像信息,如相机类型、经纬度、俯仰角等信息,这些信息的准确获取对后续的图像处理非常重要。注释信息的解译一般要经过预处理、定位、阈值分割、标识符分割和标识符识别[1]等步骤。其中,注释信息的阈值分割在整个识别过程中起到关键作用。阈值分割处理效果不好将会造成字符的粘连或者断裂,从而直接影响后续的标识符分割和识别。目前,常用的阈值分割方法主要有全局阈值法[2]、局部阈值法[3]和动态阈值法[4]三类;但这三类传统的方法都不能很好地解决字符的粘连或断裂问题,如全局阈值法没有借助像素的邻域特征,局部阈值法虽然考虑了像素邻域的特征,但又缺乏对整体图像信息的参考,而动态阈值法又比较耗时。因此,根据传统阈值分割法的不足,本文提出了基于CASDA与Niblack相结合的阈值分割算法。
基于CASDA与Niblack相结合的阈值分割算法,先对注释块图像自动检测虚影区域,确定出正常区域和虚影区域,然后对正常曝光区域进行全局阈值处理以提高处理速度,再对虚影区域采用局部阈值法逐点确定阈值以消除粘连及断裂,这样结合了全局阈值及局部阈值算法的各自优点,实现对注释信息块快速而有效的阈值分割。
根据注释信息块的自身特点(图1),结合图像在曝光及扫描时的情况将注释块分成四行,每行包括注释块的一行标识符。由于注释块的产生是利用发光二极管曝光的原理,且二极管间距离较近,因此很可能会产生点光源的散射效应,即周围未曝光区域也会“泛白”,产生虚影假象。
由于航拍胶片注释块存在“行距大,列距小”的特点,“泛白”对于相邻“行”的影响远小于“列”,因此本文只需将“行”作为一个整体处理即可,即在正常曝光情况下,注释块应该“非黑即白”,灰度直方图呈现“双峰”特点。根据这一特点,检测注释块每行所对应的灰度直方图。根据直方图灰度值的最小间隔w0,先给定一门限w,使其等于10w0,然后求取直方图上各离散点与上一离散点及下一离散点的偏导。如果出现先正后负的情况,这一离散点有可能为“峰”,也有可能为干扰。结合事先设定的门限,如果在以该离散点为中心的宽度门限w内,此点为局部极大值,便认为这一点为峰值点。由此,可判断整个注释块各行对应的直方图中存在的峰数。基于上述判断,如果检测出的注释块某行所对应的直方图出现“多峰”,证明该行标识符和背景之间出现很多干扰像素,则该行属于虚影区域;反之,如果出现“双峰”,则该行即在正常区域。
图1 原始注释信息Fig.1 The original comment information
从图2可以看出,原始注释块的灰度直方图均是第一、二行出现“多峰”,左侧的“峰”应为背景区域像素形成,右侧的“峰”应为标识符区域形成,而中间出现的像素则为干扰,即虚影区域。第三、四行双“峰”比较明显,说明图像对比度比较大,标识符比较突出。为后续处理方便,此处将同为虚影区域的一、二行合并,将正常区域的三、四行合并。注释块的虚影区域如图3所示。
确定出图像的正常区域和虚影区域后,先采用CASDA阈值分割算法[5]实现正常区域的阈值分割,该方法将图像空间分布特性与统计特性有机结合,大大加快了阈值分割的分类速度,与Bernsen、Kittler[6]等算法相比较,CASDA法具有速度快、能消除不均匀光照引起的伪影、极少出现标识符断裂等优点,阈值分割效果好。灰度图像均值为:
式中:g1表示正常区域图像中标识符灰度,r1表示标识符像素点所占比例,g2表示背景灰度,r2表示背景像素点所占比例,且 0≤g1,g2≤255,0≤r1, r2≤1,r1+r2=1。
则方差计算如下:
为把白字从黑底中分割出来,选取阈值为:
为了确定标识符像素点与背景像素点的比例,需要事先设定一阈值以实现标识符与背景的分类。这一阈值的选取根据实验选为最大最小灰度值和的1/6;然后对正常区域图像采用CASDA法进行阈值分割,求出均值、方差,再结合式(3)即可求出阈值T,从而实现分割。阈值分割结果如图4所示。
图4 注释信息的正常区域阈值分割Fig.4 The threshold segmentation of normalarea of comment information
由于注释信息块的曝光源近似点光源,因此曝光时可能会产生局部曝光不均,从而产生虚影区域。为了方便后续的标识符分割、识别,需先对虚影区域进行图像增强。由于线性变换、直方图等增强方法只能从整体上实现增强,局部对比度依然不能得到增强,因此,本文采用数学形态学中的顶帽和底帽变换。该变换不仅能够保留原图像的结构信息,还能消除图像的背景干扰,突出感兴趣的目标。开启和闭合是形态学中的两个重要运算,它们是由膨胀和腐蚀组合而成的复合运算。开启运算可以去除比结构元素更小的明亮细节,而闭合运算可以去除比结构元素更小的暗细节,所以它们经常组合在一起用来平滑图像并去除噪声。顶帽变换和底帽变换并用则可以明显增强对比度。通过验证,选取类型为square、大小为100的结构元素效果最好。实验结果如图5所示。
图5 注释信息虚影区域增强Fig.5 The enhancement of shadow area in comment information
Niblack算法[7]是动态阈值法中的一种,即每个点都有各自的阈值。该方法基于局部均值和局部标准差,其核心公式为:
式中:T(x,y)为图像任一点(x,y)处的阈值,m(x, y)为图像的局部均值,s(x,y)为图像的局部方差,k是一个调整系数。
为了确定图像中每个点的阈值,需要对图像进行扩充,扩充窗口的大小在Niblack方法中非常重要,既要能小到保持足够的局部细节,又要能大到抑制噪声。通过实验发现,扩充窗口大小取值15、调整系数k取值0.08时效果最好。为了排除阈值处理后的独立干扰点,本文在阈值化后加入了一步开运算处理,结构元素选为rectangle,大小为[2 2]。处理结果如图6所示,整体效果如图7所示。
在实验过程中,采用传统的Bernsen法、Niblack法、Sauvola法、CASDA法、迭代法、直方图阈值分割法、Kittler法及本文算法对航拍胶片进行阈值分割实验,实验结果比较如图8、表1。可以看出,迭代法和 Kittler法作为全局阈值法虽然执行速度很快,但是粘连情况比较严重,这不利于后续的标识符分割;直方图阈值分割法需要根据图像灰度直方图确定分割“谷底”,而由于干扰的存在,合适的“谷底”位置不易确定;采用Bernsen法和 Sauvola法都有伪影产生,分割起来比较困难,同时由于这两种方法是采用局部阈值,需计算每个小窗口图像,因此运行时间比较慢;Niblack法、CASDA法对于光照相对平均区域效果很好,但对于虚影区域的处理不是很好,存在标识符断裂情况;采用本文算法不仅不存在伪影现象,而且对复杂区域的处理效果也很好,同时由于结合了全局阈值法,程序执行时间也比较快,时效性很好。
图8 阈值分割效果对比Fig.8 The contrast of threshold segmentation algorithms
表1 算法执行时间比较Table 1 The contrast of algorithm executing time
本文提出的航拍图像注释块阈值分割算法结合了全局阈值法和局部阈值法的优点,在图像质量好的区域利用CASDA全局阈值法,既保证了处理效果又节省了程序执行时间;而对虚影区域先采用形态学方法进行图像增强,然后采用Niblack法进行局部阈值求取。实验证明,本算法明显优于Bernsen法、Sauvola法、Niblack法等传统的阈值分割方法,具有良好的适应性。
[1] 陈凯,曾庆业,庞怡杰.航拍胶片注释信息字符识别方法[J].计算机工程与应用,2009,45(7):235-237.
[2] ISMA IL A H,MARHABAN M H.A simple app roach to determine the best threshold value for automatic image thresholding [A].2009 IEEE International Conference on Signal and Image Processing Applications[C].2009.162-166.
[3] GONZALEZ R C,WOODS R E,EDDINS S L.阮秋琦(译).数字图像处理(MA TLAB版)[M].北京:电子工业出版社,2005. 307-314.
[4] 刘新宇,吴勇,李龙.道路标线图像分割方法研究[J].交通与计算机,2008,26(6):56-60.
[5] 张引.基于空间分布的最大类间方差牌照图像二值化算法[J].浙江大学学报(工学版),2001,35(3):272-280.
[6] 杨硕,尚振宏.一种新的二维条码图像二值化算法[J].昆明理工大学学报(理工版),2008,33(1):44-46.
[7] 李倩.文档图像的二值化算法综述[J].中国传媒大学学报(自然科学版),2008,15(4):67-69.
A Threshold Segmen tation Algorithm of Commen t Information in Aerial Photos
CHENG Hong,WANG Zhi-qiang,BA IXin-wei
(Department of Specialty,the A viation University of A ir Force,Changchun 130022,China)
The comment info rmation of aerial photos is very important for image p rocessing.The fuzzy,w hite o r non-uniform gray value of the background of comment info rmation is caused by non-unifo rm exposal,shaking o r aberration of digital photos, w hich makes it difficult to segment and interp ret the comment information.In this paper,the threshold segmentation algo rithm based on CASDA and Niblack is p roposed,the p roblem that character fragmentation is resolved in traditional segmentation algorithm.Experiment results show the high p recision and fast speed fo r the segmentation of the comment information.
threshold segmentation;image enhancement;CASDA algo rithm;Niblack algorithm
TP751
A
1672-0504(2011)04-0045-03
2010-12-30;
2011-03-10
程红(1969-),女,博士,教授,硕士生导师,从事遥感信息处理研究。E-mail:kaola0811@163.com