于翔 蒋丽丽
摘要:针对国家非物质文化遗产--南通蓝印花布在信息化方面的空白,综合分析南通蓝印花布数字图像的特点,提出局部自适应阈值法进行图像分割与边缘检测,并对其结果与其它与其它边缘检测方法的结果进行比对、分析与研究,明确局部自适应阈值法在南通蓝印花布的图像分割与边缘检测方面的优势;随后在JAVA EE环境中利用OpenCV函数库函数实现蓝印花布的局部自适应阈值的边缘检测与图像分割。
关键词:局部自适应阈值;边缘检测;OpenCV;JAVA;EE;形狀特征图像特征的提取是基于内容图像检索的基础,如何构建反映适当图像内容的特征是进行图像检索的关键技术之一。[1]图像特征包括颜色、纹理、形状等;颜色特征具有提取方便、相似度衡量简单等优点而常被CBIR系统采用;但是,颜色特征因丢失颜色的空间分布与纹理的结果信息等缺点,使其在图像检索中极易误检;而形状特征作为另一种重要的图像特征,因其包含部分语义信息、不变等特点,可有效弥补颜色特征的不足[2]。本文正通过对南通蓝印花布图像的形状特征进行分析研究,提出针对南通蓝印花布图案纹样的局部自适应阈值图像分割方法,并与其它分割方法在其上的应用结果进行对比与分析,确定其优缺点后在JAVA EE环境下成功利用OpenCV开发实现,为设计开发基于内容的南通蓝印花布图像检索系统打下坚实的基础。
1研究背景
南通蓝印花布于2006年5月经国务院批准列入第一批国家级非物质文化遗产名录,工艺美术大师吴元新先生整理收藏明清以来实物及图片资料上万件,为其理论性夯实了理论基础。然而利用CBIR的先进技术、理念及手段对南通蓝印花布展开数字化研究还属空白。本文对南通蓝印花布大量实物数字化采集后进行系统地分析、研究,并在JAVA EE环境下利用机器视觉库OpenCV对其数字化图像开展多种形状特征提取的实验,为开发实现一个基于内容的南通蓝印花布图像检索原型系统及“南通蓝印花布”信息化工作打好基础。
2图像的形状特征的提取及其相关技术
人对形状的感知不仅仅是一个视网膜的生理反应结果,而是视网膜的感受与人关于现实世界的知识这二者之间综合的结果。因此,图像的形状特征不仅是图像的重要特征之一,更是包含语义信息在内的重要特征。图像的形状特征主要有两种表示方法:轮廓特征和区域特征。
2.1 图像的形状特征
物体和区域的形状是图像内容表达和图像检索中的另一重要的特征。提取形状特征对物体形状易于识别的图像较为适合。[4]形状特征的表示包括轮廓特征表示法和区域特征表示法两种方法;前者只利用形状的外围边界,而后者则用的是整个形状区域。[2]轮廓特征表示法适用于图像的边缘清楚、轮廓清晰、容易提取的图像。区域特征表示法则是通过利用图像区域内的灰度分布信息来提取图像中感兴趣区域的特征。[6]
2.2 图像的分割
本质上,图像只是图像内容的载体。图像的内容远比图像重要,但没有图像就看不到图像所承载的内容。正如我们对照片里的内容感兴趣,而不是对照片本身感兴趣一样。因此,形状特征的表达是以对图像中物体或区域的分割为基础的。[1]当前的技术无法做到准确而鲁棒的自动图像分割。根据使用知识的特点与层次,可将图像分割分为数据驱动与模型驱动两大类。其中数据驱动分割直接对当前图像数据进行操作,虽然也可使用有关先验知识,但不依赖于知识;模型驱动分割则直接建立在先验知识的基础上。[2]
2.2.1 基于模型驱动的图像分割法
常见的模型驱动分割包括基于可变形模板的图像分割、基于统计形状模型的图像分割等,其中基于可变形模板的图像分割是基于弹性力学的方法。而基于统计形状模型的图像分割是一种以目标物体的轮廓为训练样本构造模型的方法。本文主要以基于数据驱动的图像分割法为主。
2.2.2 基于数据驱动的图像分割法
常见的数据驱动分割包括基于边缘检测的分割、基于区域的分割、边缘与区域相结合的分割等。其中基于边缘检测的图像分割其基本思想是先检测图像中的边缘点,再按一定策略连接成轮廓,从而构成分割区域,其难点在于边缘检测时抗噪性和检测精度之间矛盾的处理。基于区域的分割是根据图像数据的特征将图像空间划分为不同的区域,常用的方法有阈值法、区域生长法、聚类法、松弛法等。其中阈值法通过设定不同的特征阈值,将像素点分为若干类从而达到分割的目的,其难点在于阈值的设定。对传统阈值法的改进包括局部阈值、模糊阈值、随机阈值等方法。针对南通蓝印花布的特点,本文采用改进的局部自适应阈值法对其进行图像分割,并与采用基于边缘检测法分割图像所产生不同结果进行比对研究,讨论分析局部自适应阈值法对蓝印花布图像的分割的优缺点。
3局部自适应阈值在南通蓝印花布图像分割上的应用
分析研究表明蓝印花布的蓝色和白色亮度变化明显,每个像素位置处的二值化阈值不是固定不变的,而是由其周围邻域像素的分布来决定的,亮度较高的图像区域的二值化阈值较高,而亮度较低的图像区域的二值化阈值则会相适应地变小。因此,不同亮度、对比度、纹样的局部图像区域拥有相对应的局部二值化阈值。由此,针对蓝印花布的局部邻域块均值自适应阈值,将用来计算阈值的象素邻域大小设为足够小后即可实现的蓝印花布图案纹样的边缘检测。
3.1 南通蓝印花布的图像预处理
本文中图像预处理以下几部分:图案纹样的灰度化处理、图案纹样的滤波去噪处理和图案纹样的归一化处理。图案纹样的灰度化处理将加权值法与最大值法相结合,针对蓝印花布只有蓝色和白色两种颜色且蓝色所占比重大于白色的特点,经大量试验确定采用如下公式:
Gray(i,j)=0.61*B(i,j)+0.22*G(i,j)+0.17*R(i,j)
其中Gray(i,j)为(i,j)点上的灰度值。
另外,采用数码相机对南通蓝印花布进行数字图像采集后的图像包含大量噪声,如布匹本身的经纬线、长时间存放而产生的磨损等,大量实践表明针对此类噪声,中值滤波的去噪效果较为明显。
最后,为了方便蓝印花布的特征比较,必须对其进行归一化处理。格式转换采用工具软件提前处理,并将图像缩放为一个统一尺寸。另外,针对在实际应用过程中蓝印花布的蓝色和白色没有统一的数字化标准的实际情况,提出南通蓝印花布数字图案纹样中的蓝色RGB值{29,33,70}、白色RGB值{251,255,255}作为南通蓝印花布颜色标准,以此避免蓝印花布蓝色、白色深浅不一的缺点。
3.2 JAVA EE框架下OpenCV环境的搭建及相关技术
OpenCV是Intel开源计算机视觉库,实现了图像处理和计算机视觉方面的很多通用算法。其最新的OpenCV2.4.4版本提供支持JAVA的API,使JAVA可以方便地使用OpenCV库。[7]利用OpenCV的最新版本,将JAVA EE与OpenCV有机地结合在一起,在满足基于内容的图像检索系统要求使用数据库对图像数据进行管理的同时,还提供了处理数据库中的图像信息的要求;因此,本文在Ubuntu Linux操作系统下,使用Easy Eclipse软件搭建JAVA EE环境,并在系统中安装调试相关OpenCV语句,完成JAVA EE框架下OpenCV环境的搭建。
3.3 局部自适应阈值图像分割法在南通蓝印花布图像上的应用
蓝印花布图案纹样经过图像预处理后,选择OpenCV库的AdaptiveThreshold()函数对样图处理。通过大量实验表明:将AdaptiveThreshold()函数用来计算阈值的象素邻域大小参数block_size设置足够小,如: 3, 5, 7, ...时,阈值的“自适应程度”非常高,其结果表现为图像的边缘检测的效果[8]。实验中随机取蓝印花布图像,设计block_size值为3,则处理效果如图1所示:
3.4 边缘检测分割方法在南通蓝印花布图像上的应用
边缘检测的图像分割方法有Canny等,资料表明,[10]Roberts算子检测具有陡峭的灰度及低噪声图像的边缘效果较好,但对强噪声敏感;Sobel算子对灰度渐变与噪声不多的图像处理效果较好,但检测出的边缘较粗糙,且抗噪性不强;Prewitt算子检测的边缘可能大于2个像素,去噪的同时易平滑掉一些边缘信息;LOG算子边缘连续性好,定位较为准确,能够提取到灰度对比度较弱的图像边缘。综合考虑,本文采用Canny边缘检测的分割方法对南通蓝印花布图像进行图像的分割,为得到比较准确的边缘,先对样本图像进行二值化处理后通过Opencv函数库的Canny函数进行边缘检测。分割出蓝印花布图像如图2所示:
5结论
首先,对比采用AdaptiveThreshold()函数实现局部自适应阈值分割的结果与边缘检测分割的结果,可发现局部自适应阈值分割蓝印花布图像结果清晰,线条连贯且计算速度快;而边缘检测分割蓝印花布图像受算子影响较大,运行较为复杂,需随时调整算子大小以达到较好效果。另外,通过观察可发现,局部自适应阈值对图像噪声不敏感,而Canny边缘检测分割法对噪声较为敏感。
其次,通过对大量蓝印花布数字图像的实验,采用加权值法与最大值法相结合的方法进行图像预处理,不但突出蓝印花布的蓝色主颜色,还有效地降低计算量,大大提高了效率。
最后,大量的实验结果表明,在JAVA EE环境下结合OpenCV机器视觉库实现南通蓝印花布图像分割,不但技术上可靠,而且系统运行稳定,处理图像速度快,完全满足开发要求。
因此,在南通蓝印花布图像纹样的数字化研究中采用局部自适应阈值分割蓝印花布图像纹样,不但具有效率上的明显优势,还可以明显降低噪声对形状的影响。同时,在JAVA EE环境下结合OpenCV实现该算法,可靠易行,完全满足开发的要求。
[参考文献]
[1]翟剑锋.基于多特征的图像检索系统的设计与实现[D].北京:北京邮电大学:2010:7-11.
[2]Mori G.,Belongie S.,Malik J.,Shape contexts enable efficient retrieval of similar shapes [J].Porceedings ofthe 2001 IEEE computer Society Conference on Computer Vision and Patten Recognition,2001,1:723-730.
[3]袁杰.基于內容的综合多特征图像检索方法研究[D].杭州:浙江师范大学:2009:17-33.
[4]孟繁杰,郭宝龙.CBIR关键技术研究[j]计算机应用与研究.2004:21-27.
[5]李明俐.基于颜色与形状特征的图像检索技术研究及系统的设计与实现[D].西安:西北大学.2010:15-42.
[6]董卫军,周明全,耿国华.基于纹理和形状特征的图像检索技术[J].计算机工程应用,2004(24).
[7]http://www.opencv.org.cn/.
[8]http://blog.163.com/yx_xie2007/blog/static/10246425320108303565114/.
[9]王郑耀.数字图像的边缘检测.[D] 西安:西安交通大学,2003.