贾小军, 邓洪涛, 滕 姿, 曾 丹
(1. 嘉兴学院 数理与信息工程学院, 浙江 嘉兴 314001; 2. 嘉兴学院 设计学院, 浙江 嘉兴 314001;3. 上海大学 特种光纤与光接入网重点实验室, 上海 200072)
蓝印花布作为中国最具传统特色的民间手工艺品,以图案纹样造型朴素、粗犷,形式多样,表现手法简练,设计风格“笔断意连”而闻名于海内外[1-2]。蓝印花布作为国家非物质文化遗产应得到更好的传承与创新。随着信息技术的发展,蓝印花布的数字化传承呼声高涨,数字化传承包括蓝印花布的数字化采集和存储、数字化复原和再现、数字化展示与传播、数字化开发与创新等[3-4]。数字化传承的蓝印花布图案和通过图像传感器采集的图像具有鲜明的特征[5-7]。蓝印花布图案包括植物、动物、几何、文字、符号、器物和人物等题材,以单一、2种或2种以上的题材组合出现。这些图案以大小、形状不同的斑点和短线间隔地组成纹样,以几何点、线、面为图案基本元素,通过变化组织而成,形成笔断意连。
点、线、面是构成蓝印花布图案的基本元素,这些元素的轮廓蕴涵了整个作品的信息,提取这些元素的轮廓能够保留整个作品的结构特点。分离出这些元素,可在此基础上为重新创作新图案提供素材,这对蓝印花布的数字化继承与创新起着极其重要的作用。
轮廓是物体重要特征之一,用于区分不同的形状区域,在物体检测中起重要作用,广泛应用于工业[8-10]、农业[11]、生物医学领域[12-13]。与图像的其他特征相比,轮廓信息是一个非常稳定的特征,相对于照明条件、对象颜色和纹理的变化轮廓信息是不变的,有效地代表了具有较大空间范围的图像结构[14-15]。然而,在获取的原始图像中,一些重要的形状轮廓通常被浸没在纹理丰富或杂乱背景中,仅能观察到较明显的局部轮廓区域,增加了提取难度。传统的轮廓检测器主要基于一些低级图像特征的不连续性测量,Canny[16]和Arbelaez等[17]利用图像像素的亮度梯度理论及方法获取轮廓。梯度信息为局域信息,对图像噪声和初始化轮廓敏感,对于复杂图像易产生边界泄露。Chan等[18]提出的分段常数(CV)模型,能有效地分割含噪声和弱边界的图像,但需要假设图像中各区域灰度是均匀分布的,这种方法其实是一种主动轮廓提取方法。廖祥云等[19]提出了一种引入局部全局信息的区域自适应局域化快速活动轮廓模型,利用灰度分布信息自适应地改变局域区域的半径大小,进而在活动轮廓曲线演化过程中动态地调整局域化区域范围,以提高分割的准确性及曲线的演化效率,解决了局部图像灰度分布不均匀的问题。张桂梅等[20]提出将全局G-L(Grünwald-Letnikov)分数阶梯度融合到区域可调拟合(region scalable fitting,简称RSF)模型中,以增强灰度不均匀和弱纹理区域的梯度信息,并利用根据图像的梯度模值和信息熵构建的自适应分数阶阶次以实现轮廓提取,该方法涉及到大量的运算,比较耗时。利用信息熵来构造自适应算子,蔡青等[21]定义了一种新型能量函数用于轮廓提取。将模糊聚类方法与主动轮廓有机结合,孙文燕等[22]提出一种基于模糊主动轮廓的鲁棒局部分割方法,利用平均模糊能量函数,通过对演化曲线进行形态学膨胀和腐蚀运算构建窄带,并在窄带范围内求解模糊能量函数的最小值来实现局部分割。但这种分割方法易受模型的初始参数影响,且缺乏平滑约束,不太容易得到连续平滑的目标轮廓。Tian等[23]利用三角形方法逼近跟踪的边界得到轮廓,但生成的轮廓线光滑性还需要加强。
要将获取的现有蓝印花布图像的所有图案基元通过信息处理技术提取出来,作为后续创作的素材,图案基元的轮廓提取是其中的一个重要基础和关键步骤。本文借助轮廓参考点对蓝印花布图案基元进行曲线拟合优化,得到光滑、准确的轮廓曲线。同时,对图案基元进行分割或填充,成为独立的基元子图像,为蓝印花布数字化图案的再创作提供了重要的基础素材。
利用图像采集设备获取蓝印花布的数字化图像,具有2个重要特点。
1) 颜色高度保真。得益于图像采集设备技术的发展,采集的图像颜色失真度小,图案清晰。蓝印花布有蓝底白花和白底蓝花2种,有时背景掺杂黑色,但整个图像轮廓分明。
2) 图像中的图案基元轮廓统一,线条清晰,边界大都圆润光滑,有少量突兀,并伴有少量污点。
为实现蓝印花布图案中各基本图元的轮廓跟踪,需对图像进行二值化。首先将获取的初始图像转变为灰度图像,然后利用文献[23]计算出分割阈值T∈(0,255),用式(1)实现灰度图像的二值化。
(1)
式中:f(x,y)为初始图像在像素坐标(x,y)处的灰度值;F(x,y)为二值图像像素的值,其值为1表示该像素是图案基元中的一个像素,其值为0表示该像素不是目标像素。
蓝印花布图像二值化后,某个像素是否为某个基元轮廓的依据为:如果1个像素非零并且与其连通的区域至少有1个零像素,则该像素位于轮廓线上。采用八连通域,检测每个像素和其邻域的状态可以确定轮廓。轮廓线是由若干像素点构成,且按一定的方向自动排序(如逆时针)。假设每张蓝印花布图像中有k个图案基元,每个基元产生1个轮廓,整张二值化后的蓝印花布将产生k个轮廓,可用式(2)表示1张蓝印花布图像中所有图案基元的轮廓。
(2)
蓝印花布图案基元的轮廓是由有向像素点构成的,是一种初始轮廓线,具有以下特点:轮廓线由单像素组成;由于图案基元在手工制作中可能存在突兀,例如边角突出、孤点、重叠等,导致轮廓线不光滑,甚至为伪轮廓。这里的孤点指轮廓线上的像素极少,非需要的图案基元轮廓需要剔除。在图像数字化过程中,可对图案基元的初始轮廓进行改善,以使轮廓线光滑、美观。借助均值方法,提出一种轮廓线拟合优化方法。
给定一个整数r,称其为跨度(与当前点相隔的像素数),并且假设Ip为得到的初始轮廓线Ci中有序像素的索引值,新的轮廓线CNi中的像素坐标值满足式(3),其中N为新的轮廓线的个数。
(3)
图1 蓝印花布图案基元提取过程Fig.1 Processing of extracting image elements for blue calico. (a) Plant pattern; (b) Binarization; (c) Contour with serial number; (d) Sub images of image elements; (e) Enlarged image elements
式中:(xi,yi)表示轮廓线Ci中索引值为i的像素的坐标;Round (·)为四余五入函数;(xIp,yIp)表示轮廓线CNi中索引值为Ip的坐标,且F(xIp,yIp)=1。
至于孤立点,可在提取轮廓时设定一个阈值K,将轮廓线线的像素数目小于这个阈值的轮廓剔除,其定义如下:
(4)
式中:Num(·)为统计轮廓线上的像素个数;CNl为新生成的第l个轮廓。
图案基元的提取过程是根据得到的带有序号的轮廓图像,将其按序号顺序截取,生成独立的基元子图像并进行保存,形成基元子图库,为蓝印花布的再创新设计提供数字化素材。基元图像区域的大小由其轮廓线像素的坐标确定,矩形区域的宽度等于轮廓线像素的x坐标的最大值与最小值之差;高度等于轮廓线像素的y坐标的最大值与最小值之差。整个蓝印花布图案基元提取过程如图1所示。
由图1可知:图1(a)为蓝印花布初始图像,是一张植物纹样的蓝底白花图案;经过图像预处理,得到二值化图像,如图1(b)所示;调用轮廓跟踪方法,得到二值图像中各图案基元的轮廓,利用本文提出的方法进行轮廓拟合优化,生成带有序号的图案基元轮廓,如图1(c)所示,图1(c)右侧的图像为左侧的局部放大图,可清晰地看到各图案基元的轮廓线及其轮廓序号;根据轮廓序号,按序生成基元子图文件,如图1(d)所示,图1(d)右侧的图像为左侧选中区域的放大图像,可清楚地观察到各基元子图文件名及基元形状。为能够更清晰地观察蓝印花布中各图案基元的处理效果,图1(e)给出了4个图案基元,其中:第1行第1个图案基元为专家手工提取的原始基元,第2个图案基元为二值化结果,带有明显的锯齿边缘;第2行第1个图案基元为轮廓拟合优化后的带序号的图案基元,第2个图案基元为提取的优化后的图案基元,边缘光滑、清晰。
为对蓝印花布图像的基本图元进行提取,同时分析本文方法的有效性,选取部分扫描后形成的蓝印花布数字图像为实验对象进行验证。实验中的蓝印花布来自文献[24],并采用专家手工分割结果作为基准,如图2所示。实验的计算机环境为:Intel core i7,主频3.4 GHz,Windows 7操作系统,64位,Microsoft Visual Studio 2008,MatLab R2015b。
图2 蓝印花布纹样Fig.2 Patterns of blue calico. (a) Single pattern; (b) Geometric pattern; (c) Flower basket pattern; (d) Text pattern; (e) Plant pattern
将本文方法与Canny、文献[19]和文献[23]中提出的轮廓提取方法用于蓝印花布图案基元的提取,并对其结果进行分析。图3示出本文方法同其他3种方法在图2所示5张典型的蓝印花布图像上的图案基元提取的结果。其中,图3中4个分图中的A~E表示5张蓝印花布图像的提取结果,分别对应于 图2(a)~(e)中的初始图像。为观察每种方法提取的效果,在每种方法的右侧给出了提取结果的局部放大图,可清晰看到提取的轮廓及轮廓序号,便于了解其光滑特征。并对提取出来的图案基元轮廓用相应的数字序号进行标注,表明提取的顺序。图案基元轮廓的提取在图像上按从左到右、从上到下的顺序依次进行。
图4示出了采用4种方法对给定的5组蓝印花布图像提取图案基元子图的结果。因篇幅关系,每张图像的每种方法仅给出16个图案基元子图(黑色边框线包围而成的矩形框中的各个子图)。实际上每张图像生成的图案基元数量不止16个,这些基元子图依次用文件名SImg01.jpg~SImg16.jpg进行表示及存储,对应于图3中各图案基元的轮廓序号,并且图4中显示基元子图文件时省略了扩展名。在分析图4中生成的基元子图时,以矩形框为单元:行对应于初始蓝印花布图像处理的结果,即第 1~5行分别对应于图2(a)~(e)图像的提取结果;列代表采用的方法,即第1~4列分别对应采用Canny、文献[19]、文献[23]和本文方法提取后生成的基元子图像。
从图3、4中可看出,Canny是一种比较简单的轮廓提取方法,较为准确、快速,但用在蓝印花布图案基元提取中,存在轮廓线断裂、背景分割存在噪点、图案基元提取失败的问题。对图2(a)~(e)图像提取的图案基元子图进行统计,分别有7、3、10、10、18个图案基元的轮廓提取失败。利用文献[19]和文献[23]方法进行图案基元提取,均能正确提取出所有的图案基元轮廓,但文献[19]是利用局域化信息提取轮廓,轮廓存在明显的锯齿,且这种方法计算耗时;文献[23]是利用边界点的三角形方法形成轮廓,在保留关键轮廓点的同时,丢弃了部分轮廓像素,因而轮廓是由一些直线段组成,无法准确、完整、光滑地展现图案基元的轮廓。综合分析图3、4以及图1(e)的结果,利用本文提出的方法得到的轮廓线准确、光滑、圆润,保留了各图案基元轮廓像素的特征。
图3 本文方法同其他3种方法对图2所示的5张蓝印花布图案基元的轮廓提取结果Fig.3 Extracting results of contours of image elements by using our method and other three methods for five blue calico images(Fig.2). (a) Canny method; (b) Reference [19]method; (c) Reference [23] method; (d) This paper′s method
注:图中第1~5行分别对应图2所示5张蓝印花布。图4 本文方法同其他3种方法对5张蓝印花布图案基元提取后生成的基元子图Fig.4 Generating sub images of image elements after extracting image elements by using our method and other three methods for five blue calico images. (a) Canny method; (b) Reference [19] method; (c) Reference [23] method; (d) This paper′s method
为准确估计各种轮廓提取算法同专家手工提取效果的定量比较,采用基于面积的DC(dice coefficient)[19]和定义基于轮廓线的CC(contour coefficient)2个评价指标进行分析,其定义分别如式(5)、(6)所示。
(5)
式中:S1和S2分别代表采用各种轮廓提取算法获得的结果和基准;A(·)表示轮廓所包围的区域面积(像素点个数)。DC值越接近于1,表明提取效果越好。
(6)
式中:N(·)表示轮廓线上的像素点个数。CC值越接近于1,表明提取效果越好。
用于评价指标的典型蓝印花布图像共6张,包括图2中的5张和图1中的1张,分别对应于表1中的A~F。其相应的提取效果如表1所示。可以得出:相对于专家手工提取的图案基元轮廓,4种方法得到的DC均接近于1,说明轮廓线所包括的图案基元形状非常接近;对于指标CC,4种方法差别明显,这是由其本身算法特性决定的。而本文提出的方法,其DC、CC平均值均高于其他3种方法,提取结果最优。
表1 DC和CC标准下的6张蓝印花布图案基元轮廓提取的表现Tab.1 Performance of contour extraction of image elements for six blue calico images based on DC and CC
注:F为图1(a)所示纹样图像,表2亦同此。
同时,表2示出4种方法对图2及图1中共 6张蓝印花布的图案基元轮廓提取的计算时间的比较。可以发现,Canny提取效率最高,但由于Canny本身算法的缺陷(部分图案基元丢失),该方法不可取。除此之外,采用本文提出的方法的分割效率最高。
表2 4种方法的计算时间Tab.2 Computing time for four methods s
本文提出通过轮廓线拟合优化法提取蓝印花布的图案基元,作为蓝印花布设计创新素材的方法。利用图像处理技术,包括灰度化、去噪、二值化、轮廓跟踪,得到蓝印花布图案基元的轮廓线,通过提出的轮廓拟合方法获取光滑、完整的轮廓线,最后提取出图案基元,生成基元子图。通过和另外3种方法比较,验证了本文方法的可行性及有效性,为蓝印花布的创新打下基础。对于蓝印花布的传承与创新,今后的研究工作主要集中在以下方面:在提取的图案基元中,很多是相同或相似的,需要设计分类器将这些图案基元进行分类,形成基元库;利用基元库进行蓝印花布的再创作,自动生成新的蓝印花布图案,实现自动创新。