袁小艳
(四川文理学院智能制造学院,四川达州 635000)
十几年来,巴文化的研究取得了可喜的进展,主要集中于巴文化区域(川东地区)的考古研究以及巴地民歌、舞蹈、乐器、服装、铜器、纹饰的研究等。研究中出现了大量的符号、图腾、纹饰、兵器、乐器、服装和建筑,这些多半都是以图像的方式展示出来的。重庆的三峡博物馆、巴国城博物馆和达州的巴文化馆均大量采用了图像,但这些图像仅仅是简单的使用,并没有更深层次的应用[3],如图像联系、人物联系、图像分割、图像分类[4]等。为了后期更进一步的研究、开发和宣传巴文化,需要对图像进行预处理,即图像显著性检测。显著性目标检测是包括图像分割、目标识别等在内的许多计算机视觉任务的重要步骤,有着重要的理论和应用价值。
显著性目标检测在图像理解和分析中有重要的作用,它的目标就是通过显著图得到显著区域,即能够第一眼就吸引人们注意力的区域[5]。显著性目标区域的检测通常受人类视觉感知观念所影响,其中一个观念就是显著性区域和其他区域在一定程度上是不同的,如颜色、边框、纹理等,因此很多显著性目标检测技术都是根据各种特征来检测的[6]。
陈蕾等融合了图像级别和像素级别的颜色特征检测显著图像[7],王豪聪等采用边界特征和颜色特征检测显著性[8],刘亚宁使用流行排序对前景和背景特征进行检测[9],刘松涛等融合邻域对比度特征和全局灰度特征检测红外图像的显著性[10],逄铭雪等提出颜色与梯度布尔特征相融合的显著性检测算法[11],崔丽群等提取了图像的颜色、亮度、方向和纹理等特征,并进行DWT 分解,得到多种特征图[12],柴小雲等提取了颜色、亮度、边缘等特征检测肺结点[13]。袁小艳等提取了颜色、纹理、Objectness、轮廓等特征并进行比较[14]。
当今研究的巴文化有广义和狭义之分[15],广义的巴文化是指和“巴”有关的所有痕迹,包括物质和精神两方面的,如青铜器和印章上经常使用的巴文化符号、独特的巫文化圈[15]、发达的巴文化舞、崇拜的白虎信仰等,狭义的巴文化是指巴文化遗迹与遗物的考古文化,如船棺、柳叶短剑、虎纹、印章、圜底罐等,该文研究的是广义巴文化。
广义巴文化的图像较多,多在巴文化数字博物馆中。数字博物馆中的图像仅仅是简单的展示,没有对巴文化图像进行识别和分类。显著性目标检测是研究巴文化图像识别、分类的基础。
从过去十几年的发展历程来看,视觉特征的不同决定了显著性检测模型的优劣程度。显著性检测模型的特征众多,如颜色、纹理、形状、结构、Objectness[14]、Focusness[14]、边框连接性、上下文、空间分布等,根据袁小艳等[14]的研究表明,颜色、纹理、边框、Objectness这4 种特征最适合进行显著性目标检测,但由于巴文化图像多为线条,前景和背景差别不是很大,所以该文选择提取颜色、边框和纹理特征,其算法流程如图1 所示。
图1 该文算法流程图
超像素分割的算法有多种,常用的算法有均匀分割和SLIC[16]分割算法。巴文化图像中的物体有规则的和不规则的,采用均匀分割的方式容易引入亮度、纹理和颜色完全不相似的像素点,为了避免这种情况,该文采用SLIC 算法进行超像素分割。
SLIC,即简单线性迭代聚类[16],是在K-means 算法的基础上进行改进的。它将彩色图像转换为CIELAB 颜色空间的图像,得到L、A、B分量。为了兼顾位置信息,加入X、Y坐标,构成了5 维特征向量,即[L,A,B,X,Y]。在该5 维特征向量中计算距离,并进行局部聚类。这样得到的超像素一般比较紧凑整齐,邻域特征也比较容易表达。SLIC 算法相较于其他超像素分割方法速度更快、超像素更紧凑,边界保持得也较理想。
SLIC 算法中比较关键的地方是每个超像素中心点的计算与像素点的聚类。超像素中心点的计算步骤如下:
1)假设图像大小为M×N,超像素数量为k个,将此图像均匀分为k个超像素块,因此每个超像素块的长和宽均是SL=,中心点是(SL/2,SL/2);
2)每个超像素块的中心点有可能在噪音点或者像素突变处,为了降低这个概率,采用差分方式进行梯度计算,计算中心点的8 邻域像素点,梯度值最小的点就是新的中心点。差分梯度计算公式如下:
最后,我国的环保政策对我国磷肥出口的影响较大,环保政策使得我国磷矿石产量下降、磷肥生产环保成本上涨,从而导致我国磷肥产量下降、磷肥生产成本上涨,最终导致国际磷肥供应紧张,这才助推了我国磷肥出口价格的上涨。
其中,I(i,j)是位置为(i,j)的像素点的值,G(x,y)是位置为(i,j)的像素点的梯度值。
像素点聚类的步骤如下:
1)在每个中心点周围的邻域内为每个像素点分配聚类标签,这个邻域范围是2SL×2SL,即是期望超像素尺寸的2 倍;
2)计算搜索范围内像素点与中心点的颜色距离和空间距离,公式如下:
其中,dc是第j个超像素块中心点和相应搜索范围内的第i个像素点的颜色距离,ds是是相应的空间距离,D是最终距离,m是LAB 空间距离的可能最大值,取值范围是[1,40],一般取10;
3)每个像素点对应多个超像素块中心,当然就有多个距离,取最小值对应的中心点为该像素的中心;
4)完成一次迭代后,重新计算每个超像素块的中心点坐标,并再次进行迭代,一般迭代10次就可以了。
在巴文化图像的分割过程中,经多次实验可知,k取值为300 最合适,其分割效果如图2 所示。
图2 超像素图
巴文化历史悠久,其物质文化大多是青铜器,文物也多是兵器、礼器等[17],其上的线条都比较简单。总地来说,巴文化图像的特点就是符号简单、颜色单调、纹理多样、形状清晰、边界分明,因此巴文化图像显著性检测算法可以只计算简单的特征即可,如颜色、边框、纹理特征等。
2.2.1 颜色特征
颜色特征,顾名思义就是图像的颜色。图像有多种颜色空间,如RGB、HSV、LAB 等。RGB 颜色空间是原始图像常用的模型,颜色由3 个分量R(红)、G(绿)、B(蓝)组成,三维向量构成三维空间。HSV颜色空间是根据颜色的直观特性创建的一种颜色空间,由H(色调)、S(饱和度)、V(亮度)来表示颜色。LAB 颜色空间与人眼感知颜色最相似,与设备无关,由L(亮度)、A(红绿色)、B(黄蓝色)组成。RGB颜色空间主要面向设备,HSV、LAB 颜色空间主要面向用户,HSV 常用于数字图像处理。巴文化图像的颜色单调,图像大多是灰色的,所以其超像素分割采用LAB 颜色空间,提取颜色特征时使用HSV 颜色空间。
颜色特征的提取方法有多种,如颜色局部对比度、颜色全局对比度、局部直方图、颜色频谱、颜色矩、颜色聚合向量、颜色分布等。颜色特征属于全局特征,该文选择局部对比度、局部直方图和颜色分布来描述颜色特征。
颜色局部对比度是从图像的局部出发,将局部区域和周围区域比较,这使轮廓周围有高显著值,适合于局部差异大的图像[7],其计算公式如下:
其中,n是区域数量,dis(ci,cj)是区域i和区域j的颜色距离(欧几里得距离),是区域i和区域j的平均位置距离。
局部直方图是对局部区域颜色的量化和统计,用于描述颜色的组成分布和所占比例,具有平移旋转不变性,其计算公式如下:
其中,n是区域数量,dis(bi,bj)是区域i和区域j的颜色直方图距离(卡方距离),是区域i和区域j的平均位置距离。
颜色分布主要用于测量图像前景和背景对象的紧凑型差异[7],其计算公式如下:
其中,locj是第j个区域的位置,sim(ci,cj)是区域i和区域j的颜色相似性,γi=是颜色ci的权重平均位置[11]。
多颜色特征如图3 所示。
图3 多种颜色特征
2.2.2 纹理特征
纹理是图像非常重要的一种视觉特征,它表现为物体表面缓慢、周期性的变化,通过像素点和周围邻域的灰度分布[14]来表示,即局部纹理,局部纹理的重复就是全局纹理。提取纹理特征的方法有灰度共生矩阵、LBP 局部二值模型、Gabor 滤波器、傅里叶变换等方法,该文采用Gabor 滤波器来提取纹理特征。
Gabor 滤波器的频率和方向都类似于人类的视觉,可以在不同尺度、不同方向提取特征。Riche 等[18]在3 个尺度和8 个方向上使用高斯Gabor 滤波器计算,得到24 张中间图。这24 张图的边界衰减如式(10)所示:
其中,x′=xcosβ+ysinβ,y′=-xsinβ+ycosβ,α是正弦波长,β是方向,φ是位移,δ是长度纵横比,σ是高斯函数的标准差[14]。
2.2.3 BonC特征
BonC 特征,即边框连接性,表示每块区域与边界的紧密连接程度,主要用来检测背景。每个超像素区域的特征值是超像素块周长和整个图像周长或面积开方的比例[14],其公式定义如下:
其中,super 块既属于r区域,又属于该区域的边框块的集合bnd[14]。
3 种特征效果如图4 所示。
图4 巴文化图像特征图
该文选择了3种颜色特征,颜色特征融合公式为:
其中,LC是颜色局部对比度,LH是颜色局部直方图,D是颜色分布。
得到颜色特征后,还需和纹理、BonC 特征融合,融合公式如下:
其中,C是颜色,B是BonC(边框连接性),颜色和BonC 采用贝叶斯算法进行融合,得到salCB显著图,然后将此显著图和Gabor 纹理salG显著图进行线性融合,得到最终显著图。
该文实验主要有两类,一类实验是各种特征的提取和融合,特别是颜色特征。颜色特征多种多样,该文提取了局部对比度、局部直方图和全局直方图,如图5 所示。文中进行多方面比较,发现因为巴文化图像的颜色全局差异性不大,所以全局特征效果是最差的,因此最终选择使用局部特征。
图5 颜色特征比较
另一类实验是CA 算法(上下文感知算法)、FT算法(频率调谐算法)与该文算法的比较,如图6所示。
从图6 中可以看出,FT 算法主要提取的是轮廓,没有从显著性整体出发,计算的是像素点的显著值,不是区域的。CA 算法的效果优于FT 算法,从物体的整体出发,背景处理得很干净,这也导致有些图像的显著性不完整。该文算法要优于前两者,因为它既考虑了细节又考虑了整体,还结合了背景特征。文中的巴文化图像显著性检测,需要快速进行,所以计算区域的显著值更好。根据结果显示,该文检测方法更适用于巴文化图像的显著性检测。
图6 各种算法比较
巴文化历史悠久,其文物随着考古的开发越来越多,由此延伸的精神文明产物也比比皆是,这就使得巴文化的数字化保护[19]刻不容缓。但巴文化图像众多,其包含的信息量也是庞大且冗余的,所以需要对巴文化图像进行处理,提取出图像的显著区域。该文围绕着巴文化图像的显著性目标检测进行研究,首先使用SLIC 算法对图像进行超像素分割,然后分别提取颜色、纹理、BonC 特征,最后进行特征融合,得到最终显著图[20-21]。图像显著性目标检测是一个极具挑战的课题,将其应用到巴文化图像中,是对巴文化保护的初步研究,后期还需继续研究,如巴文化图像的多方获取形成数据集、巴文化图像的采集等。