刘 亚, 张团善, 王恩芝
(西安工程大学 机电工程学院, 陕西 西安 710613)
灰度图像可以用最基本的信息表示原图像,反映其重要特征,并且空间占用少,运算量小,系统处理效率高;由于其具有处理操作步骤少、可视化快和成本低等优点,促使研究人员投入对彩色图像到灰度图像转换的研究。彩色图像的灰度化在机器视觉、文字识别、指纹识别、光学条纹识别、细胞识别,和军事上的自动目标识别等领域有着更广泛地应用。
图像的灰度化是将3个通道的彩色图像转换成符合人眼视觉的单通道图像,并且使得转换后的图像保持原有图像的特征、轮廓、边缘和纹理等。由于图像灰度化是一个信息压缩的过程,不可避免地会丢失或削弱[1]图像原有的特征,如色度、边缘信息等,且稳定性较差。如何最大化的利用灰度的有限范围来准确地呈现彩色图像的对比度及细节特征,确保灰度图像更符合人眼的感知,仍是图像灰度化研究中的重要课题。
根据目前已有算法中映射函数是否可以作用于整幅图像的所有像素,彩色图像灰度化算法可分为全局映射法和局部映射法2类[2]。全局映射法着眼于整体颜色分布差异,对所有像素采用同一映射函数,因此具有全局一致性。如Gooch等[3]提出了“color2gray”的彩色图像灰度化算法,引入了像素对之间的颜色对比度,结合相邻像素之间的亮度与色度差去建立相邻像素间的颜色差,最后使用迭代法求目标函数的最优解;Kim等[4]采用了非线性参数模型,将颜色与灰度图像之间的梯度差作为目标函数,通过最小化梯度差来求解映射函数中的参数;陈广秋等[5]由3个通道与对比度图之间的结构信息相似度直接求取映射函数权重系数,输出灰度图像,但由于整幅图像所有的像素均采用同一映射函数,结果使输出图像变得平滑,造成原彩色图像的局部特征不明显。局部映射法着眼于局部颜色分布差异,根据局部分布差异调整局部空间的像素强度,能够精确地保留局部特征信息,如Smith等[6]结合H-K颜色效应和全局映射确定颜色排序,然后使用拉普拉斯金字塔来进行局部对比度的调整,增强不明显的局部边缘;卢红阳等[7]在目标函数中引入原始图像梯度的权重系数实现最大化,并且在原彩色通道梯度中用高斯加权系数表示,保留原彩色图像中对比度不明显的区域;顾梅花等[8]将彩色图像灰度化为保留RGB的3通道单色图像特征的多尺度融合问题,采用梯度域导向图像滤波去除由于多尺度图像融合而造成的伪影,但这种类型的算法强调局部特征信息,忽视全局信息,对整体图像造成不同程度的信息损失,容易产生晕轮、噪声增强等问题。
为了得到最优灰度图像,同时兼顾准确性、鲁棒性以及高效率,将彩色图像中颜色对比信息最大范围的映射到输出灰度图中,得到符合人眼视觉感受的优化灰度图。课题组综合全局映射法和局部映射法的优点,从不同像素间梯度信息产生的边缘轮廓入手,提出一种基于高效边缘检测的彩色图像灰度化算法,通过计算备选灰度图像的边界点数来估计权重系数,使用像素差异网络[9]对离散权重空间后得到的备选灰度图像进行边缘检测,边缘图像与原彩色图像的轮廓重合度最高的灰度图为最优选项。
用颜色通道的线性组合来表示灰度输出:
g=ωrIr+ωgIg+ωbIb。
式中:Ir,Ig,Ib是输入图像的R,G,B通道;ωr,ωg,ωb是R,G,B通道中要优化的参数,ω={ωr,ωg,ωb}称为权重空间。
进一步在权重上执行一个正约束和一个能量守恒约束,以使灰度图像在[0, 1]。这2个约束为:
ωr+ωg+ωb=1。
根据实验可知,稍微改变权重ωr,ωg,ωb时,灰度外观并没有明显的变化,而且步长选取的越小,备选的灰度图像就会越多,后续处理时间也会随之增加。经过大量实验对比,综合考虑灰度转换效果与效率,课题组选取步长St=0.1。此离散方法,可得到66个备选灰度图像。
传统的边缘检测如Sobel算子,信息利用率不高,没有侧重于梯度信息;而基于卷积神经网络(convolutional neural network, CNN)的边缘检测算法检测性能高,学习能力强,但是需要对大规模数据集进行模型预训练,占用大量内存和能量,使得计算成本高、运行效率低、吞吐量低和标签效率低。
像素差值网络是一种简单、轻量级并且有效的框架。课题组采用了像素差值卷积(pixel difference convolution, PDC)计算图像中的像素差,然后与卷积核权重相乘获得输出特征如图1所示。像素差值卷积不依赖于传统边缘检测Canny算法[10]辅助卷积神经网络模型进行边缘信息检测,而是直接将梯度信息提取过程整合到卷积运算中,使卷积运算更加紧凑、可学习性更强;像素差值卷积只有1个主干结构,使用了1个简单的捷径分支(shortcut)[11]作为卷积块的第2分支;并且像素差值卷积使用了可学习的滤波器,可更加通用和灵活地捕捉丰富的梯度信息用于边缘检测。
图1 像素差值网络框架
像素差值卷积与普通卷积的区别仅在于像素差值卷积是对像素对的差值做卷积,而普通卷积对单个像素值做卷积。
普通卷积公式:
像素差值卷积公式:
像素差值卷积是将扩展的局部二值模式(elongated local binary pattern, ELBP)算法与卷积神经网络相结合,得到图2的3种像素差值卷积的计算方式:中心像素差值卷积(central pixel difference convolution, CPDC),角度像素差值卷积(angular pixel difference convolution, APDC)和径向像素差值卷积(radial pixel difference convolution, RPDC)。像素差值卷积可以帮助PiDiNet有效捕捉更多有用的边界,提取丰富的梯度信息,便于边缘检测。
图2 3种像素差值卷积实例
式中:yi是像素为i的边缘概率值;η是预定义的阈值,在计算损失时,如果被标记为正的像素少于η,则该像素将被忽略且不被视为样本;为避免混淆,β是负像素样本的百分比,且α=λ·(1-β),则总损失函数:
图像的边缘可以很大程度上体现彩色图像的基本特征。若提取的边缘对原彩色图像的轮廓复原度越高,那就说明此灰度图像在越大程度上保留了彩色图像的特征信息。所以对66个备选灰度图像提取边界,对边界点数进行统计。边界点数最多的灰度图像对应的权重系数就是最优的投影方向。
2.1.1 彩色图像边缘提取
图3 彩色图像的边缘提取图
2.1.2 彩色图像灰度化
图图像集和BSDS500图像集彩色图像灰度化结果
图4中Gooch算法和Smith算法损失了部分色彩对比信息,没有突出原彩色图像中的重要特征,对边缘轮廓比较分明的图像产生的灰度图比较平缓;而GcsDecolor算法不能很好的转化一些低饱和度的图像,结果出现空图;Rgb2gray算法产生了过度拟合的效果;笔者提出的算法整体亮度较高,不仅特征保留的较好,彩色图像中的特征在灰度图像中仍然是可分辨的,而且排序保留良好,在彩色到灰度的转换中可以保留所需的颜色排序。
2.2.1 不同灰度化算法的客观评价分析
灰度化图像间差别不大时,人眼视觉做出的主观评价并不是唯一评判标准,需要引入客观评价方法对灰度化图像进行定量分析。课题组采用Lu等[14]提出的颜色对比度保持率(color contrast preserving ratio, CCPR)进行定量分析。颜色对比度保持率RCCP度量指标是基于一种人类对颜色的感知现象,但当彩色图像中2个像素点x,y的欧式距离δ小于阈值τ时,RCCP值在人类视觉中几乎是不可见的。因此,颜色对比度保持率的任务是保持人类可感知的颜色变化。
式中:Ω为原始图像梯度δx,y≥τ的子像素对集合;‖Ω‖表示Ω中的像素对数量;gx-gy为灰度图像像素梯度值;#{(x,y)|(x,y)∈Ω,|gx-gy|≥τ}为集合Ω中经过灰度化处理后还存在像素间差异的个数。
RCCP表征的是灰度图像中对比度与输入颜色的相似程度,RCCP越接近1,代表灰度化效果越好。
平均颜色对比保持率(average color contrast preserving ratio ,ACCPR)的公式如下:
平均颜色对比保持率越大表示灰度图像与输入彩色图像的相似程度越高。引入参数平均颜色对比保持率可以更好地研究每幅图像的性能。
在客观评价中,分别度量不同算法灰度化后颜色对比度保持率RCCP及τ的值为1~ 15时RCCP的均值RACCP,结果如表1和图5所示。从表1可以看出笔者提出算法得到的灰度图像RCCP值比Gooch,Smith,Rgb2gray和GcsDecolor算法得到的RCCP值大,RACCP值也是如此,充分体现了笔者提出算法的优势。由图5可以看出5种算法的RCCP值都比较接近,但笔者提出的算法在不同的阈值水平上均优于其他的算法,并且更加稳定。图4也显示笔者提出算法得到的图更加清透,符合人眼视觉感知。综上所述,笔者提出算法将可见的颜色变化映射到灰度变化方面效果较好,更好地反映了彩色和灰度图像之间的结构相似性。
表图像集的CCPR
图5 BSDS500图像集的RCCP值
2.2.2 不同灰度化算法的主观评价分析
借鉴文献[7]中的实验模式进行用户主观对比实验。使用具有代表性的13幅图像, 将笔者提出算法和Gooch,Smith,Rgb2gray和GcsDecolor算法进行用户选择性实验和准确性实验,我们邀请30位年龄在20~50岁的参与者, 他们没有视觉缺陷并且从事不同行业。图6所示为参与者年龄、职业及有无相关学科研究经历等情况分布。
图6 参与者信息情况分布
选择性实验:在没有提前接触相关彩色实验图像的基础上,用户每次从2幅灰度图像中选择他们认为相对较好的图像 (一幅是笔者提出算法得到的灰度图像, 另一幅是按照顺序依次提供4种算法得到的灰度图像),每位参与者均进行4次选择实验。
准确性实验:给用户提供原彩色图像及Gooch,Smith,Rgb2gray,GcsDecolor算法和笔者提出算法得到的结果图,用户选择出最能表示原始彩色图像的一幅结果图,每位参与者只进行1次选择实验。
实验结果显示准确性实验耗时相对于选择性实验较长。用户主观对比实验统计结果如图7和图8所示。从实验结果来看, 笔者提出算法相对于另外4种算法结果效果要好。由图7~8可以看出用户对笔者提出算法的结果图有较优先的选择,可知笔者提出算法的灰度化效果相对其他4种算法有较好的视觉效果。
图7 选择性实验结果
图8 准确性实验结果