基于DCT域视觉的场馆监控图像显著区域检测

2021-11-18 05:05:50魏泽国赵长伟
计算机仿真 2021年1期
关键词:注视点分块特征向量

魏泽国,赵长伟

(河南科技大学,河南 洛阳 471000)

1 引言

图像的显著区域检测[1]一直是视觉研究领域的热点,将人类的视觉系统所感兴趣的区域利用计算机作为辅助的检测工具,感知该区域的运动目标[2]。在计算机中,显著性理论较为复杂,高级显著检测里会涉及到关于人的视觉、神经学、心理学等。在图像数据加工过程中,“注意”是在整个场景初步形成基础上的视觉感知,是一种重要的心理调节机制,其变化可以决定注视区的范围、注视点的具体位置。视觉注意的显著区域监测对图像的分析有着重要的意义,如果将这种调节机制引入到检测领域中,有效的图像信息就可以进行分配并具备感知选择的能力。在计算资源时,优先将注意分配到观察者容易感知的区域,这样就会提高图像分析的工作效率,以这种思想基础上建立的方法被学者们称为显著区域检测。

在传统的图像显著区域检测中,需要检测人员注意力高度集中的情况下工作,但是长时间保持这样工作会使检测人员注意力大大降低,也会给视力带来很大的负担,导致容易错过图像中重要的检测数据[3],所以传统的显著区域检测方法在实际的工作中实用性较差,效率不明显。近年来,已有相关学者对场馆监控图像显著区域检测做出了研究,通过对显著性检测方法使用的领域范围不同,可将现有的方法分为两种:文献[4]提出基于多特征的监控图像显著区域检测算法,主要包括对目标边缘度、对称性进行计算,但在同一区域中出现相似的目标时,检测结果偏差较大,因此,该方法的实际运用性较差,使用范围不广泛;文献[5]提出面向社群图像的显著区域检测,利用社群图像的CNN特征,进行显著性计算及语义计算,结合二者计算结果,优化显著区域的空间一致性。该方法计算结果简便,但得到显著区域检测图像的精准率较差。

针对上述方法存在的问题,提出基于DCT(Discrete Cosine Transform)域的显著区域检测,首先,将图像进行分割成图块,实现DCT系数对颜色、纹理等特征进行提取,再将图像进行阈值分割,获得显著区域。基于此,在视点转移中根据整幅图像的特征差异进行全局的显著度量,以全景判断图像中的注视区范围、注视点位置,计算注视点中最强的位置实现视区追踪,从而完成显著图像的区域监测。

2 DCT域显著性检测视觉系数提取

DCT的AC系数分为低频、中频、高频三种类型,低频系数包含了DCT主要信息;高频系数能够反映图像的边缘等较次要的信息。利用JPEG的基本原理对每个8*8块进行DCT,在对图像进行编码时,以最小编码单元(MCU)[6]为基本单位。

将图像以MCU为基本单位进行分割,然后将分割后MCU进行DCT来得到DCT的亮度块并进行特征提取。

单块MCU中包含了8*8的亮度块4个、8*8色度块2个A1和A2,图像中的原始值为aij,DCT块为B,则DCT如式(1)所示

(1)

据上文所述,以MCU为基础单位进行分割,如图1所示。

图1 MCU分割系数图

系数图在进行分割后,其中的低频分块都在左上角上集中,高频分块都在其余位置上分布。如图2所示,低频分量里包含着重要的DCT信息,高频分量可以忽略掉。F(0.0)表示DC系数值,将所有MCU的b进行提取,得到分量后的DC系数A1和A2,基于此转换到RGB颜色空间获得原始尺寸1/8的采样图像。

传统的降采样方法在检测当中容易将图像原始的信息丢失,然而,本文基于DCT实现显著区域检测可以有效地保留图像的原始信息,使检测后的图像信息数据更加准确。

图2 DCT8*8系统块

利用RGB[5]颜色空间方法提取采样后图像的亮度及颜色特征,其中,R、G、B用来分别表示采样后图像中红色,绿色、蓝色的颜色通道,I=(r+g+b)/3为提取的亮度特征,分别计算4个宽调谐的颜色通道如式(2)所示

(2)

据上文所述,最后,根据最初形成的人类视觉感官特性,将计算所得的4个颜色通道分解为2对互逆的RGB颜色特征,如式(3)所示

(3)

MCU的纹理特征值如式(4)所示

(4)

将图像中的DCT块遍历后,以归一化方法降低后文显著区域检测的计算复杂度,保留亮度分量中频和高频系数,得到相对应的纹理特征有效地保留了原图像的纹理细节,使接下来的显著性检测过程与结果更加真实。

3 DCT域视觉显著性检测

通过对视觉显著性选择与分析得到注视区范围与注视点位置,然后结合人类的视觉效果感知的特性进行进一步的优化,再将图像块的显著性以特征向量[7]的全局对比度估算得到,最后根据在不同特性的融合得到优化后的显著区域检测方法,

3.1 视觉显著性选择与分析

依靠DCT视觉的显著性来选择判断其中的注视点大小与注视区范围,是行业学者一直探讨的研究内容,为了获取到新的注视内容,文中提出以下的假设:以全局场景来判断注视点的位置,并计算注视点在场景中的视觉反差,从而得到全局显著性;再找到注视点中显著性最强的位置,得到视点转移;再根据场景的局部信息确定注视区的大小,计算与周边的反差得到局部显著性完成显著区域检测。

首先,如图3的视觉显著性图所示,A所占的位置要比图中其它部分更加明显,更加能够引起观察者的注意力,这就是视觉显著的突出性。A部分就是突出性最明显的部分也是图像中的显著性区域。以心理学的定义,使人能够产生新异的刺激、所期待的刺激场景区域都会引起视觉感知的注意,因为,视觉的显著性可以划分为两种:一种是高层视觉效果,由知识决定自上向下的视觉显著性,另一种是低层视觉效果,由信息数据驱动自上向下的视觉显著性。

图3 视觉显著性

若获得更多的场景信息必须循环交替地进行视点转移,因此,使注视内容变化的特点有以下几种:

1)转移性:注视点由强到弱的顺序由一个位置转移到另一个位置;

2)缩放性:注视区扩大或者缩小;

3)排斥性:同一时间内只能存在一个注视内容。

3.2 对比性与分布性特征向量全局

图像中显著性主要由分布性和对比性综合来决定,图像的显著对象内部区域关联性为分布性;图像的显著性和非显著性之间存在的差异性为对比性,其中,影响对比性的重要因素是亮度和颜色的差异。

3.2.1 分布性计算

在计算图像分块特征对比性同时,还应该考虑显著性区域和背景区域的空间分布不同。显著性区域的空间分布密集、内部的特征趋于相似,显著性就会较高;背景区域的空间分布位置比较分散,与前者相比,含有高方差的空间分布,显著度不明显,不易引起视觉注意,因此,图像分布的空间方差如式(5)所示

(5)

其中,图像分块xi的空间特征分布的质心和图像分块xi与xj的空间特征距离如式(6)、式(7)所示

(6)

(7)

图像分块xi特征值相对于图像分块xj的特征值相似权值[8]如式(8)所示

(8)

其中,Zx为归一化算子。

3.2.2 对比性计算

图像分块的周围环境差异决定了图像分块的显著性,周围环境与图像的分块差异越大越可能是高显著的区域。如果将该图像分块与其它图像分块进行对比更容易引起观察者的视觉注意,那么图像分块的显著性如式(9)所示

(9)

(10)

假设,xi和xj图像分块的中心位置以si和sj替代,ϑ2取值为20。因为带有亮度与颜色特征的图像分块在整幅图像中也是突出的,所以需要计算图像分块在全局图像中的特征显著性,如式(11)所示

(11)

C1(xi)=LC(xi)*GC(xi)

(12)

3.2.3 实现显著区域检测

在不影响显著检测的前提下量化[9]特征空间,统计特征向量的概率,频率最低的部分向量利用相近的向量进行替换,从而降低全局对比度计算的复杂度,最后构建符合人眼视觉特性的高斯函数,对全局对比度进行优化,完成图像显著区域检测。

DCT差值之和估计可以通过与其余(N-1)个特征向量计算,如式(13)所示

(13)

其中,特征向量Fi和Fj之间的距离以D(Fi,Fj)表示,因此,Fi的对比需经过(N-1)次计算求得,而遍历所有特征向量需计算N*(N-1)次。

需要将运算次数明显降低可以通过量化和统计特征空间内特征向量的分布规律计算求得,具体步骤如下:

2)对所有量化后特征向量进行统计,根据频率值降序后排序,保留前90%的特征向量,频率最低的10%被距离最近的特征向量替换。

3)对比性估计,假设最终保留的特征向量为n(<

(14)

其中,k∈(1,n)且n小于N,特征向量Vk的频率为fk,此时的计算次数为n*(n-1),由于n远小于N,因此计算次数明显下降。

在计算机视觉中,高斯差分函数是一种基于人眼视觉特性,将一个原始灰度图像的模糊图像从另一幅灰度图像进行增强的算法,通过函数计算以降低模糊图像的特征向量,然后从一幅图像中减去另一幅可以保持在两幅图像中所保持的频带中含有的向量空间信息,这样的话,原始图像中被保留下来的频率之外的其它频率信息利用函数计算进行去除,从而实现了图像的显著区域检测。其算法如式(15)所示

(15)

其中,Sif(Vk)为高斯差分函数计算[10]后对应的显著区域,而m1=n*θ,θ为确定显著检测的范围,

如图4所示,为式(15)计算得到的显著区域检测结果对比,可以看出,图像不仅前景区域与背景区域有明显的差异,而且前景区域有更好的突显性,使显著区域检测对比更加明显。

图4 显著区域检测图像对比

4 实验结果与分析

为了验证本文所提方法的有效性,实验主要内容包括对显著图像的精准度-召回曲线,以主观质量为基准。

对于单一图像,如图5所示,与对比图相比,显著图中的显著区域的像素点显著值更高且之间有着较高的一致性,而且背景的差异性越强背景区域的亮度也越低。

图5 对比度与显著性图像对比

将所选的图像进行实验,每幅图像在等到相应的对比度和显著性后,分别对两种图像进行分割,分割过程中阈值[11]区间为[0,255]并取整,基于此计算相应的精准度召回率,如图6所示,将最后所得的结果平均得到精准度召回率对比曲线。由于文献计算对比度时,没有考虑人眼的视觉特性,只考虑了图像的颜色和亮度,召回率的精准度低于显著图。

图6 精准度-召回率对比图

在显著图中,显著前景为色彩明显区域,而色彩偏暗区域为背景区域。一般情况下,不同的显著性检测方法准确性会从主观和客观两个方面进行对比。

为进一步验证本文方法有效性,将与文献[4]方法、文献[5]方法进行对比试验。最终结果如表1所示,统计了两种方法单张图像显著区域监测平均消耗的时间。

表1 单幅图像平均计算时间

结果显示,文献[4]方法提取图像特征后进行的显著性检测,耗费时间为1.740s,效率低,文献[5]方法的计算时间为0.794s,效率较低,而本文方法对图像中显著区域能够在获得良好的检测结果同时,单幅图像平均计算时间为0.259s,实际工作效率高,能够高效完成场馆监控图像显著区域检测。

5 结论

针对传统显著区域检测方法的不足,本文提出一种基于DCT域视觉的显著区域检测方法,首先对DCT域视觉系数进行提取,获得显著区域,通过计算得出显著区域范围与注视点位置,完成图像的显著区域检测。实验证明,本文所提方法成本低,可以实时对出现在显著区域的目标进行检测,并且在生活中实时性效果高、有着良好的检测效率。但不可否认的是,该方法仍有不足之处,本文所选择的特征描述形式与视觉感知都还存在一定的差距,接下来会进一步考虑如何引入更多有效的视觉特征,并结合实际应用建立有效性更强、更完善的显著区域检测系统。

猜你喜欢
注视点分块特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
眼动仪技术在里院建筑特色分析中的应用
克罗内克积的特征向量
基于超复数小波和图像空域的卷积网络融合注视点预测算法
分块矩阵在线性代数中的应用
一类特殊矩阵特征向量的求法
射击运动员的反向眼跳研究
体育时空(2017年6期)2017-07-14 09:24:48
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
中华建设(2017年1期)2017-06-07 02:56:14
基于中央凹图像显著性和扫视倾向的注视点转移预测模型
反三角分块矩阵Drazin逆新的表示