李 宗, 徐家品
(四川大学 电子信息学院,四川 成都 610064)
给定一幅图像,图像质量好坏通过人工来判定比较容易。但人工评定效率很低,不同人有不同的评判。这种主观的评价方法无法适用于海量图片的评定。因此客观的、有明确的数学表达的图像质量评价方法的建立十分有必要。
文中提出一种有效的图像质量评价方法。从图像的颜色丰富程度、局部特征丰富程度以及是否背景丰富、是否包含多个子图等信息进行综合质量评价。通过对互联网上抽取的1600万张进行测试,文中方法对图像质量的评价有效地改进了后续图像处理的效果,改善了图像搜索的体验效果。
图像质量评价包括主观评价和客观评价两方面。主观评价是用人眼观察判断图像的好坏。德克萨斯大学有这样一个学术界公认的主观评价数据库[1];美国国家图像解译度分级标(NIIRS[2],National Imagery Interpretability Rating Scale),其分为可见光,雷达,红外,多光谱图像的评价。客观评价是对图像通过计算得到一个评价值,分为有参考和无参考两类。现今,业界对图像质量客观评价的研究还主要停留在个别的、细分的领域,而且大多都是有参考的客观评价。目前图像质量的客观评价内容可分为3个方面:噪声量、模糊度、曝光度。
为了得到一个图像质量的综合评价,可以结合曝光情况对清晰度和噪声程度的值按一定比例加权后得到一个最终的评价值。
文中方法是基于单幅图像的绝对图像质量评价方式,对于大部分图像都能从展示效果和后续图像处理的角度进行有效的质量评价。
文中从以下几个方面入手,对质量分级、内容分类处理:判断图像是否为纯色背景;判断图像是是否为简单图像(包括颜色简单和局部特征较少)。
判断图像是否为纯色背景的前提是,首先从图像中将背景提取出来。背景是否能够恰当提取,会对该项判断的准确性有一定的影响。现有的前背景提取方法有:2004年J Sun[3]提出使用泊松方程进行区域提取的方法;2008年A levin[4]采用邻近区域方程进行图像分层的方法。2008年Y Tai[5]在文章中提出二值分层的方式获取特征区域的边界。目前的算法,在大多数情况还很难从图像中提取出准确的图像背景,但是也可以进行一些简单的判断。
采用的图像区域的判定方法:对原图的灰度图用 canny边缘检测后得到边缘二值图,通过两次膨胀和一次腐蚀变换后对其求连通块。然后根据连通块的特性判断此连通块是否为背景。具体的连通区域判断依据为:连通区域的面积率;连通区域的标准方差;连通区域中的洞的个数以及区域中的洞占区域的面积率;连通区域是否处于图像的边缘位置。背景区域提取以后采用背景区域的面积大小、面积率、背景区域的标准方差等信息综合判定背景区域是否为相对纯色区域,如图1所示,图 1(b)中黄色区域表示提取的背景区域,通过判定为纯色背景,图 1(d)中阴影区域表示提取的背景区域,通过判定为非纯色背景图像。
图1 图像纯色背景判断
2.2.1 图像是否接近自然图像色彩分布
有关自然图像的统计分布研究也非常的广泛,如 Fergus[6]从大量的自然图像中,求得统计的平均梯度分布,如图2所示。图2中的中间部分代表了图像的平滑区域,图2中的两边拖尾代表了图像的细节部分,可见,自然图像中大部分区域是比较平滑的。同时也说明通过图像的强度统计信息来判定图像的质量好坏是可行的。
图2 图像统计平均梯度分布
为了计算方便,采用图像的直方图信息来讨论。从大量的图像的直方图中分析得知。直方图统计信息比较糟糕的主要有以下3种情况:①图像本身所含带的信息太少;②计算机生成图像;③图像拍摄时欠曝或者过曝。下面列举了几类图像的示例。直方图分布是否合理:该判断是分析图像的直方图分布,得出图像直方图分布与图像质量之间的对应关系。如图3,图4和图5所示,可以明显的看出来3类图像所对应的直方图分布的差别很大。图 3和图4是用相机实际拍摄的图像,图5是用计算机生成的图像。实际判断时,通过分析直方图分布的主峰个数,主峰宽度等实现。使用直方图统计信息进行判断时,没法区分这3类图像。不过在图像搜索时,可将这些图像一并处理。
其实现方法为:①扫描图像直方图,获得最高峰的位置和高度;②设定一个阈值线将直方图划分为多个隔离的峰,统计各个峰的位置、峰高、峰宽和峰所占的面积;③合并峰顶距离较小的峰;④统计图像中的颜色数和滤波后的颜色数(滤波的高度阈值为 MAX(10.0,总像素/1000);⑤通过图像滤波颜色数和峰的个数、宽度、面积等判断项综合判定是否符合自然图像彩色分部要求。
图3 欠曝图像与其直方图
图4 过曝图像与其直方图
图5 计算机生成的非自然图像与其直方图
2.2.2 图像局部特征是否丰富
图像局部特征是相对于图像全局特征而言的,指在图像局部区域提取的特征,包括图像中的特殊点、脊、边、斑点等等。由于局部特征大多具有良好的旋转不变性、灰度不变性、几何不变性等,近几年对图像特征的研究发展非常的迅速,成为很多图像处理技术的基础,比如图像拼接、图像三维重建、图像搜索等。现有的图像特征算法有 Moravec角点、Harris角点、SIFT特征、SURF特征、MSER特征等。
图像局部特征的复杂度,很大程度上代表了图像所带信息的复杂度。考虑采用图像局部特征的有效个数来判定图像的信息丰富程度。上述的图像特征算法各有不同的特征,在实际的运用中可以根据实际情况来选择合适的图像局部特征进行该项判断。
在实际应用中,使用图像搜索特征提取一致的算法,无需重复特征提取。这里,以SIFT算法为例来展示的结果。步骤为:①高斯金字塔分层;②层间求差值;③在本层的 3×3矩阵和相近两层的3×3矩阵的26个点中判断是否为极值点,如果是极值点判断为斑点,否者则不是斑点。由图6可见,图6(a)中有效的特征点数有 89个,图 6(b)中图像的特征点数有 15个,两图的信息复杂度差别也可由此得来。
图6 图像局部特征提取
为了检测上面判定项的有效性,从互联网上随机的下载了1600万多张图像。规定图像最长边大于 100,尺度过小的图像所能容纳的信息较少,可以直接判断为简单图。
表1 图像搜索系统测试结果
在判断图像局部特征是否丰富时,该方法召回率达96%,准确率达96%,其判断时间跟选择的局部特征有关,用搜索一样的具体特征算法,其时间可忽略。
从实验结果可见,各种图像的存在会影响搜索的效果。作为一个普适性的图像搜索引擎,一刀切的将该部分数据丢弃是不合理的,需要在图像搜索算法实现时将这部分图像区分处理,比如简单图像优先和简单图像匹配等[7-10]。可以明显地感觉到该方法无论从数据还是实验效果上都极大地改善了图像搜索判别效率。
[1]BOVIK A C.Subjective Image Quality Assessment-LIVE Image Quality Assessment Database[DB/OL].(2010-09-17)[2011-10-10].http://live.ece.utexas.edu/research/quality/subjective.htm.
[2]LEACHTENAUER J C.National Imagery Interpretability Rating Scales Overview and Product Description[C]//ASPRS/ACSM Annual Convention & Exposition Technical Papers.Bethesda: ASPRS/ACSM, 1996:262-272.
[3]SUN J, JIA J, TANG C K, et al.Poisson Matting[C]//Siggraph’04.USA:ACM,2004:315-321.
[4]LEVIN A, LISCHINSKI D, WEISS Y.A Closed-form Solution to Natural Image Matting[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2008, 30(02):228-242.
[5]TAI Y, DU H, BROWN M S, et al.Image/video Deblurring Using a Hybrid Camera[C]// Computer Vision and Pattern Recognition.Anchorage: Proc.IEEE Conf.USA:IEEE,2008:1-8.
[6]FERGUS R, SINGH B, HERTZMANN A, et al.Removing Camera Shake from a Single Photograph[J].ACM Transactions on Graphics,2006(25):787-794.
[7]李鹏,田东平,张楠.基于混沌序列的数字图像隐藏技术[J].信息安全与通信保密,2007(06):222-225.
[8]张磊,赵维.基于DCT的图像低频域数字水印方法[J].信息安全与通信保密,2007(03):85-86.
[9]胡玉晖.基于局部子区域的活动轮廓图像分割方法[J].通信技术,2010,43(02):68-70.
[10]李强,王喆.基于小波分析的图像压缩[J].通信技术,2010,43(08):236-238,241.