邓建华+陆玲
摘要:现在社会上流行的虚拟智能试衣系统的核心技术就是服装区域的定位与提取,而准确快速定位出一张图片中人像的服装区域则是其难点所在,而本方法则是通过图像预处理和图像分割等技术比较准确地定位出图片中人像的衣服区域解决了这个难点.从而为虚拟的智能试衣系统打下基础。
关键字:虚拟智能试衣系统;服装区域定位;图像预处理;图像分割
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)27-0137-02
1 引言
随着科技的发展,特别是近几年”互联网+”的迅速崛起,近日,多款虚拟试衣软件进入手机平台。不少市民在网购衣服时,实际到手的衣服穿起来和网商宣传图片差距较大,所以许多网购族在网上买衣服时往往抱怨没法判断自己是否适合某套衣服。如今各种新出的虚拟试衣软件系统有可能改变这种尴尬局面,并为网购衣服带来新的转折点。而虚拟智能试衣系统中首先要解决的就是人像中服装区域定位的问题。这也就是本文研究的重点。而人像中服装区域定位就和图像感兴趣区域的定位是一样的道理,可以借鉴感兴趣区域的提取方法来达到与优化人像中服装区域定位技术。
Claudio M.根据人眼的视觉特征提出了八种通过计算局部最大值来提取ROI的图像处理算法。第一种是对称变换(symmetry transform),第二种是离散小波变换(discrete wavelet transform),第三种是沿灰度级方向的差(difference in the gray-level orientation),第四种是每单位区域的边缘(edges per unit area),第五种是熵(entropy),第六种是麦克尔逊对比度(Michaelson contrast),第七种是离散余弦变换(DCT - discrete cosine transform),第八种是高斯-拉普拉斯算子(the Laplacian of the Gaussian)。根据以上八种方法,模拟人眼的视觉特征,并寻找图像中人眼最敏感的视觉停留点,再通过聚类(clustering)和排序(sequencing)实现感兴趣区域的提取[1][2]。
Itti 等人提出了显著图(saliency map)模型。显著图是一幅表面图像中各点的显著性特征的二维图像,显著图可由输入图像经过拓扑变换得到,然后通过动态神经网络选取显著值最大的点作为注视点[3][4][5]。
Rao 等人提出把高斯微分函数作为滤波器对图像的点在 m 个方向 k 个尺度上进行滤波,得到的响应可以组成一个 m×k 维的特征向量,然后就可以基于这个向量来选取注视点[6]。
在以上研究的基础上,本人针对智能试衣系统中的服装区域提取问题提出了一种服装区域定位提取方案,本方案是通过图像灰度化、Sobel、二值化、封闭区域填充方式和积分投影法等图像处理技术相结合来定位出人像中的服装区域。通过实验验证本方法能够将服装区域的定位效果较好地呈现出来。
2 人像中服装定位
2.1灰度化
图形图像处理方法绝大多数都是对灰度图像进行处理。灰度花就是将原彩色图通过平均值法的灰度化效果使其变成灰度图,从而可以减少图像的色彩特征,为后续的处理奠定基础。处理效果如图2所示:
平均值法:
2.2 Sobel算子处理
对灰度图进行Sobel算子处理,就可以形成梯度增强的图像同时也让图像的边界部分更加明显.从而可以在图片中凸显出人像的轮廓部分。处理效果如图3所示:
具体算子方法如下:
2.3二值化
将Sobel效果图在进行二值化,通过二值化使得整个人体的图像轮廓能够凸显出来.常用的二值化方法有直方图求阈值,基本的全局阈值法和Otsu.这里采用的是基本全局阈值法。处理效果如图4所示:
基本全局阈值法:
1)计算图像平均灰度作为初始阈值T。
2)利用该阈值变换函数(1)的计算,求出两组灰度,并计算两组灰度的平均值m1,m2。
3)计算新的阈值。
4)重复步骤2,3,直到最近两次迭代的阈值差小于给定的误差为止。
2.4创新方法
在对图像二值化以后,图像中的白点分布不均匀,这样对后续使用的图像分割产生一些影响而使得我们不好提取我们需要的服装区域,所以针对此项瓶颈从而提出一种封闭区区域填充的方式让图像能够更好的分割。其处理效果如图5所示:
创新点:封闭区域填充方式:遍历整幅图的像素点,如果此像素点上面,下面,左边,右边都有封闭的白点把它围住,那么也将此点变白,如果其上下左右有一边没有被围住那么此点将会变黑。
2.5积分投影法
水平积分投影是将每一行像素的灰度值求和后投影到垂直方向上,设f(x,y)是图像中像素点(x,y)处的灰度值,且x的范围为x1<=x<=x2.则水平积分投影为:
垂直积分投影是将每一列像素的灰度值求和后投影到水平方向上的,当y的取值范围为y1<=y<=y2,则垂直积分投影为
3 人像中服装区域定位效果图
4 总结和未来展望
从上述的图像效果中可以看出本方案已经实现了人像中服装区域基本的定位分割功能效果,能够通过一些图像处理的方法并结合自己提出的一些方案能够很好地定位出人像中的服装区域,从而为整个智能试衣系统的实现奠定了核心基础。
虽然实现了初步定位效果,不过还是存在着一些不足,比如图7所示人像服装区域头部和腿部定位不是特别的精确,而且这种定位功能目前只能针对纯色单一的背景人像服装的提取并且服装颜色不能和背景颜色太相似,如果背景复杂的话或者服装颜色与背景颜色相似那样就会极大降低提取区域的准确率.所以如何提高服装定位区域的精确性和提高复杂图片的适应性也就成了后续智能试衣系统的研究重点。
参考文献:
[1] Claudio M. Privitera, Lawrence W. Stark. Evaluating image processing algorithms that predict regions of interest, Pattern Recognition Letters, 1998(19):1037-1043
[2] Claudio M. Privitera, Lawrence W. Stark. Algorithms for defining visualregions-of-interest: comparison with eye fixations, IEEE Transactions on PatternAnalysis and Machine Intelligence, 2000(9):970-982
[3] Laurent Itti, Christof Koch, Ernst Niebur. A Model of Saliency-Based VisualAttention for Rapid Scene Analysis, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998(11):1254-1259
[4] Laurent Itti, Christof Koch. Comparison of feature combination strategies for saliency-based visual attention systems, Proc. of SPIE , 1999(3644):473-482
[5] Laurent Itti, Christof Koch. Computational modeling of visual attention, Nature Reviews Neuroscience, 2001(3):100-112
[6] Rajesh P.N. Rao, Dana H. Ballard. An active vision architecture based on iconic representations, Artificial Intelligence Journal, 1995(78):461-505.