旅行照的背景图像检索模型研究

2018-03-02 12:22张荣臻
数字技术与应用 2018年12期

张荣臻

摘要:熱门景区拍摄的旅行照背景中通常会混入无关人物,影响旅行照的效果。本文探索了旅行照背景图像检索的方法,以期应用于旅行照的二次处理。方法中引入了行人检测模型,以提高背景图像检索的准确率。

关键词:图像检索;旅行照;行人检测

中图分类号:TP391.3 文献标识码:A 文章编号:1007-9416(2018)12-0058-01

近些年来,旅游成为了日常生活的一项常规活动。但是,大众旅游一般都集中在节假日时段,这也导致了热门景区人挤人的情况频发。在这样的背景下,拍一张满意的旅行照成为了一种奢望,通过技术手段对旅行照进行二次处理不失为一种新选择。旅行照处理涉及到背景图像和人物图像两方面的处理技术,本文集中探讨背景图像的处理方法。本文研究了一种旅行照背景图像检索模型,通过该模型检索出匹配的背景图像,以期应用于旅行照的合成。

图像检索方法分为文本搜图和以图搜图两种,旅行照缺乏准确的文本标签匹配,其背景图像的检索需要采用以图搜图的方法。以图搜图的图像检索方法,主要依赖于图像视觉特征的提取,如颜色特征、纹理特征、形状特征,进而根据查询图像和数据库图像之间的特征相似性来获得最终检索结果[1]。旅行照中不仅包含前景图像和背景图像,如果将整张旅行照图像特征提取出来用于检索,前景图像的特征必然会干扰到图像的检索效果。本文尝试通过自动筛除前景图像特征,保留有效图像特征,以提高检索准确率。

1 背景图像检索模型

旅行照的前景图像为人物图像,这部分图像除了照片主角的图像,还有过往行人的图像。这些人物图像信息对于背景图像检索不仅毫无作用,还可能引入多余特征影响图像检索,因此在图像检索之前剔除人物图像非常有必要。基于人物图像的特性,模型引入了自动驾驶领域流行的行人检测方法来分离出背景图像,之后再将分离所得的背景图像用于图像检索。详细的模型结构如图1所示,旅行照图像经过行人检测模块处理框选出人物图像,之后从原图中去除人物图像区域及其周边区域得到背景图,之后提取背景图特征与数据库中的图像进行逐一匹配,检索出数据库中相似性较高的图像。

整个模型中,行人检测模块功能相对比较独立,该模块选用R-CNN网络进行行人检测。其检测流程为:使用Selective Search得到潜在的目标候选区域,所得的候选区域图像归一化处理后传入到CNN中得到其特征向量,通过SVM对输入的特征向量进行分类确定其是否为目标。用于图像检索的特征提取是否合理也是影响模型效果的关键要点,这里主要使用了颜色特征、纹理特征、形状特征。颜色特征的提取使用空间颜色直方图来实现,这样既可以反映颜色信息,又保留了颜色与像素位置特征之间的空间关系。图像纹理特征的提取通常是基于灰度共生矩阵,涉及的图像纹理参数包括能量、熵、对比度、相关性,本模型延用此方法。图像形状特征提取的方法比较多,如内角向量、梯度向量、Hu矩向量、惯性矩向量、Harris角点向量等,这里选用Harris角点向量[2]。

2 实验

模型中的行人检测模块参数需要进行单独训练,由于深度模型需要使用大量数据用于训练,这里选用了INRIA训练数据集用于训练。训练完成后使用自建旅游景点图像数据库进行图像检索效果验证,效果如图2所示。

3 结语

背景图像检索模型能从图像数据库中有效检索出相同背景的图像,不过排名靠前的图片通常与去除行人区域后的图像区域较为接近,后续还需要进行图像区域匹配方面的优化。

参考文献

[1]刘丽端.基于聚类的图像检索技术研究[D].武汉理工大学,2012.

[2]刘爽.多特征融合图像检索方法及其应用研究[D].哈尔滨理工大学,2016.

Background Image Retrieval Model for Travel Photos

ZHANG Rong-zhen

(Zhejiang Institute of Economics and Trade, Hangzhou Zhejiang 310000)

Abstract:Thravel photos taken in popular scenic spots usually involves irrelevant people, This paper explores the method of retrieving background images of travel photographs in order to apply to the secondary processing of travel photographs. A pedestrian detection model is introduced to improve the accuracy of background image retrieval.

Key words:Image retrieval; travel photos; pedestrian detection