王春妍
(江苏海事职业技术学院信息工程系,江苏 南京 211170)
移动终端的迅速发展,使得一个完全网络时代降临。用户和网络间的连接不仅限于室内或者计算机设备,而且可以通过任何终端访问互联网。目前移动终端设备迅速发展,屏幕规模可达到5英尺,将实现八核处理器,和快速指纹识别功能。此外,针对用户时空信息的提取技术也已基本成熟,可以利用三维的时空信息帮助用户更好地在网络中进行交流。因此,图像采集技术也从传统的摄像和扫描等获取方式,转变成和移动终端紧密连接的方式,从而获得丰富信息的、多维度的图像。
目前,许多商业搜索引擎,如Google,Yahoo!等均利用在图像和视频上加文本标签的方式,基于语义的搜索方法来检索相关图像或视频。这种方式由于图像信息和标注的文本不同步,或者信息不匹配问题,常无法准确地检索到所需图形图像信息。为了解决低层特征与高层语义概念间的语义鸿沟问题,图像信息的自动标注研究,成为当前关注的热点。图像视频的标注技术结合了基于文本的检索与基于内容的检索两者的优点,有效地解决了语义鸿沟问题。基于学习的标注将图像或视频标注作为一个学习问题,用每幅图像的所有关键词或关键词与视觉特征的联合分布建立一个统计模型。在文献[3]中,利用判别式条件随机场CRF模型把图像作为整个观察数据,用组合的方式从语义层次和视觉层次获得语义概念的相互作用,利用图形结构建立语义概念的上下文关系,利用Contextual Kernel解决一组独立的二次设计问题,用TRECVID做实验数据库来训练模型。该方法的优点是不需要图像分割,与传统的SVM方法相比,查准率和查全率都有很大提高。
图像搜索引擎的检索模式就是它的检索方式,根据这些检索方式来确定不同的检索策略。图像检索模式的核心问题是图像特征的抽取和图像检索。前面的图像搜索引擎的案例代表了两种不同的检索模式:基于文本的检索模式和基于内容的检索模式,此外还有基于两者结合的综合特征的检索模式。下面就对图像搜索引擎检索模式进行分析,并探讨不同的应用状况。
(1)基于文本的检索模式
基于文本的图像检索是对图像的名称、编号、内容描述、图像大小、图像所在文件的大小、图像来源、作者、建立图像的时间、存储地点等关键性的信息采用自动标引或进行人工注释,并进行图像的特征抽取,建立图像索引数据库,然后按全文数据库管理,采用全文数据库检索方法。现在的基于网络的图像搜索引擎就是大都采用的这种基于文本的检索模式。网络上的图像文件通常以GIF、JPG、PNG等作为扩展名的。如Google抽取图像的题名、图像大小、图像内容的描述语言、图像所在文件的大小、图像来源、作者、建立图像的时间、存储地点等信息,专门针对这些图像信息建立索引。Corbis通过人工对图像信息标注。
(2)基于内容的检索模式
大容量的图像/视频数据库,一般的文字搜索引擎已经不能满足用户需求,基于内容的图像检索技术如何快速、有效地从大规模的图像库中检索出有用的图像已成为国内外研究的热点。虽然该方法有效地考虑了图像的语义信息,但是基于关键词的图像检索方式存在因用户理解差异而导致对图像语义理解的歧义问题。
随着个性化服务技术的发展,图像信息资源管理也要求实时记录和更新用户的个性化信息,检索时遍历用户侧档,为不同用户输出符合用户个性化要求的检索结果,用户每次反馈的信息都会有选择性地再次更新用户侧档中的信息,使个性化信息永远持续被更新。
目前随着用户对图像资源检索的需求量不断增大,图像搜索引擎的发展如火如荼。图像搜索引擎向着个性化、智能化,以及交互性方向不断推进。图像搜索引擎的个性化原则需要打破当前用户界面提供什么样的图像信息显示内容、排列什么样的搜索结果、利用什么样的访问设备等别无选择的限制,从根本上实现查询界面的个性化、信息类型的个性化、访问设备的个性化等。
[1]汪斌.基于ARM和GPRS的农田现场信息远程采集系统的研究[D].昆明理工大学,2010.
[2]张庆辉.无线粮仓害虫检测系统[D].河南工业大学,H04N7/18;H04N7/08.
[3]Y Xiang,Semantic context modeling with maximal margin conditional random fields for automatic image annotation[C],Computer Vision and Pattern Recognition(CVPR),2010 IEEE Conference on,3368–3375
[4]Jamieson,M,Using Languageto Learn Structured Appearance Models for Image Annotation[J].IEEE Transactions Pattern Analysis and Machine Intelligence,2010,31(1).