王福兴 伍花
【关键词】内容 图像检索 实现
1 设计目标
这种数字图像描述模型及处理系统,它可以在低层特征索引和语义特征标注之间建立一种统一的机制,该机制支持对特征提取结构的标准化描述,支持描述的分层结构,支持数据的透明访问等。分为通用视觉特征及导出特征提取、特定语义特征提取、知识库管理、查询子系统访问界面及统一存取子系统共5个子系统。
2 子系统功能
如图1。
系统包括5个子系统,其功能简述如下:
2.1 通用视觉特征及导出特征提取子系统
子系统功能主要包括:通用视觉本体的定义、以WSDL方式描述视觉特征提取接口、完成特征索引等。
子系统对图像的属性主要考虑以下几方面:
(1)图像创建信息;
(2)图像的颜色、颜色分布、纹理、轮廓形等低层特征;
(3)布局、摆放形式等导出特征。
2.2 特定语义特征提取子系统
子系统功能主要包括:特定领域本体的定义(如以人脸资料库为例)、以WSDL方式描述语义特征提取接口、支持自动语义标注或人工语义标注等。
子系统对图像的语义特征主要考虑以下几方面:表现事件或过程的描述;特定的人、地点、事件;专业术语及专业中通用的复合概念;图像相关的主观感受等。
2.3 知识库管理子系统
以RDF/OWL为基础,支持知识库的断言维护、实现知识库的查询语言功能、支持规则定义及推理机制。
知识库中包括通用视觉特征及特定领域应用两种类型的断言集和规则集。
2.4 查询子系统
在知识库的支持下,可以完成图像资料库的建立和维护,并且可以实现类似QBIC或商业搜索引擎的查询功能。
2.5 访问界面及统一存取子系统
实现人机、机机两种类型的访问界面,提供系统不同层次间的统一访问机制和接口调用。
3 开发环境
如表1。
系统支持的相关标准和协议
(1)在基础数据格式、描述方法及存取路径上遵循的协议,包括:RDF、OWL等相关标准。
(2)检索上支持国际国内的有关标准和协议,包括:通用查询标准,如:SPARQL等;低层信息检索协议,如: WSDL等。
4 系统实现的主要功能
4.1 圖像预处理
用户得到的图书图像,倘若不清晰或是有所划痕,可以根据分数阶微积分处理技术,如分数阶图像增强技术、分数阶图像修复技术对图像进行有效处理,得到有利与系统对图书图像的特征提取的效果图。
4.2 下层语义查询
图像的通用视觉特征分为低层特征,如颜色、灰度、纹理、形状、空间分布等,本系统通过自动的获取图像低层特征或手工标注图像低层特征,记录这些特征并存储起来。用户输入一张图像或是手工输入图像低层特征,系统根据低层特征查询包含用户所录低层特征的所有图书。
4.3 上层语义查询
图书图像的语义描述是提取图书图像的语义特征进行标注,并据此建立索引。对于图书图像的上层语义信息,即抽象的概念属性,如作者、书名、出版日期、ISBN号、出版社、语种、版次、所属分类、开本大小、字数及定价等等。用户输入图书的上层语义信息,通过SPARQL语句,后台自动查询并给出包含用户所录图书上层语义信息的图书。显然,这种查询的结果过多,并不精确,所以我们需要上层语义与下层语义结合起来共同查询。
4.4 下层语义与上层语义结合查询
用户以自然语言的形式,同时将图书图像的下层语义信息与上层语义信息输入到检索框中,系统后台实现自动分层,在实现上层语义的查询的同时,再借助下层语义来精确检索。如用户要找一本“图书封面背景是蓝色的C语言”,系统在查询出C语言书的同时,再根据低层图像特征蓝色来精确查询结果。
参考文献
[1]王东艳.中美数字图书馆研究比较[J]. 情报资料工作,2001(6):32-36.
[2]张蓓.图像检索技术的发展及现状分析[J].福建电脑,2009(004):42-42.
[3]蒲亦非,周激流.分数阶微积分在现代信号分析与处理中应用的研究[D].成都: 四川大学,2006.
[4]黄晓斌.基于内容的图像检索技术[J]. 大学图书馆学报,1999,17(4):25-27.
[5]祁宇明,季俊忠.Internet中图像检索技术的研究[J].科技咨询导报,2007(021):8-8.