焦迎雪
摘 要 当前动态场景中的视觉目标识别技术在生活中的角色越来越重要,在军事应用,医疗卫生,交通指挥以及在人工智能方面都能看到该项技术的影子。其中图像目标识别这一环节更是机械视觉领域所不能替代的,是计算机真正能够拥有感知能力的一个重要途径。随着这几年科技的不断发展,目标识别技术也在飞速的提高,正在逐渐从研究阶段转变到现实的生活应用中。通过结合动态场景中受光照、视角以及背景等影响较大的目标对动态场景中的视觉目标识别,本文从视觉目标特征检测与描述和目标识别等方面对动态场景的视觉目标识别方法展开研究。
【关键词】目标识别 动态场景 特征检测 描述 支持向量机 空间金字塔
1 动态场景中的视觉目标识别方法的背景及意义
视觉目标识别是一种利用图像处理和模式识别领域的理论知识和方法,判断并对存在的感兴趣的目标赋予合理的解释,在必要情况下甚至可以确定其位置。其中视觉目标识别的场景可以分为静态场景和动态场景。现实中的场景大多数为动态场景,受到的环境因素特别大,比如光照条件的影响,场景中物物体的移动等等都会对整个识别环境的过程带来很大的影响。因此,动态场景中视觉目标对工作人员的研究具有一定的挑战。
2 动态识别系统的实际应用
2.1 辅助驾驶系统
辅助驾驶系统即为辅助驾驶员驾驶车辆或者可以使车辆进行自动驾驶的系统。辅助驾驶系统是一种通过雷达,红外探测仪以及摄像头,通过程序精确的为车辆判断自身车辆与障碍物或者在行驶过程中的前方车辆的距离,保证车辆的安全行驶。在遇到紧急的情况的时候,车辆自身的系统可以听过程序付出紧急警报或者自动刹车进行避让,对车辆的行驶以及司机的生命安全做出保障。
2.2 交通监控系统
交通监控系统可以在车辆、交通、以及驾驶员之间建立起一种快速的通讯联系,同时在道路发生拥堵以及道路上行驶的车辆发生故障时可以将这些信息以最快的速度传输给交通管理人员,使之坐车相应的安排。在功能作用上与机场的航空控制器的作用类似。
2.3 智能机器人系统
智能机器人系统是最近几年普遍流行起来的技术。智能机器人系统可以根据外界条件的变化对自身的行为动作做出相应的调整,具有类似于人类一样的感受,识别,推理以及判断能力。这种智能机器人拥有一定的自动规划的能力,可以在不需要认为的干预和照料下,能够完全独立的工作。智能机器人系统的发展将大幅度的改善人们的衣食住行,节约大量的劳动力。
2.4 智能监控系统
智能监控系统是指在嵌入式视频服务器中集成了一些智能行为识别的算法。该系统可以自动对话场景中的人、车辆以及其他目标识别及判断,并且在一定的程度上对可以对用户进行信息提醒。智能监控系统可以广泛的运用到现实生活中的诸多方面,比如物体识别,轨迹跟踪,越界识别,车牌识别,异常行为识别等。在应用应用领域上,智能监控系统在各行各业中都得到了广泛的应用,比如金融领域的营业大厅的监控,金库的监控,自动提款机以及自助银行的监控,商场的保安监控,超市,货柜,仓库的加官等等,交通领域的高速收费管理,交通违章,住宅小区以及商场停车场的无人监控等。
2.5 虚拟、增强现实技术
在医学技术,工业设计,考古和娱乐等领域中,虚拟增强技术都有着十分重要的应用用价值。计算机可以通过虚拟现实和增强现实这项技术,模拟出一个虚拟的三维世界,以及将部分的虚拟场景添加到现实生活中去。可见,增强现实是在虚拟现实技术的基础上来进行的,可以增加使用者的真实感,提高用户的使用了乐趣。
上述领域中,目标识别都起着相对重要的作用,其中动态场景的视觉目标识别同时也是将目标识别推广到实际应用的重要前提,因此开展动态场景中的视觉目标识别研究意义重大,具有十分广泛的应用前景。
3 国内外对于动态场景中的视觉目标识别的现状
从上世纪九十年代开始,麻省理工大学结合其他几所高校就已经在美国的组织下,开始了民用和军事上对于目标识别技术的研究。美国的几所联合起来的高校也共同研制除了可以通过颜色以及运动信息来识别道路和来往的车载视频实时处理系统。国内在目标识别这个领域上也进行了很多年的研究,在人脸识别,车牌识别等方面也获得了很杰出的成就。可是在目标识别的领域,国内外都存在着一定的问题,例如图像中物体的分割,视点不同造成的表象差异,无标记图像的学习等。因此图像中感兴趣物体的分割成为了目标识别的一个重要的难点。
4 目标识别模型介绍
4.1 对于目标识别模型的概述
目标识别模型主要的研究问题是如何对一个给定的目标进行建立模型的问题。在一个目标识别系统中,目标识别模型关系到目标特征以及学习、识别方法的选择和确立,并且具有十分重要的作用。自本世纪以来,Bag of words模型以及Parts based methods 模型已经逐渐成为了最广泛的使用模型,同时也取得了巨大的成功。但是对于科技的探索没有停止,科研人员一直都在探索使用起来更为广泛,更为方便的模型,同时也提出了很多全新的建模方法。
4.2 Bag of word模型
Bag of words模型最初是在model free模型上发展起来的,模型的主要基本思想是从图像中提取出目标物体关键的部分,然后根据这些关键点的集合表示图像的目标。Bag of word 模型是一种表示文档的方法,最初是运用在文献的搜索领域上。大致的思想是讲一个文档看做是一个一个词汇的集合,不去考虑文献中各种词汇的结合顺序以及语法,所以在检索的过程中,所有的单词都是独立的,互不影响,也不会随着语意的改变而改变。在Bag of word 后续的发展过程中,随着数字图像处理和计算机视觉技术的需要,研究者们也开始尝试将该模型运用到图像上,对图像进行表征,但是图像与文字的性质完全不同,图像不仅仅是简单的词汇的结合,因此在将Bag of words 模型用于图像的时候,可以不考虑图像之间的复杂关系,只是将其看作是一系列的简单视觉词汇的结合。
4.3 Bag of word模型存在的问题及解决方法
Bag of words 模型虽然已经是一个很成熟的模型,在实际生活中,被许多的系统以及研究所使用,但是仍旧存在着各种不足之处。当前Bag of words 主要存在的问题是,在处理特征点的检测过程中,通常会产生大数量处理的特征点,另一方面是在进行分类时,经常将目标在图像中的背景包含进行,其中还包括不属于目标的图像或文档,使Bag of words模型构成的词袋在有些情况下是不合理的。所以在使用Bag of words模型的时候,为了避免类似的问题,可以采用SCPCD的方法抽取出整个短语,或者采用高阶的统计语言模型,这样可以在一定的条件下解决这种问题,对于那些词序,句法以及语法均不能忽略的场合,不可以采用Bag of words模型。
5 结束语
本文主要陈述的是动态场景的视觉目标识别在生活和工作研究中的一些应用,以及在实际操作实行时遇到的一些问题以及解决方法。虽然国内对于动态场景的视觉目标识别的研究中取得了一定的进展和效果,但是仍旧伴随着一些较为明显的不足之处,仍旧需要科研工作者在未来时间内,在对这项技术的不断实践,不断发掘,发现问题,对这项技术进行进一步的探索。希望在进一步的研究过程中,对于动态场景的视觉目标识别一定会取得质的飞跃。
参考文献
[1]谭筠,安向京,贺汉根.基于优化的动态场景深度恢复[J].华中科技大学学报(自然科学版),2013(S1).
[2]刘华平,李建民,胡晓林,孙富春.动态场景下的交通标识检测与识别研究进展[J].中国图象图形学报,2013(05).
[3]王斌,肖文华,张茂军,熊志辉,刘煜.采用时空条件信息的动态场景运动目标检测[J].计算机辅助设计与图形学学报,2012(12).
[4]衡浩,熊惠霖.复杂动态场景下基于道路平面提取的行人检测[J].计算机仿真,2013(09).
作者单位
山西轻工职业技术学院 山西省太原市 030013