商 睿
图像识别技术是将所需物体进行有效信息采集,并依据所采集信息,在数据库里进行关键信息检索,从而将所需物体归类到不同种类的图像处理信息技术。其本质是将物体这一个体范围投影到类别范围。这种技术主要是对图像所体现的信息进行识别。图像识别技术的发展主要经历了文本信息提取识别,分割图像信息识别,三维物体信息识别3个阶段。图像识别系统主要由划分图像,提取图像有效信息,检索关键信息并以此分类将个体投影到类别这三大部分组成,是目前世界上较为先进的识别技术[1]。
图像识别技术的原理是基于人们对事物的认知过程。当人们看到一个陌生的事物时,会在潜意识里在自己的大脑存储库里搜寻这种事物的关键词。图像识别技术亦是如此,它是先扫描面前的物体,通过图像分割等步骤及方法,提取出有效信息并根据有效信息进行检索得出物体种类后归类。只不过图像处理技术搜寻的关键是在于事物的特征是否明显,若特征明显,那么搜寻的效率就高,反之特征不明显或者模糊不清,那么搜寻的效率就低。
图像识别技术的发展主要经历了文本信息提取识别,分割图像信息识别,三维物体信息识别三个阶段。文字识别兴起于1950 年,主要是识别字母数字符号为基础的印刷文明。随着时代的发展,图像识别技术开始识别手写文字,且应用广泛在许多专业设备中都有其身影。数字图像识别技术于19世纪60 年代中期兴起,其具体出现的时间有待考证。这种识别技术主要是对二维世界的信息提取与检索分类,是在图像识别技术发展中,应用较为广泛的识别技术。在人类社会发展中起了非常重要的作用。这种技术除了感知与认识的作用外,还有着易于储存运输处理方便等巨大优势,极大满足了人们对于图像信息提取处理的认识传播的需求。以上两种均是针对于二维世界,而近代兴起的物体识别则是针对于三维世界,但物体识别也是在数字图像识别的基础上兴起的,它通过对物体本身及环境的感知达到识别的目的。物体识别属于高级计算机视觉领域,对我们生活产生着不可替代的意义。
图像识别分两大步,第一步是对图像进行分割。对于图像的分割,就目前来看有着3 种基本方法。第一种是依据图像的阈值不同进行分割。这是较为常用的一种方法。这种方法本质上是基于不同目标的灰度值来选取信息,具有用时短效率高的巨大优势。但是这种分割的局限性也很大,如不易区分阈值从而造成提取出大量无效或具有干扰性信息。第二种方法是依据区域不同来进行图像分割。分割有两种基本形式,一种是区域生长,一种是分裂合并。与其他方法不同的是,这种方法可以有效避免因无法区分阈值而提取出大量无效信息的问题,并且这种方法注意到了维护空间的连接性。因此,具有很强的鲁棒性。第三种方法是通过检测图像像素的灰度值,并识别这些像素灰度值的差异,从而探测到图像的边缘地区来进行分割的方法。这种方法的科学技术含量较高,且需要按一定策略,将检测所得边缘点链接形成轮廓,构成所需图像分割领域。第二步是进行图像的匹配。在图像匹配这一步中,现在最为常用的方法是细节匹配。这一步相较于上一步更为复杂,需要将一定信息数据带入公式,再依据公式检测出细节是否匹配[2]。
航空与卫星遥感技术是当今图像识别技术应用较多的领域。其主要分为两个方面,一是摄影,二是图像识别,其中图像识别又分为光学机器扫描(红外探测系统)和多光谱遥感技术。红外探测系统是依据地物发射的热辐射温度的差异,将红外辐射能量以亮度表示的一种图像化系统。多光谱遥感技术则是一种特殊的技术。在地物的辐射中,一般来说产生的是较宽的、连续的电磁波,在这样的电磁波里难以直接获取信息。而如果把这种电磁波分割成许多个比较瞎站的光谱段,就可以获得一些有效信息。这种以摄影或扫描的方式,在同一时间获得同一目标的、来自不同光短信息的技术就是多光谱遥感技术。这种技术在当下研究航空卫星图像时是一种非常重要的内容,也是图像识别技术的重大应用[2]。
人脸识别技术是图像识别技术在生物信息提取识别方面的一种最为广泛、最为主要的应用。人脸识别是近年来各领域研究的热点问题。这是一种依据捕捉人眼鼻嘴的参数比例,在数据库进行搜索识别技术[3]。但是这种技术也存在着一种缺陷,当外部环境或者人表情姿态发生变化是人脸识别的性能就会将下降,因此在人脸识别技术上,很多研究者对光照及姿态变化进行了专门的研究,找到了多种解决的方法,如针对于光照变化的构建图像模型,针对于姿态变化的线形对象类思想,当然也有同时针对光照和姿态变化的三维建模思想,这些方法思想在近几年均有了较大的进展[4],但在实际应用方面还存在着较大的挑战。
在农业生产方面,图像识别技术主要应用于识别不同的植物,如花伴侣App[5]。花伴侣App 是一种面向大众新型知识服务App,它是基于中国植物图像库,将里面的植物按照所属群科分类。人们只需要拍张照,就能知道这个植物是什么种类,是什么科的。方便了人们的生活,对于扩大人们对植物的认识有着非常重要的意义。
图像识别技术在交通方面应用较为宽泛,如汽车标志定位技术,用于定位车标,在现实生活中具有重要意义。车标识别技术的原理并不复杂,利用摄像头等摄影工具,把车标拍照后上传到数据库,再通过数据库进行关键信息的检索,即可得到我们所需要的信息。但是由于车标识别技术中的定位并不准确,因此带来识别中车标大小尺寸的差异,所以如何减小这种差异也成为研究智能图像识别技术的热点。除此之外,图像识别技术在维护交通安全方面有着重要的作用,交警可以将监控信息上传,通过人脸识别,在信息库中搜索相近的信息得出相似度最高的人员,从而协助交警抓住肇事逃逸人。因此图像识别技术对交通安全的维护有着一定促进作用。
图像识别技术在军事上有着重要的应用,对军事化的发展起到一定的促进作用。如在军事演习中所使用的遥感技术,对地面物体的信息提取分析将所得主要信息呈现在所需人的屏幕上。除此之外,图像识别技术还有利于军事勘察,并且对于军事勘察有着不可替代的作用。
机器视觉也可运用于对货架中的商品进行识别。这一工作的原理是:先让机器分析与识别大量的图片,同时纠正机器判断出错的数据,同时使用神经网络的算法反复学习。在这样过程之后,计算机就获得了具有简单的识物功能。在此基础上,继续对机器进行训练,使其可以认识货架上商品的包装,是瓶装还是袋装亦或其他类型,甚至是什么品牌、口味与规格。这样的机器可以准确识别成千上万种商品,大大提高无人超市的管理等工作的效率。
图像识别技术在当今世界中起着不可替代的作用,它的应用范围大到军事航空,小到日常生活,在现实产生着重要意义,极大的方便了人们的生活,并且协助人们维护社会日常准则。但是图像识别技术在当下并不完善,它还存在着许多未知领域和技术难题等待着我们的探索和完善,除此之外,图像识别技术也并不是人们所想象中的那样,它对人类同样存在着一些威胁,只不过尚未表现出来。因此,针对图像识别技术,我们在积极开发它的同时,也要注意合理运用。