技术宅
说到人脸识别,可能很多朋友都非常了解了,无论是支付宝的登录,还是iPhone X的解锁,甚至ATM的取款,通过人脸识别都可以完成。不过这些人脸识别都只是对静态位置的人脸进行识别,现在有一个更为实用的研究应用——行人再识别。行人再识别是利用计算机视觉技术在图像或视频中检索特定行人的任务,从而在行动影像中识别对应的人物。
行动中的识别——了解行人再识别技术
如上所述,现在人脸识别大多只是对静态位置的人脸进行识别。在實际生活中,人很多时候是在行走的状态。如何识别行走的人物?这就是行人再识别技术,它通过摄像头或者监控视频,对行走的人体摄像按照指定要素进行匹配,从而实现对行动人像的识别,在视频中找到符合要素的人物(图1)。
显然行人再识别技术和常见的人脸识别不同,人脸识别是人们主动提供自己的脸型数据和选题预设数据进行匹配,从而完成脸型的验证。行人再识别则需要在众多视频影像中找出符合要求的人物,比如在某商场孩子走丢了,家长们通过提供孩子的体貌信息,然后根据这些信息在商场监控视频中去匹配特征,从而通过视频影像识别,并找到孩子的最终位置。
行动中的识别——行人再识别技术原理
如上所述,行人再识别技术主要是对视频影像中的行人进行识别。因为这些影像大多是摄像头捕捉的,这样和普通的人脸识别相比,一是捕捉的角度不同,摄像头捕捉到的可能是行人的背影或者侧面等影像;二是它在采集图像时不需要行人主动配合,而且采集的是动态行走的影像;三是对于行人识别可能需要在不同场景进行识别,比如在机场采集A的影像,当在商场再次出现A的影像时,同样需要对A实现精准识别(图2)。
显然行人再识别技术的识别难度就远远比人脸识别要难得多。那么这种技术是怎样实现对行人的精准识别的呢?
我们来了解一下识别技术的基本原理。无论是人脸识别、指纹识别还是行人再识别,从识别理论上来说大同小异。以人脸识别为例,首先是样本学习,根据人的脸型数据,按照一定的标准让机器学习大量的样本数据,同时借助AI技术,让机器学会自主学习。在完成大量的样本数据学习,机器可以精准识别人脸后,开发者就生成一套算法,然后使用这个算法就可以部署到识别服务器。这样机器预先将获取的人脸数据保存在数据库,再次采集到人脸数据后就会和原始数据匹配,匹配成功即可完成一次人脸识别(图3)。
回到行人再识别技术,它的原理与之类似。行人识别这种技术主要是依靠行人特征进行识别,首先是给定某人的一张图片,从多张图片中找到属于他/她的那一张或多张,最后通过行人整体特征实现的人员比对技术。因此行人再识别技术关键是要确定特定人物的整体特征,然后把它作为识别点和其他人物比对,这里整体特征就相当于“人脸”数据。
同样的该技术首先也是样本学习,通过制定一定的标准让机器去学习识别视频里的人物特征。当然这个标准是多维度,比如将人按照头、身、腿分成三部分分别标记其特征信息,或者先通过人体骨架估计,然后再通过骨架信息来对齐,这样就可以将每个人相对独立的特征提取出来(图4)。
当然由于人体特征点非常多,科研人员同时借助深度卷积神经网络去提取特征和自主学习,最终形成一套识别人物特征的算法。这样借助这套算法就可以对视频中的人物进行比对识别了。举个简单的例子,当在逛商场的时候,4岁孩子走丢了,孩子特征是4岁,下肢较长,当天穿着红色上衣。那么利用行人再识别技术寻找孩子时,只要在识别系统中输入上述特征,系统就会去和视频中符合这些要素的人物进行比对,很快就可以找到你家孩子最近(或者现在)出现的视频影像,从而快速找到孩子。
行人再识别 不仅仅和安防相关
说到行人再识别技术,很多人想到的就是警察追捕嫌疑犯的场景。确实该技术在当今的安防领域已经有着很多的应用,比如各地公安部门借助“天网”系统和行人再识别技术可快速找到嫌疑人的踪迹(图5)。
其实除了这些专业区域外,行人再识别技术还可以运用在我们生活里的很多场景。如现在很多朋友出外旅游都喜欢给拍照,拍摄人物多了以后照片就不好归类。现在借助行人再识别对拍摄的人物进行追踪,很容易就可以将照片按照自己、孩子、朋友的类别进行相册的分类整理。对于零售商来说,借助自己摄像头拍摄的视频结合行人再识别技术,则可以轻松知道哪位顾客经常光临自己的店面,喜欢在哪些柜台前逗留等详细信息(图6)。endprint