深度学习在公安实战中应用前景的研究

2021-12-16 04:01
湖南警察学院学报 2021年4期
关键词:声纹警务人脸

封 顺

(吉林警察学院,吉林 长春 130117)

一、引言

随着公安信息化建设的不断推进,我国平安城市、雪亮工程、治安防控体系战略的深入发展,实施公安大数据战略,着力打造数据警务、建设智慧公安应运而生。如何运用警务大数据,并使公安工作实现科技化、智能化和高效化,提升公安实战各领域的信息化技术手段,这是公安工作者需要亟待解决的问题。近年来,人工智能相关技术不断应用到公安领域中,公安警务工作方式日新月异,公安实战应用也发生了翻天覆地的变化,这些新技术为警务工作提供新思路、新方法和新模式,为公安各警种实战应用提供了有力的技术支撑,并在实际应用中发挥了至关重要的作用,大大减轻了一线民警的工作负担,极大地提升了公安警务工作效率。

深度学习是当前人工智能领域发展最快和最引人瞩目的领域,在计算机视觉、自然语言处理、网络安全等许多应用领域中都取得了很高的成就。随着研究的深入,目前已涌现出许多基于深度学习的网络模型和算法,卷积神经网络、循环神经网络和生成对抗网络是当前比较热点的网络模型,深度前馈网络、BP算法、正则化、Relu激活函数、稀疏编码、Dropout[11]、LSTM[9]长短时记忆等是当前使用较为广泛的深度学习算法。相关模型和算法以及改进型在人像识别、图像处理、目标检测与跟踪、机器翻译、自动驾驶、声纹识别、网络信息安全、图像生成等现实应用领域中取得了成功。

近年来随着深度学习在诸多领域中得到了长足的发展,被广泛应用在各类人工智能任务中,且都取得了理想结果。一些从事警务研究人员将注意力转移到深度学习研究领域,尝试构建深度学习模型来处理公安实战中遇到的问题。目前流行的深度学习网络模型为卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)和生成对抗网络(Generative Adversarial Networks,GANs),受到了人工智能学术界和工业界的广泛研究和高度关注,可应用于警务工作中的诸多领域,在公安实战应用中有着广泛的应用前景。

二、深度学习模型

人工神经网络[1](Artificial Neural Network,ANN)是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度出发对人脑神经元网络进行抽象描述,从而建立某种简单模型,按不同的连接方式组成不同的网络。深度学习是人工神经网络的发展和延续,2006年Hinton在《Science》杂志上首次提出深度学习概念,提出多层人工神经网络模型有很强的特征学习能力,深度学习模型对原始数据有更本质的表述等观点[10]。在大数据技术和计算能力飞速发展的今天,深度学习作为目前人工智能领域研究热点,因其具有广泛的发展前景,受到了学术界与工业界的双重关注,近年来也涌现出成功的深度学习模型。下面介绍应用较为广泛的卷积神经网络、循环神经网络和生成对抗网络。

(一)卷积神经网络

卷积神经网络(Convolutional Neural Network,CNN)是一类以卷积计算为主体,包含激活函数和降采样,且具有深度结构的前馈神经网络,是当前应用最为成功、网络深度最深的深度学习模型之一,在计算机视觉、图像处理、生物信息等领域取得了巨大的成功。CNN模拟了人类视觉信息处理的过程,这种信息处理方式非常类似图像处理领域的图像卷积运算,原始的图像以二维图像呈现,由一个卷积核来对整张图像进行处理,得到带有原始图像某种特征信息的新的图像,这样就把原始信号中某种特定的信息提取出来,实现信息压缩和抽象。随着层数的堆叠,每层有若干个特征提取,若干层堆叠在一起,逐步实现对概念、对视觉的理解。

图1 人类视觉皮层处理视觉信息过程

图2 二维图像卷积运算示意图

图3 卷积神经网络结构图

卷积神经网络主要包括五部分:输入层、卷积层、激活层、池化层和全连接层[19]。输入层对输入数据进行标准化处理,这项处理操作有利于算法学习效率的提升;卷积层主要功能是实现对原始信号的特征提取、抽象、压缩和理解,每个卷积层由多个卷积核组成,每个卷积核通过共享相同的权值处理上层的全部数据或部分数据,通过调整卷积核的大小和权值可以实现不同特征的提取,通过权值共享可以减少参数的数量来提高学习效率,使得网络模型具有更好的泛化能力;激活层通过引入激活函数(Sigmoid、tanh、Relu)来增加非线性因素,使得网络可微可导;池化层实现降采样,在保持特征布局不变的同时不断减少数据输出维度,使得参数数量和计算量下降,从而保留最有效信息并控制过拟合现象,这是卷积神经网络能够持续加深的原因,常用的池化有最大池化(Max pooling)和平均池化(average pooling);全连接层对卷积层、激活层、池化层学习得到的特征信息拉平为一维向量,经过几个全连接的前馈神经网络(FNN)的加权求和,预测最终输出结果。

最早出现的卷积神经网络有时间延迟网络和LeNet,被用来识别字符,随着更有效的卷积神经网络模型的提出,以及数字计算设备的更新和大数据带来的机遇,CNN在2012年有长足的发展,并在以后衍生一系列的深度学习算法模型,如LeNet-5、AlexNet、VggNet、GooleNet、ResNet[21]等。

(二)循环神经网络

循环神经网络(Recurrent Neural Network,RNN)是一类善于处理和预测序列数据的深度学习模型[7]。RNN及其变体网络已经被应用到很多领域,尤其是具有序列性质的输入和存在一定时间依赖的关系的数据,如语音识别、机器翻译、词量生成、文本分类、信息检索、情感分类、音乐生成、DNA序列分析等。网络最大的特点就是隐藏单元在前一时刻的输出作为当前时刻的输入再次输入到隐藏单元,这样就可以把当前时刻的状态传递给下一时刻[2],t 时刻隐藏单元接收网络前一时刻的隐藏单元的值a^()和当前的输入数据x^()两方面内容,并通过隐藏单元的权值计算出当前时刻最终的输出,从而保持数据中的依赖关系;重复网络结构中的隐藏单元参数(W_ax、W_aa、W_ya)是共享的,展开后的循环神经网络计算过程如下:

图4 展开后的循环神经网络网络结构图

RNN通过正向传播(Forward Propagation)得到a

然后计算每个元素和整个序列的损失函数(Loss function):

最后使用通过(穿越)时间反向传播[8](back propagation through time)求导来更新网络中的权重参数,这也是当前循环神经网络最常用的训练算法。

循环神经网络能够将输入序列数据映射为序列数据作为输出,根据不同任务,输出数据长度和输入序列长度不一定相同,有多用对应的关系。图2-5中(a)“多对一”结构,可用于电影情感分析等任务,首先读取输入为一个电影评论的文本,然后判断他们是否喜欢电影;(b)“一对多”结构,可以用于表示生成音乐、图片描述等任务,输入固定大小的矩阵表示的数值或图片,输出一首美妙的音乐或图片描述文字;(c)“一对一”结构,是一个小型的标准神经网络,输入序列数据后得到输出,固定的长度输入和固定长度输出;(d)和(e)是“多对多”结构,输入输出都为序列数据,(d)输入输出同步,可用于语音识别,(e)输入输出为非同步,可用于机器翻译,一个中文句子和一个英语句子不同数量的单词却能表达同一个意思。目前,在实际应用中使用最广泛的循环神经网络架构来有门控循环单元(Gated Recurrent Unit, GRU)、长短期记忆网络[9](Long-Short Time Memory, LSTM)和双向循环网络(Bi-directional RNN, BRNN)。

图5 不同类型RNN结构示例图

(三)生成对抗网络

生成对抗网络[12](Generative Adversarial Networks,GANs)在2014年由Goodfellow首次提出,是当前深度学习领域最具潜力的研究成果之一。其核心思想受博弈论中二元零和博弈的启发,同时训练两个相互协作、同时又相互竞争的深度神经网络,它的框架中包含一对相互对抗的模型:判别器(Discriminator,D)和生成器(Generator,G)。生成器的目的是学习真实样本的数据分布,生成与真实样本分布高度逼近的生成样本,判别器的目的是判别训练样本是真实样本还是生成样本。二者为了在博弈中胜出,需不断提高各自的样本生成能力和样本判别能力,通过连续不断的对抗训练,生成器生成以假乱真的生成样本分布最大化,判别器判别真实和生成样本的错误概率最小化。

图6 生成对抗网络示意图

生成器和判别器都是任意可导可微函数,因此,建立一个损失函数(Loss function)来监视和判断模型学习效果,然后利用随机梯度下降法(SGD)进行优化。由于判别器是一个二分类模型,可采用交叉熵表示其损失函数[3],即

其中,E是求期望,D和G分别为判别器和生成器的可微函数,x为真实数据样本,z为随机噪声矢量,G(z)是生成器的生成数据。公式(5)前半部分表示判别器D判断出x是真实数据的情况,后半部分为判别器D判别数据是由生成器G将噪声矢量z映射而成的生成数据的情况。在训练优化生成器G时,输入为噪声向量z,希望生成样本G(z)通过判别器D后的概率值为1,即希望D(G(z))趋于1,故极小化模型G。在训练优化判别器D时,当输入为真实样本x时,希望D(x)趋于1;当输入为生成样本G(z)时,则希望D(G(z))趋于0,故极大化模型D。因此GANs的优化问题可描述为下面极大极小博弈问题,最终的损失函数为:

在模型的训练过程中,生成器G和判别器D的参数交替迭代更新,先固定G,训练D,更新迭代D的参数,然后在固定D,训练G,更新G的参数,在不断重复上述过程最终达到模型稳定。GANs作为一种生成式模型,最直接的应用就是对真实数据进行建模并生成与真实数据分布一致的数据样本,目前使用较为广泛的生成对抗网络模型有提出推土机距离的WGAN[17](Wasserstein GAN)、首次将卷积神经网络引入GAN中DCGAN[14](Deep Convolutional GANs)、提出了一种图像到图像翻译的通用方法的Pix2Pix[15](Image-to-Image Translation with Conditional Adversarial Networks)、提出了一种一对多的图像到图像的翻译方法StarGAN(GANs for Multi-Domain Image-to-Image Translation)。

三、深度学习在公安实战中的应用前景探究及发展趋势

(一)应用前景探究

1.卷积神经网络在人脸识别中的应用

2017年7月,国务院发布的《新一代人工智能发展规划》指出,围绕社会综合发展、新型犯罪侦查、反恐等迫切需求,要研发视频图像信息分析识别技术、生物特征识别技术的智能安防与警用产品,建立智能化检测平台。随着2012年深度学习的兴起,极大地加快了人脸识别技术的研究进程,在众多现实场景中取得了成功的应用。其中使用卷积神经网络架构的人脸识别算法在进行训练和验证时,具有高识别率、高精确率、模型稳定和拓展性强等特点,成为人脸识别领域学术界和工业界的研究热点,在警务工作中将会逐渐的被应用于公共场合治安维护、云端身份认证、公安视频侦查等公安安防领域。

人脸识别技术(Face Recognition)是一种基于人的面部特征信息进行身份识别的生物特征识别技术。在公安实战应用中主要的三种应用模式有:人脸验证(Face Verification),即判定两张人脸图像是否属于同一人,常用于身份认证如人证核验;人脸辨别(Face Identification),即给定一张人脸图像,判断是否在人脸库中,若在则返回具体的身份信息,常用于犯罪嫌疑人静态检索或动态布控;人脸聚类(Face Clustering),即给定一批人脸图像,将相同人的图像归类到同一个类,不同人的划分为不同的类,常见的应用有智能相册、一人一档等。

图7 基于卷积神经网络模型的人脸识别流程图

当今主流的人脸识别算法,包括活体鉴别、人脸检测、人脸预处理、特征提取、比对识别五步骤。其中活体鉴别用来判断人脸识别处理中的人脸图像是否采集自真实人体;人脸检测是从视频或图像中检测出人脸,记录和标记重要部位的位置;人脸预处理和特征提取主要判断图像质量、位置、光照条件,选取固定大小的人脸图像,输入到卷积神经网络模型中提取人脸特征向量;比对识别可分为人脸验证(1:1)和人脸辨别(1:N)两类。

公安安防是基于深度学习人脸识别算法应用最广泛的领域之一,主要为视频结构化、人脸检索、人脸布控、人群统计、智慧交通、出入安检等方面提供安全可靠的人脸识别服务,重点应用于犯罪人员的识别追踪、失踪儿童寻找、反恐行动助力、大型安保、可疑人员跟踪、视频监控智能检索等工作。在公安应用场景中达到事前预警、事后跟踪、事后快速处置的目的,并在平安城市、雪亮工程、天网工程、智慧城市等公安项目中发挥了至关重要的作用。

2.卷积神经网络在恶意代码检测中的应用

恶意代码已经成为目前网络空间安全中最多的威胁来源。近年来,全球各地网络信息安全事故频发,各行业的电子信息设备不断遭受攻击,严重破坏了社会稳定和威胁国家安全。智慧公安打造的精准警务需要依托于警务信息综合平台,具有实时性、高效性、稳定性、机密性等特点,如何保证系统信息安全而不受病毒的侵扰一直都在困扰着警务工作者,因此亟需一种高效准确的恶意代码检测分析技术来消除其带来的潜在威胁。

恶意代码检测方法按照是否可执行代码分为动态检测和静态检测,传统方法都需要依赖专业的实验室与复杂的工具和具有丰富经验的分析检测人员,需要较高的人工和经济成本,严重影响恶意代码的识别率和准确率,难以满足大数据时代下大规模的恶意代码检测需求。近年来,卷积神经网络模型被用于检测恶意代码,通过从大量的恶意代码样本中进行恶意特征的提取,并训练这些恶意特征进行分类,最终得到恶意代码识别模型,其模型具有资源消耗低、操作简单方便和自动化程度高等显著优点。

图8 深度学习恶意代码检测方法的一般流程

基于多通道图像视觉特征和AlexNet神经网络的恶意代码检测方法[6]将采集到待检测的恶意代码转化为具有更加明显图像特征的多通道图像,利用带有局部均衡归一化的AlexNet的卷积神经网络搭建恶意代码检测模型,使用多通道图像提取彩色纹理特征并分类进行恶意代码检测。利用均衡处理后的Malimg数据集进行测试,结果显示不同类恶意代码的彩色图像纹理特征具有相异性、网络模型收敛速度快、具有较强的泛化能力,准确率和精确率分别达到97.8%、97.8%。

3.循环神经网络在声纹识别的应用

声纹识别被作为识别人身份的一种非常重要的生物认证技术,有着无需接触、识别成本低廉、声纹提取便捷等优点,一定时期内具有稳定性和唯一性的特性。近年来,基于循环神经网络模型的声纹识别技术极大地提升了识别的准确率,逐渐在公安实战中展开应用,诸如公安取证、刑侦破案、身份认证等,与智能视频监控结合,解决现有智慧城市建设中的“眼强耳弱”的问题[4],特别是在电信诈骗中发挥着无可替代的作用,是警务工作应对新形势下声纹识别与鉴定的关键。

图9 Malimg数据集四类恶意代码多通道图

图10 带有局部均衡归一化的AlexNet网络结构图

公安实战应用中的声纹识别平台包含声纹采集设备、智能语音分析系统和公安声纹实战平台三个板块,提供从音频数据采集、传输和存储,到识别、转写和分析,再到比对、鉴定和司法审讯的全方位一体化管理和使用综合平台。

高性能的音频采集设备是能否获取高质量声纹数据的关键,对以后语音识别与声纹分析发挥着重要的作用,现有的音频采集设备能够实现多通道采集、语音增强、自适应降噪及声源分离,在复杂场景下达到高质量音频。智能语音分析系统由声纹数据库、语音识别模块、语音转写模块、声纹分析模块组成。声纹数据库具有声纹数据的读入、调取和管理等功能,是实现语音识别、语音转写和声纹分析功能模块的基础;语音识别模块主要是将收集到音频中话者的声纹与背景音进行分离,准确找出说话人的声纹数据;语音转写模块是将搜集到的声纹转写为文本文字形式;声纹分析模块主要是对声纹的声学特性进行分析,如声纹的振幅、频率、基频、共振峰、功率谱、音调等。公安声纹实战平台含有公安声纹比对平台、声纹鉴定平台、司法审讯平台等,主要以声纹分析模块为核心,结合声纹数据库,提供声纹大数据检索、比对、分析和鉴定等功能,通过声纹检索比对来锁定嫌疑人身份,对声纹的分析与鉴定来认定犯罪嫌疑人,在可疑人员查控、人员身份核验、案件侦破、反电信诈骗等场所发挥重大作用。

图11 公安声纹识别平台构架图

这套完整的公安领域声纹识别方案利用深度学习和专业的数字化频谱生成知识,辅助声纹识别专家,快速比对、分析检材与样本的物理特性和声学特性,实现对语音中说话人的识别认定,为声纹的识别与鉴定提供了非常可靠的技术基础。

4.生成对抗网络在被拐卖人口外观和潜逃逃犯面貌预测中的应用

警方对长期失踪、被拐卖人口和长期潜逃人员所掌握的只有少量年代久远或者模糊不清的照片,多年下来面貌变得如何这类问题一直都在困扰警方,也给案件侦破带来不小的难度。近期有学者提出了基于生成对抗网络的新方法“寿命年龄转换合成[16](Lifespan Age Transformation Synthesis)”,旨在从一个单一的输入图像模拟连续老化的过程,连续生成从年轻到年老的自己的照片。这种方法未来可以广泛的应用与公安实战中,例如模拟失踪、被拐卖人口的外观、长期潜逃套嫌疑人面貌预测等。

图12 公安声纹实战平台界面

基于深度学习框架新的多域图像生成对抗网络结构,其学习潜空间模型是一个连续的双向的老化过程,解决的是单张照片的年龄增长和退化的问题,即预测一个人未来的样子,或者他们过去的样子。该算法不仅考虑了人脸质地和纹理的改变,还加入了人体在老化和生长过程中头部形态的变化,使得生成的图片对略微年长的成年人的更具有适用性和儿童照片能产生高质量的结果。

该方法是在FFHQ数据集上进行训练的,并按照年龄、性别和语义分割对其进行标记。采用固定年龄类别被用作锚定来进行近似连续年龄转换。新框架可以通过一张照片预测0-70岁年龄段的完整头像,同时修改头部的纹理和形状。

图13 寿命年龄转换合成结构示意图

图14 寿命年龄转换合成年龄预测示例图

5.深度学习在图像超分辨率重建中的应用

在当今公安工作中,视听资料在刑事侦查、视频侦查、预审和刑事诉讼中发挥着中要的作用,高品质影像、图像和声音是获取关键信息的前提和保障。然而公安实战中各种因素的影响会导致影像和图像质量不佳,出现模糊的现象,视觉效果不理想,这会对案情的分析、比对和研判造成严重的影响。实际工作中获取的影像和图像都为案后被动获取,往往依赖图像处理方式改善其质量。近年来,深度学习技术在超分辨率重建领域得到了积极的探索和发展,取得了长足的进步,为模糊图像处理和图像超分辨率重建提供了一条解决该问题的新途径。

图像超分辨率(Super Resolution,SR)重建是使用特定算法将同一场景中低分辨率(LR)图像恢复成高分辨率(HR)图像,该技术是计算机视觉和图像处理与检验的主要技术之一,具有高灵活性、简便性和适用性。高分辨率图像因其具有很高的像素密度,能够获取图像更多的纹理特征和细节信息,使图像能够看得更细、看得更清,在未来警务工作中有着广泛的应用前景。目前流行的基于深度学习的超分辨率重建方法有CNN网络模型(SRCNN、VDSR、DRCN、SRDenseNet等)和生成对抗网络(SRGAN、ESRGAN、DICGAN等),这两个网络模型都能够很好的恢复图像的高频细节,使输出图像更接近真实图像。

图15 Meta-RDN[20]方法的超分辨率示意图

2020年有学者提出一种用于人脸超分辨率的深度迭代协作方法[18](DICGAN),在人脸超分辨率重建取得了可人效果。该方法提出了一种在深度迭代合并网络,迭代并渐进地计算超分辨率(SR)图像和人脸的特征点,采用对抗损失来增加图像的细节信息。该模型设计两个分支的网络结构,一个分支为了人脸的恢复,另一个分支用于人脸特征点的计算,两个分支互相逐步促进,此外还设计了注意力融合模块来将人脸图像特征点进行融合,而不是简单的连接。DICGAN算法在CelebA和Helen人脸数据集上进行训练都取得了良好的效果。图3-10为DICGAN不同步骤的视觉比对效果图,结果显示不同人脸的生成图像逐步改善,最后一步生成高质量和高保真的图像。

图16 DICGAN [18]方法不同步骤生成的效果图

(二)未来发展趋势

1.人脸识别领域未来的发展方向

当前,基于卷积神经网络模型的人脸识别技术在公安实战中的人脸验证、人脸辨别、人脸聚类等方向有着很好的应用前景,但对于低质量人脸图像的识别率和准确率相对较低,给公安工作带来一定程度的困扰。在实战中动态应用场景下,人脸识别技术由于场景的不可控因素,采集到的图片质量和CNN模型训练图片的质量有很大差异,如人脸偏转,大幅度侧脸;运动模糊和离焦模糊;逃避侦查的刻意伪装与遮挡,疫情防控下的口罩;低的光照强度和对比度;视频传输由于封装方式、有损压缩和编解码过程产生的人脸信息丢失;特殊人群和双胞胎等,这些综合因素都会导致目前现有基于卷积神经网络算法的准确率极度下降。针对这些实战应用中遇到的问题,人脸识别未来应朝着综合利用图像增强技术和图像生成技术的方向发展,如采用基于深度学习的框架对小尺寸模糊人脸进行超分辨率重建和基于注意力机制对人脸图像进行去模糊处理等。

2.恶意代码检测技术研究方向

近年来,随着深度学习方法不断更新和发展,已代替传统方法成为恶意代码识别的热点研究方向,取得了较好的成就。通过恶意代码收集获取将其转化为图片格式的数据集和对其进行均衡化处理,通过现有成熟的卷积神经网络来构建恶意代码检测模型,从中提取恶意特征并进行分类。经过训练和测试后的恶意代码识别模型,识别率和精准率较高,具有资源消耗低、操作简单方便和自动化程度高等优点。但是现有基于深度学习的检测识别模型,还存在模型相对复杂、深层次特征提取能力偏弱、训练不稳定、难度较高、模型泛化能力不足等问题,需要进一步探索和研究。

3.声纹识别技术现在面临的挑战

卷积神经网络的出现,促进了声纹识别技术的迅猛发展,较传统的方法在识别率和准确率有较高的提升,但实际应用中嘈杂的环境和各种复杂场景都对声纹识别系统提出了巨大的挑战。如短语音情况,待检测语音所包含说话人的信息不均衡,有些声纹特征收集不全和不准确,对声纹识别的性能有着直接的影响,会导致检材与样本的匹配性严重下降;如噪音及混响因素[4],在实际的应用中总是或多或少地掺杂着各种各样的噪声,在一定程度上不仅淹没了语音信号中所蕴含的语音信息,还使得声纹识别系统无法获取语音准确的声纹特征;如远场景应用,在媒质中传播的声音受到摩擦力的作用会随着传输距离而衰减和消失,随着距离的增加和周围复杂环境中的噪声叠加,会导致语音的信噪比和声纹识别的性能严重下降,视频监控中的语音尤为突出。如何能够更广泛地在公安实战中应用声纹识别技术,使其成为案件侦破的重要手段,解决好短语音、远场应用、噪音及混响等问题是未来的发展方向。

4.深度学习在图像超分辨率重建中的发展趋势

深度学习技术的快速发展,以及硬件设施和超大规模数据的不断完善,为图像超分辨率领域提供了非常好的发展机遇。现有基于深度学习模型的图像超分辨率重建算法的性能已经取得了长足的进步,但还有很多改进空间。如何在放大任意比例时保证生成的高分辨率图像质量;如何构建合理的评价机制,能够有效评价图像质量;如何优化模型结构,使其训练过程快速收敛,能够避免深层网络梯度爆炸/消失、模型崩溃等问题;如何满足视频侦查、无人机侦察、违禁物品检测、刑侦分析、刑事图像检验、人脸识别等公安应用领域的精确性和适用性的需求,这将是接下来图像超分辨率重建领域在警务工作中的重点研究方向。

5.人脸面貌预测在公安实战中的应用前景

人脸面部蕴含着丰富的视觉信息,在公安实战中有着广阔的应用前景。基于深度学习的人脸老化技术可以预测一个人未来的样子或他过去的样子,经常用于人脸识别、医学、娱乐行业和电影特效制作中,未来在公安领域具有广泛的实际应用价值。除了在模拟失踪、被拐卖人口的外观、长期潜逃套嫌疑人面貌预测,提供有价值的可比对人脸信息外,还可以应用到公安科普教育中,例如禁毒教育,通过还原吸毒者吸毒前的容貌,或者预测吸毒后的面容进行比对,直观地展示毒品对人体造成的伤害,让体验者更加深刻地认识毒品的危害。还可以应用于时间跨越较长案件的串并中,由于当时技术条件因素影响,在单个案件中,现场提取物证较少,线索缺失较多等情况致使无法将多起犯罪方法和方式相似的案件进行串并,人脸面貌预测可以作为补充手段,将不同案件中犯罪嫌疑人的人像进行前向预测和后向回溯,将生成后的不同案件中的人像进行相互匹配和比对,查验出相似人员的身份信息及已连续作案信息,达到串并案件的目的。

四、深度学习在公安实战应用中未来拓展领域

深度学习的快速发展,以及硬件设施的不断完善,为公检法、智慧公安、平安城市、平安校园领域的公安实战应用注入新动力,提供新的技术手段,未来在警务工作中还有诸多的应用领域可拓展。

(一)卷积神经网络可拓展的领域

目前,作为深度学习的代表算法之一,卷积神经网络在很多领域都取得了相当好的成就,在公安实战中有诸多可扩展的领域。如刑事技术中足迹和指纹识别等领域,能够解决公安工作中犯罪嫌疑人和警用数据库中的快速比对,具有快速、高效、准确、便捷等特点。如人群异常行为检测,对监控视频中行人的行为区分正常行为和异常行为,及时发现灾难和意外事件,可用于公安安防领域;如去雾、去噪、去模糊领域,能够提升涉案图像或视频的质量,增加细节和纹理信息,可以广泛的应用于公安工作中的图像处理与检验中。

(二)循环神经网络可拓展的领域

循环神经网络能够有效的处理具有序列特性的数据,模拟人脑记忆功能,挖掘数据中的时序信息以及语义信息,可应用于公安工作中很多涉及自然语言处理的方面。如序列文本内容分析,用来识别文章的主题进行网络舆情的分析与趋势预测,是未来信息安全领域的重点研究方向;序列文本比对,用来比较不同文档的相关程度,可用于公安保密工作;时间序列预测,根据公安警务大数据建立犯罪预测模型,实现交通流预测、区域犯罪率预测、警情预测等,合理调配警力,提升工作效率。

(三)生成对抗网络可拓展的领域

目前,生成对抗网络除了在面貌预测、计算机视觉等领域有不错的应用,对公安工作还有着广泛的前景。如图像翻译、图像修复、人像生成等领域,能够解决公安工作中图像模糊、关键人脸部分有遮挡,目击人描述重塑嫌疑人面貌等亟待改善的问题。图像翻译可以根据轮廓图像生成照片、根据一张图像生成多模态图片,可应用于公安夜间侦查方面,使图像中人车物具有更高辨识率;图像修复以图像缺失部分的周边像素为条件生成完整的修复图像,能有效移除嫌疑人人脸图像中的遮挡物并用于人脸识别。GANs可以进行文本到图像的转换,根据目击人对嫌疑人体貌特征的描述,进行关键字的识别,自动生成犯罪嫌疑人人像图像。

未来警务工作必将向着更便捷、更安全、更高效、更精准的方向发展,深度学习技术在公安应用中有着巨大的发展前景,会大大提升公安工作效率,给公安工作带来新的技术变革。

结语

本文在对深度学习进行广泛研究的基础上,对深度学习相关技术在公安实战中的应用前景进行了分析与研究,包括卷积神经网络、循环神经网络、生成对抗网络模型三种深度学习常见模型的介绍,研究和探讨了相关算法在公安实战业务中的应用前景,并提出相关领域存在的不足和进一步发展趋势,阐述了不同模型未来可拓展的领域。

近年来,深度学习作为当前科技最前沿技术之一,在计算机视觉、自然语音处理、生物信息学、自动控制和网络信息安全等领域中都取得了突破性进展,为智慧警务的建设和实现公安实战应用智能化、现代化和高效化提供了非常好的技术支撑。虽然现有的警务工作中有深度学习的身影,但覆盖范围并不广,有着广泛的可拓展领域,还有很多改进空间。如何解决计算量大、便携性差的问题,深度学习需要对大量的数据进行计算,硬件设施要求教高,很多应用还不适合在移动设备上使用;如何构建和优化深度网络模型,深度学习的模型设计非常复杂,需要投入大量的人力物力和时间来开发和优化特定的公安实战应用算法和模型;如何提升模型泛化能力,深度学习依赖训练数据,并且可解释性不高,极易陷入局部最优,并不能很好地预测未知的数据等,这将是深度学习在公安实战应用中未来重点研究的方向。

猜你喜欢
声纹警务人脸
新形势下警务战术指挥
有特点的人脸
一起学画人脸
屏幕即指纹识别
三国漫——人脸解锁
科技对接项目服务展台(七十四)
探究警务战术的本质、知识生成与运用
警务训练中腹痛的成因及预防
警务指挥与战术研究现状及发展趋势
长得象人脸的十种动物