基于三维视频监控系统的应用研究

2016-12-13 02:49:04龚德忠

湖北警官学院学报 2016年6期

关键词：图像识别三维重建识别率

龚德忠

（湖北警官学院，湖北武汉430034）

基于三维视频监控系统的应用研究

龚德忠

（湖北警官学院，湖北武汉430034）

视频监控系统在平安城市建设中的作用越来越明显。传统的二维视频监控系统是从二维的角度对目标对象进行扫描和识别，其识别精度、识别率以及图像的还原能力方面存在着先天的不足；而三维视频监控系统从多个角度对目标对象进行扫描和识别，再利用三维重建技术进行还原，大大提高了视频监控系统的识别精度、识别率，以及图像的还原能力，具有明显优势，是未来视频监控系统的发展方向。

三维；视频监控；三维重建

一、前言

随着我国经济的高速发展，我国的社会结构发生了巨大变化，为了维护社会稳定，保障人民安居乐业，公安机关建设了大量的城市监控报警联网系统。这在一定程度上有助于应对社会治安面临的严峻挑战，有力地弥补了警力资源的不足。据统计，截至2014年底，上海市安防监控摄像机安装数量为100多万台、北京市安装的摄像机数量超过120万台、广州市安装的视频监控摄像机数量也达到了30万台。这些监控摄像机基本覆盖了各市重点公共场所、主要交通道路、重要要害单位等。[1]而武汉市则于2012年成立了全国首支视频侦查支队，投入300余名警力，以全市25万只摄像头为核心布下“天网”。视频侦查支队自组建以来，抓获处理的刑事犯罪嫌疑人达1214人，同比上升77%；通过视频侦查手段查处街头抢劫、抢夺、诈骗等犯罪团伙71个，同比上升196%；破获街头刑事案件861起，同比上升172%。与此相对应，全市街头一年警情降幅达到了最大，仅抢劫、抢夺、街头接触性诈骗就分别下降了26.4%、16.2%、14.2%。比如令很多城市头疼的多发难破的飞车抢夺案，武汉的破案率达到70%以上，在全国名列前茅。所有这些数据证明了视频监控系统的建设是非常必要的。[2]

二、视频监控的概念、组成与功能分析

（一）视频监控系统的概念

视频监控系统是建立在计算机技术、工业控制

技术、多媒体技术和人工智能技术等基础上的，具有实时数据采集、存储、传输、加工、处理等功能的一种管理信息系统。其基本业务功能是提供实时监视的手段，并对被监视的画面进行数据采集、存储，在此基础上，还可以对监控装置采集的数据在后台进行相应的处理，如自动与后台数据库中的信息对行比对、分析，并能触发报警与联动等。视频监控系统因其具有实时、快速、智能和大容量存储等特点，在社会管理尤其在公安治安管理和侦查破案中起着越来越重要的作用。

（二）视频监控系统的组成

视频监控系统组成由前端设备、传输设备、终端设备三部分构成，一般视频监控系统组成如图1所示。

图1 视频监控系统组成

1.前端设备：主要由摄像机组成，其主要作用是将各个位置的图像转化成为可传输的电信号。

2.传输设备:用于将采集到的信号，经各种不同的电缆传输到终端并转换为图像信息。主要包括：电源线、视频线、控制线、信号线等。

3.终端设备：主要由存储系统、控制系统、管理系统组成。存储系统作用是将多路视频信号压缩后存储起来，在需要提取证据的时候，可作回放图像来浏览；控制系统是通过发出控制信息来管理前端的视频摄像机动作；管理系统是加载在视频信息上的一些应用系统，如图像识别、行为分析、自动跟踪等。

（三）视频监控系统的功能

在公安工作中，因侦破案件的需要，对视频监控系统的功能要求相当高。一般来说，用于城市治安管理的监控系统应该具备以下功能：

1.监控功能。通过视频监控系统，监控人员可以实时发现可疑迹象和对象，及时密切跟踪，并将警情实时通报给一线警力，实现快速反应出警，同时还可以通过指挥中心实时指挥现场抓捕嫌疑人，防止或避免违法犯罪事件的发生。对已发生的违法犯罪，也可以在事后提取监控录像，对视频中的人、物进行回放、处理，及时固定犯罪证据，为后续的侦查提供线索和依据。

2.图像识别功能。图像识别是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术，它是人工智能的一个重要领域。它包括自动识别和图像还原两种情况。[3]

自动识别主要应用于实时图像清晰对象的识别上，在摄像机工作的过程中，后台管理系统根据接收到的图像，加载相关算法，去除背景，从连续的视频帧中分离出不变的像素(代表背景)，专注于变化的像素(代表前景移动的物体)，[4]再与数据库的模板进行匹配，如人或车等（图2）。

图2 图像自动识别对比

图像还原主要应用于图像模糊不易识别的对象上，在摄像机取得对象图像的过程中，可能因为速度、色差、光线、角度等原因，造成图像的模糊不清而不能自动识别，这时视频监控系统利用图像增强、去雾等技术来对模糊不清的图像进行分析了，如图3。

图3 图像还原

3.行为分析功能。视频行为分析是指利用计算机视觉和图像处理等技术对视频信号进行分析和理解，并根据预定义的规则发出相应的控制信号（如图4）。[5]视频行为分析分基于规则的行为分析和基于学习的行为分析。

基于规则的行为分析是指根据预定义的规则判定目标动作是否出现不同于规则的异常，如碰撞、接近、徘徊等。并判定这种异常是系统定义的哪一种，然后根据判定结果触发不同的报警响应。

图4 行为分析

基于学习的行为分析是指利用人工智能，让机器模拟人脑的观察来感知异常的存在，具有记忆、关联、学习等性能。

4.自动报警、跟踪功能。自动报警是指根据图像识别和行为分析的结果，将目标判定为危险情况后，自动触发相应的联动报警平台，引导相关部门出警。自动跟踪是指自动报警后，根据行为目标的运动规则，智能切换摄像机，实时跟踪目标运动轨迹。

三、二维视频监控系统存在的不足

判断一个视频监控系统是否稳定、可靠、有效，主要从识别精度、识别率和图像还原能力三个方面判定。

在视频监控系统中，前端摄像机是原始数据的采集设备，其采集数据的方式和质量直接影响后期的数据处理效果，是视频监控系统的基石；传输设备在性能上主要要求能实现快速无差错传输视频数据；终端设备中，存储系统、控制系统的性能要求一般可以满足，管理系统则是基于前端摄像机所采集的数据，依据不同的工作需求，开发出功能不同处理系统来对前端采集的数据进行处理。

因此，前端数据采集的方式和质量是整个监控系统性能是否强大、是否满足用户要求的基础。在二维监控系统中，前端摄像机生成二维图像数据，在后台存储也是前景里的二维画面数据，由于摄像机拍摄的图像，容易受环境如光线、角度、速度等的影响，生成的图像可能模糊不清，影响识别精度和识别率，同时因其图像的平面特征，在后台的图像识别中不容易识别出所需要的数据，图像还原能力较弱。

三维视频监控系统专门针对二维视频监控系统的不足而提出，三维数据具有显式的空间形状表征，因此在信息量上比二维图像丰富。对比二维视频监控系统来说，三维视频监控系统具能较高的识别精度、识别率和图像还原能力。

四、三维视频监控系统

顾名思义，三维视频监控系统所处理的数据应该是基于三维的。其基本原理是把前端摄像机获取的二维视频图像，通过三维重建技术，转换为三维图像。在三维视频监控系统中，二维数据的获取，可通过单视点摄像机或多视点摄像机获得。

1.三维重建技术

三维重建是指对三维物体建立适合计算机表示和处理的数学模型，是根据单视图或多视图的图像重建三维信息的过程。由于单视频的信息不完全，因此三维重建需要多个视图，[6]其方法是先对摄像机进行标定，即计算出摄像机的图象坐标系与世界坐标系的关系，然后利用多个二维图象中的信息重建出三维信息。

图5 三维重建效果图

三维重建方法主要有以下两种：

（1）多视点立体视觉

该方法是利用两个或多个摄像机（见图6）从不同的角度拍摄同一场景的图像，计算机对拍摄同一物体的两幅或多幅图像上的像点进行检测和匹配，得到对应物点深度值。

图6 多视点摄像机

（2）单视点视觉

单视点系统中，前端只有一个摄像机，系统利用摄像机获得物体的单幅或多幅图像进行三维重建。对于单幅图像，主要利用图像的二维特征（如明暗度、纹理、焦点等）推出物体的深度信息。对于多幅图像，则与多视点系统类似，对运动物体获取多幅图像，再对同一物体的多幅图像进行特征检测与匹配，得到不同图像中的相同特征，再计算出该物体的三维点坐标信息，从而实现三维重建。

2.三维视频监控系统的优点

三维视频监控系统的优点主要体现在对目标图像的识别精度和识别率上，识别精度越高和识别率越高，图像还原能力就可以越强。

（1）三维图像识别精度。利用PowerScanner-STD标准型设备分别对球面度、球体空间精度、平面度进行测量，得到相应的图像测量（识别）精度。

①球面度识别精度测试

实验：对直径为50.805mm的陶瓷球进行测试见图7。

图7 球面度精度测试实验

在测量空间内的任意十个位置进行测试，结果见表1：

表1 球面度精度测试结果（单位：mm）

实验：采用球心间距为150.056mm的高精度球距规进行测试见图8。

图8 球体空间测试实验

在测量空间内的七个不同位置进行测试，结果见表2：

表2 球体空间精度测试结果（单位：mm）

实验：采用大小为160mm*100mm的高精度陶瓷平板进行测试见图9。

图9 平面度测试实验

在测量空间内的六个不同位置进行测试，结果见表3：

表3 平面度测试结果（单位：mm）

表4 不同三维人脸识别算法识别率比较[1]

（2）三维图像识别率。在三维图像识别上，三维

图像识别算法有多种，不同算法在识别率上有一定区别，下面介绍几种代表性识别算法的识别率（三维人脸识别为例），见表4。

研究人员对二维和三维图像识别进行了对比研究，比较了PCA算法在二维和三维人脸数据集上的识别效果，用FRGC v1.0人脸数据库中的275人共951个三维数据进行了实验，结果表明：基于三维数据的PCA识别率比基于二维图像的PCA识别率高，融合后得到的图像结果（即图像还原）更好。[7]

五、总结

由于三维数据具有显著的空间表征，空间效果明显，信息量丰富，因此，三维图像比二维图像更加丰满和细腻，而且还可以通过三维重建技术，利用目标物体的交叉的边角信息还原出完整图像，体现了三维图像强大的图像识别能力和还原能力，同时，由于三维视频图像具有空间特征，它也能在交通管理中通过测速和测距来判断否发生了交通事故和违章等等。这些优势，将在社会生活、生产和治理中，发挥出越来越大的功能，尤其在公安工作中，将成为威慑犯罪分子、打击违法犯罪的有力武器。

[1]赵兴涛,杜治国,洪卫军.监控摄像机效能三维仿真研究[J].公共安全,2012(4).

[2]武汉公安：布下“天网”[EB/OL]http://www.mzyfz.com/cms/pinganzhongguo/anbaowenti/pinganbobao/htm l/893/2013-05-18/ content-754687.htm l,2013-05-18.

[3]高晓东,罗宏.基于机器视觉的挡圈检测系统研究[J].机电元件,2015(6).

[4][5]张俊,任延珍.基于学习的视频行为分析技术的特点和应用[J].湖北警官学院学报,2012(5).

[6]隋巧燕,董洪伟,刘蕾.双目下点云的三维人脸重建下载[J].现代电子技术,2015(4).

[7]王跃明,潘纲,吴朝晖.三维人脸识别研究综述[J].计算机辅助设计与图形学学报,2008(7).

【责任编校：刘志军】

Research and Aplication of Three Dimensional Video Surveillance System

Gong Dezhong
（Hubei University of Police,Wuhan 430035,China）

The function of video surveillance system in the construction of safe city is more and more obvious.The traditional video surveillance system is two-dimensional scanning and recognition of objects from two-dimensional angle,the recognition accuracy and recognition rate and image reduction ability are congenital deficiency.Three-dimensional video surveillance system scans and recognites the target from multiple perspectives,then uses 3D reconstruction technology to restore,and finally improves the recognition accuracy and recognition of video monitoring system as well as the ability to restore the image.Three-dimensional video surveillance system has obvious advantages,which is the future development direction of video surveillance system.

Three-Dimensional;Video Surveillance;Three-Dimensional Reconstruction

D918.2

1673―2391(2016)06―0009―06

2016-09-28

龚德忠（1969—），男，湖北鄂州人，湖北警官学院信息技术系副教授，研究方向为计算机取证。