HNPG步态特征数据库管理系统设计与实现

2012-07-25 02:27:40匡晓红
计算机工程与设计 2012年7期
关键词:步态结构化数据库

匡晓红,汤 丹

(湖南警察学院 计算机科学技术系,湖南 长沙410138)

0 引 言

步态识别是最近几年兴起的新研究领域,作为一种远距离非接触式的身份识别技术,与虹膜、指纹等生物特征身份识别技术不同,步态识别技术具有不受距离影响,具有非接触性、难以伪装、受环境影响小等特征[1]。美国、日本、瑞士和国内的一些大学和研究机构都展开了相关研究,而且都侧重于步态特征提取模型和识别算法的研究,但由于缺乏通用的步态数据库及其规模限制,当前对识别算法性能的研究也只是处于起步阶段。在国内,中科院自动化研究所完成了CASIA步态数据库的建设[2],而且取得了令人鼓舞的成果,但国内当前步态数据库都是小样本的,一般局限于几个至几十个人,算法的适应性和实用性都会受到影响。HNPG (HuNan police gait database)步态特征数据库管理系统的目的就是建立一个大样本的通用特殊人群[3]步态数据基础支撑平台,项目得到了湖南省科技计划项目及公安部应用创新项目的支持,作为步态识别应用研究的基础数据管理支撑平台,现在系统已经采集了120个人正面、侧面和45°的3个视角1440个图像序列,系统数据量达18G。

1 总体架构

作为一个开放式的基础平台,HNPG步态特征数据库管理系统采用基于J2EE的多层结构,各个层之间相互独立,并且底层向上一层提供接口和相应的数据基础。自下至上可分为基础设施层、数据资源层、应用支撑层、应用层和展现层[4],如图1所示。

图1 系统架构

基础设施层主要包括网络、服务器、存储等IT基础设施,是系统的物理基础。

数据资源层是系统的基础数据层,主要包括结构化数据和非结构化数据[5]两部分。结构化数据包括数据规则库、个人基础信息数据库、步态特征数据库、用户数据库、系统日志等数据库。非结构化数据主要来自视频文件、图片序列、二值化图片和文件等。

应用支撑层主要封装了一系列公共组件,为应用层提供各种通用服务,如信息发布服务、编码规则转换、流程控制服务、识别算法接口管理、文件管理等,它能有效地简化应用系统的设计和实现,同时也能够保证系统良好的开放性和扩展能力。

应用层主要集中在实际的业务资源管理和业务动作、业务事件的处理逻辑上,实现系统的业务功能,提供个人基本信息管理、数据采集管理、图片预处理、步态查询与识别、识别算法管理、步态展现和用户管理等应用功能。

展现层:展现层是用户能够看到的系统展示页面,用户通过该层根据权限进行系统操作和功能访问,由于采用B/S架构,展现层主要是浏览器。

整个系统采用平台化的思想进行构建,采用成熟的分层和组件化开发方式,保证了系统的扩展性。系统架构支持分布式部署,保证系统部署的灵活性。

2 步态数据规范设计及采集加工

建立一个大样本的步态数据基础支撑平台,步态基础数据采集和加工是至关重要的一环。为了对数据质量进行有效地控制和管理,需要先进行数据规范设计,并在保证数据规范的基础上,对数据采集、加工过程等方面进行科学管理,从而保障数据的准确性、完整性、一致性、可用性和安全性[6]。

2.1 数据规范设计

步态数据库中存在大量的个人信息,还有海量的非结构化的视频文件、图片序列文件、二值化图片文件等数据。随着数据量的增加,数据管理也越来越复杂。作为一个开放式的步态数据管理平台,有必要设计一套数据规范,用来规定数据定义和处理标准与规范。步态特征数据库中,制定了如下数据规范:

(1)文件命名规范

文件命名规范如图2所示。

步态数据库中的数据包括文件夹、视频文件、图片序列文件、二值化图片文件命名采用统一的规范。文件共28位长,由个人ID号、姓名、拍摄角度、运动方向、文件类型和文件序号组成。命名规范如下:

个人ID号:采用身份证号码作为个人唯一标识,个人ID为18位长。

姓名:采用中文命名,长度为4位。

拍摄角度:指拍摄与人行进的角度,长度为1位,分为侧面、正面和45°这3种。

C:表示侧面拍摄;

Z:表示正面拍摄;

X:用表示45°拍摄。

运动方向:长度为1位。

当拍摄角度为侧面和45°时,0表示从左至右,1从右至左;

图2 文件命名规范

当拍摄角度为正面时,0表示正面行进,1表示反面行进。

文件类型:长度为1位,其中:

V:表示视频文件;

P:表示图片序列文件;

D:表示文件夹;

E:表示二值化图片文件。

文件序号:长度为3位,按照先后顺序从000-999进行自动顺序编号。

(2)视频数据源

视频文件格式:AVI;

分辨率:640*480;

时长:步态运动是一种周期性的运动,视频时长要达到6个步态周期。

(3)步态图像序列和二值化图片数据

采样频率:100ms

图片格式:JPG

分辨率:640*480

2.2 数据采集加工流程

步态数据采集加工流程如图3所示。

图3 步态数据采集加工流程

(1)将人的步态通过数码摄像机拍摄形成步态视频数据源,文件格式为AVI(640*480),要求每个行程6个步幅、往返2个行程、每个行程两次。此外,采集的步态数据一方面会受环境 (光照变化、背景或者运动噪音干扰、自身生理条件、衣着、是否携带包裹等)的影响,另一方面又与拍摄角度[7]相关,因此,本项目对人的步态数据从正面、侧面和45°角分别采集,以提高数据适用性。

(2)将视频数据源AVI文件通过图片预处理分解成步态图像序列文件,文件格式为JPG,图片大小640*480,数据采样频率为100ms。

1)将步态图像序列数据进行二值化处理,生成步态图形数据。

2)步态图形数据直接入库。另一方面,可由步态图形数据进行步态特征提取,获取步态特征数据,然后将步态特征数据入库。

3)个人基本数据录入或导入,形成个人基本数据,个人基本数据与步态图形和步态特征数据通过个人ID号 (身份证号码)进行关联。

2.3 数据加工过程

(1)视频数据采集 数据采集目标:视频数据源采用数码摄相机 (CCD分辨率1000万)分别从侧面、正面和45°角进行数据采集。为保证步态数据的识别率,要求每个行程要至少采集6个步幅周期,为了提高步态特征值可靠性,每个行程要采集两次数据。步态视频数据源采集如图4所示。

图4 步态视频数据源采集

(2)步态图像序列数据 工具:采用PotPlayer或GOMPlayer工具,对视频数据源文件进行步态图像序列采集;每100ms采集一张步态图像 (jpg),一个视频源 (avi)文件根据时长会对应一系列的步态图像序列数据,如图5所示。

(3)二值化图片:将步态图像序列数据,通过综合利用间接差分法、迭代法、最大方差比方法等图像预处理[8]算法进行二值化,得到二值化图片,如图6所示。二值化图片可以作为步态分析和识别的基础数据。

3 系统设计

3.1 用例模型

系统用例模型[9]描述了系统的功能需求,如图7所示,系统主要提供步态信息查询、步态识别、步态分析、步态识别算法管理、个人基本信息管理、步态数据管理和API接口管理步态数据基本管理功能。

图7 系统用例模型

步态信息查询:提供通过步态特征、姓名和个人身份证等查询方式,为用户提供快速查询个人基本信息、步态视频、图像序列和二值化图片等信息。

步态识别:通过从步态识别算法库中选择相应识别算法,进行源数据和目标数据选择,并进行步态识别。识别结果直接可以通过外部接口直接提供给其他外部系统。

步态分析:通过选择源数据,按照指定识别算法进行步态分析,分析的结果形成步态特征数据库。

个人信息维护:为系统管理员提供个人信息管理维护功能,主要对个人的基本信息、步态数据目录管理、步态特征信息进行管理和维护工作。

步态源数据维护:为系统管理员提供步态视频、图像序列和二值化图片等步态源数据的入库、维护和管理功能。

3.2 数据库设计

由于本系统存在大量的非结构化数据如视频、图片文件,因此在本项目采用面向对象的数据库模型[10]设计,通过将关系数据库管理系统 (Oracle 10g)和操作系统 (Windows vista)中的文件系统相结合,实现对非结构化数据的管理。主要方法是,若关系型数据表中的某个字段的属性是非结构化数据,则以存放非结构化数据的文件名代替,这样数据库管理系统不负责非结构化数据本身的存储分配,它管理的只是非结构化数据的引用,对非结构化数据的控制只能通过操作系统、文件系统和应用程序来实现。这种方法虽然效率低,但方法简单、容易实现。系统数据模型如图8所示。

3.3 处部接口设计

作为一个步态识别的基础数据平台,系统要有足够的开放性,以便向其他外部研究和应用系统 (步态分析、步态识别系统)提供统一的接口。由于Web service技术有很好的封装性,集成性,数据传输透明性[11],框架稳定性,而且技术发展也比较成熟,因此本项目使用Axis[12]技术开发的Web service[13]接口来解决异构造成的项目间复杂性和依赖性。Web service以Web应用程序的形式驻留在应用服务器上的Web service容器中,其他应用系统或客户机都可以启动常规HTTP会话与本系统进行交互。

4 系统实现与分析

4.1 系统实现

系统部署在局域网环境中,共有4台PC服务器,包括两台数据库服务器进行双机热备,文件服务器、WEB和应用服务器各一台,所有服务器均采用Windows 2003操作系统,数据库为Oracle 10g,WEB服务采用Apache。

图8 系统数据模型

数据量方面,按照数据规范及加工流程,数据采集人员 (10人)通过近半年的时间,采集加工了120个人3个视角1440个图像序列,系统数据量达18G,目前系统数据量仍以每年10G的数据量在递增。此外,系统的数据采集规范、样本数量、步态数据清晰度、平台开放性等指标都超过了其他国内步态数据库,并且为相关公司和研究机构的步态识别手机应用和算法研究提供了数据服务。

4.2 系统分析

系统的创新点在于如下几个方面:

(1)数据采集加工方面,建立了一套整完整的步态数据采集、加工和处理的规范体系,有利于提高数据的一致性、可用性,保证了步态数据的质量。系统加工后的二值化图片分辨率要远高于CASIA步态数据库。此外,系统数据采集环境要求不高,完全可以依托于公共场所 (机场、车站、广场等)已有的视频监控设备[14],无需进行数据采集部分的投资,从而有效利用数据资源。

(2)数据管理方面,通过统一的数据管理模型,提供了较强的数据扩展能力,已经收集了120人,近18G的步态数据,能够在较短的时间内,形成上千人,上万个序列大样本的步态基础数据库,能够为步态识别研究、应用提供可靠的数据支撑。

(3)数据应用方面,采用平台化的方式,提供了统一的应用接口,便于实现与向外部研究和应用系统的对接和集成,并且适合于网络发布和资源共享。

(4)国内当前步态数据库都是小样本的,一般局限于几个至几十个人,算法的适应性和实用性都会受到影响。本项目建设的大样本步数据库,已经形成了成熟的数据采集、加工和管理模式,能够较好、较快地建设大样本的步态数据库,大大增强各种步态识别算法的评估和验证的可靠性,实现资源共享,加速步态识别技术的实际应用进程。

5 结束语

HNPG步态特征数据库管理系统的开发设计分为预研和数据规范制定、总体设计、基础数据采集和处理、应用开发、系统测试和试运行等阶段。通过3年多的研究,系统基本形成了一个开放的基础步态数据平台,并且在统一的基础框架之下,可以逐步按照现有的管理模式不断增加数据采集量,从而形成具有特色的大样本、多步态特征的基础数据库。目前,系统已经收集了120人,近18G的步态数据,而且数据量以每年10G的速度递增。由于系统研究的重点不在步态识别,而在于步态基础数据的管理,因此系统可以作为步态识别的基础支撑平台,通过规范的海量数据支持,可以大大提高步态识别和人体运动分析领域[15]算法验证的有效性。此外,由于采用开放的接口体系,也可以方便的实现与外部研究应用系统对接,提供可靠的步态数据支持。同时本系统形成的面向对象的多媒体数据管理模型,也为其他生物特征识别数据库如虹膜、指纹、人脸、声纹等数据提供了参考模型。

[1]YE Bo,WEN Yu-mei.Survey of gait-based human identity recognition techniques [J].Journal of Computer Applications,2005,25 (11):2577-2580 (in Chinese).[叶波,文玉梅.基于步态的人身份识别技术综述 [J].计算机应用,2005,25(11):2577-2580.]

[2]YU Shiqi,TAN Daoliang,TAN Tieniu.A Framework for evaluating the effect of view angle,clothing and carrying condition on gait recognition [C].Hong Kong,China:Proc of the 18'th International Conference on Pattern Recognition,2006.

[3]XU Zhu-yu.Practice and thinking of public security organs of social management innovation [J].Policing Studies,2011,196 (2):15-17 (in Chinese).[徐珠宝.公安机关社会管理创新的实践与思考 [J].公安研究,2011,196 (2):15-17.]

[4]YU Dong-jin,RUAN Hong-yong.General framework of profession software supporting rapid development [J].Computer Engineering,2009,35 (20):2312-2314 (in Chinese).[俞东进,阮红勇.支持快速开发的行业软件通用框架 [J].计算机工程,2009,35 (20):2312-2314.]

[5]TIAN Wanpeng,WANG Jianmin.A pay-as-you-go framework for unstructured data modeling based on their features [C].The 27th National Database Conference of China,2010 (in Chinese).[田万鹏,王建民.一种基于特征的非结构化数据演化管理建模框架 [C].NDBC第27届中国数据库学术会议,2010.]

[6]TANG Dan,FAN Qiang,KUANG Xiao-hong.Labor and social security resource database system based on DB trichotomy method [J].Computer Engineering and Design,2009,30(7):1664-1667 (in Chinese).[汤丹,范强,匡晓红.基于三库分离技术的劳动保障资源数据库系统 [J].计算机工程与设计,2009,30 (7):1664-1667.]

[7]GAO Haiyan,RUAN Qiuqi.A gait recognition method based on front-view [J].CAAI Transactions on Intelligent Systems,2011,6 (2):119-125 (in Chinese).[高海燕,阮秋琦.正面视角的步态识别 [J].智能系统学报,2011,6 (2):119-125.]

[8]MING Ying,JIANG Jingjue.Background modeling and moving-objects detection based on Cauchy distribution for video sequence [J].Acta Optica Sinica,2008,28 (3):587-591(in Chinese).[明英,蒋晶珏.基于柯西分布的视频图像序列背景建模和运动目标检测 [J].光学学报,2008,28 (3):

587-591.]

[9]JI Zhen-yan.UML system design and analysis applications[M].Beijing:People Post Press,2009 (in Chinese).[冀振燕.UML系统分析设计与应用案例 [M].北京:人民邮电出版社,2009.]

[10]XU Hong-bo,HAO Zhong-xiao.The normalization theory and algorithm in OODB design [J].Journal of Harbin University of Science and Technology,2005,10 (1):29-30 (in Chinese).[徐红波,郝忠孝.OODB设计中的范式理论及求解算法 [J].哈尔滨理工大学学报,2005,10 (1):29-30.]

[11]LIN Tong,SHU Zhen-cai.Web services based integration of remote heterogeneous databases [J].Journal of Beijing Polytechnic University,2005,32 (2):210-212 (in Chinese).[林彤,舒真才.基于Web Services的异地异构数据库的集成[J].北京工业大学学报,2005,32 (2):210-212.]

[12]Apache software foundation [EB/OL].http://axis.apache.org/,2009.

[13]SHEN Li-min,LU Fu-jun,LI Feng.Web service recommendation model oriented enterprise information system integration[J].Computer Integrated Manufacturing Systems,2011,17(1):185-188 (in Chinese).[申利民,吕福军,李峰.面向企业信息系统集成的Web服务推荐模型 [J].计算机集成制造系统,2011,17 (1):185-188.]

[14]LIU Xiangfeng,ZHOU Hang.Gait recognition technology and application in video surveillance [J].Video Engineering,2011,35 (1):31-35 (in Chinese).[刘相锋,周航.步态识别技术及其在视频监控中的应用 [J].电视技术,2011,35 (1):31-35.]

[15]ZHAO Yong-wei,ZHANG Er-hu,LU Ji-wen.Gait recognition via multiple features and views information fusion [J].Journal of Image and Graphics,2009,14 (3):388-393 (in Chinese).[赵永伟,张二虎,鲁继文,等.多特征和多视角信息融合的步态识别 [J].中国图象图形学报,2009,14(3):388-393.]

猜你喜欢
步态结构化数据库
小蚂蚁与“三角步态”
科学大众(2024年5期)2024-03-06 09:40:34
促进知识结构化的主题式复习初探
结构化面试方法在研究生复试中的应用
计算机教育(2020年5期)2020-07-24 08:53:00
基于面部和步态识别的儿童走失寻回系统
电子制作(2018年18期)2018-11-14 01:48:04
基于Kinect的学步期幼儿自然步态提取
自动化学报(2018年6期)2018-07-23 02:55:42
数据库
财经(2017年2期)2017-03-10 14:35:35
数据库
财经(2016年15期)2016-06-03 07:38:02
数据库
财经(2016年3期)2016-03-07 07:44:46
数据库
财经(2016年6期)2016-02-24 07:41:51
基于图模型的通用半结构化数据检索
计算机工程(2015年8期)2015-07-03 12:20:35