朱庆淦 钟桂凤
摘要:校园安全关系到学生的健康成长,与每个师生、家长和社会都有着密切的关系,保证校园的安全是每个学校及教育工作者应有的责任。校园的出入口作为校园的第一道防护关卡,需要无时无刻地记录每一位出入人员的动向,但如果依靠人力去实现,实施起来会带来极大的困难,如果借助于人脸识别技术,则能极大地减少校园安保人员的工作量,同时提高对出入人员身份验证的工作效率。基于已经发展并且成熟的人脸识别技术,结合大数据的主流框架——Hadoop来提升人脸识别的效率,使用大数据技术进行大范围人脸数据的管理,从而更好地将其应用到校园安保工作,对校园安全管理的优化具有十分重要的意义。
关键词:大数据技术;人脸识别;智能安防;Hadoop;Spark
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2022)02-0038-02
高等院校的管理与安防工作向来都受到国家、社会、家长的密切关注,因为高校人口密集,是集学习、生活、各类活动于一体的一个“小型社会圈”。大多数是在校大学生,生活经验不够丰富,社会阅历不够广泛,而他们又即将是社会发展的创造者,所以高校的管理与安防任重道远。高校也大规模地布设了摄像头,这些摄像机系统无缝地为高校管理者提供了海量的视频信息,这些视频数据被广泛观看、记录、储存以及传输为各类可视化技术的应用而提供基本的一个原始信息系统。但是视频监测目前主要是实现了一种实时、在线的监控,需要人工全天24小时进行关注,根据所要监测场景对信息进行分析与处理是比较劳心劳力的一种方式,而且无法充分发挥对监测信息技术在视频监测系统中实际应用情况的一种实时主动监督。也无法实现对实时观测的对象行为进行分析与描述。基于大数据背景下的智能视频监控,拟解决的问题是采集视频运动对象行为并进行智能化分析,并做出实时、高效的处理,也可以对海量数据进行批处理,给管理者提供决策分析。
1 AdaBoost算法實现人脸检测
人脸检测的基本思想是通过对人脸面孔先进行数学建模,使用摄像头将检测到的整个区域先动态扫描,对区域内的数据实行重要定位,然后聚焦人脸数据后与所产生的人脸模型进行比较,从而得到可能的人脸面孔。使用相关知识和统计学结合,完成人脸建模的工作,与区域内采集的人脸图像进行匹配,从而得到判定结果。
Adaboost是一种迭代式的算法,在设计和学习的过程中不断地依照事先设置和定义的各种正例及反例特征引入后所发挥的效应进行调整该特征的权值,最终根据这些特征的属性优劣而给出判断的准则。Adaboost算法的大致流程是:从系统中抽取训练的人脸数据,然后构成一种分类技术能力很强的弱分类器,这些分类器形成一条类似流水线的工作流,对动态的图像进行捕捉和识别,判断是否属于人脸。如果通过,则送往下一个分类器进行检测。通过对弱分类器的流水组合使用,再结合简单的Haar-like特征定义图像相邻矩形区域像素之和的差值,使用一种称为积分计算机制得出像素值。弱分类器中使用的是最简单的决策树实现,且使用的特征识别向量是稀疏算法实现,最终得到计算公式:[YMx=sign(mMαmym(x))]。本系统有关智能安防所需要的人脸识别技术的应用研究,使用 Adaboost 算法来对人脸图像进行处理,通过摄像头采集的数据,导入Hadoop分布式系统中,再使用此算法进行Spark计算,就可以完成人脸识别这一重要环节的工作任务,Adaboost算法如图1所示。
2 分布式数据库作为后台数据存储
用HBase数据库存储用户身份数据并与人脸识别系统进行衔接,实现人脸识别系统所需的用户信息数据访问功能。由于HBase是构建在HDFS之上的分布式存储系统,因此对于数据扩展有着先天的优势,只需在集群中添加节点就可以扩充数据库容量,而不用像传统的关系型数据库需要将数据迁徙到新硬件之上的数据库系统来实现其扩容的目标,因此对于存储海量的用户数据有着较大的优势。
通过将用户信息数据保存到HBase中,当采集的人脸数据通过系统检测后连接到HBase,就能够快速读取HBase中的人脸数据用来进行特征提取。通过把图片的所有相关属性信息同时存储在 HBase的一个大表中,可以直接支持对图片的各种相关属性进行综合查询。此外,还可以根据应用的需要对列簇数据库进行延伸和扩充,保存与应用有关的信息,从而提供与应用有关的影像和数字库查询。可见,基于 HBase 的海量数字化图片存储技术不仅有效解决了各类图片的海量存储,还有效实现了灵活的海量图片信息搜索。HBase数据库中表结构如图2所示。
3 搭建Hadoop+Spark人脸识别系统
校园内部有关安全管理技术主要是借助在指定的地点布设网络摄像头,通过在局域网内部布设网络摄像头,架设在一个局域网内并与整个校园服务器进行连接。摄像头将所有视频或者图像数据都实时返回到一个局域网的服务器端,用于数据分析和处理。对学校、宿舍出入人员(包含黑名单)等身份信息录入和人脸采集并进行人脸权限设置,完成人脸库的建设,后续分析将基于此人脸库进行对比。基于视频流/图片文件分析人脸、人体特征等信息,构建半结构化(非结构化)数据并进行数据分析及研判。校园安防系统的实现需考虑以下问题:
(1)在整合实时人脸采集、人脸库搜索时,构建实时性强的采集、预警、查询等监控业务功能体系,有效解决安防监控系统的自动化和时效性问题。
(2)精细化数据处理粒度:基于人脸信息系统构建的人脸数据库,实现以人脸信息为主要线索的实时搜索与自动预警,基于人体识别技术分析出流量信息、区域性预警、姿态识别。
基于以上所述,依据Hadoop和Hbase的可扩展性,使其支持对人脸识别的应用程序。这个解决方案是可以把大量人脸数据直接分配给Hadoop集群的各个节点,实现高并发性,从而很好地改善了对于人脸识别的精确率。Hadoop平台在技术上具有非常高的可扩展性,因为随着时间的变化,所需要的存储容量会逐渐增加、计算功能会逐渐增强。Hadoop可以很容易地向当前的集群扩展,而且在价格便宜的pc节点下,它还可以减少扩展的成本。这些特殊的优点都使得采用Hadoop 集群成为一种降低成本的选择。
具体的系统设计思想可分为以下步骤:①用户将人脸图片上传到系统后,系统根据Adaboost算法计算并得到处理后的数据,然后将数据存储到Hadoop中的HDFS中。HDFS的高可用机制与容错机制可以保证这些数据不易丢失。②将HDFS中的人脸数据通过Sqoop传输到HBase中,HBase拥有海量存储、极易拓展和高并发的特性,大量数据同时写入也能保障系统的稳定性。③Spark是基于Hadoop框架的高速数据处理平台,相比MapReuce的数据处理能力有了极大的提升,通过Spark对图像进行处理,然后将结果存入基于HBase的存储系统中。
基于Adaboost算法实现人脸识别搭建校园安防系统的应用研究,目前技术应用非常娴熟,但在比较复杂的场景下,人脸检测结果较难得到保障,还是会出现一些判断误差。在进行系统研究过程中,对于采集的实时数据,场景比较复杂且昏暗的情形下,对于分析结果会造成比较大的误差。基于DCNN(深度卷积神经网络)的深度学习算法自出现后,这种算法能够很好地学习到监控视频、图像中各个目标物各种层级的特征,同时具有很强的抗干扰能力,目前团队正在研究使用DCNN来优化系统。
4 结论
本文通过本次校园人脸识别系统的创新探索, 应用了较先进的人脸识别技术算法,校园安全管理和高校大数据应用技术得以紧密结合,人工智能的广泛应用正在逐渐取代传统的手动操纵。身处广州理工学院的校园内,可以切实体会使用到“人脸识别”等各种智慧型应用的强大便捷性。在大学校园的各个出入口都已经设置了安全人脸识别出入闸机,对于经常来往的学生人员也要严格做到安全人臉识别,防止任何陌生物和人员的随意闯入。校园安全保障工作是在整个大学校园里师生学习和工作生活的一种基础性安全保障,关乎每个在校师生的生命人身安全和经济社会生命财产安全。通过利用人脸识别技术来有效控制未经资格考核的人员进入大学校园,为管理工作的开展提供了有效辅助。目前校园里的各个宿舍均已安装好人脸检测系统,对于整个校园内部的人员安全保护情况可以进行实时管理,如果校园发生了不好的安全情况也可以及时主动告知安保管理部门并进行及时调查和应急处理,减少了各种安全隐患。
参考文献:
[1] 陈嘉棋.基于内存计算的高通量视频流人脸识别系统[D].上海:上海交通大学,2018.
[2] 丁文涛.基于Hadoop的人脸识别系统研究与设计[D].镇江:江苏科技大学,2017.
[3] 张安申.Spark框架下的人脸图像检索系统的设计与实现[D].西安:西北大学,2017.
[4] 耿玉琴.基于MapReduce的人脸识别的研究[D].西安:西安科技大学,2017.
[5] Wu B,Ai H Z,Huang C,et al.Fast rotation invariant multi-view face detection based on real Adaboost[C]//Sixth IEEE International Conference on Automatic Face and Gesture Recognition,2004.Proceedings.May 19-19,2004,Seoul,Korea (South).IEEE,2004:79-84.
【通联编辑:代影】
1366500511303