吴 坚
浅析警务信息化系统中云存储平台的设计和实现
吴 坚
苏州市公安局科技信息化处,江苏 苏州 215000
为顺应时代发展的需要,提升警务系统的性能,人们尝试对传统警务系统进行信息化改造,使警务信息的登录、存储、统计、查询等各方面均可以在计算机系统中完成,但随着警务信息数量的快速增多,警务信息存储的隔离性和扩张性较差,分析、存储的能力较弱等问题逐渐暴露,在警务信息化系统中应用云存储平台已经成为必然选择。在此背景下,针对警务信息化系统中云存储平台的设计和实现展开研究。
警务信息化系统;云存储平台;设计和实现
云存储即将存储硬件通过分布式文件系统、虚拟化技术、网络计算、并行处理等技术进行整合,共同提供数据存储、业务访问等服务的系统,现阶段存在直接附加存储、网络接入存储、存储区域网络等三种主要的形式,其均由访问层、应用接口层、基础管理层和存储层构成,在警务信息化系统中应用云存储平台,对提升警务信息的处理效率具有积极作用。
要满足警务信息化系统的实际需要,云存储平台设计中首先要具有可靠性、可用性、扩展性均较理想的存储应用平台,保证系统的容灾能力,这主要靠OLTP存储服务平台实现,其可以对系统底层硬件资源完成虚拟化处理,形成新的服务平台;其次要具备对大量数据可靠的存储、准确的分析服务能力,提升系统对单机节点失效的容忍能力,这主要靠OLAP分析平台实现;再次,应可实现对系统数据的全面、准确迁移,保证系统的实施,目前主要靠数据迁移系统实现[1]。
结合运存储平台的功能,针对警务信息化系统云存储平台的设计,可以通过设计三个系统实现:
(1)OLTP存储服务平台的设计与实现。考虑到现阶段VMware和Hyper-v虚拟化技术仍处于收费阶段,而不收费的KVM相比Xen与Linux兼容效果更理想,而且可操作性更强,所以在设计的过程中笔者使用KVM虚拟化技术;在使用的过程中要将CentOS和KVM安装在计算机中,并保证CPU对其支持,在此基础上在http://jenkins.cloudstack.org/网站中下载CloudStack的agent、Management Server和NFS,这种设计一方面保证平台中虚拟机创建镜像、快照功能的实现,对停止运行的虚拟机及其数据盘进行复制和存储;这既提升了解决宕机的效率,也降低了数据丢失的可能。
另一方面实现资源的隔离状态下的按需分配,可以结合数据库负载的实际变化,对Service Offer进行调整[2]。
在以上基础上,可以利用API进行云平台管理系统的设计,在其管理和监控下,可以结合资源负载的变化对Service Offerring的状态进行调整。即开机后,直接对SQL Sever虚拟机进行监控,在发现虚拟机或者数据库出现故障后,对虚拟机进行重启并重新监控,如果负载发生变化,则对虚拟机的Service Offerring进行修改,停止监控。在此系统实现的过程中要保证此系统的网络安全,现阶段其基本上均受到平台防火墙的保护,在提升安全性方面具有一定的作用,但外部访问受到限制,这要求该系统在应用的过程中要对平台的1433默认端口进行开放设置,或网络内主动将外网IP视为VPN启动,否则外部访问将难以实现。
(2)OLAP分析平台的设计与实现。此平台的设计主要针对数据库数据、日志、非结构化数据的分析三个方面进行,在数据库数据分析中,要针对警务事件的事件编号、人员身份证、时间、地点编号、事件描述、相关警员编号、警务事件类型等信息进行,考虑到数据数量的庞大,利用Map Reduce完成警务数据处理,并利用Sqoop使相应的数据在HDFS中存储,例如“1,J3208047009060000064,a320804010000200906 0099, 320821197705XXXXXX,2015-06-09 08:30:00. 000,012,江苏省淮安市淮阴区王营镇长江东路银河湾,盗窃事件,警000078,案件”为分析中统一的记录格式,这对提升数据价值挖掘的能力效果显著。现阶段警务信息化系统数据库数据主要包括人员案件和交通事故案件的信息,在具体分析的过程中应针对案件的特点进行分析,例如在人员案件中为提升办案效率,也针对警务事件、进行Map筛选,然后Reduce聚合每人的犯罪数量,获得每人的犯罪数目,Map要以案件数量为Key,人员身份证号为value,然后获得按照案件数量顺序排列的案件信息。在日志分析的过程中主要针对Log4j打印获取的日志、 服务器tomcat和Mysql的日志进行,在分析tomcat的过程中应利用Map Reduce按照TextInputFormat格式对日志的访问和访问频率进行分析;Log4j打印日志分析的过程中要针对Map抽取错误日志和Reduce整体每类错误信息进行分析;针对数据库日志的分析要结合Map划分的时间段,Reduce统计时间段的访问数量,然后输出排序后的结果。而在分结构化分析中,要首先在信息、博客中利用Map查找关键词的词频,然后Reduce统计文章对应的词频;Map以词频作为key,Reduce整合所有同词频文章,最后进行排序输出。
除上述两个系统外,还需要数据迁移系统,其主要通过支出关系型数据库系统中的数据被传递到Hadoop中的Sqoop实现,其可支持日志的自动导入和数据的自动迁移。
通过上述分析可以发现,现阶段人们已经认识到警务信息化系统中应用云存储平台对提升信息处理效率、增大存储空间等方面的重要性,并有意识地结合警务信息化系统的实际需要和云存储平台的特点进行设计,这是警务系统顺应时代发展的具体体现。
[1]田静.警务信息化云存储服务的需求分析[J].辽宁警察学院学报,2015(5):51-54.
[2]刘衍.“警务云”中心模型的应用研究[J].四川警察学院学报,2012(3):98-101.
Design and Implementation of Police Information System of Cloud Storage Patform
Wu Jian
Suzhou Municipal Public Security Bureau of Science and Technology Information Office,Jiangsu Suzhou 215000
To meet the needs of the development of era, improve the performance of the system of police, people have tried to the traditional system of police information technology innovation, make the police information login, storage, statistics, inquiry and so on various aspects all can be done in a computer system, but with the fast increase in number of police information, police information storage of isolation, and expansionary is poorer, analysis, storage ability gradually exposed problems such as weak, cloud storage platform used in the system of police informationization has become the inevitable choice. In this background, this article in view of the police information system in cloud storage platform design and implementation of the study.
police informationization system; cloud storage platform; design and implementation
TP333
A
1009-6434(2016)08-0011-02
吴坚(1974—),男,汉族,籍贯为江苏省苏州市,当前职务为科长,学历为大学,研究方向为信息化在公安工作中的实践应用,大数据在公安行业中的实践,作者单位为苏州市公安局科技信息化处。