□许发见
(福建警察学院,福建 福州 350007)
大数据应用技术已从一个高深的技术概念变成一项实用的工具和方法,对于我们公安行业的海量高价值数据,大数据的应用成为了首当其冲的问题。全国公安系统自上而下积极探索公安基层大数据建设和应用,各省、地市级公安部门也在积极响应和落实对大数据的应用。公安大数据是需要做自上而下的顶层设计的,所以我们有针对性地开展了对W省的公安基层大数据网络基础及应用情况调研,希望更多了解公安基层单位的基础建设、应用和需求情况,设计出符合实际需求的大数据采集、治理和应用模式,形成基础的数据集和应用形式。
为了更好的了解基层单位的大数据应用情况,我们对W省的地市基层单位公安大数据网络基础展开调研工作。
大数据网络基础调研内容包括:基础网络建设、各县区机房建设、电子证照应用、OA系统应用、应用系统平台建设及异构系统建设情况。通过调研问卷、实地调研和会议交流等形式开展调研,对调研结果进行分析总结如下:基础的网络接入基本是单个运营商单线路接入,未做多运营商冗余也很少有双线路备份;大部分县区现有机房未达到B类机房标准,机房管理方面比较松散,少数地区机房内机柜冗余及建设情况相对较差,存在很多物理安全隐患,包括监控、门禁及动力环境监控系统存在问题;有一些地区的网络安全及准入系统建设不够完善,存在一些外网接入的不安全因素;电子证照、异构系统、OA系统各县区均已应用,但存在着电子证照签章应用率偏低等问题;应用系统平台的建设,各县区基本使用市里已建设的成果,县区这一级在挖掘和推广大数据新应用方面动力和积极性不够。
我们针对公安基层大数据应用平台建设现状开展调研,调研数据表明多数市局和基层单位都在拓展公安系统的大数据应用,更好地为现代警务工作服务。在数据掌控现状方面,一些市区级单位开展公安信息资源和社会信息资源的整合共享工作,在公安机关内部对不同警种和业务数据进行规划和划分协调,争取实现不同数据服务与分布式资源库对接;基层单位和部门梳理出职能部门的接口和数据需求,开始采集和引进对公安业务具有价值的社会公共信息资源,特别是公共安全信息;为了使大数据服务更有价值,基层单位着手开展基层基础数据的处理、整合工作,包括数据采集、同步、清洗和整合,在基于数据之上建设应用工具集。
在数据掌控现状方面,一些市区级单位开展公安信息资源和社会信息资源的整合共享工作,在公安机关内部对不同警种进行数据资源划分和任务分工,并协调数据管理权限,实现与资源库对接;一些部门按照政府行政管理职能和社会管理服务对象性质的不同,梳理出职能部门的接口和数据需求,开始采集和引进对公安业务具有价值的社会信息资源。
在基础硬件设备的建设上,首要的是保证通讯冗余和保障数据的应用安全。调研中多数是建立分布式的大数据资源云存储平台和融合服务,由平台来负责对基层单位各类基础软、硬件资源和设备实行统一运维管理、统一技术维护,形成统一的基础存储和计算能力。避免了人力资源的浪费和硬件的重复投资。
在机构设置和管理体系方面,各地的状况有所不同,一般市局都有成立项目建设和应用领导小组,下设办公室或者信息化部门,再细分有的地区有较完善分工和管理体系,包括综合科、信息中心、通信保障科、网络运行科、数据质量管理科等机构,但是很少有专门的保密和安全管控科室。总体来说,这些机构和管理体系相互配合,各有侧重,共同协调和推进公安基层大数据应用。
在机构设置和管理体系方面,各地的状况有所不同,一般市局都有成立项目建设和应用领导小组,下设办公室或者信息化部门,再细分有的地区有较完善分工和管理体系,包括综合科、信息中心、通信保障科、网络运行科、数据质量管理科等机构,但是很少有专门的保密和安全管控科室。总体来说,这些基层单位机构和业务体系相互配合,协调合作,构成基层大数据应用的核心。大数据需求调研还发现,大数据应用的意识和大数据思维还需要在基层单位得到进一步推广普及。当前公安工作强调信息化、自动化、智能化,各类警务信息资源和社会安全领域相关数据剧烈增长,存在数据标准不规范、难以整合汇聚、使用效率低下等问题。
目前基层的公安大数据建设和应用主要是围绕如何提升公安战斗力展开。在公安基层大数据服务和应用中,公安基层单位要充分调动信息统一集中的优势,形成实时、动态、有效的人、事、物数据档案,构建多维度、高时效的数字防控体系。在这些数据基础上,以实战导向、聚焦实战应用,从基层一线民警关心的痛点、难点为切入点,挖掘大数据实战应用,从而提升公安战斗力和工作效率。
此外,公安机关掌握着丰富的视频数据来源,大数据技术也是对视频大数据发展最直接有效的方法;相比于其他公安业务,图像侦查更应该紧紧抓住“线索”这个目标去研究各种技战法。但视频信息大数据并不是简单的完全交给硬件设备或技术人员,而应结合基层单位具有丰富实战经验和业务知识的专门人才,所以这方面的工作是任重道远。
为了强化基层单位预警、预判、预防的综合业务能力,一线基层单位更需要建设和应用好大数据和人工智能以及物联网等新技术,以获取更多、更广的数据。公安基层大数据的服务和应用可以提高工作效率和战斗力。
1.统计查询:这是有区别于传统信息系统的服务,也是大数据的基本应用。它把历史数据与现状信息以及时空数据进行整合,综合应用生成出发生了的事情,以及这些事情和数据背后的规律或线索。
2.数据碰撞:它不同于数据挖掘和分析,其重点是要发现数据之间隐藏的未知的关联关系,发现偶然中的必然。
3.预测预判:大数据的服务和应用就是通过经验积累和知识图谱的构建,形成合理的数据模型,推导其内在关系,能够就趋势和方向做预测和预警。
随着大数据采集渠道的拓宽,可预见的是现有的存储系统将很快被塞满,而且存储效率和使用效率会降低。其次伴随大数据的深入应用,并发请求处理能力将受到挑战,容易造成网络拥堵。这些是公安基层大数据应用调研中反映较多的问题。
大数据的特征是数据量大、种类繁多复杂、价值密度低,这就需要整合多部门、各方面的资源进行综合开发利用。公安大数据包括社会公共安全方面的数据资源的整合,调研发现公安内部数据和社会数据资源在整合上都或多或少存在数据难获取、数据陈旧、更新不及时等问题。具体表现: 一是在数据采集率上,整体采集率不高;二是在基础信息录入的准确性方面,需要加强提高,数据质量没有保障会严重影响后期服务和应用;三是采集维度方面不够完整,一些关键维度信息有缺失;四是数据更新不及时,一些实际住址等动态性信息不准确。[1]
另一方面公安基层大数据的数据融合和应用分析较困难。主要体现在基础数据的平台不一,使用技术和架构体系不统一,数据很难协调工作,更难以实现自动更新,需要大量的人工干预;数据格式方面,每个系统所需要的关键信息在数据格式上不一致,做整合需要先将格式进行统一,影响了系统效率也影响更新时间;不同行业或不同领域的信息资源更新周期有长有短,一些基础信息变化小,所以更新周期较长,这也会影响数据融合和应用分析。
以调研中的车辆基础数据应用系统进行具体分析,公安基层大数据系统构建和服务应用方面需注意以下问题。
车辆基础信息的大数据系统核心数据应简单分为静态、动态两方面的基本数据,标准要统一,避免复杂。静态数据来源于各个相关业务数据系统,动态数据则主要来源于各种车辆数据和实时通行的数据,结合来自其他设备、渠道和外系统的车辆图片,构成外围辅助数据,作为补充。这样数据划分清楚,层次明了。
核心的静态数据,都是结构化数据,应该存放在关系型数据库中,易于管理使用。核心的卡口动态通行数据,可以用高性能分布式数据库HBase存储;而车辆经过留下的实时痕迹,其动态变化、更新快,可以动态堆放在内存中。[2]
对于摄像头产生的海量非结构化数据,想要充分利用和进行数据检索,就要利用智能标注和分析工具进行结构化或者半结构化处理,存放在HBase内。调研表明数据的结构化与搜索查询工作已经开展的比较成熟了,在此基础上才能够进行多条件复合检索和服务,进一步开发更丰富的应用方法。
调研情况表明,数据的结构化处理非常重要,结构化数据结合PGIS,可以方便我们对其进行各种类型的统计、分析,包括流量、归属、平均行程时间、高峰期、出行规律等。然后,结合各种业务工作展开大数据应用研究,如利用卡口图片结构化的成果以及与车辆核心库的车牌信息对接,利用数据碰撞发现隐藏在数据背后的信息,为更加精准地打击违法车辆服务。
调研反馈应结合公安民警多年工作经验和智慧结晶,利用卡口通行数据进行挖掘分析,形成一系列的卡口技战法,提供用户在不同场景下使用,包括区域频次、路径匹配等。这样才能够更好的利用大数据技术提供工作效率。
基层单位在开展业务和对大数据应用时,一定要时刻关注数据信息在生产、使用、销毁各生命周期中暴露出的安全问题。
大数据的源头众多、数据多样、增长快速,虽然公安数据相对规范、可信,但是大数据采集的可信性及数据质量仍是一个重点。首要的安全问题是数据被伪造,这将直接导致分析数据时得出错误结论;所以前期数据采集把关很重要,数据源要可信,数据整理和清洗环节的安全问题也很重要;现在大数据分布式存储,呈现多副本、多节点、分布式的特点,不排除存在被非法入侵的漏洞。
大数据离不开云计算,在数据迁移到云的过程中,要考虑对大数据流转各环节的安全控制,特别是对安全边界外的数据管控,应该重点确保数据传输过程中的机密性、完整性。
在数据使用环节上不严格、不规范的访问控制也有导致数据泄漏的风险;在数据共享环节存在数据被各使用方有意无意地做为本地存储使用的情况,这也将是一大漏洞。
调研中也发现大数据应用在Web服务中产生的过程性数据一般是临时存放在云平台中,理论上最终是需要彻底删除的,即采用物理介质全覆盖的传统数据物理删除的方法;但是在云环境下,由于用户对数据的物理存储介质没有控制权,无法保证数据存储的副本(过程性数据)被物理删除,这样其中的敏感数据有可能因为删除不彻底被恢复而导致泄露。所以保证过程数据被彻底删除或销毁,是大数据安全的一个重要问题。[3]
大数据的应用衍生出独特的架构、存储、网络传输及计算方法,需要在数据的产生、采集、传输、存储、处理与分析、应用、归档等阶段采取对应的访问控制机制和加密+措施,增强大数据应用的安全性。
公安基层大数据应用的调研及分析,使得我们明白在公安大数据的整个生命周期里,都要从数据质量、权限控制、加密、安全等角度强化对大数据应用的管理,也让我们更深刻认识到应该在保障措施、组织机构、规章制度等方面完善公安基层大数据应用的配套,积极通过思维突破提升应用和管理能力,在公安基层大数据应用的引导下对公安业务工作进行流程改造。
公安基层大数据综合分析报告,是公安大数据更有价值的一种应用前景。一份好的公安大数据分析报告甚至可以支持政府决策和支撑宏观政策。例如“平安指数”就是公安大数据综合分析报告的典型应用,它从更高层面上为行政决策提供更客观、科学、全面的数据和更多维的分析视角。