□ 文/李正东
实时数据处理技术在情报实战中的作用
□文/李正东
随着信息技术的进步,现代警务体系的建设取得了长足的发展,以合成作战指挥平台为代表的新一代警务应用系统在实战得到检验。本文分析了情报大数据平台的发展过程,特别是实时数据采集与识别对于公安实战的作用。并指出公安应用领域实时数据处理的核心是要解决可计算,可视化和动态调整三个方面的能力。简要讨论了实时数据的应用场景和案例,对当下实时数据的采集及应用中的局限性进行研究,结合应用现状给出相关的建议。
1829年,现代警务体系的雏形在英国出现,此后随着现代化进程而不断演化。未来,现代警务体系将向多元化的价值理念、法治化的制度规则、网络化的组织结构与合成化的运行机制方向发展[1]。随着信息技术的进步,我国的公安警务体系的建设取得了长足的发展,特别是近年来,以合成作战指挥平台为核心的现代警务指挥体系建设,整合了公安三大中心(接警、情报、指挥),五大系统(一体化指挥调度、情报研判、勤务管理、民生警务、满意度测评),提高了公安一线的指挥和作战效能,得到了实战检验。
与以往不同的是,现代警务指挥体系的基础是警务大数据,统一通讯服务和地理空间定位服务,它们为合成作战平台实现扁平化、可视化、点对点指挥调度的提供了基础支撑。在各级指挥部门(指挥长)进行统一调度时,现代警务指挥平台可以将情报信息与业务指令关联起来,统一发送到接受者的终端上;与此同时,现场处置的警员也可以将实时数据采集并回传给指挥中心,为后一步的调度指令提供参考,这个过程形成了一个动态完整的信息链。
在合成作战指挥的“情报-指挥-勤务-行动”四大关键步骤中,情报分析是第一个环节,也是后续指挥作战的重要参考因素,这也是为什么各级公安部门都非常重视情报实战平台建设的原因。警务大数据是情报实战平台的信息来源入口,也是情报平台建设的先决条件,它是由基础资源池数据和实时数据分析两个部分构成。其中:基础资源池数据包括基础信息(人口、法人、重大事件、房屋、民生)、出入境数据、旅店数据、交通路网和消防数据、铁路、民航、宾馆、网吧、工商、税务、房产、水电油气数据等;实时数据则包括动态信息(警情、舆情、交通、反恐、维稳、治安视频、实时通讯)等。前者在警综平台的建设过程中,已经得到了较好的解决;而实时数据的处理与分析,由于实时信息的具有非数值和多维的特性,使得其采集与分析都不同与传统的数据处理方式,并且它还是飞速增长的海量信息,这在当下的信息处理技术上,还没有得到完善解决。
实时数据分析要解决的是海量信息的处理问题,由于数据源是不间断的,从实战的要求来讲,其响应时间也必须是实时的,一般是要求处理响应是秒级。以中国南方的某一个大型城市的交通卡口大数据项目为例,在全市64个交通卡口,以及130个主要桥梁隧道出入口采集的数据量,高峰时可以达到每个小时200万条记录,这对于传输和处理都造成了巨大的压力。所以,实时数据的处理需要进行分流,对于数据量大而无法或没有必要进行后台运算的,需要分节点来处理,从而达到响应速度的提高。
在公安应用中,实时数据处理的核心是要解决可计算,可视化和动态调整三个方面的能力。可计算是指对于流媒体格式数据的处理能力,比如视频和语音数据的检索,实时的数据计算和分析可以动态实时地刷被监控对象的行为,展示其变化情况。以平安城市监控为例,分布在城市的监控点有上万路,每时都在上传海量的视频信息。虽然现在有技术可以针对视频进行特征量的提取和多维分析,但这是个耗时比较长的计算,若是对于每一路视频都进行分析,那么这个计算量是非常大的,目前的技术处理能力是不可能完成的。
对于流式实时数据的处理,不能作为一般性工程问题来解决,试图通过无限增加计算节点来提高计算能力的方法不可取。在现实中,通常可以采取提高主干道和出入口的视频分析能力,排除非重要路口的视频分析量,这好比将人的主动脉监管起来,从而达到将城市的关键数据加以收集分析。此外,也可以通过调节识别精度来降低计算量,对于实时数据筛选来讲,不是每一次的分析结果都必须是唯一性的,更有效的方式是先解决模糊数据的排查问题,定位问题最大的可能区域或时间,再进一步精确分析。实时情报分析的精准度是可以调节的,因为大量数据的查询需要工作时间长,特别是面对非结构化数据的处理,其特征量的分析提取本身就是个运算量极大的工作。通过多次重新定位和分析,来提高情报分析结果的正确率。
在警务大数据分析中,另一项重要就是内容态势分析,它是基于空间与时间相结合的情报分析展示,信息的可视化就是为了让情报分析的结果可以被更好的辨识,从而提高决策的效率。1987年美国国家科学基金会举办的可视化会议,首次正式提出了可视化这一术语,可视化作为一个研究领域开始发展起来。1989年,Robertsong, Cardsk和Mackinlayjd首次提出了信息可视化这个概念[2]。在实时情报分析领域的研究中,对于海量信息的检索与海量信息的展示,都是非常重要的。如果动态信息不能有效的展示出来,那将会给指挥者造成困扰,有时甚至会得出错误的判断,从而影响决策。
从事研究的情报实战平台产品中,能对实时数据的抽取的分析结果,通过三种方式进行展示。一种是统计分析图形化展示,即将各个专题数据进行多纬度的统计分析,并以图形或表格形式进行展示,以便于得高识别度;其次是空间的关联性分析,也就是通常说的密度图展示,将经过分析的数据在地图空间上进行多维度分析,可以看到全局和某一个区域热点分布情况,从而让决策者能快速定位问题发生的热点区域;第三种是时间轴的河流模型分析,属于专题可视化分析方法,其效果是使决策者不必逐个分析过程,直接通过拖动时间轴就可以了解某个事件在某个时间段或整个时间区间内的发展趋势,以及多个事件在时间维度上的对比情况,并表现出地点、实体之间关联关系的耦合程度。
最后一项,就是实时数据分析的动态调整能力,这也是实时中最难建设的一个部分。公安部门已经掌握了大量的社会化信息,针对这些信息的查询及综合统计分析方面,也已经有相当的成熟度。可以说,对于这些信息的有效分析与处理给一线的治安工作提供了极大的帮助,但是在实际工作中,还是有很多无法预测的问题出现,这些问题的产生就是因为情报分析工作的滞后性。近年来,在反恐领域的突发事件增加的形式之下,提高情报分析工作的预测能力和干预能力,其最终目标就是打击和预防事件的发生。
在笔者与以色列国内安全机构交流学习过程中,了解到他们对于实时情报分析中非常重视,尽管在他们国内的情报分析平台中,收集了大量结构化的数据,可以提供详细的筛查功能。然而,在实际工作中,对于非结构化的实时性的数据采集与分析,其重要性甚至要高于结构化的数据。这方面的他们采用工具也较完善,比如通过实时监测被监控人的通话或短信,可以直接干预通话内容,从而达到将可能发生的事件引到被控制区,进行干预和消灭。实时情报的动态调整能力并不是一个特定的应用,它是需要在各种应用系统之间数据接入和转换上进行干预,从而防止因为信息的不对称,导致指令或行动的冲突。据以色列的安全人员介绍,他们每天防止的恐怖事件约30起。
综上所述,在公安行业应用领域,实时大数据分析的方法及工具已经得到部分的应用,这些应用相较以前的结构化分析来讲,算是进了一大步。但是面对现实工作,还是有大量非结构化信息不能得到及时的处理与分析,从而限制了情报工作的成果在实战中的发挥。实时数据分析在情报工作的效果,不仅仅是为了情报分析的结果正确性,而是需要考虑多个方面的平衡,包括完整性分析,合理性分析,时效性分析和精确度分析。实时数据分析技术作为大数据信息化的最新研究方向,将会成为公安及其它行业应用中新的创新力,从而促进情报平台的升级和工作方式的转变,进一步推动现代警务平台的优化升级。
作者单位:金鹏电子信息机器有限公司