张 颖,刘 辉
(1.南京艺术学院信息化建设管理中心,南京 210013;2.网络通信与安全紫金山实验室,南京 211111)
金盾工程实施以来,公安系统已经形成了相对完善的基础设施、网络平台以及各类应用系统。经过多年的业务沉淀,数据种类日益丰富,数据数量每日以TB级速度递增,但同时也带来了一系列问题:各类数据信息来源复杂,数据质量参差不齐,异构数据增多,数据重复、跨警种/层级/地域的数据资源无法有效共享[1],各业务条线实战能力有待进一步提升。大数据和云计算技术的发展为构建统一的数据治理和综合服务平台,形成资源和服务共享的体系,实现公安业务部门间的“打、防、管、控、服”一体化联动提供了可能,全面提升公安协同作战能力,构建智慧警务体系的理念逐步在公安部门形成共识。
本文正是基于此背景,在公安大数据平台的基础上,重点探讨如何通过可视化技术构建智慧警务大屏一体化指挥调度系统,提升快速科学决策和统一协同作战能力。
数据可视化技术可以理解为一门利用计算机图形学、用户心理学、数据建模和挖掘、交互设计学等综合学科的知识对数据进行图形化表达以增强用户认知,提高信息沟通效率的一门综合性应用的技术和方法。在大数据时代,数据可视化是不可或缺的工具和手段,其过程和步骤一般分为数据源明确、数据采集获取、数据清洗和过滤、数据入库和存储、数据建模分析、数据展示以及人机交互等。目前常见的数据可视化工具有Google Chart API、Float、Gephi、Raphael、D3等,地图可视化工具包括Modest Maps、PolyMaps、OpenLayers等[2]。2018年底美国工业安全部门出台了一份针对新兴技术的出口管制名单,其中就包括了数据可视化技术[3]。因此,针对数据可视化技术的研究与应用迫在眉睫。
大数据背景下智慧公安的建设旨在提升公安警务效率和各部门协同作战能力。但目前在智慧公安建设的过程中存在以下几个方面的痛点。
公安数据体量大、增长快,数据资源非常丰富,不仅存在八大资源库、警务综合应用库、情报、刑侦等业务警种的情报信息库[1]和来自各业务平台的数据,也有来自电信、物流、金融、水电煤气等相关机构的信息数据,同时这些数据结构不一,涉及结构化、半结构化和非结构化数据,如数据库表、XML、文件、各类文档、文本、音频、视频、图片等[3]。且数据质量参差不齐,加大了数据综合利用的难度。
在长期信息化建设的过程中,由于公安各业务条线的系统在建设之初都是单独建设的,一方面这些业务系统在建设过程中并未充分考虑未来数据交换和服务的需求,或者即使考虑了但预留的数据服务接口也非常有限,因此各系统之间并不能很好地提供数据相互调用服务。此外部分紧急业务处理需求过程中即使临时增加了新开发的数据服务接口,也带来了运维成本增高的问题;另一方面由于各种业务数据如警情、重点人员、情报、刑侦、经侦、技侦等业务信息并未实现充分共享,信息之间存在壁垒或者孤岛,导致在警情研判和综合决策指挥调度时各类数据资源的整合和利用率低。
在公安实际业务过程中,警情案情的监测、分析和研判本质是一项综合性的决策工作,需要依赖来自各业务部门的数据支撑,但目前并没有能够有效支撑决策的能提供时空化、直观化、可视化、便捷化的综合研判工具,由此造成了决策效率相对低下,各部门协同作战能力有待提升。
大数据平台的建立部分解决了数据异构和数据共享的问题,但在支持公安业务快速研判和决策方面,仍需要依赖大数据平台发挥其独有的数据价值。在实际过程中,往往基于大数据平台的数据共享服务层之上再建立数据应用层,并提供数据查询、搜索、比对、信息布控以及数据挖掘和分析服务。同时基于数据应用层建立可视化展示的大屏,以此来提高数据的可视化研判决策和指挥调度能力,实现态势分析综合化、研判决策实时化、指挥调度可视化,也能提升各部门警务效率和协同作战能力。
公安大数据的可视化通常是基于各类数据服务和应用的综合展示。从业务的角度公安数据可以划分为以下几个类别。
(1)PGIS数据:主要是地图相关的数据。
(2)反恐维稳类数据:包含六个类别,涉恐人员数据、事件类数据、情报类数据、重点管控数据、重点车辆数据以及视频感知数据;
(3)打击犯罪类数据:包含警情类数据和案件类数据;
(4)安全监管类数据:主要展示道路交通、消防火灾事故数量、地区分布及比较分析;
(5)勤务执法类数据:包含勤务监督数据和执法类数据;
(6)危险物品数据:主要展示区域重点危化企业和危化品生产、运输、使用企业,以及民爆物品、枪支弹药、剧毒化学品、放射性同位素等数量及地区分布;
(7)交通运输数据:如机动车保有量及地区分布,驾驶员数量及地区分布;
(8)消防安全数据:主要展示消防重点单位、重点部位数量及地区分布,以及与消防管理、灭火救援相关的数据等;
(9)人口管理数据:如全市常住人口、暂(居)住人口数量及地区分布;
(10)警务资源数据:如全市民警、警务辅助人员数量及地区分布等;
(11)其他数据:如政府部门、企事业单位、社会相关数据等。
从数据特点来看,数据可以分为时空数据和非时空数据。其中,时空数据主要涉及地理信息数据和空间标量数据,如辖区地图、警力分布图、摄像头的分布、网格单元示意图等。非时空数据占比较大,包含各项业务分析综合指标,如从时间维度分析的案情趋势情况、实有人口统计;重要文本信息,如实时案情展示;层次关系和网络关系数据,如重点任务关系图谱;以及多维度关联数据,如结合不同业务指标对某一辖区派出所的多维评估等。业务数据类型多样而繁杂。从数据展示的维度,可视化可以通过热力图、地图、散点图、雷达图、柱形图、饼图、条形图、折/曲线图、南丁格尔玫瑰图以及组合图形等展示不同分析角度的数据。具体来说,结合业务需求和数据本身的特点,其展示方式可总结如下:
(1)地理信息数据:公安某派出所所管辖区重要安全检测点信息等。常见涉及的业务数据包含:如警务资源数据、人口资源数据、危险物品数据中跟区域部分相关的数据,可用地图+标注等形式展示。如图1所示。
(2)空间标量数据:主要是统计类数据,如犯罪类数据按照时间维度统计的分布情况、展示方式有:散点图、热力图等。
(3)综合分析指标:如常见交通警情类别分析,全市驾驶车辆和驾驶人员统计以及同比分析等,此类数据常常是基于基础业务数据之后的二次统计和分析的结果。可用柱形图、条形图、饼图等统计图形展示。
(4)直接文本数据:如案情、警情实时播报;安全监管类数据中的实时安全检测情况播报;交通运输数据中的实时交通状况播报;反恐维稳类数据中的实时情报等。展示方法如基于词频统计,标签云技术等,直接对信息进行精简之后滚动播报展示。
(5)层次关系或网状关系数据:全年案情类别统计以及案情关联分析,重点人员和重点车辆关系分析等。此类数据往往不是单一来源,是多个不同数据源通过数据挖掘而得到的数据结果集。展示方式如上下层次树、网络拓扑图结构、关系图谱。
(6)多维度关联数据:重点人员、涉恐人员等信息多维度展示等。展示方式有雷达图、堆叠面积图、多维立体坐标图等。
从海量数据中发现案情线索的蛛丝马迹或找出布控对象的关联,是公安业务中常见的应用场景。传统的办案过程中民警本身的经验和素质起着举足轻重的作用。依托于大数据平台的可视化建模分析工具,民警可以将自己的办案思路和经验形成流程化的研判模型,通过条件碰撞、比对、数据查询、合并、分类等操作从而找出数据中的关联,这一系列过程的可视化展示可以极大地降低民警学习的成本。一般来说基于业务模型的动态流程可视化过程可分为:①明确业务需求;②确定原始数据库;③建立分析算子或模型;④选择可视化展示组件;⑤数据转化和展示。其中步骤③可以对此迭代,形成中间模型和中间数据结果,并在此基础上进行二次分析。图7为某公安局重点人员同住分析的可视化建模过程。
数据可视化最关键的一环在于可视化的设计,在实际应用过程中由于存在业务场景不同、使用对象不同、展示客体不同等因素,往往需要多维度综合考虑和衡量。一般来说,至少需要从以下几个角度考虑。
3.3.1 数据特点和业务使用场景
数据的特点主要考虑数据的更新频率,一次数据传输的大小,数据交互时增量传输的数据量等。而业务场景主要考虑三个方面:①查询和过滤:在实际业务使用的过程中是否需要进行条件过滤,以及对应过滤时进行数据选择所涉及的时间和数据传输成本,需要尽可能让用户交互时的延迟感最低。如采用预先加载技术或增量数据传输技术等;②图形的放大或缩小:用户在当前操作页面是否存在图形缩放的需求,当从整体切到部分布局的时候是采用弹窗还是屏幕缩放,一般弹窗适合针对整体中部分指标的详细信息进行二次浏览,而普通情况下仅对当前数据的查看采用缩放图形即可;③图形之间的联动以及下钻问题:图形之间的联动可以更好地探究业务之间的关联,在考虑图形之间联动的时候,存在图形的重新加载或数据切换,如果数据量较大,可采用分步加载的方式,在不影响用户体验的情况下将次要数据放在后面加载;而下钻最重要的是如何进行返回以及确保在下钻的时候不丢失原有上层信息的问题,可在下钻的时候将部分上层数据带入。
3.3.2 用户习惯和交互心理
不同的用户其使用习惯存在一定差别,但从格式塔视觉心理上讲,可视化的设计需要遵循以下几个原则。
原则一:简单原则。大屏是对信息的综合展示,因此在显示的时候必须有所侧重、分清主次。只对跟业务密切相关的重要指标数据进行简单展示,才能够让用户一眼抓住关键,从而避免信息过载;
原则二:对比和近似原则。心理学研究发现,与间距较远的元素相比,位置彼此接近的元素会被看作是一个整体的一部分,因此在进行可视化设计的时候要注意对于内容相似或风格相似的数据和图形在布局上需要安排更靠近,从而让用户产生整体联系感。同时如果要突出相似数据之间的差异性,则要在两者之间关键不同点的色彩、风格上有所区分。
原则三:视觉焦点原则。在进行可视化设计的时候需要和业务人员进行多次沟通,如有必要,跟随业务人员进行实际场景的体验,从而进一步弄清楚不同场景主要关注的指标和数据,在设计的过程中将这部分数据突出显示,以便用户第一时间抓住视觉焦点。
3.3.3展示方式和风格
首先需要考虑的是展示客体的分辨率和尺寸,同一张图在手持终端、电脑屏幕以及大屏上展示的需求和效果都有一定的差异。特别是当下流行的多信号源输入大屏,往往需要用16∶9或16∶10的比例小屏拼接为大屏以达到最佳视觉效果[4]。
其次要考虑的是整个大屏的布局和划分。在公安业务系统中常见的大屏布局划分包括:以中央为主题,左右两侧为辅助的左中右型;上下左右四分型;上2/3下1/3的不对称型;九宫格型等。但不管是哪一种布局,都需要分清主次,其基本原则是将用户最关心、最核心的数据放在用户视觉焦点进行展示,同时适当弱化次要信息,保持整体风格一致。
其他需要考虑的因素还包括具体图形展示的位置、方向、形状、颜色、纹理、灰度等级等[5]。在公安环境中,大屏展示以深蓝色系为主,建议使用公安标准色,同时结合红黄橙不同的等级数据展示关键预警或警示信息。具体可关注《GA/T 2000.260-2019公安信息代码第260部分:视频图像关注对象标注颜色代码》《T/CICC 16001-2018一体化指挥调度业务资源图形符号技术要求》。
随着大数据技术的发展,可视化技术在智慧公安系统中已得到广泛的应用并取得了良好的效果。各类技术和工具也是层出不穷,但基于公安业务的可视化技术并未形成体系化的理论,实战过程中也存在诸多需进一步解决的问题,主要体现在如下几点。
由于存在多源数据或异构数据,导致数据在进行展示前需要经过数据清洗和数据质量提升[6]。这个过程的效率直接影响到最终数据展示的效果,特别是针对实时流数据,如何能够做到实时可视化展示,在技术上仍需要加强和提高。
在实际应用中可视化展示的大屏往往有限,可谓“寸土寸金”,而当前大部分的统计分析软件在面对多维度数据有效展示时能力往往不足。如何在有限的可视屏幕中更有效地展示多维数据,使信息更加立体和全面值得进一步研究。
如果数据从源头发生结构上的改变,或者从业务的角度增加了新的维度,往往需要可视化相关联部分重新编码或设计,造成前期投入和资源的浪费,可视化图形可配置性不高或修改代价较大[7],因此需要从原子粒度的角度对可视化组件和业务数据进行建模或模块划分,提升可视元素的可重用性,节省成本。目前模块化可配置的可视化组件方面的研究已取得一些进展,如专利2017113975588提出了《一种基于可配置控件的轻型应用程序创建方法》,但如何更合理科学地进行原子粒度组件的划分仍值得进一步探究。
本文基于智慧公安建设的大背景,在介绍大数据平台的基础上,结合实际经验重点探讨了可视化技术在构建智慧警务大屏一体化指挥调度系统中的应用原则和技巧,并对下一步值得深入研究的问题提出了初步探讨,为后续可视化技术在公安行业的进一步发展提供参考。