宋祥斌
(江苏警官学院,南京 210000)
随着大数据、移动互联、云计算等技术的蓬勃发展,公安信息网、视频网、卫星通讯网实现连通,互联网、公安专网形成的警务数据信息正迅猛增长。大力实施公安大数据战略,需要把握时代发展大势,着力打造数据警务、建设智慧公安,坚持实战引领,充分运用大数据等新技术手段,积极构建以大数据智能应用为核心的智慧警务新模式,着力提高预测预警能力、精确打击能力和动态管理能力,不断提升公安工作智能化水平[1]。因此,警务部门要主动拥抱大数据、开发利用大数据、治理管控大数据,深入实施科技强警战略,推动警务实战转型升级。
在大数据环境下,“万物皆数”特征更加明显,警务战场的实时情报信息、警务指挥与控制命令、治安监控管理信息等,都以数据形式生成、传输、存储和处理。公安大数据已经成为构建公安战斗力的核心要素。在警务大数据中,案件构成要素以及人、事、物、空间等一系列的信息都可以全方位、多角度地与案件进行关联。例如,犯罪分子在通信联络、浏览网页、刷卡消费、游戏娱乐、交通出行、金融交易等等方面都会生成业务数据和行为数据并被记录下来,而这些数据就有可能隐藏着犯罪行为的蛛丝马迹,通过数据挖掘、关联分析、智能处理等技术,就能为发现犯罪、揭示犯罪、证实犯罪提供线索或证据。
大数据正对犯罪预防、调查取证、案件研判、侦查决策等环节进行全方位渗透,以大数据为支撑的公安信息资源的广泛搜集、深度分析和智能应用,将使警务形态发生质的变化,推动智慧公安的发展。在大数据战略从顶层设计到底层实现的“落地”过程中,技术是载体,分析是手段,应用是目的,而治理是基础[2]。大数据信息资源在警务实战中起到基础性、驱动性、战略性的作用。警务大数据的有效治理,是为了解决警务实战部门清楚“有哪些数据?怎么获取数据?如何更好应用数据?”加快传统警务侦查模式向从人到案、从物到案、从案到案的多元模式转型,从而提高预防犯罪能力,降低破案成本,缩短打击周期,对推进公安大数据战略和提升警务实战效能具有重要的理论意义和应用价值。
警务大数据涉及公安内部和外部社会不同来源的复杂数据,倘若缺乏科学的数据治理,那就很难正确整合和管理数据,很难开发满足实战需求的警务应用。目前警务大数据运用仍处于起步阶段,大数据实战应用的场景还不够丰富,大数据广泛服务于实战的态势还未形成,需要对警务大数据进行有效治理,促进公安系统大数据资产在警务实战中的价值变现。目前,开展警务大数据治理时面临的主要问题有以下方面。
随着各类信息系统的建设和运用,数据分散在公安内外,数据量高速膨胀,导致了数据资源利用的复杂性和管理的高难度。主要表现在,数据多头采集和标准不统一,使数据整合、数据转换、数据清洗变得非常复杂和难以处理,难以建立全面、准确、完整地反映犯罪态势的单一数据视图,难以实现数据的逻辑整合[2]。用户不知道大数据平台中有哪些数据,也不知道这些数据和公安业务的关系是什么,虽然意识到了大数据的重要性,但不知道该到哪里寻找这些数据,不清楚平台中有没有能解决当前警务问题的关键数据。
由于公安内部的部门区隔和行政分化,不断地制造着数据交互的断层,公安外部其他社会部门的“体外数据”与公安的核心数据体系不能自然地融合。这种数据的异构化,影响数据获取,导致数据资源接入混乱,增加数据资源管理成本和处理难度。数据不可控是从传统数据平台开始就一直存在的问题,在大数据时代表现得更为明显。没有统一的数据标准,数据就难以集成和统一,没有质量控制,大数据就会因质量过低而难以被利用,难以建立有效管理大数据平台的管理流程,制约警务大数据的管控和跨库共享[3]。
大数据时代,公安系统是社会治理部门中的数据大户,在警务实战中积累了海量数据,但缺少对数据的知识管理,没有建立起警务数据的知识图谱,数据与知识之间难以快速转换,缺乏对数据进行自助探索和挖掘的工具和手段,数据的深层价值难以体现[3]。由于缺乏规范的数据质量治理流程和审核机制,数据归口不一,查询的信息不完整,存在一定程度的“时差”,致使数据供给与警务实战需求不匹配,甚至脱节。用户即使知道自己业务所需要的是哪些数据,也不能便捷自助地拿到数据;相反,获取数据需要很长的开发过程,导致情报研判分析的需求难以被快速满足,而在大数据时代,警务实战追求的是对案情的快速分析,漫长的需求响应时间难以满足实战需求。另外,相关警务大数据规范机制不完善,影响隐私保护和授权访问,在数据使用的时效、范围、次数、层级、程序等环节上缺乏规范,数据应用隐患多,成为大数据环境下一大执法隐患。
如何以大数据为中心精确设计和指挥警务,已经成为改革和创新公安管理的制高点。对警务大数据资源进行源头治理,必须紧紧围绕“把大数据管起来、用起来,保证数据与警务实战的融合”的目标,理清大数据治理的关键要素,构建警务大数据的治理框架。需要调研实战部门大数据技术平台的搭建、组织的变革、政策的制定、流程的重组、数据的管理,摸清大数据在侦查破案中的实际应用情况,切实理清公安内部和外部社会数据资源的种类,为构建警务大数据治理的框架打下扎实的基础。
警务大数据的建立依赖于自顶向下的数据规划和自底向上的数据治理,数据治理面向元数据,警务元数据及警务数据的标准化、规范化是重要基础。根据警务大数据资源的种类、来源、内容等,制定统一的元数据标准和主数据标准,有效管理数据中的结构化、半结构化和非结构化数据,从基础上保障数据的完整性、规范性和一致性,提高各层级警务信息系统间信息的共享水平和数据资源的利用率。基于数据标准的治理,可以通过自动化手段,自动识别数据资源并标明数据方位和属性,建立办案民警能理解的数据服务目录,实现自我治理,并能够实现对公安业务变化的自适应性。
大数据应用之前必须评估大数据质量,加强审计、监督和评价,以保证分析结果的准确性,提高数据的访问效率,保证大数据的鲜活度,满足侦查破案的实时性要求。大数据质量管理关注数据在清洗后的整合、分析和价值利用,旨在消除警务大数据的不一致性,建立规范的数据应用标准,提高组织数据质量,实现数据广泛共享。数据质量对大数据的深度应用至关重要,认为大数据基数超大,可以忽视数据质量的观点是不全面的,只有质量合格的大数据才能够作为公安系统的宝贵资产应用于犯罪预防、侦查破案、管理决策中,发挥数据资产的警务实战价值。
对警务大数据的挖掘分析、开放共享增强了数据的应用价值,同时也增加了数据的透明度,尤其是将数据集中和共享使用时,一些敏感隐私的数据就有可能被泄露或非法使用,这给警务大数据的安全与隐私保护带来更加严峻的挑战。大数据环境下的数据安全与隐私管理要求建立有效的大数据安全规范和策略,以确保警务大数据在使用过程中具有适当的认证、授权、访问和审计等控制措施,从而满足大数据利益相关者的隐私与合规要求。
合理、可靠的大数据架构是保证大数据警务应用正常运行的技术支撑。在警务大数据治理中,需要描述警务大数据应用的关键要素、技术架构和技术路线,对音视频、案件卷宗等非结构化数据的存储与挖掘提供支持,开发元数据管理、主数据管理、知识图谱、数据可视化等功能,建立统一的警务大数据治理与评价平台[4]。
警务大数据治理是专注于将大数据作为公安核心资源进行应用和管理的一套管理机制,实现对数据资源采集、传输、存储、利用、开放的规范管理,促进数据在风险可控原则下最大程度开放共享,促进技术流、业务流、数据流的融合,并推进公安内外数据资源的对接,实现跨层级、跨地域、跨系统、跨部门、跨警种的协同管理和服务。大数据治理将帮助公安各级实战部门更好地采集、使用和管理数据,为大数据时代的智慧警务带来广阔的发展空间。