马锐 边孝诚
摘要:在目前日渐复杂严峻的社会治安形势和科技强警战略的大背景下,通过现代化的信息技术来帮助公安机关开展各项工作,这是目前公安信息化工作的发展趋势。然而,通过调研发现公安信息系统存在着问题,集中表现在数据资源一致性、准确性、实时性较差和信息孤岛的问题。为了解决这些问题,建立起基于数据仓库技术的公安综合信息平台,将海量信息资源进行科学有效的资源整合、信息处理以及共享关联,以此提供给各级公安机关使用,已经成为公安信息化工作的一项新挑战。
关键词:数据仓库;信息平台;探索
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)08-0009-03
1引言
公安信息化进程是国家信息化进程的重要组成部分,对公安信息的共享和综合利用是公安信息化的重要手段。使用合适的方法、对策来建立与维护公安综合信息平台,可以使得公安各方面的工作上一个新台阶、新水平。基于数据仓库技术来搭建公安信息平台,实现公安信息的获取、采集与处理,实现快速高效地从数据中提取有价值的信息,从而显著提高公安队伍的业务水平。跟随公安行业和国际潮流,实施信息主导警务战略,对增加公安资源利用率,减少公安运营成本,以及提高公安工作效率都具有实际意义。
2背景
如今,由于经济的全球化以及社会信息化的大趋势,公安部门面对的案件和违法活动也日益高新与智能,涉及的区域也越来越广,社会的治安環境与以前相比有了翻天覆地的改变,公安机关面临的挑战越来越多、压力越来越大,传统的勤务方式和警务体制已经不适应新时代的发展需要,改革行动迫在眉睫。与此同时,在当今世界,信息化的发展更是十分迅速,同样,犯罪活动的智能化趋势也在加剧,世界各地的公安部门都将情报工作作为警务工作的首要前提。当今,情报主导警务前提下的情报工作是预防、打击违法犯罪活动的重要手段,这是被众多的国家、地区共同认可的。欧美及日本等国家的警务组织,通过组建公安情报部门,运用本国最先进的技术手段,~i.St自己的警务情报信息平台,展开系统化的综合信息分析,对预防、打击各类违法犯罪活动起到了积极的作用。
综合各国的警务发展情况,如今计算机科学技术高速发展,在公安综合信息平台的系统设计中,也逐渐采用B/S模式的架构,使用多种专业技术搜集公安信息情报。同时,建立信息对比数据库,提升搜索引擎,动态生成信息搜索结果已经成为公安信息综合平台开发设计的主流。
3数据仓库基本概念
W.H.Inmon是数据仓库概念创始人,在其所著的《建立数据仓库》中,将数据仓库定义为一种集成的、面向主题的、不可更新的(稳定性)、随时间持续改变(不同时间)的数据集合,用于支持经营管理中的决策制定过程。这是一种被普遍认可的数据仓库定义。同时,还有一些组织或个人提出其他定义,如数据仓库是一种语意一致的数据仓储(独立的且不影响已在运作的实用系统),以达成不同的文档报告、数据存取的需求;数据仓库是一种体系结构;数据仓库是一个持续发展的过程,融合了多个异质数据在一起,来支持实时查询、分析报告和决策。
所有的数据仓库结构都是从一个简单框架发展来的,一般由以下模块组成,如图1:
4构建数据仓库
4.1优势
在公安信息平台建设的进程中,大部分的单位都是采用分步和分块实施的策略来构建信息系统,也就是说,对于不同部门的不同需求构建各自的业务信息子系统。这种策略的优势很显然:分期投资、效率很高,对于以后的应用和维护也非常有帮助,但凡事都有两面性,不同子系统之间会有重复,重叠部分都是冗余的信息存储,甚至对相同目标信息会产生矛盾现象等,这些都可能导致信息孤岛问题,信息共享难以在不同的部门和不同的单位之间达成。
这种分布式的系统使用户很难从各自独立存在的众多系统之中同时得到全面的数据信息,警方在执行跨部门或跨单位任务时会因为系统之间无统一业务流程逻辑联系和业务信息传递渠道,而对大量的信息进行重复的操作或键入。构建一个完整、统一、高效的业务流程信息管理平台,能够将各自独立的系统的不同功能有效组织利用起来,为使用者提供一个统一的登录人口,并采用有关的业务流程管理技术,整合各式警务信息系统,尽可能地减小重复资源和信息孤岛,为使用者营造一个更完善、更高效的服务平台。
4.2目的
构建公安数据仓库是为了能综合利用警务数据信息资源,通过分析警务数据的特征可以有效帮助工程师更迅速、准确地构建数据仓库,且能够在最大程度上利用警务数据信息。
4.3构建数据仓库
4.3.1数据源
对于所要设计的系统,录入的数据信息包括两大类:
第一,可以直接入库的数据信息。对于这种数据信息,事先数据中心和相应单位已经商量好了报送数据信息的内容、相应的专业描述用语或者更加严格地元数据形式。无论是采取的何种方式,都会直接录入报送数据单位的原貌数据库,并且也会将其复制为原始数据存入基础数据库。这种数据,会有专业的业务员按照规则及要求去审核、评估、验收所报送的数据,在通过验收后将其更新为基础数据库中的正式数据。
第二,不可以直接入库的原貌数据。这种类型的数据信息或许还未经元数据整理,或许还未知有无元数据与之对应。为了可以快速地录入,先将原始状态下的是数据暂时存储到数据保存库中。然后,整理并规范化数据,将元数据提取并补充到元数据库中;接着,按照得到的元数据,与相关单位协商,将其转换为以元数据形式描述的数据报送任务,让它变成第一类描述的形态的数据信息;然后,回到第一类数据处理的步骤,对数据信息按照规范转换,然后验收,之后再录入基础数据库,使之变成正式的数据信息资源。
4.3.2数据采集
由于数据资源的类型、数据量、更新频率、安全等级规定、传递通道等构建情况不一,数据的采集方式也会随着数据特征的不同而不同。采集数据信息有很多不同的方式,数据抽取和手工录入都是常用的数据采集方式,除此之外,通过接口导入或者共享交换等方式也可以达到数据采集的目的。