■文/公安部计算机与信息处理标准化技术委员会秘书处 闫建华
随着公安信息化工程建设的深入,信息系统已经迈入大整合时代,积极引用资源整合和数据共享的理念,为解决公安数据标准中代码重复、交叉等冲突问题,公安部确定了数据元标准与数据项标准的对应关系,明确了用数据元规范信息系统的建设。
数据元,在GB/T 18391.1-2009中对数据元(data element)有明确的定义:由一组属性规定其定义、标识、表示和允许的数据单元。公安数据元是在国家标准定义的基础上,结合公安业务的特性建立的。
要了解公安数据元首先要了解数据,什么是数据?数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。公安数据元是公安业务系统中数据的最基本单元,是通过一系列属性来描述数据,属性(attribute)是指一个对象或实体的特征。在GA/T 542-2011《公安数据元编写规则》中给出了公安数据元的六大属性类别:标识类属性、定义类属性、关系类属性、表示类属性、管理类属性和附加类属性。这六大属性类别又分别代表不同的属性名称,标识类属性代表内部标示符、中文名称、英文名称、中文全拼、标识符、语境、版本和同义名称;定义类属性代表说明、对象类词、特性词和应用约束;关系类属性代表分类方案、分类方案值和关系;表示类属性代表表示词、数据类型、表示格式、值域和计量单位;管理类属性代表状态、提交机构、注册机构、主要起草人和批准日期;附加类属性代表备注。在这26项属性名称中14项是必选属性。
公安数据元的提取有两种方式:一是自上而下提取,二是自下而上提取。针对新的系统、数据集建立宜采用自上而下的提取方法,一般步骤为业务功能建模、业务流程建模、信息建模、数据元提取和数据元提交。针对系统中已经存在的数据元宜采用自下而上的提取方法,即逐部门系统收集、筛选、梳理、排重、找出共性、定义、分类、整理、实现标准化。
在梳理出有实际意义的公安数据元后,下一步就是公安数据元的应用。公安信息化的深化从某种程度上说就是追求数据的最大化及数据活用,如果把信息化比作人体,那么数据就是血液。公安数据元最基本的应用既是数据项的规范表示和数据项标准的编制。在GA/T 1053-2013 《数据项标准编写要求》中对使用公安数据元规范表示数据项做出了硬性、详细的规定。数据项是具有一定含义、按照特定规则命名和标识的、用于描述警务活动的信息数据单元;数据项需使用公安数据元或公安数据元数据元与公安数据元限定词表示。为了精简公安数据元,使表结构更加清晰,引用了公安数据元限定词的概念,公安数据元限定词是区分概念的词。公安数据元在数据交换、数据备案和接口服务中可用于规范交换(备案)数据项的值域规格和规范交换(备案)数据项、条件参数、反馈结果的XML的标记符。通过公安数据元的逐步应用改善了数据质量;提升了采集效率,梳理采集需求,以公安数据元对采集数据项进行规范,避免重复采集;数据全网扫描,通过数据流向轨迹图可以展示关键业务数据在被哪些系统、哪些应用引用,从而掌握数据来龙去脉,提升数据的整体安全性,并且支持一次变更,全网更新;数据关联整合,通过数据元这个关键的“纽带”能够有效的关联各类信息化应用中相关的业务数据。目前公安部办公厅、人训局、经侦局、治安局、刑侦局、出入境管理局、消防局、监管局、交管局、装财局、禁毒局、督察局、纪委监察局、科信局等业务部门已充分认识到公安数据元在信息化建设中的重要性,并已相继提出所需公安数据元。
公安数据元从提出到发布还需要经过公安部标准化管理部门的审核。公安部科技信息化局为提高工作效率现已建立了公安数据元管理系统,该系统是公安数据元的审核发布的快速通道,形成数据标准化平台,实现标准收录,智能化结构设计、离线对标、在线对标、数据关联、数据地图等功能。全国公安部门均可通过该系统进行公安数据元网络申报。另外,为配合公安数据元管理流程和编写规则,公安部科信局相继出台了GA/T 541-2011 《公安数据元管理规程》、 GA/T 542-2011 《公安数据元编写规则 》、GA/T 1053-2013 《数据项标准编写要求》和 GA/T 1293-2016 《应用软件接口标准编写技术要素》等管理标准,通过公安数据元及其相关标准的编制、管理、应用,实现数据标准化。
公安数据元的建立经过公安信息化部门的不断努力推进,目前已日趋成熟,截至目前,共发布公安数据元1212个,公安数据元限定词533个,公安信息代码标准378项,数据项标准27项,接口、交换技术规范11项。这些标准的制定,有效规范了数据元的全生命周期管理,为数据标准化应用奠定基础。
公安数据元源于具体业务,高于具体业务,规范具体业务。从具体业务到公安数据元是抽象、聚类、归纳过程;从公安数据元到具体业务是具体、释放、演绎过程。公安数据元标准化建设是当前与今后一段时间数据中心建设、信息资源服务平台建设的基础工程及切入点。
[1]GB/T 18391.1-2002,信息技术 数据元的规范与标准化 第1部分 数据元的规范与标准化框架[S].
[2]GA/T 542-2011,公安数据元编写规则[S].
[3]GA/T 1053-2013,数据项标准编写要求[S].