何琳,刘燕涛,任兴
(1.联通大数据有限公司,北京 100013;2.北京泰策科技有限公司,北京 100081)
在数字化政务推进的过程中,政务数据的敏感性越来越成为政务数据开放和共享过程中需要重点关注的问题。对海量政府敏感数据的分级将是政务数据工作的重点。公共数据是指各级行政机关以及具有公共管理和服务职能的事业单位在依法履行职责过程中获得的各类数据资源[1]。公共数据分级目的在于确定各类型政务数据的敏感程度,从而为政府不同类型数据的开放程度提供参考。本方案是对浙江省某市政务数据进行数据分级设计,为政府部门在开放和共享政务数据时正确数据定级提供参考。
数据分级管理是数据安全保护场景下的必要的前提条件。《数据安全法》规定国家建立数据分类分级保护制度[2],对数据实行分级保护,数据分级工作是基础和核心,数据分级是数据使用管理和安全防护的基础,为数据尤其是重要数据制定分级制度并依规管理,是实现数据安全目标的重要工作。
(1)公共数据管理
公共数据基于数据目录进行管理,各单位应将本单位的公共数据资源进行全量编目,做到目录之外无数据[3]。公共数据目录可分为基础库目录、重点领域资源目录、省级目录、市级目录、区县目录等类型[4]。按照公共数据目录中的某种共同属性或特征(包括数据对象、重要程度、共享属性、开放属性、应用场景等),公共数据可进一步进行区分和归类。公共数据共享交换,最小单位为公共数据目录的单个数据资产。数据资产进行拆分或聚合,将产生新的一个数据资产。
(2)公共数据分级体系
按照公共数据遭到破坏(包括攻击、泄露、篡改、非法使用等)后对国家安全、社会秩序、公共利益以及公民、法人和其他组织的合法权益(受侵害客体)的危害程度对公共数据进行定级,为数据全生命周期管理的安全策略制定提供支撑[5]。公共数据分为敏感数据(L4级)、较敏感数据(L3级)、低敏感数据(L2级)、不敏感数据(L1级)。
L4级有下列情形之一:对全社会、多个行业、行业内多个组织造成严重影响;对单个组织的正常运作造成极其严重影响;对人身和财产安全、个人名誉造成严重损害。
L3级有下列情形之一:对全社会、多个行业、行业内多个组织造成中等程度的影响;对单个组织的正常运作造成严重影响;对个人名誉造成中等程度的损害。
L2级 有下列情形之一:对全社会、多个行业、行业内多个组织造成轻微影响;对单个组织的正常运作造成中等程度或轻微影响;对个人的合法权益造成轻微损害。
L1级对社会秩序、公共利益、行业发展、信息主体均无影响。
公共数据分级基于公共数据目录的数据资产开展,公共数据资产级别不低于所包含数据项的最高级别。
(3)公共数据级别变更
当应用场景、数据资产、数据项级别等方面发生变化,导致数据发生泄露、篡改、丢失或滥用后的影响对象、影响程度、影响范围发生较大变化时,应重新对数据进行分级。
数据分级发生变化的情形包括但不限于:①数据资产发生了增加、减少、改变等情况;②数据在汇聚、加工、分析等过程中级别发生变化或产生新数据(如脱敏后的数据、统计产生的数据等);③数据应用场景发生变化导致数据级别变化。
公共数据分级流程包括6步:(1)公共数据获取(公共数据目录);(2)系统自动分级;(3)分级结果修正;(4)分级结果确认;(5)分级结果复核;(6)确定分级结果。公共数据分级流程具体如图1所示。
图1 公共数据分级流程
(1)公共数据获取:根据数源单位编制的公共数据目录,数据分级系统通过接口获取公共数据目录。
(2)系统自动分级:系统内置知识库和规则字段进行自动分级,得到公共数据目录初始级别。
(3)分级结果修正:结合现有和可预期的数据应用场景,补充对未自动标识字段进行分级,或修正级别建议值,初步确定数据级别。
(4)分级结果确认:数源部门进行分级结果确认,调整本部门待审核数据资产的级别值。
(5)分级结果复核:主管部门数据管理员复核各部门公共数据级别。若复核不通过,则驳回,给出建议,由数源部门重新分析,评定数据级别。
(6)确定分级结果:通过主管部门数据管理员复核后生成公共数据级别,并同步至公共数据目录中。
由各数源单位将本单位公共数据进行编目。根据数源单位编制的公共数据目录,数据分级系统通过接口获取公共数据目录。公共数据获取通过配置公共数据目录连接信息,包括名称、主题、类型、URL、账号等,对配置公共数据目录连接信息进行管理,并可测试连接情况。
配置公共数据目录连接的接口设计如下:
(1)接口:getdatacategorylevelinfo
(2)请求URL:http://ip:port/bdcl/s/api/getdatacategorylevelinfo
(3)请求参数
表1 请求参数列表
(4)获取信息
表2 获取信息列表
通过系统的知识库对公共数据目录按评估流程和评估模型进行评估定级,得到公共数据目录初始级别。系统的知识库包括公共数据分级规则库、敏感度知识库、合规知识库等类型的知识库。公共数据分级规则库对分级数据的格式规则进行管理;敏感度知识库对公共数据目录的评估后的元数据级别进行敏感度分析;合规知识库是对国内法律法规高敏感度级别数据和国内行业定义的高敏感度级别数据进行管理。
系统自动分级的设计如下。
结合现有和可预期的数据应用场景,数据安全技术团队补充对未自动标识字段进行分级,或修正级别建议值,初步确定数据级别。数据安全技术团队根据字段敏感度从业务、法规、安全等方面进行评估得到数据级别,评估规则包括去最值、去平均值和加权平均等方式。
图2 公共数据分级评估模型
分级结果修正的操作设计:(1)通过公共数据管理平台进入数据分级系统;(2)进入分级修正环节;(3)选择需要修正的公共数据目录;(4)查看每个字段的自动分级级别;(5)技术团队从业务、法规、安全等方面进行评估确定初步级别;(6)级别确定完成后进行提交至分级结果确认环节。
数源部门进行分级结果确认,调整本部门待审核数据资产的级别值。数据源部门数据专员线下组织数据安全和业务专家,对数据分级进行评审,确定级别值,确保分级的准确性和科学性。
分级结果确认的操作设计:(1)通过公共数据管理平台进入数据分级系统;(2)进入分级结果确认环节;(3)选择要修改的公共数据目录进行编辑;(4)查看每个字段的分级结果;(5)如果需要修改级别时对该公共数据目录级别进行修改;(6)级别修改完成后进行提交;(7)修改完成并确认无误后提交复核。
主管部门数据管理员复核各部门公共数据级别,复核通过后将数据级别同步到公共数据目录中。若复核不通过,则驳回,给出建议,由数源部门重新分析,评定数据级别。
分级结果复核的操作设计:(1)通过公共数据管理平台进入数据分级系统;(2)进入分级结果复核环节;(3)选择需要复核的公共数据目录;(4)依次核对公共数据目录的级别;(5)当级别评定满足评定标准时,则通过复核;当级别评定不满足评定标准时,填写驳回理由并驳回至数源部门。
通过主管部门数据管理员复核后生成公共数据级别,并同步至公共数据目录中。在确定数据级别之后,将分级结果信息实时推送到kafka队列中,公共数据级别信息同步规范设计如下:
表3 公共数据级别信息同步规范表
?
本文依据浙江省数字化改革的相关标准,通过对公共数据分级设计,将某市公共数据分级工作有效落实,为政务数据开放和共享工作进一步推进提供良好根基。