数据分类分级政策演化研究*

2023-03-06 05:30徐婧欣
图书馆 2023年2期
关键词:层级分级工具

徐婧欣 郭 丰 苏 鹏

(1.中国政法大学商学院 北京 100088;2.北京大学信息管理系 北京 100871;3.中国信息通信研究院 北京 100191)

数据分类分级政策是信息化时代的研究热点,是开展数据治理及信息资源管理的关键环节,也是国际规则博弈中的战略制高点,其在数据流通、数据安全、数据共享等方面发挥着重要作用。近年来,“数据分类分级”在国家政策中被频繁提及,我国的“十三五”和“十四五”规划都突出了数据分类分级的重要性[1-2]。2020年颁布的《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》首次将“数据”纳入生产要素,并且提出要完善适用于大数据环境的数据分类分级安全保护制度[3]。要使数据发挥出最大生产力,就必须开展数据治理工作,而数据分类分级是一切数据资源管理的基础,因此制定统一可行的数据分类分级制度迫在眉睫[4]。同时,针对数据分类分级的研究也日益受到学术界的关注。例如,完颜邓邓等调查分析了国外政府数据分类分级授权协议的应用情况[5];赵润娣调查分析了国内8个开放政府数据平台教育主题数据资源的分类分级状况[6]90-100;洪延青从国家安全的角度阐述了数据分类分级保护制度[7];张勇在数据分类分级的基础上,对数据犯罪进行了罪质界定和罪量评价,并对数据安全保护的关联罪名予以界分[8]17-27;郑曦探究了刑法领域的数据分类分级框架[9]3-16。以上研究有利于推动我国数据分类分级政策的制定和完善。不过,现有研究多局限于法学视角和技术视角,并没有对我国已出台的数据分类分级政策文本进行分析。基于此,笔者选择我国已出台的数据分类分级政策文本为研究对象,分析其外部特征及文本内容,并讨论其演化趋势,此研究对完善我国数据分类分级政策具有一定现实意义。

1 相关概念

1.1 数据分类分级的概念界定

数据分类分级由“数据”“分类”“分级”三个概念组合而成。其中,数据(data)是信息(information)的载体。目前,学界对“数据”的定义主要有两种,一是指对客观事物的记录和描述[10-11],二是指所有能输入计算机并被计算机程序处理的数字、字母、文字、声音、图像等符号的总称[12-13],本研究中的“数据”是基于第二个定义展开。数据分类分级包含数据分类和数据分级两方面内容,相关部门和学界通常将其合并使用,但是两者在概念界定方面存在一定差异。数据分类是指按照数据的内容、来源等属性进行划分和归类[9]3-16,而数据分级是指按照一定的定级标准对数据进行层级划分[8]17-27。目前,学者们对于数据分类分级的关注度尚不高,现有研究没有对数据分类分级的概念进行统一的学术层面的界定[6]90-100,[14]。国家相关部门也没有在已出台的数据分类分级政策文件中对其概念进行界定,仅提出了数据分类维度和分级规则[15-18]。综上所述,文章将数据分类分级的概念界定为执行数据分类分级的责任主体对组织内部的电子数据进行全面梳理,形成数据清单,按照国家和行业的分类分级要求,同时结合自身实际需求,对数据类别进行细化,判定数据安全级别的工作。

1.2 政策演化的相关概念

(Inducement)、能力建设式(Capacity-building)和机制变革式(System-Changing)4种类型的政策工具[23]。这种分类方法是较为全面、多维的[24],进一步突出了政府在推行政策时是以激励为主要手段促进政策落地,还是以命令等方式强制推行[25]99-113。探究这种分类模式下的政策工具演化可更加鲜明地突出我国各级政府在推行数据分类分级政策时的力度,并进一步验证该政策发展所处的阶段。笔者通过分析我国数据分类分级政策文本和借鉴其他学者[26-32]的分类标准,讨论细化了具体的工具名称(如表2所示)。

表2 具体政策工具的含义

1.2.1 层级扩散及关联演化

公共政策层级性扩散模式可依据政策行动主体的不同分为自上而下的层级扩散模式、自下而上的层级扩散模式、同一层级的区域或部门间扩散模式和不用发展水平区域间政策跟进扩展模式[19]。层级扩散演化可以剖析某一政策在各层级政府实施过程中的效力大小及受关注程度。层级关联演化可以深入挖掘各层级政府在不同阶段的各项特征及演化趋势[20]87-106。本研究根据数据分类分级政策的发文机构,将其层级划分为国家级、省级和市级,其中国家级指人民代表大会、国务院及其部委机关等;省级指省、直辖市、自治区人民政府及其各部门、各直属机构等;市级指直辖市各区、地级市人民政府及其各部门、各直属机构等(如表1所示)。

表1 发文机构层级界定的示例

1.2.2 政策工具关联演化

政策工具是政府为达成既定政策目标而使用的方法和手段[21]。政策工具关联演化可以揭示不同层级政府在不同时期对于某项政策的手段、力度、侧重点以及发展趋势。目前,学术界针对政策分析的不同目的,将政策工具划分为不同类型,但不同分类之间也有一定的交叉和重合。结合现有数据分类分级政策文本的内容,本研究采用了McDonnell[22]提出的权威式(Mandate)、激励式

1.2.3 应用领域演化

应用领域演化是政策文本的核心内容,也是政策演化研究关注的重点[20]87-106。剖析政策应用领域演化,可以厘清政策发展的脉络及扩散趋势,并确定该政策的先发应用领域。根据既往研究[33-37],结合数据分类分级政策文本的实际情况,笔者将该政策的应用领域划分为18个,其中未提及领域是指在政策文本中没有提及特定领域的数据,其他应用领域的具体分类情况详见表3。

表3 应用领域的含义

2 数据采集与加工

2.1 数据采集

笔者选取“Wolters Kluwer法律信息库”作为政策文本的数据来源[38]18-30。该信息库是我国首个本土化法律信息数据库,收录了自1949年至今的中央政府及各地级市政府的法律法规,是目前我国时效性最强的法律信息数据库。

由于在政策文本中有“数据分类分级”和“数据分级分类”两种表述,故笔者采集数据时构建了两个检索式:①“数据 分类分级” ~ 5;②“数据 分级分类”~5。搜索范围限定为“全文”,发布时间限定为“2001年1月1日—2021年12月31日”,时效性限定为“现行有效”,检索时间为2022年1月1日。去除重复的政策文本后,笔者共计获得有效样本327份。为尽可能查全相关政策文本,笔者又针对国家和省级政府的门户网站进行了二次检索,但未获得新的政策文本,由此可以说已采集的数据基本涵盖了当前的数据分类分级政策。

数据采集完成后,经人工剔除与数据分级分类不相干的政策文本,并剔除已出台正式文件的“征求意见稿”后,共获得有关“数据分类分级”的254份有效政策文本(如表4所示)。

表4 数据分类分级政策文本(部分)

2.2 数据加工

笔者对 254份数据分类分级政策进行了数理统计和人工编码,并分析了数据分类分级政策的外部特征及文本内容,用以讨论其演化趋势。编码程序具体如下:

第一,研究者共同讨论确定人工编码规则[39]。首先,根据政策发文机构的级别将其划分为3个层级,分别是国家级、省级和市级(详见表1)。其次,将政策文本中分类分级的数据进行汇总归纳,按应用领域进行划分,本研究的数据应用领域共计18个(详见表2)。最后,依据数据分类分级政策文本内容和其他学者的分类标准,讨论并细化具体的工具名称(详见表3)。

第二,研究者根据已确定的编码规则分别展开编码,并根据编码结果进行一致性讨论[40-41]。对于界定范围不明确或不同编码人有歧义的内容,再征求相关领域专家意见,最终形成数据分类分级政策文本的内容分析编码结果。

第三,研究者对编码结果进行统计和分析[42]。采用数据可视化来分析数据分类分级政策文本的外部特征及其文本内容的演化趋势。

3 数据分类分级政策发展阶段及其演化分析

3.1 数据分类分级政策发展阶段

依据政策发布数量来划分政策发展阶段,可以揭示政策的发展规律以及政府对于该政策的推行力度,有助于剖析政策各阶段的主要特征,预测政策未来的发展趋势[43-44]。以我国数据分类分级政策数量变化及相关事件与背景等为时间节点(如图1所示),本研究选择2001年、2010年、2015年三个重要时间节点,将我国数据分类分级政策的演化历程划分为3个阶段[45]。

图1 数据分类分级政策发布情况变化趋势

第一阶段,政策发展起步期(2001—2009年)。在数据分类分级政策方面,可追溯的最早政策文本是《重庆市人民政府关于印发重庆市电子商务发展纲要和数字重庆地理信息系统发展纲要的通知》,提出了数据安全、数据共享等理念,这标志着我国数据分类分级政策发展步入起步期。

第二阶段,政策发展调整期(2010—2014年)。在这5年之间,涉及数据分类分级政策文本的发文量较少,这符合政策发展规律及数据治理的时代背景,也意味着我国出台数据分类分级政策在总体上比较审慎。在此期间,虽然发布的政策数量较少,但各级政府一直在进行积极探索,为数据分类分级政策发展储备理论、技术、人才等。

第三阶段,政策发展加速期(2015年至今)。2015年后,数据分类分级政策的数量再次呈上涨态势,并逐步在更多领域得到实施应用,掀起了我国数据分类分级政策出台的高潮。国家“十三五”规划和“十四五”规划先后提及数据分类分级,数据安全法中也有涉及数据分类分级的相关内容[1-2,46],这标志着数据分类分级工作越发受到相关部门的重视。

3.2 数据分类分级政策演化分析

3.2.1 层级扩散演化分析:基层政府推动力不足

各级政府出台数据分类分级政策的情况体现了我国数据分类分级政策的发展走向、各级政府对政策的响应程度以及政策的演化特征[20]87-106。本研究将政策发布机构划分为三个层级,分别为国家级、省级和市级,各级政府的数据分类分级政策发布情况如图2所示。

图2 各级政府数据分类分级政策发布情况

在政策发展起步期,数据分类分级政策最先由省级政府发布,再分别自下而上、自上而下地向国家级、市级政府进行层级扩散。其中自上而下的层级扩散较为突出,各市级政府积极响应,在信息治理、数据治理等方面不断涌现新的增长点[47]。在政策发展调整期,各级政府的发文数量均较少,层级扩散趋势不甚明朗。在政策发展加速期,各级政府的发文数量均呈加速上升态势。其中中央政府先后在“十三五”规划和“十四五”规划中提及数据分类分级,并出台了有关数据分类分级的政策,从宏观和微观两个层面重点推进数据分类分级工作,有关数据分类分级政策的具体制度、标准、细则等数量逐年提升,再次掀起数字化治理的浪潮[48]。这一阶段的政策多由中央政府自上而下地向省级和市级政府进行层级扩散,但层级扩散刚开始时地方政府尚能积极响应,到了后期其响应积极性逐年降低,致使基层政府推动力不足。导致这一现象产生的主要原因是地方政府仅对中央政府的发文进行转发及解读,并没有很好地结合自身特点进行融合创新,同时,地方政府也缺乏数据分类分级所需的高端技术及人才等。

3.2.2 政策工具关联演化分析:政策工具使用不平衡

政策工具是政府用来实施某种政策[49],达成既定政策目标所采用的方法和手段[50]。政策工具在不同层级政府和政策发展不同阶段的转化情况可以反映出该项政策能否落实,以及是否朝着健康的方向发展[20]87-106。笔者通过对我国数据分类分级政策工具“层级—阶段”关联演化特征进行分析(如图3所示),发现其有明显的“层级演化性”“阶段演化性”“层级—阶段关联性”等规律特征[20]87-106。

图3 政策工具“层级—阶段”关联演化特征

数据分类分级政策工具的阶段演化是由单一的权威式和能力建设式政策工具向多样化的政策工具类型延伸,由构建数据分类分级所需的基础设施,依靠强制力推行政策实施不断向激励引导或鼓励政策自发落实演变,从多角度丰富数据分类分级政策的方法及手段。数据分类分级政策的层级演化是由中央政府自上而下地向地方政府扩散,地方政府在国家级政策工具的基础上再演化延伸并进行一定的创新。

从数据分类分级整体的“层级—阶段”关联演化来看,我国的政策工具类型虽然在政策发展加速期得到了一定的拓展,但目前仍集中在权威式和能力建设式两种类型,对于激励及机制变革式政策工具的使用较少,在数据分类分级政策工具的使用方面不平衡。这意味着我国数据分类分级政策发展仍处于初级阶段,对于政策工具的使用还在不断探索,数据治理缺乏系统性。此外,对激励式和机制变革式政策工具使用较少,说明目前我国数据分类分级没有细化部门职责,缺乏政策落实的后续拉力,导致出现政策推行难、落实难、实施难等问题。

3.2.3 应用领域演化分析:营利类数据应用难度大

应用领域是政策演化的核心内容[25]99-113,也是政策演化研究者关注的重点[51]。对应用领域进行研究分析,可以有效地梳理出数据分类分级政策的发展趋势及其关注点[38]18-30。我国现有的数据分类分级政策文本所涉及的应用领域共计18个(详见表3),本研究主要从时间维度对其进行分析,总结我国数据分类分级政策应用领域的演化趋势(如图4所示)。

图4 数据分类分级政策应用领域发布情况

数据分类分级的先发领域为科学和安全两大主题,因为科学界最早关注数据分类分级,认为对科学数据进行分类分级管理有利于链接国家科技数据和开展信息交换[52-53]。相较而言,安全领域发布的数据分类分级政策数量更多,这反映了当时的数据治理更关注安全、应急管理等[54-55]。随后,数据分类分级政策开始向其他领域扩散,正式进入多领域争鸣时代。从现有的应用领域来看,该政策主要集中于政务、医疗、工业等公共数据和非营利数据,关于商业等营利性质的数据较少,这说明我国的数据分类分级政策仍停留在收集处理较为容易的公共数据和非营利数据,而对商业竞争等营利数据进行数据分类分级管理的难度较大。因此,我国需要不断完善数据分类分级的相关技术、制度等。

4 政策建议

4.1 地方政府加大投入,积极参与数据治理

随着海量数据的爆发式增长和信息技术的发展,以及网络空间治理和数据治理的不断推进,相关领域对于数据分类分级处理的能力要求也越来越高。由于政策发展起步期的需求大多停留在战略等宏观层面,应用领域也主要集中在一些数据流动小、容易收集、易于管理的安全和科学领域,对于数据分类分级底层技术的要求较低。因此,地方政府在该阶段热衷于出台一些数据分类分级政策,具有一定的先进性。在政策发展加速期,随着分类分级规则、具体操作方式等微观层面逐步细化,应用领域不断扩大,数据管理难度增大,对技术的要求也会不断提升。因此,国家级政府和地方政府在同一政策实施过程中出现两极分化是不可避免的。

为了应对基层政府推动力不足的问题,我国需要加大地方政府在数据分类分级相关技术、资金、人才等方面的投入,提升其积极参与数据治理的能力。首先,中央各部门应按要求制定数据分类分级的详细规则,设计并建设数据分类分级的平台、基础设施等,将其下发给地方政府,使各地可以在国家标准的基础上,按自身发展特色进行完善创新,保持与中央高度相近的技术层级。同时,中央还应为地方政府开展数据分类分级的培训活动,保障其技术的更迭速度,做到与时俱进。其次,应向地方政府划拨专项资金,明确该项资金仅用于数据分类分级的技术扩展及专项人才引进,使地方政府具备高素质的专项人才和技术能力。最后,鼓励地方政府积极参与数据治理工作。虽然国家需要统一的数据治理、数据分类分级标准,但是地方政府在处理数据时也应遵循具体问题具体分析的原则。因此,国家需要激发地方政府参与建设数据分类分级的积极性,以此保障我国数据分类分级政策的长久高效精准实施。

4.2 优化政策工具体系,强化政策落实拉力

当前,我国数据分类分级政策阶段和层级在不断演化,政策工具日益丰富,但是仍较少使用激励和机制变革式政策工具。政策工具类型对政策实施起着重要作用,每个类型的政策工具都有其自身独特的优势和劣势。为了实现数据分类分级能力的有效提高与数据治理的可持续发展,政府应优化政策工具体系,使其具备多样化特征,以全方位推动数据分类分级政策的实施。

针对现有政策工具使用不平衡的问题,我国应有针对性地丰富政策工具的使用类型。首先,在国家级的数据分类分级政策中,应增加激励式政策工具,可以从正向激励和负向激励两个角度引导或鼓励政策实施主体开展数据分类分级工作。同时,增加机制变革式政策工具,可以采用机构设立、部门协调、职责分工等方式细化并明确负责数据分类分级的主体或部门,将其责任单独划分出来,提高政策落实的成效。其次,在优化国家级政策工具体系的基础上,将政策工具类型自上而下地向各级地方政府扩散,使各级政府的政策工具体系均具备多样性、完备性等特点。最后,不断强化政策落实拉力。在政策初期,采用权威式和能力建设式政策工具能在一定程度上提升政策推行的力度和强度,但随着政策的不断演化,仅采用强制性措施无法保证政策落实的效果,还需要配合使用具有激励性质的政策工具,为政策落实提供一定的拉力,助力政策实施主体认真并自愿进行数据分类分级工作。

4.3 发展数据收集能力,注重营利数据应用

在数据爆炸时代,要高效实现对海量数据的分类分级,数据收集能力是关键。我国提出数据分类分级的首要目的是保障数据的安全和共享开放,因此当前数据分类分级的应用领域集中在公共数据和非营利数据,因为这类数据不涉及资产,能相对较为容易地进行收集、管理等。在保障数据安全和共享开放的基础上,数据分类分级还应赋予数据一定的价值,使一些数据在限定条件下实现资产化,并将其扩展到营利数据应用中,这是数字经济环境下的必然趋势。

为了解决当前营利数据应用难的问题,我国首先应发展数据收集能力,提升数据资源管理利用成效,这需要相关主体在底层数据平台设计算法、数据库硬件软件运行以及数据挖掘处理等方面进行创新,发展数据收集处理能力。因为只有具备较高的数据处理能力才可以保障在遵循法律法规、人文伦理、商业道德等基础上进行数据处理活动,并将其应用于营利数据领域。因此,注重营利数据分类分级有助于数据依法有序自由流动,促进以数据为关键要素的数字经济不断发展。

5 结语

数据分类分级是我国网络空间治理、信息治理、数据治理的基础,自提出以来就备受各行各业的关注。笔者认为,从已有的政策文本出发进行政策演化分析,可以较为客观地梳理出当前该项政策的发展趋势和问题,有助于向政策制定者提供后续改进建议,使得数据分类分级政策更加系统化,网络空间治理更加有效,进而推动我国充分管理和利用数据,使其发挥出最大生产力,构建持续稳定高效的数据市场。

我国数据分类分级政策主要有政策发展起步期、调整期和加速期三个阶段。笔者经研究发现当前地方政府对数据分类分级政策的后续管理较为乏力,对现有文献的政策工具使用不平衡,激励及机制变革工具使用较少,主要应用领域集中在公共数据和非营利数据,对营利数据的应用难度较大等问题。综上所述,我国数据分类分级仍处于初级阶段,存在较大发展空间,如何优化实施数据分类分级政策是新阶段亟待业界深入探究的重要课题。

猜你喜欢
层级分级工具
军工企业不同层级知识管理研究实践
波比的工具
波比的工具
基于军事力量层级划分的军力对比评估
职务职级并行后,科员可以努力到哪个层级
准备工具:步骤:
“巧用”工具
分级诊疗路难行?
分级诊疗的“分”与“整”
任务期内多层级不完全修复件的可用度评估