黄一川
(南昌大学法学院 南昌 330031)
数字技术的更新迭代促进了国家治理体系和治理能力现代化的模式革新,也带来数据的不断聚合、极大丰富以及多样化.在海量的数据中,由国家实际控制的公共数据存量大、结构化低、使用效率低,若真正发挥作用必能为数字中国建设注入源源不断的生机与活力.
对于公共数据的探讨已有很多,权利法和行为法是2条主要路径.数据确权问题仍争议颇多,更加现实的讨论转而聚焦数据的用益性权利.但是,单纯“弱化所有权而强化用益权的数据权利体系”[2]仍无法避开数据产权制度这一基础问题,纯粹的行为规制也无法应对复杂多变的数据行为.从数据分级分类的思路出发,本文拟分析论证公共数据的权属问题.
权属问题离不开范围的相对明确,本文从界定数据、公共数据的内涵和外延开始对权属问题进行了探讨.
我国立法已大量使用“数据”这一概念,民法、行政法、经济法、刑法领域立法均有涉及,主要见于《中华人民共和国民法典》第127条、《中华人民共和国刑法(2020修正)》第285条与286条、《中华人民共和国反垄断法》第9条与第22条.通过比对可发现,这些概念的含义差别较大,数据出现的位置相对分散,频率普遍不高,仅部分法律集中规定,主要见于《中华人民共和国数据安全法》(以下简称《数据安全法》)、《中华人民共和国网络安全法》(以下简称《网络安全法》)、《中华人民共和国电子签名法》.相较于立法对数据定义的不一,学界的讨论中,以最大可能的求同存异,对数据概念的明确需区别于“信息”“大数据”“数据库”等概念.尤其是在与信息区分时,形成了“数据为信息的载体,信息是数据的内容”[3]的共识,数据的主要价值功能即承载信息,无法反映信息的数据只在计算机内部的代码层面有一定意义.此外,在通用大数据领域,大数据通常被认为是数据集,以特征明确大数据的范围[4].数据资源、数据要素等概念主要关注数据功能、价值和所在体系,在内涵与外延上与数据区别不大.因此,本文拟对数据进行如下定义:以数字技术符号等形态为载体,对客观事物现象的记录.
“政务信息”“政府数据”“政务数据”等概念也成为划定“公共数据”内涵与外延的重要参考[5].对公共数据的概念界定,可从目的、主体、行为3方面要素分析之.
从目的来看,公共数据作为一种具有公共性的生产要素,目的应当指向社会公益.由于公共利益在学界也未有共识,可将其概念外延相对限缩而主要指向履行公共管理职责与提供公共服务.
从主体来看,公共数据应与国家管理、公权力运行相关,所涉主体主要为国家及代表国家的组织,有明确的公共属性.从实践层面看,政府在其中扮演主要角色,立法和共享、开放、开发、安全保障等内容依靠政府实现.但同时,基于公共属性的性质,法律法规授权的事业单位、企业单位等应纳入主体范围,立法机关、司法机关也可能被纳入.
[15]亚当·斯密:《国民财富的性质和原因的研究》(下卷),郭大力、王亚南译,北京:商务印书馆,1974年,第27页。
从行为来看,以合法、依法为标准,是从事相关公共活动对数据的收集或伴随活动产生数据的行为.因此,公共数据应当被认为是履行公共管理职责与提供公共服务的国家及代表国家的组织在依法履职过程中所收集或伴随产生的各类数据的统称.
在以上3要素对公共数据进行基本界定后,还需厘清其与企业数据、个人数据等概念的关系,相对控制公共数据的外延,提高可操作性.同时防止公权力的过度扩张,不应将数据来源或数据内容作为唯一判断标准.因此,第一,对于企业数据.主要指企业在其生产经营活动中实际控制的数据,这些数据不归为公共数据的重要前提是不表现公共性.对于体量巨大的互联网平台,其运营形成的大型网络社区承载的大量数据,在某些时候已经表现出一定的公共性,需要予以充分考量.第二,对于个人数据.对公共数据进行具体的拆分,与个人无关联的公共数据主要表现为国家机关内部工作过程中产生的数据,或者对地理、水文、气象等的记录.与个人有关联的数据主要表现为国家机关工作过程中对公民信息的收集.虽“公共数据在使用时通常具有去个人化的特点,一般表现为无法识别具体个人的宏观抽象数据”[6]但是在大数据技术下仍有可能重新定位到个人.因此,应该设置较为严格的保护,以个人信息界定个人数据,结合《中华人民共和国个人信息保护法》第3条、第4条之规定厘定个人数据的范围.对于关涉个人信息的数据,一律不归于公共数据.
作为一种生产要素公共数据具有较强的资源属性.将公共数据置于国家治理的视野,关涉国家与公共数据的关系问题.此时最为直接的参照物便是自然资源.第一,二者具有国家战略高度的价值.基于算法、算力的不断提升,数据的产出量大大增加,而人工智能等数字技术也需要数据的“喂养”.各方主体都希望能够控制尽可能多的数据:在国家竞争层面,国与国之间数字技术的碰撞加剧,其中包括对数据的控制、数据物理存储位置和数据管理等问题;对于互联网大型平台企业,从国内外实践来看均有不断扩张的倾向,大有向“数据垄断”发展的可能.第二,二者具有高度的利用价值.在一定时间空间范围内自然资源是有限的,很大一部分是不可再生资源,且具有较大的利用价值.对自然资源的利用通常是一次性的、单向度的;而数据具有反复使用、不发生损耗的特性,产品的产出不影响数据本身.第三,二者有被滥用等危险.自然资源易被人不当使用,表现为使用的方式不当或无限度,一旦发生损害自然资源的恢复成本较高,甚至无法恢复.而公共数据也同样易被不当使用,如被不法传输、不当分析.虽数据本身可能不会受损,最多发生数据物理存储介质的受损.但是,信息泄露等危害结果一般也难以得到弥补.
数据是不具有物理性的资源,直接作出公共数据属于自然资源这样的论断在逻辑上不够周延.而为公共数据和自然资源寻找共同的上位概念——“公共资源”借助证成的做法,也受到了一些学者的驳斥[7].另外,有学者[8]提出,无形性、非竞争性和可重复利用性特征,决定了资本经济形态下形成的以稀缺资源配置效率,以及对有体财产的独占为核心关切的所有权制度丧失了对其适用的基础.应当看到公共数据与自然资源的区别,类比不能完全证成2件事物必然的一致性,仅可通过相似性考虑规制路径,上述问题还需要制度正当性等的分析予以解释.
《中华人民共和国宪法》(以下简称《宪法》)第9条规定中的“等自然资源”存在一定的可解释空间.如民法对国家所有的确定,《中华人民共和国民法典》第252条规定无线电频谱资源国家所有.无线电频谱可以通过广义理解为自然资源,属于技术发展新发现的资源.而公共数据作为“类自然资源”,也是技术发展后涌现的新资源,或许有被《宪法》第9条容纳的空间.
除此之外,算法、算力也有边界,正如在某一技术条件下,对自然资源的利用率是有限的.依据有限的算法、算力,分析的数据结果或产生的数据产品也是相对有限的,且由不同主体在同一领域分别产出的结果或产品可能是高度相似的.在数据的使用场景下结果的一定排他性反作用于数据,也相应弱化了其排他性.换言之,数据利用不一定是非竞争性的,数据能分析得出的结果是不固定的,但有价值的结果可能是固定的,从中获取的信息可能存在稀缺性.进言之,理论不一定能绝对周延完成证成,但或许可以作为一种实现路径.可将目光落在现实情况中,至少在目前的实践层面,公共数据仍表现出较强的竞争性和“零和博弈”状态.照搬所有权制度当然是不可欲的,但完全推翻原有的制度引入一套新制度,无论是“霍菲尔德框架”[9],亦或是“卡-梅分析框架”[10],或者参考美国自由市场和强监管的实用主义路径、欧盟《通用数据保护条例》(General Data Protection Regulation),对原有制度的破坏性又略大,或缺乏我国特有语境.正因此,针对公共数据的分配和利用应当更多考虑公共利益和正当性的要求,而不应以个人利益和效率为先.公共数据与自然资源在特性上诸多相似,无论范畴上要如何容纳,在规制路径上参照自然资源是可欲的、可行的.
首先,“国家所有制”与“国家所有权”并不一样,国家并非直接独占资源并取得利益,以私权观念认识公权力是不够准确的.
若不确认国家所有,只能采取行为或责任规制路径.有学者[11]提出应放弃所有路径,“可以直接援引我国《宪法》保护公共资源的责任条款而保护和管理公共数据”;但是缺乏权属明确这一前提,难以证成国家保护和管理公共数据的正当性与必要性.若只通过管理实现公共数据的开发利用国家也难以促进私主体控制的数据公共数据化,导致更多“数据孤岛”出现.对于国家而言,“我的数据是我的”是一种体制僵化思维,“你的数据都是我的”是一种数据公权的扩张甚至滥用,“你的数据是你的”可能会是一种公权退缩和私权无度的开始.单纯的行为或责任规制都可能导致本身由政府主导开展的工作受到较多的掣肘和影响,效率难提高.
国家所有制能为国家公共数据提供动因.首先从便利性与效率性的角度分析,公共数据大多由政府主导收集并实际控制,存储在其服务器中.中共中央、国务院2023年3月16日印发的《党和国家机构改革方案》提出组建国家数据局,这一改革措施与国家所有制相适应.由国家数据局和省级数据管理机构统一协调,主导开发利用,更加便利,更有效率.其次,从专业性与相关性角度分析,考虑数据资源的配置模式.我国现有的公共资源配置机制经过不断发展完善已经相对成熟,国有资产制度体系健全.虽要结合数据这一特殊资源的数字技术特性,并运用数字技术进行有效规制;但其基础性架构已经足够完备,可以容纳公共数据.也有利于在国家的主导下培育和建构公共数据要素市场,防范市场失灵.最后,从安全性与可控性的角度分析,公共数据交由具有公信力的国家来主导调配,对数据处理行为进行风险防控,相对更加安全可靠.涉国家安全、公共利益的问题也便于国家进行决断.
公共数据目前未进行国家统一立法,除《数据安全法》专章规定“政务数据安全与开放”;《网络安全法》第18条规定:“国家鼓励开发网络数据安全保护和利用技术,促进公共数据资源开放,推动技术创新和经济社会发展”;《中华人民共和国地方各级人民代表大会和地方各级人民政府组织法(2022修正)》第66条规定:“推进政务数据有序共享”.其余主要是党政联合发文或国务院及其部委发布的行政规范性文件.
立法实践更多可从地方立法进行观察.但数字经济的相关立法整体而言模式混乱不一,且因地域差异,这一现象更为严重.大数据、数据要素、数字经济这3方面的立法都可能包含公共数据的有关内容.从专门立法来看,部分地区进行了专门立法,但具体命名不一,有规定“公共数据”的,也有规定“政务数据”“政府数据”的,内部的条文结构也有区别.因“政务数据”“政府数据”属于且是主要的公共数据,即政府数据在主体上更狭窄一些,仅限行政主体;而政务数据在行为上更狭窄一些,主要是政务服务场景下所产生的数据,在此一并讨论.从地方立法实践来看,以地方性法规、地方政府规章为限,对公共数据的权属规定有以下几类:第一,避免规定公共数据权属.对公共数据较早规定的有《浙江省公共数据和电子政务管理办法》,第3条仅规定了工作原则,未有权属的明确规定.之后以“公共数据”命名的规定多是这一模式,避开了权属规定,如成都市、上海市、江西省等10余个省市;部分“政务数据”命名的规定也是如此.二是规定政务数据国家所有,纳入国有资产管理.如《福建省政务数据管理办法》第3条较早将政务数据规定为国家所有,进而以招投标和生产要素投资方式开放数据资源,获得的开放开发收入缴入财政金库.《重庆市政务数据资源管理暂行办法》《山西省政务数据资产管理试行办法》也采用了类似的制度方案.三是规定政务数据政府所有.如《广东省政务数据资源共享管理办法(试行)》第4条对政务数据作出明确规定,政务数据资源归政府所有.除此之外,少数几个地级市政府规章也作了类似规定.
综合来看,国家层面数据立法还停留在规范性文件的阶段,政策性、倡导性、号召性的内容较多.说明数据问题已经得到党和国家的高度重视,也已有进入法律的趋势,但离专门全类型立法可能还有一定距离.在地方立法实践层面,以各种形式开始探索数据立法问题,但对于权属问题,大多持回避态度.部分有规定的也仅仅对控制较强的政务数据规定了国家所有或政府所有,以国家所有占多数.
当前立法实践对公共数据的规定如此谨慎或学界存有疑虑的原因,可能有二:第一,地方可能无权界定公共数据权属,尤其是确认国家所有.根据《中华人民共和国立法法(2023修正)》第11条等的规定,对公共数据设定国家所有,属于基本经济制度,属全国人民代表大会及其常务委员会的立法权限.而且对于地方政府规章,也只能在其职权范围内考虑政府数据、政务数据的问题,难以涉及公共数据.当然,已进行立法的地区也不能全盘否定,应该视为对公共数据治理的有益尝试,或能为未来立法提供一定经验.第二,公共数据的规制模式还没有形成较大范围的共识.各地还处于“摸着石头过河”的阶段,以促进、支持、鼓励等措施为主,立法政策性较强.而且,公共数据纳入国有资产范畴予以管理的正当性、合理性并没有得到充分论证[12].此外,目前中央和部分省级地方虽已经成立数据局,部分地方之前也存在大数据局、数据中心一类的机构,但这些机构的职能暂未系统化、规范化,整体处于主体缺位的状态.
在国家所有制的基础上,公共数据的制度构建方向进一步明晰.可将中共中央、国务院2022年12月2日的《关于构建数据基础制度更好发挥数据要素作用的意见》[13]为指导,确保制度建构与政策方向相允协,推动形成具有中国特色的公共数据产权制度体系.
建立公共数据分类分级制度,融合于数据的分类分级制度.分类分级保护的关注点之一是安全,安全保护制度同样是前提性制度,能为公共数据的深入发展保驾护航.“分类保护”与“分级保护”作为独立概念,有不同的制度价值,可“以数据项为基础单元,以数据分类和数据分级相结合”[14]为实施路径.
一是依据前文标准,厘清公共数据的内涵和外延,在数据分类中与企业数据、个人数据区分开.二是设置分级制度,需依据公共数据的首次来源、相关领域以及层级等标准.同时应在《中华人民共和国国家安全法(2015修订)》等国家安全法律制度的范畴下予以考虑.目前《数据安全法》以一般数据、重要数据、核心数据区分,但标准有待进一步明确,例如需要阐明“重要民生”“重大公共利益”等概念.
建立公共数据的确权制度.国家所有制是公共数据宪法层面、观念层面的宏观确认,要进一步嵌入数据产权制度中.数据资源持有权、数据加工使用权、数据产品经营权属于数据3类主要产权,在国家所有制下应当归属国家.这一制度也能够明确政府的主体地位,充分发挥政府在配置公共产品时的主观能动性.
同时,从数据产生和处理的过程以及数据的生命周期来看,持有、加工使用、产品经营过程与原始数据的距离逐渐增大.因此,应严格限制公共数据资源持有权的获得,可以相对宽松限制公共数据加工使用权与产品经营权的获得.
基于公共数据国家所有制,我国应完善公共数据产权性质,建构特定公共数据开放和数据资源有效流动制度规范,这是解放数据生产力主要的可行路径.以充分利用为目标,建立公共数据的共享开放与授权运营制度,在以上“三权分置”的基础上,在保障安全前提下发挥市场在资源配置中的决定性作用,建立加工使用权与产品经营权的共享和授权制度.让更多的市场主体有条件地参与进来,建立过程与结果共享的开放机制.这在充分发掘数据价值的同时也能防止头部企业的过度垄断.
第一,防范原始数据直接开放共享,公共数据的汇集和统一管理机制要明确.对于数据的开放共享,除了国家机关应当各司其职,还应建立相应的专职机构.第二,对公共数据处理过程建立协同准入机制,即允许相应的社会主体通过行政协议等公私合作形式,在充分的资格审查后,通过共享或授权制度加入处理过程.第三,基于公共数据的公共属性,以无偿共享模式为原则,以有偿共享模式为例外.
此外,对于公民个人而言,主要享受结果层面的利益.大部分公民至少在目前与数据存在较大的“数字鸿沟”,限于知识的匮乏和技术手段的迭代迅速,还难以掌握数据的处理过程.因此,更应当在收益层面实现分配正义,即在数据处理过程和结果产生的收益,以国家财政、政府信息公开、政府指导等模式实现全体人民共享.即收益应当进入国家财政统一进行管理;产生的各类信息要以政府信息主动公开为主,进行广泛公开共享;而与生产生活及其他相关的信息,也可以通过政府指导的方式,以明确的政策指向给公民带来实际的收益.
数据或公共数据如同一条大河,因其流动性、动态性,每时每刻都在发生变化,国家、企业、个人都参与其中,同时影响着其具体内容.因其非排他性、非竞争性,又难以将某一部分归属于某一主体.只有大河里的一些实在的物质,数据所反映的信息可以排他性地归属于某一主体.而将公共数据这条大河,基于中国特色社会主义制度的全民所有,通过国家所有制明确其权属或许是可能的规制路径.