摘 要:人工智能时代的公共数据不仅释放了经济和社会价值,而且成为推动社会治理现代化、促进数字经济高质量发展和实现国家治理体系与治理能力现代化的关键力量。公共数据处理者的权责配置应当与人工智能发展水平相适应。当前公共数据的数据处理者权责不够清晰和周延,限制了公共数据开放和利用的进一步发展。根据权责对等原则,在处理公共数据时,应当赋予不同主体以不同的职责和权限。为此提出公共数据处理者权责配置思路是从数据确权到数据管理运营权的确立,构建公共数据处理者管理、运营、开发的权责体系,并在此基础上明确公共数据处理者责任主体范围、建立多维风险防范措施、平衡数据开放与个人信息及隐私保护、强化数据开放和获取的公平性等公共数据处理者权责配置具体措施。
关键词:人工智能;公共数据;数据处理;权责配置
中图分类号:D 912.29 文献标志码:A 文章编号:2096-9783(2024)05⁃0037⁃09
数据作为国家基础战略性资源和重要生产要素,已被各行各业高度重视,特别是以政府为主导的公共数据的开放,也体现在各地立法文件中1。公共数据是数据资源的重要内容,激发公共数据的创新活力,能够释放其巨大的经济和社会价值。“数据二十条”2强调,公共数据被视为关键的国家资源,其开放与共享旨在充分发挥海量数据规模优势,激活数据要素潜能,促进数字经济的高质量发展,同时确保在维护个人隐私和公共安全的基础上,实现数据资源的社会化利用和价值最大化。在人工智能时代,公共数据作为国家关键信息资产,已上升为国家治理和经济社会发展的核心要素。
一、人工智能时代下的公共数据价值
全国首部针对公共数据的地方性法规《浙江省公共数据条例》已于2022年3月1日起正式实施。全国各省(区、市)积极响应国家关于数据资源建设的号召,纷纷出台了一系列公共数据相关的地方性法规与规章,以规范和促进数据资源的有效管理和利用。尤其在那些经济上十分发达以及技术创新前沿的城市中,比如上海与深圳,公共数据法规的建立已经取得明显的进步。上海市被选为全国首批大数据综合试验区的一员,并且颁发了《上海市数据条例》(2022年1月1日施行)。该条例的宗旨是促进数据要素的市场化运作、加强对数据资源的发掘和保护工作的重视。该条例清晰地界定并制定了数据资源开放与共享的机制,同时明确了公共数据的可开放范围和相关流程,并针对数据的安全性以及保护隐私作出了详细的规定。深圳市被视为改革开nDHM+jAA1lxN0fGOHA4muL0Sy96FWneosQRXI2m614M=放的最前沿区域,在2022年1月1日施行的《深圳经济特区数据条例》对数据资源的搜集、加工、共享和交易等步骤也进行了详尽的规定。该条例特别强调了数据资源的产权保护,推动了数据要素的有序流通,同时为数据安全和个人信息保护提供了法律支撑。
在数字化发展的大潮之中,公共数据起着不可替代的作用。这不只是人工智能算法的培训和优化的根本,也是促使社会向智能、准确治理方向前进的重要资源。随着《中华人民共和国数据安全法》(以下简称《数据安全法》)以及《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)等相关法律和规章的实施,我国已经构建了一套相对齐全的数据保护策略与办法。然而,在确保数据的安全性和个人私密性不受损害的基础上,如何有效使用公众信息以促进人工智能行业的创新发展,已经变成了一个亟待解决的问题。公共数据的开放性和共享性不仅可以为人工智能领域带来大量的参考资料,同时也将有助于推动整个社会知识和技术的增长与发展。
开放性的公共数据成为触发创新活动的一个关键要素。公共资源如政府数据或科学研究数据的开放,有可能为人工智能的研究与应用创造一个宽广的试验环境。这种开放方式不只助推了不同学科和领域之间的知识融合,同时也为解决社会上的复杂问题提供了全新的视野和手段。例如,在城市设计、环境守护、公共健康等重要领域,深度解读和运用公共数据,有助于决策者更加深入地领悟问题的核心,并制订更合理与科学的方针与政策。另外,公共数据的开放性还具有吸引力,能吸纳社会资金和专业人才参与到人工智能领域,从而推动该产业走向多样化和可持续性的发展道路。
在人工智能的框架中,公共数据的权重划分和管理变成了一个既复杂又迫切的议题。一方面,有责任确保数据的可访问特性和开放程度,这对于推动人工智能科技的持续创新和进步至关重要;另一方面,还需仔细考量数据安全、隐私保护措施以及与伦理问题有关的多方面因素。这意味着需要在法律、政策以及技术各个层面上进行全面的考量和规划,目标是建立一个既可以保证数据安全性,也可以有效推动数据应用的综合管理体系。譬如,在确立合适的数据分类准则、建立访问监管体系以及制订数据应用规范的情况下,公共数据在维护个体和机构利益的基础上,有可能进一步增强其在社会中的价值。此外,必须增强对数据管理者的培训与监督力度,以确保可以按照法律规定,合理地执行数据管理的职责和功能。
二、公共数据的数据处理者的界定
目前对于“公共数据”及相关参与方的界定呈现出“各地规定、学界与实务界分离”的态势,究其根本原因还是在于国家层面没有统一的规范,相互争鸣也属正常现象,本文把相关概念明晰如下:
(一)“公共数据”不同于“政务数据”“政府数据”
《浙江省公共数据条例》第三条就规定了公共数据的概念3,也就是公共管理和服务机构在依法履行公共管理职责或者提供公共服务过程中产生、处理的数据。《广东省公共数据管理办法》首次明确将“具有公共服务职能的组织”提供公共服务过程中制作或获取的数据纳入公共数据的范畴4。实践中,公共数据的生产者和主要参与者是公共管理和服务机构,包括国家机关、法律法规规章授权的具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等公共服务运营单位。
过去,立法并未明确“公共数据”的具体概念,而多将其表述为 “政务数据”“政府数据”,或者将“公共数据”规定在“政务数据”“政府数据”的子项中。这里公共数据不仅是指广义政府数据,狭义层面政府数据的开放内涵也蕴含其中[1]。在政府数据、政务数据之后,随着政府数据开放范围的进一步扩大,公共数据逐渐成为地方立法青睐的新概念[2]。
其实,有关上述概念的讨论可以归根于“公共数据开放”与“政府信息公开”的关系,有观点认为,前者是后者的升级,《政府信息公开条例》奠定了公共数据开放的基础[3]。公共数据的关键在于开放,政府信息则应当进行公开,两者具有本质的区别。前者开放能够充分挖掘数据价值,后者则是透明政府建设的要求。从政府信息依法公开到公共数据有序开放,本质上是公共信息资源配置的根本性变革[4]。当前,有关“公共数据”的最新立法已经建立起主体框架,有必要针对具体概念进一步解释和扩充,使得整体概念更加周延。
(二)公共数据的数据处理者需要严格限定
《数据安全法》是规范数据处理活动、保障数据安全的专门性法律,数据处理包括数据的收集、存储、使用、加工、传输、提供、公开等。公共数据的处理者就是公共管理和服务机构,处理活动均属于《数据安全法》规定的活动内容。但公共数据的数据处理者跟其他一般的数据处理者不同,主要区分如下:
其一,公共数据处理的主体是政府,政府部门既是公共数据的处理者,也是公共数据处理的规则制定者和监督者。同时,政府作为公权力机关,其公共数据处理活动无法适用民事法律关系,而主要涉及行政责任法律制度和刑事法律责任制度,主要是适用行政法律责任,包括监察政务处分、行政处罚以及政府侵权责任等[5]。
其二,公共性是公共数据处理最显著的特征,这也导致公共数据的处理活动区别于其他一般数据处理活动。在公共数据处理过程中,数据处理者应当属于公用性质的主体。而如滴滴、美团打车等平台企业,由于其本身就不是公用企业,无论其掌握的数据是否具有“公共”属性,都不是公共数据[6]。公有性质的主体除政府部门外,还包括具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等公共服务运营单位。
其三,处理的数据复合化。公共数据涵盖大众的衣食住行等各个方面,还有一些公共事业数据,所以从公共数据的来源和构成来看,公共数据来源于个人数据的集合,具有一定的私权属性,而其形成和利用反映政府为了公共利益而行使公共权力,具有一定的公权属性,最后还共享给社会成为公共产品[7]。因此,法律对此类数据的处理者提出了更高的要求,只有法律规定或授权的公共管理和服务机构才可以处理公共数据。
(三)人工智能时代下的公共数据处理者
人工智能技术的应用提高了数据处理的效率和准确性,同时也带来了新的挑战和责任。随着科技创新和人工智能的深入应用,公共数据的处理能力正经历着显著的转型。在之前,公共数据处理者大多负责数据的处理和分析,但随着人工智能技术的进步,这些处理者不只是要处理数据,他们也要制定相应的数据策略并参与决策活动。由于人工智能技术的进步,很多在数据分析中的复杂流程可以被自动完成。例如,进行数据清洗、数据整合和初步的数据处理等工作[8]。这样操作不仅能提升数据管理流程的高效运作,同时也降低了由于人为误差而导致的潜在危险。这也意味着公共数据的处理者需要具备更为出色的技能,如数据解读和模式检测。在大模型的背景下,数据治理与人工智能的关系呈现为一个持续的改进和优化循环[9]。数据治理工程完成之后,便能有更为专门的手段为大型模型输送优质的数据,进而显著提高模型的性能与准确度。这种互相联系的关系使得数据处理者不仅要重视数据质量与管理,还必须了解人工智能模型所需的条件和约束。因此,从事数据处理的人应当学会新的技能与工具。例如,他们有必要对机器学习(ML)的结构及其优化技巧[10]有所了解,并能够借助人工智能工具强化整个分析流程。另外,对数据的隐私保护和内容的同意管理已经变成数据处理者应该重点关注的几个重点。在将来的公共数据处理领域,人工智能注定将变为数据处理者所不可缺少的技术工具。所以,在数据处理者使用人工智能技术提高处理效率的过程中,他们也必须正视由人工智能引发的相关法律挑战。
三、人工智能进程中公共数据的数据处理者权责现状与问题
在人工智能的推动下,公共数据处理者的职责与权利经历了显著的多维演变,其角色扩展至促进社会治理现代化和提升公共服务效率的关键力量。全球多数国家已建立一套旨在规范数据处理、保障数据安全与个人隐私的法律架构,这些架构强调数据分类、安全原则、数据主体权利及应急响应机制等要素,为数据的有效应用和传播提供了坚实的法律基础。当然,也存在一些问题,总结如下:
(一)公共数据的权属在立法上不明确、不统一
有关公共数据的权属一直存在较大的争议,但这是一个基础性问题。只有在产权关系清晰的前提下,才能对公共数据作出控制权和使用权的分割,实现公共数据的高效、有序流转并明确各方的权利和义务[11]。目前公共数据的权属问题主要有所有权方案和行为规制方案两种路径。其中,所有权方案,即政务数据(信息)资源归国家所有,行为规制方案则是通过规定政府之于公共数据的权力与责任来行使职能[12]。
实践中也有很多观点认为公共数据归国家所有,体现在一些地方的立法文件中5。也有学者认为,政府数据也不是 “无主物”,不能划归私有,而应归属于全体人民共同所有,政府数据属于国家所有[5]。当然,最近很多主流观点偏向否定国家所有,认为公共数据资源作为一种新型资源,在客观属性及价值特征等方面均与有体物存在根本性的差异,由此导致所有权制度在调整公共数据资源方面陷入功能失灵状态[11]。
以上有关公共数据的权属之争也从侧面说明这一基础性问题的重要性。当前大家主要集中在数据确权的思路,而此种思路会导致数据利用难、运营不畅、价值不大等问题,在公共数据处理者的权责配置中需要找到更加平衡协调的理路和体系。虽然各国政府和国际组织都在不断完善数据相关法律法规,明确数据收集、存储、处理和共享的规范,为人工智能技术开发与应用中的数据相关行为提供法律指引,但在实践中数据权属的规定仍不明确。
(二)公共数据处理的责任主体仍不周延
虽然把公共数据的处理者基本界定为公共管理和服务机构,公共数据开放的三大主要责任主体是政府、政务数据管理部门或大数据主管部门、政府其他部门,部分立法中还规定了一类主体同样承担公共数据开放的责任,即行政机关以外的公共管理和服务机构,但这类主体在不同立法中具体指代的对象并不相同⑥。
在人工智能时代下公共数据处理的责任主体对技术的依赖性显著增强。这些主体需要掌握并应用先进的人工智能技术来提升数据处理的效率和质量。因应人工智能时代的典型特点,责任主体不再局限于传统的政府部门和公共机构而且还扩展到科技公司、研究机构以及私营部门,他们共同参与到数据的收集、处理和应用中,这就要求各责任主体之间建立更清晰的责任划分和协作机制,但在实践中未明确列明公共数据处理责任主体而使得权责划分无计可施。因此,公共数据的处理者作为主要参与者,需要进一步明确国家机关的范畴、法律法规授权的各类组织和运营单位的界限标准。
(三)公共数据开放的责任不确定、尚无标准
除责任主体外,公共数据开放的责任范围和标准也不明确。通过检索各地公共数据开放服务平台可知,当前公开的公共数据质量仍有待进一步提高,各地对于公开数据的标准和质量尚没有明确的规范。同时,公共数据开放平台使用的算法的责任主体到底是人工智能系统供应商还是公共数据处理者,这个问题还未得到解决。因此,完善人工智能责任机制,明确各相关主体的责任,是确保人工智能健康发展的重中之重。
当前,“开放为原则,不开放为例外”的开放原则是各地普遍的共识,在确保国家安全、商业秘密和个人合法权益不受损害的前提下尽可能多地开放公共数据是总的要求。关键问题在于开放的公共数据范围、开放模式仍无法有效确定,这就导致公共数据的处理责任主体没有动力和相应技术资源去开放公共数据,从而影响整体数据开放数量和质量,因而需要加以重视并解决。
尤其在人工智能时代,公共数据开放服务平台的数据质量、标准和规范存在不足,这就要求公共数据处理者不仅要在技术层面上进行提升,还需要在政策、法律等多维度应对,以确保数据的有效利用和公共利益的最大化[13]。
(四)公共数据处理者的法律责任过于弱化
有关公共数据的各地立法文件中基本上都会有“法律责任”的规定,但普遍存在规定的内容较少、法律责任较弱、一些法律责任与甚至其他法律法规相抵触、实际解决问题的成效低等问题。
在法律责任内容较少方面,相关条文基本在2至5条左右,不能全面规范约束数据处理者的违法责任。在法律责任较弱方面,大多法律责任的规范逻辑一般是,先由主管部门责令改正,没有改正的由政府内部通报批评,进行政务处分,产生严重后果的追究刑事责任等⑦。这就明显弱化了公共数据处理者的责任,造成处理者不能更高质量地开放和处理公共数据,数据价值的最大化难以保证。在一些法律责任与其他法律法规相抵触方面,由于公共数据相关立法的层级较低,法律责任规定又较弱,一些甚至与其他单行立法相抵触,实践中如何应用就是个问题,这将不利于公共数据相关法律责任的整体性规范。在实际解决问题的成效低方面,保障数据使用方最终的合法权益是必然之选。如对于不予开放相关政府数据的行为,民众很难通过诉权来予以纠正,只能通过内部投诉渠道或民主参与程序进行纠正。换言之,政府数据开放法具有很强的政治性、政策性、宣示性和抽象性。当公共数据的使用方不能充分维权,达到预期使用效果的话,那就无法释放公共数据的效能。
随着人工智能技术的广泛应用,公共数据处理者的权责也有了相应变化。公共数据处理者需要更加重视数据的安全性和隐私保护。例如,中国互联网协会召开的研讨会[14]强调在人工智能时代下,数据安全治理与发展具有同等重要性。这就要求建立追责机制,一旦发生数据安全事件,能准确定位责任主体,实施追责。
四、公共数据处理者权责配置进路
(一)配置思路:从数据确权到数据管理运营权的确立
当前各界对于公共数据的相关权属依然争议较大,实践中的公共数据开放制度并没有很好地建立在一个“权利基础”之上[3]。本文认为数据本身就不同于石油等有限和排他特性的自然资源,不能上升到宪法的角度等同于自然资源的所有权性质,因而数据本身的确权是没有实质意义的。公共数据不是“公有数据”,所有权的制度并不适用。公共数据基于其特有的公共属性更是如此,更加无法去确权。确权的理念更多应当应用在公共数据产品上才是解决这一问题的长远之计。
将公共数据确立为“公物”实属不妥,必将导致数据处理者将公共数据视为自己的“筹码”而不利于更好的开放和利用。公共数据开放的功能定位,呼吁着一种数字时代的新型权利。唯有以明确的权利为基础,方可构造和优化公共数据开放的法律制度体系[3]。针对这一权利体系的构建,学界也展开了很多讨论,如有学者提出将数据主体二分为数据原发者和数据处理者,为两者分别配置数据所有权和数据用益权[15]。有学者提出从公平利用权的规范逻辑出发,指出当下公共数据开放制度应着力于理性、公平的数据开放利用秩序之建构[3]。
在人工智能时代,数据的价值和影响力日益凸显,对数据权属的界定和管理运营权的确立也变得尤为重要。传统的数据确权方法可能不再适用于人工智能时代,需要探索新的确权机制,以促进数据的合理利用和保护。例如,基于区块链技术和数字水印技术提出了一种新的大数据确权方案[16],通过引入审计中心和水印中心,来分离大数据完整性。此外,也有学者提出,数据不是在有形财产上产生的权利,很难用所有权的四项权能简单概括。因此,数据财产权应包括以下三种不同层次上的权利: 数据资源持有权、加工使用权、 数据产品经营权[17]。
因此,一方面需要摒弃传统的数据确权观念,而更加深入地研究公共数据的应用和相关数据产品的创新。这也有助于确认公共数据处理者的管理和运营权限,使他们能注重开发开放高价值数据,全面进行数据的管理和运营。另一方面,公共数据处理者还需对数据进行更多的管理和监督,确保数据安全和高质,进而为人工智能算法提供高质量的数据录入。例如,《数据安全法》第六条专门规范政府部门的安全责任及其分工,第八条则是对所有数据处理者的安全和合规义务的原则性规范。
(二)配置体系:构建公共数据处理者管理、运营、开发的权责体系
基于公共数据的开放定位,通过建立完善适应的权责体系才能够保障公共数据运营的有序进行。当然在权责体系构建中各相关权益的厘定是非常困难的,多方共治需要各利益主体承担不同的责任,主体间存在怎样的关系、不同主体的角色定位是什么、各主体在治理中的职能和作用边界要怎样划分等责任分配相关问题都是公共数据治理实践中要面对的重要挑战[18]。
针对于公共数据的处理者权责体系的构建,可以从如下几方面来展开:其一,明确公共数据处理者的管理权。此处的管理权包括对于公共数据的存储、使用、加工、传输、提供、公开等处理活动,重点对于公共数据的多元化管理,让数据有序流通和利用。其二,明确公共数据处理者的运营权。公共数据运营是指按照国家相关法律法规要求,经公共数据管理部门和其他相关信息主体授权具有专业化运营能力的机构,在构建安全可控开发环境基础上,按照一定规则组织产业链上下游相关机构围绕公共数据进行加工处理、价值挖掘等运营活动,产生数据产品和服务的相关行为。其三,明确公共数据处理者的开发权。此处的数据开发并不等同于数据收集,公共数据的主管部门应当从需求出发,建立公共数据需求清单,满足实际社会发展需要。同时,公共数据的开发要树立底线思维,不得损害国家利益、社会公共利益和第三方合法权益。
人工智能技术的发展要求公共数据处理者构建一个全新的权责体系,构建一个适应人工智能时代的权责体系。第一,要明确责任主体。在人工智能时代,需要明确谁是数据管理和运营的责任主体,以及他们在数据生命周期中的权责分配。公共数据安全责任应当按照谁收集谁负责、谁持有谁负责的原则进行管理[19]。第二,我们需要制定人工智能的应用伦理规范,确保公共数据处理者在利用人工智能技术时严格遵守透明度、平等性和安全性的原则。例如,欧盟发布的《可信赖的人工智能伦理准则》详细罗列了七项人工智能伦理原则,它们涉及了人类主体与监管、技术的稳定性和安全度、隐私保护与数据管理、透明度等领域。总之,在人工智能迅猛发展的时代下,我们必须及时更新和强化与人工智能直接关联的法律和规章制度,为公共数据处理者提供清晰的法律方向和保障。
例如,“人工智能法草案”2023年和2024年已连续两年在国务院年度立法工作计划中被列入预备提请全国人大常委会审议项目。2024年3月16日在北京“AI善治论坛 人工智能法律治理前瞻”专题研讨会上发布了《中华人民共和国人工智能法(学者建议稿)》[20]。
通过以上措施,可以更好地应对人工智能时代公共数据处理者的权责配置问题,确保数据的有效管理和合理利用,推动数字经济和数字政府的发展。
四、公共数据处理者权责配置的举措
有了公共数据处理者管理、运营、开发的权责体系,还需要深入完善每个权责的具体内容,在此过程中可能会遇到很多问题,但此项权责配置需要循序渐进,更需要融入公共数据开放的基本理念。公共数据的开放不能单纯消极地公之于众,而应由主管部门以搭建服务平台的态度和目标来推进数据开放,构建数据合理收集、融合、利用的生态系统[21]。
(一)明确公共数据处理者的责任主体范围
公共管理和服务机构的界限需要明确,何谓承担公共管理职能的组织当前仍没有统一定论,尤其是政府部门已经成为最大的公共数据处理者,哪些机关部门要去公开,不同部门之间的公共数据如何公开等牵涉到这一基础性问题。尤其是国家机关、法律法规规章授权的具有管理公共事务职能的组织以及供水、供电、供气、公共交通等公共服务运营单位如何细化明确,仍是当前空白的要点。增加公共数据的开放体量非常重要,但并不意味着不该公开、限制公开的数据也被公开,此类责任主体的清单仍需要建立,明确界限范围。
随着人工智能技术的发展,公共数据的治理也面临新的挑战和机遇。人工智能技术在提升公共管理效率和决策质量上发挥着越来越大的作用,但同时也带来了数据质量不高、技能人才短缺、数字鸿沟等问题[22]。为了应对这些挑战,有必要进一步明确公共数据处理者的责任主体范围,并结合人工智能技术的发展,制定相应的政策和制度。首先,应当构建一个统一的数据开放平台,作为支持公共数据开放的统一载体[23]。其次,开放公共数据的主体应根据有关的标准和要求,同时结合各自的行业或地域特性,对其公开的数据进行分级,确立其数据开放的特点、所需条件以及管理策略。除此之外,对于公共数据,还应该加强其安全管理与保密措施,以确保在数据开放和应用的全过程中能做到安全可控。从宏观角度看,明晰公共数据处理者的职责边界,结合现代人工智能的持续进步,制定相关的策略和框架,是确保公共数据得到开放、共享和高效应用的关键环节。
总体而言,明确公共数据处理者的责任主体范围,并结合人工智能技术的发展,制定相应的政策和制度,是推动公共数据开放共享和高效利用的关键步骤。这不仅有助于提升公共管理和服务水平,还能促进数字经济的发展和社会治理的现代化[24]。
(二)授权运营中建立多维风险防范措施
公共数据的授权运营是对数据开放的有效补充,特别是在高价值数据的开放方面起到了显著作用。为了确保授权运营发挥最大效用,需要明确其中的法律风险,首要就是梳理授权方和被授权方之间的法律关系。正是因为授权方有国家机关的参与,双方之间的授权协议是行政协议,授权方可同时授权多方参与并可加入竞争机制,挑选优质的授权主体。国家“十四五”规划提出“要加强公共数据开放共享,开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”[25],这为公共数据营运构建起了顶层设计。当前,一些地方也已建立了统一的公共数据运营平台,可充分发挥平台作用,提供安全、可信、可靠、可控、可溯源的机制,防控授权中的法律风险。例如,新发布的《浙江省公共数据条例》中首次专门规定了“公共数据授权运营”,起到了很好的示范作用。
在人工智能时代下,应当根据不同主体对人工智能系统的控制力度,采取权责相统一的原则,加诸相应的合规义务,建立多维风险防范措施。可将人工智能和算法技术按风险等级进行分类管理,确保每个层级都有相应的监管措施。同时,在法律层面对企业收集数据的技术应用及数据过滤保护机制进行更细致的规定与严格监管。明确数据隐私和保护规则、透明与可解释规则,以防止数据滥用和隐私泄露。此外,明确人工智能的法律主体,确定在人工智能载体触犯他人利益、造成社会损失时的责任承担问题。建立透明性、隐私保护与可追责性的规则架构,确保在人工智能致损时能够明确责任。
(三)平衡数据开放与个人信息及隐私权保护
公共数据来源于自然人、法人、非法人组织等各类社会主体的数据。数据采集环节,虽然是在提供公共服务过程中收集的,但也要遵守网络安全、数据安全、个人信息保护等法律、法规以及国家标准的强制性要求。由于政府主体的参与,违反个人信息及隐私保护而承担的责任主要是行政责任和刑事责任,在行政责任承担方面需要跟《中华人民共和国网络安全法》《数据安全法》《个人信息保护法》等法律责任衔接,加强侵害个人信息、隐私权、商业秘密等处罚力度。
平衡数据开放与个人信息及隐私权保护,还可以借助数字技术的应用。如可反向识别数据保留限制原则是平衡数据共享与隐私权保护的重要支撑[26]。各地搭建的公共数据开放平台就可以融入相关数字化保护技术,确保在源头收集数据的时候排除违法性干扰,通过彻底的脱敏、匿名化等手段防控泄露风险。其中隐私计算技术通过“数据可用不可见”的特性,在数据的开放性、共享性和隐私安全之间达成了平衡。该技术可以在数据不被外泄的情况下进行数据处理。另外运用数据的脱敏、匿名处理等技术,也能够有力保护个人隐私,避免在数据处理时发生恶意攻击或外泄。在应用人工智能技术时,应当突出强调基于知情同意这一关键原则,以有效保护个人信息。像生成式人工智能新规就主张以得到知情同意为核心,以确保个人数据得到充分和有效的保护。
同时,企业应遵循最小化权限原则,限制数据访问权限,减少不必要的数据收集和使用。另外,透明度有助于建立人工智能的可靠性以及人们对这项技术的信任。联合国隐私权问题特别报告中也指出,透明度不仅有助于促进和保护隐私权,还能增强人们对人工智能的信任。
(四)强化数据开放和获取的公平性
在人工智能发展的进程中,确保数据的开放性和公平性至关重要。这不仅影响到算法的公平和透明性,还需要制定明确的数据法规政策,以保证各群体能够平等地使用信息,从而消除算法偏见。在确保数据的隐私和安全性上,一方面要求公正地开放数据资源,以保证数据的合理和合规运用。另一方面要求多角度的数据收集与处理,避免数据分布不均衡而使分析结果不科学。只有这样双管齐下,才可以推动数据资源的公正开放和使用,从而促进人工智能技术的广泛发展。
具体而言,公共数据的开放与利用是一体两翼的关系,既要强调各类公共数据开放的公平,也要强调大众获取利用数据的公平。这对于公共数据的处理者也对应着不同的权责。
在公共数据开放的公平性方面,根据数据使用者的实际需求来开放对应数据是非常必要的。如上海市公共数据开放平台上,用户检索频率较高的分别是服务、高新技术、医疗机构等,这反映了用户对数据需求集中在民生服务、经济建设、卫生健康等领域。因而,开放更高价值、与社会民生有迫切关联的数据是当务之急。欧盟的《关于开放数据和公共部门信息再利用的指令》中对应是“高价值数据集”,也就是那些“具有很高的商业潜力”,可以加快“增值信息产品”以及推动“人工智能发展的关键数据源”的数据[27]。公共数据的开放需要循序渐进地按照需求程度来展开。
在公共数据利用的公平性方面,目前各主要地方法规中均突出强调了公共数据的利用,促进公共数据共享利用而非纠结于数据权属的争议是当前协调的趋势。公共数据的利用针对的是数据获取主体的便利性和公平性,如果公众获取公共数据很难或者有不公平的问题,那就背离了公共数据开放的主要目标。因而在公共数据处理者的权责中需要充分围绕数据利用性来展开,各地有了较好的尝试,如杭州市提出了公共数据治理中的市民授权机制,国家发展改革委《关于对“数据基础制度观点”征集意见的公告》建议对于各类市场主体在生产经营活动中采集加工的不涉及个人信息和公共利益的企业数据,推动由市场主体享有数据持有、支配和收益的权利,确保投入的劳动等要素资源获得合理回报。
五、结语
习近平总书记指出,要充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。在人工智能的历史性进程中,公共数据的开放和利用虽然面临诸多挑战,各地各方面正积极探索新机制和新模式,以解决这些争议问题。本文聚焦于公共数据的数据处理者权责配置问题,旨在通过深入分析,厘清公共数据开放和利用的进路,构建起一个适应人工智能时代的管理权、运营权、开发权的权责体系。这一体系将促进公共数据处理者更高效地利用人工智能技术,提高数据处理的智能化水平,实现数据驱动的运营优化,并鼓励创新导向的数据开发。同时,面对数据安全、隐私保护、算法偏见等挑战,合理的权责配置将有助于确保公共数据的开放和利用既安全又高效,最终实现公共数据高价值的进一步释放,为社会经济发展和技术创新提供更加有力的数据支持。
参考文献:
[1] 张会平, 顾勤 . 政府数据流动:方式、实践困境与协同治理[J]. 治理研究, 2022(3):59⁃60.
[2] 郑春燕,唐俊麒. 论公共数据的规范含义[J]. 法治研究,2021(6):68⁃70.
[3] 王锡锌, 黄智杰. 公平利用权:公共数据开放制度建构的权利基础[J]. 华东政法大学学报,2022年(2):60⁃62.
[4] 徐珉川. 论公共数据开放的可信治理[J]. 比较法研究,2021(6):144⁃145.
[5] 邢会强. 政府数据开放的法律责任与救济机制[J]. 行政法学研究, 2021(4):42⁃49.
[6] 常江, 张震. 论公共数据授权运营的特点、性质及法律规制[J]. 法治研究, 2022(2):127⁃128.
[7] 袁康, 刘汉广. 公共数据治理中的政府角色与行为边界[J]. 江汉论坛, 2020(5):121⁃122.
[8] 人工智能对数据分析领域的影响是什么?[EB/OL].(2024-02-27)[2024-07-06]. https://www.cda.cn/bigdata/ 2043 50.html .
[9] 大模型时代,数据治理与AI相互依存形成闭环[EB/OL]. (2023-10-23)[2024-06-07]. https://www.thepaper.cn/newsDetail_forward_24986394 .
[10] 数据驱动时代:AI(人工智能)的智慧决策[EB/OL]. (2023-11-20)[2024-04-30].https://www.cstc.org.cn/info/1081/234618.htm .
[11] 齐英程. 公共数据增值性利用的权利基础与制度构建[J]. 湖北大学学报(哲学社会科学版), 2022(1):15⁃19.
[12] 黄尹旭. 论国家与公共数据的法律关系[J]. 北京航空航天大学学报(社会科学版), 2021(3):29⁃30.
[13] 公共数据开发利用将迎重磅政策 数据要素资产化进程将会“更进一步”[EB/OL]. (2024-07-05)[2024-07-06]. https://new.qq.com/rain/a/20240705A02B7700.
[14] “AI时代下的数据安全治理与发展”研讨会在京召开[EB/OL].(2024-06-14)[2024-07-06].https://www.isc.org.cn/airticle/21084713168385728.html.
[15] 申卫星. 论数据用益权[J]. 中国社会科学, 2020(11):127⁃128.
[16] 马梦伟. 基于区块链技术的数据确权问题研究[J]. 财会研究, 2022(12):57⁃59.
[17] 王利明. 数据何以确权[J]. 法学研究, 2023(4):68⁃71.
[18] 孙红蕾. 图书馆公共数据治理的主要问题、概念框架与实践路径[J]. 图书馆学研究, 2022(3):16.
[19] 如何做好数据生命周期治理[EB/OL]. (2024-05-20)[2024-05-21]. https://docs.pingcode.com/ask/294625.html.
[20] AI发展法先行,首届“AI善治论坛”发布《人工智能法学者建议稿》[EB/OL] . (2024-03-17)[2024-07-17]. https://www.sohu.com/a/764774934_254324.
[21] 丁晓东. 从公开到服务:政府数据开放的法理反思与制度完善[J]. 法商研究, 2022(2):141.
[22] 张成福, 王祥州. 人工智能嵌入公共服务治理的风险挑战[J]. 电子政务, 2023(1):44⁃46.
[23] 贾政,申卉.提升公共数据开放质效 赋能实体经济高质量发展[N] .广州日报2023⁃04-11(1).
[24] 《生成式人工智能服务管理暂行办法》出台,公共数据将如何赋能大模型? [EB/OL]. (2023-07-13)[2024-07-06].https://www.21jingji.com/ariticle/20230713/herald/ 1dd46baad746e6be4beec8165a99174e.html.
[25] 中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要[EB/OL]. (2021-03-13)[2022-06-17]. http://www.qstheory.cn/yaowen/2021-03/13/c_1127206301.htm .
[26] 任颖. 数字时代隐私权保护的法理构造与规则重塑[J]. 东方法学, 2022(2):196.
[27] European Union:EUR-Lex-32019L1024-EN-EUR-Lex[EB/OL]. (2019-06-20)[2022-06-01]. https://eur-lex.europa.eu/legal-content/EN/TXT/?qid=1561 5631 10433&uri=CELEX:32019L1024.
The Allocation of Rights and Responsibilities of Public Data Processors in the Context of Artificial Intelligence
Zhang Dongmei
(Department of Law, Shanghai Sanda University, Shanghai 201209,China)
Abstract: In the era of artificial intelligence, public data not only unleashes economic and social value but also becomes a key force in promoting the modernization of social governance, fostering high-quality development of the digital economy, and achieving the modernization of the national governance system and governance capabilities. The allocation of rights and responsibilities of public data processors should be in line with the level of artificial intelligence development. At present, the rights and responsibilities of data processors of public data are not clear and extended, which limits the further development of public data opening and utilization. To this end, the idea of configuring the rights and responsibilities of public data processors is put forward, which is to build a rights and responsibility system for the management, operation and development of public data processors from data confirmation to the establishment of data management and operation rights. At the same time, it also puts forward the countermeasures for the four-point implementation of the power and responsibility configuration of public data processors.
Keywords: artificial intelligence; public data; data processor; rights and responsibilities configuration
作者简介:张冬梅(1980—),女(回族),上海人,讲师,博士,研究方向:科技法,知识产权法,知识产权管理。
1 有关“公共数据”的地方性立法主要是地方政府规章、地方规范性文件及地方工作文件体现的。地方政府规章如《山东省公共数据开放办法》《江西省公共数据管理办法》《江苏省公共数据管理办法》等都是2022年后实施的,地方规范性文件如《中国(上海)自由贸易试验区临港新片区公共数据管理办法(试行)》《温州市公共数据共享开放管理暂行办法》《长宁区公共数据管理办法》等。
2 《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》。
3 《浙江省公共数据条例》第三条:本条例所称公共数据,是指本省国家机关、法律法规规章授权的具有管理公共事务职能的组织以及供水、供电、供气、公共交通等公共服务运营单位(以下统称公共管理和服务机构),在依法履行职责或者提供公共服务过程中收集、产生的数据。根据本省应用需求,税务、海关、金融监督管理等国家有关部门派驻浙江管理机构提供的数据,属于本条例所称公共数据。
4 《广东省公共数据管理办法》第三条:本办法下列用语的含义:(一)公共数据,是指公共管理和服务机构依法履行职责、提供公共服务过程中制作或者获取的,以电子或者非电子形式对信息的记录;(二)数源部门,是指根据法律、法规、规章确定的某一类公共数据的法定采集部门;(三)数据主体,是指相关数据所指向的自然人、法人和非法人组织;(四)省政务大数据中心,是指在数字政府改革模式下,集约建设的省市一体化的政务大数据中心,分为省级节点和地级以上市分节点,是承载数据汇聚、共享、分析等功能的载体。
5 《福建省电子政务建设和应用管理办法》和《重庆市政务数据资源管理暂行办法》皆规定其政务数据(信息) 资源归国家所有。
⑥ 《福建省政务数据管理办法》称其为数据生产应用单位,《上海市公共数据开放暂行办法》称其为其他公共管理和服务机构,《济南市公共数据管理办法》称其为公共服务企事业单位。
⑦ 《福建省政务数据管理办法》第四十二条:违反本办法规定,数据生产应用单位有下列情形之一的,由数据管理机构或者有关主管部门责令限期改正;逾期不改正的,给予通报批评;情节严重的,对直接负责的主管人员或者其他直接责任人员依法给予处分;造成损失的,责令赔偿损失;构成犯罪的,依法追究刑事责任。