赵加兵
〔河南财经政法大学 民商法学院,河南 郑州 450016〕
公共数据利用是影响公共数据资源价值实现的重要因素,也是建构数据要素市场必须思考的核心问题,海量的公共数据资源如果无法得到充分开发利用将是社会的重大损失。在公共数据利用方面,理论界展开了相关探讨,形成了一定的研究成果,现有研究在某个维度上回答了公共数据利用中涉及的议题,却难以从全面规范角度提供公共数据利用有效实现的方案。笔者在梳理公共数据基本特征基础上,认为开放许可模式是公共数据利用的可行方案,并就公共数据开放许可制度建构提供了相对规范的实施方案。
从其性质看,本文所言的公共数据利用是对公共数据的再利用,即公共部门在履行公共职能外通过授权模式允许公共部门以外的主体对公共数据开放利用。[1]目前,各国尚未发现和确定公共数据有效开放利用的规范模式,理论及实务界主要认可公共数据免费许可与公共数据有限授权许可两种利用模式,接下来将对这两种模式作以简要分析。
1.公共数据免费许可模式
公共数据免费许可是目前世界上主要国家和地区普遍采用的公共数据利用模式,对公共数据开发利用产生了重要推动作用。需要说明的是,这里的免费许可主要强调的是在公共数据提供时仅收取必要的收集或制作成本,而非以市场化模式确定明确的交易价格。如美国信息自由法明确对公共数据利用模式做出区分并确立了差异化费用支付标准。将公共数据用于商业用途的,应支付数据检索、复制及审阅所需合理费用;将公共数据用于非商业用途的,应支付数据复制所需的合理费用;将公共数据用于公共利益目的的,应支付必要复制费用甚至可以免费使用。(1)参见《美国信息自由法》第552节(a)(4)(A)(ii)。从免费许可的基本运作模式看,各个国家和地区在具体实施时主要从如下维度展开。
(1)明确公共数据产权性质。包括美国、欧盟在内的主要国家和地区均以立法形式明确规定公共数据不受版权法保护,换言之,政府对公共数据不享有版权。英国政府声明大部分政府信息受版权法保护,但这并不影响英国政府以免费许可形式允许社会公众利用公共数据。[2]
(2)明确规定公共数据许可基本规则。在公共数据许可方面,不同国家与地区采取的模式有所差异,针对不同类型公共数据提供不同权利义务范畴的许可使用机制。(2)如美国公共数据许可采取的是“开放数据许可”,英国采用的是“开放政府许可2.0版本”,澳大利亚采取的是“知识共享署名3.0版本”。更多详细论述参见迪莉娅:《政府数据开放许可适用研究》,《图书馆》,2014年第6期,第92页。如欧盟公共数据许可制度“从许可再利用的条件、责任、义务、文件的合理使用、格式,到许可的公平、公开、透明,再到许可的终止、侵权行为、准据法都进行了明确的规定和说明”。[2]
(3)限制公共部门与私人部门在公共数据利用方面展开竞争。为限制公共部门与私人部门在公共数据利用层面展开直接竞争,一些国家或地区对公共部门再利用公共数据施加了必要限制。如《欧盟公共部门信息再利用制度指令》规定:如果公共部门在履行基本职能外使用公共数据,则应与其他社会主体遵循相同的收费原则和条件。[3]以此维护公共数据利用相对公平的市场竞争环境,激励私人部门积极展开公共数据开发利用,满足社会日益增长的数据产品需求。
2.公共数据有限授权许可模式
公共数据有限授权许可的核心是允许公共数据提供者在设定相应限制条件的情况下将数据向社会公众开放,从其本质看,公共数据有限授权许可是一种市场化数据利用模式。公共数据有限授权许可模式运作遵循如下规则。
(1)肯定公共数据提供者享有数据权利。公共数据有限授权许可的基础是认可数据提供者对公共数据享有数据产权。从数据来源看,公共数据也是数据提供者生产出来的资源,公共数据的产生是基于投资或劳动,但无论如何公共数据提供者都应当对其生产的数据享有数据产权。[4]
(2)允许公共数据提供者设置特定的授权条件。既然数据提供者对公共数据享有产权,允许其自主处分数据产权自是权利行使的应有之意。公共数据提供者可根据公共数据使用的数量、质量、范围及目的等设定相应的价格,并按照市场机制收取许可使用费。
(3)有限授权许可应注重保护公共数据承载的利益。在公共数据市场化利用时强调有限授权许可,意在保护公共数据所承载的个人隐私、商业秘密及国家安全等利益。在公共数据市场化利用前必须用特定技术对公共数据进行必要的脱敏或清洗,在尽可能去除敏感信息的基础上实现公共数据的开发利用。
(4)有限授权许可不能是排他许可。公共数据作为公共资源,属于全民所有的财产,这类资源应在遵循生产资料社会主义公有制的基础上被尽可能充分开发利用,以释放其内在价值。如果将公共数据授权许可仅限于特定行业或特定主体,无疑是用全体纳税人的钱满足少数主体的利益,这显然有违社会公平。[4]因此公共数据授权许可必须也只能采取普通许可模式。
现有研究对公共数据基本特征的认知具有合理性,但对公共数据利用模式的探讨难以契合未来公共数据利用的发展趋势,需要结合公共数据的基本特征进行更为深入的分析探讨。
1.现有研究视野下公共数据的基本特征
梳理现有研究可知,公共数据及其利用具有如下基本特征。
(1)公共数据具有价值性。公共数据的价值性至少可从如下维度得到合理解释:首先,公共数据本身具有价值。公共数据是对政府等公共部门工作的全面记录和全景展示,汇集了特定时间段内客观对象的全部信息,对于建设数字政府、展开数字治理及推动数字经济发展具有重要意义。其次,公共数据对数据提供者与利用者具有价值。公共数据的核心价值在于分析描述对象特征与规律,预测客观世界的发展趋势,[5]对于公共数据收集者及控制者而言,公共数据可被用于完成基础公共服务的职能,也可以用于进行更为深入的再利用,释放更多的经济社会价值;对于公共数据使用者而言,公共数据是其展开数据分析、创造数据产品的“原材料”,离开公共数据资源支撑,相应的商业开发都将是无源之水。最后,公共数据对数字经济、数字治理与数字政府具有价值。公共数据等数据资源被称为数字经济的“石油”,是数字社会的基础性资源和数字经济活动的基本要素。公共数据等数据资源对于加强市场主体服务和监管,(3)参见《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》(国办发〔2015〕51号)。推动数字政府建设、完善数字社会治理(4)参见《促进大数据发展行动纲要》(国发〔2015〕50号)。及建立健全数字经济所需的数据要素市场(5)参见2020年3月30日发布的《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》。具有重要意义。
(2)公共数据具有可流通性。无论是涉及个人信息的公共数据还是与个人信息间接相关的公共数据,均具有可流通性,可为社会公众接触和利用。[5]涉及个人信息的公共数据同时具有公共性和社会性,关涉个人利益也关涉他人和整个社会的利益。[6]对于这类公共数据应在确保无法识别特定个体身份的情况下,允许其进入数据市场流通。对于非个人信息的公共数据,因其主要是对个人以外客观世界或社会因素的描写与记录,不涉及个人身份识别,这类数据应当在确保数据收集合法且不侵害他人合法权益的情况下,允许数据控制者许可他人使用该数据资源。[5]
(3)公共数据利用具有非竞争性。公共数据利用的非竞争性,是指公共数据利用者可在互不干涉的情况下同时对公共数据予以开发利用。公共数据利用的非竞争性为数据提供者同时授权不同主体利用公共数据奠定了理论基础,也为公共数据价值释放提供了实践基础。即使针对同一公共数据集合,不同的公共数据利用者也可基于不同目的进行不同类型的开发利用,进而获取不同的经济或社会价值。
2.现有研究对公共数据利用认知的局限性
(1)公共数据免费许可论仍将公共数据与政府信息等同视之。在探讨公共数据利用时仍将公共数据限于政府应公开的基本信息,进而认为公共数据许可应以免费许可为基本实现方式。如英国允许免费使用政府或公共部门收集或产生的非个人数据、公共部门门户网站公布而没有出版的数据集、原始的开源软件和源代码,[2]这显然是将公共数据与政府应公开的基本信息等同视之。将公共数据等同于政府应依法公开的信息是对公共数据范围的误读,将会产生严重不利的后果。
首先,公共数据范围要大于政府依法应公开的信息。在大数据时代,公共数据指的是政府及公共管理和服务机构在履行职责过程中所收集和形成的所有数据资源。(6)参见《上海市公共数据开放暂行办法》(2019年8月29日上海市人民政府令第21号)第3条。其在范围上既包括根据《政府信息公开条例》应当依法公开的政务信息,也包括由政府等部门收集整理但不能直接对外公开的数据,如涉及个人信息、商业秘密及国家安全等的敏感数据。
其次,公共数据开放与政府信息公开的目标具有差异性。政府信息公开是为了满足社会公众的知情权,提升和强化社会公众对政府行为的监督能力;公共数据开放意在推动公共数据开发利用,不断释放公共数据承载的经济社会价值,推动数字经济发展和数字社会治理能力现代化发展。
最后,以政府信息免费公开方式实现公共数据开放将会严重限制公共数据价值的实现。公共数据是数据要素市场的核心组成部分,也是推动数据经济发展的核心动力。对于这类资源的利用应当全面考虑、综合安排,从某种意义上而言,没有数据产权的清晰界定和数据资源的付费使用就没有数据经济。[4]免费开放原则显然不适用于大数据时代的公共数据开放,也不可能成为公共数据开放利用的常规模式。
(2)公共数据有限授权许可论并未明确付费许可使用的具体实现方式。现有研究已认识到应当对公共数据采取有别于传统政府信息公开的开放许可模式,也对公共数据有限授权许可模式展开了相对规范的论证,却未搭建更为规范的公共数据开放利用机制。一方面,公共数据有限授权许可论认可公共数据是一项财产,公共数据控制者可以按照某种条件将之对外许可并收取许可费;[4]另一方面,公共数据有限授权许可论者未能为公共数据有限授权许可提供规范有效的实现路径。仅从原则上指出公共数据受控开放“实质上就是允许数据拥有者一直控制数据的使用权,不仅可以选择数据使用人,而且可以决定数据的使用目的、方式、对价等”。[4]但未说明何种模式下的公共数据有限授权许可最有效率,最能实现公共数据的价值。
鉴于公共数据开放利用的现有困境,笔者以为应当创新公共数据利用模式,以最大程度推动公告数据开放、开发与利用。从现有实践看,以专利开放许可为参考,建构公共数据开放许可制度具有内在合理性。一方面,公共数据与技术方案均具有非排他性和非竞争性,这为借鉴专利开放许可制度,建构公共数据开放许可奠定了理论基础;另一方面,专利开放许可遵循着所有权保留、实施者地位平等及授权条件确定等原则,与公共数据利用模式具有相当的契合度。所有权保留有助于强化政府对公共数据的控制,申请主体的平等性有助于推动公共数据广泛利用,授权标准确定性有助于提升公共数据许可效率。
但与技术方案相比,公共数据仍具有诸多特殊之处,这意味着公共数据开放许可将采取有别于专利开放许可的实现模式。第一,公共数据范围具有不确定性。技术方案具有确定性,专利权人在提出专利开放许可时必须确保其技术方案合法有效且边界确定。但公共数据作为一个数据集合,其边界难以事先确定,唯有数据使用者提出具体使用请求时方能最终确定公共数据开放许可的数据集合范围。
第二,公共数据的价值具有多样性。首先,公共数据的性质决定其价值具有多样性。不同的公共数据类型承载的信息具有差异性,公共数据既包括诸如天气、水文、植被等自然资源数据,也包括人口、征信、交通、工商登记等社会数据,还包括违章违法、行政处罚、犯罪记录等社会主体的敏感数据。对于公共数据使用者而言,这些数据本身便具有价值,且原始数据越特殊,其价值越大。其次,公共数据利用场景决定数据价值。同样的公共数据,使用场景越特殊其价值越大。将公共数据用于反恐或预防腐败会比将之用于简单的商业开发具有更大的价值。最后,公共数据与不同数据的结合也将影响其价值。将相同的公共数据与不同的数据聚合在一起应用于不同的算法或分析目的将会得出不同的结论,释放不同的价值。[5]有鉴于此,期待以事先定价方式确定公共数据交易许可费数额显然不是有效的利益分配方式,也难以充分释放公共数据的真实价值。
第三,公共数据利用具有限制性。公共数据承载着诸多利益,包括但不限于个人隐私、商业秘密、国家安全等。在公共数据利用前应进行必要的技术处理,以尽可能降低因公共数据利用而给特定主体利益造成损害的风险。对公共数据的处理应确保公共数据不存在直接与个人关联的身份数据或唯一性识别符,但可保留指向或关联到某个体的可能性,以便识别分析数据对应主体的行为趋势或倾向,从而最大程度保留大数据发展给社会发展带来的制度红利。[5]
因此,在公共数据开放许可时应确立比专利开放许更为严格规范的制度设计,具体而言,公共数据开放许可制度建构应当围绕如下维度展开。
1.明确公共数据开放许可交易主体的权利义务关系
作为典型的交易行为,公共数据开放许可的双方当事人理应按照合同法之规定享有相应的权利和承担相应的义务。在公共数据开放许可过程中双方当事人还应承担某些特殊的义务及责任。接下来将主要就当事人应承担的义务及责任作阐释。
(1)公共数据提供者应承担的义务。公共数据提供者至少应承担如下义务。第一,依照许可合同约定提供公共数据资源。依照许可合同约定提供标的物本是合同当事人的基本义务,但与有体物不同,公共数据这类资源无法用直观方式予以观察和判断,必须依靠一定的技术手段予以分析和甄别。这对于那些技术水平较低的社会公众而言,可能存在受欺骗的风险。明确公共数据提供者的义务有助于督促其严格按照合同约定的条件保质保量地为使用者提供所需的公共数据资源。
第二,保证公共数据质量。公共数据质量是影响公共数据开放许可有效实现的核心要素,也是最难把控的要素,用于流通的公共数据应当具有关联性、准确性和可用性。[5]为确保数据质量,必须对现有公共数据进行必要的清洗、脱敏等技术处理,以有效清除数据缺失、数据冗余、数据冲突和数据错误等数据噪音,为数据分析和数据管理奠定基础。[7]这就要求公共数据提供者应针对数据清洗、数据整合、相似记录检测、数据质量评估、数据质量过程控制和管理等事关数据质量的各个环节,建立数据质量监管程序,并确立各个环节中的监管重点。[8]
第三,承担公共数据瑕疵担保及某些数据安全义务。作为供给方,公共数据提供者应对公共数据的合法性及公共数据安全承担一定的义务。一方面,提供者应当对自己提供的公共数据的真实性合法性等承担证明义务,对该数据承担瑕疵担保责任,如因其提供的数据失实、不合法而给数据使用者造成损失的,应承担相应的法律责任。另一方面,公共数据提供者一般不对数据使用过程中的数据安全承担法律责任。公共数据提供者可对数据使用者所利用的公共数据进行跟踪、管理和评估,但不应对因数据使用者不良或不法行为而导致的数据泄露承担法律责任。公共数据提供者仅在疏于审查直接使用者资质而导致数据泄露时才承担相应责任。[5]
(2)公共数据使用者应承担的义务。公共数据使用者至少应承担如下义务。第一,按照合同约定使用公共数据。按照合同约定使用公共数据是公共数据使用者最基本的义务,要求公共数据使用者严格依法依约使用公共数据,并承担因违法或违约使用公共数据而引发的各项法律责任。在依约使用公共数据时,公共数据使用者有权审查公共数据的合法性、真实性,以便厘清因公共数据使用而产生的法律责任。
第二,保障公共数据安全。保障公共数据安全是公共数据使用者必须承担的基本义务。公共数据从数据提供者转移至数据使用者的同时也产生数据安全风险的转移。换言之,公共数据使用者必须承担起自觉维护公共数据安全的义务,如因公共数据使用者原因导致公共数据丢失或泄露,数据使用者必须承担相应的法律责任。
第三,配合公共数据提供者实施公共数据管控。公共数据使用者应依照相关规定接受政府机关或公共数据提供者对其利用公共数据的行为进行追踪、评估和监管,以保障公共数据安全,发现和确定公共数据价值最佳实现方式。
2.规范公共数据开放许可的市场化定价机制
公共数据许可使用的价格确定或定价机制应采取市场化运作模式,由交易当事人根据公共数据的数量范围、时间跨度、数据深度、数据完整性、数据样本及数据实时性等因素,[8]自主确定每笔交易的最终成交价格,这一成交价格可作为以后相同或类似公共数据许可使用的参考价格。从实现方式看,公共数据开放许可的市场化定价机制建构应着重从如下维度展开。
(1)设定灵活的公共数据开放许可价格确定机制。公共数据许可价格具有高度的不确定性,难以在公共数据开放许可声明中事先确定固定价格,只能根据特定场景设置相对灵活的价格确定机制。如根据贵阳大数据交易所定价系统确立的规则,公共数据的实时价格主要取决于数据样本量和单一样本的数据指标项价值,而后通过交易系统自动定价,价格实时浮动,公共数据最终交易价格由卖方与交易所最终确定。[8]
(2)确定灵活的公共数据开放许可费支付方式。公共数据开放许可费支付方式指的是买方应当以何种方式将约定的交易价款提供给卖方。从尊重当事人意思自治及交易习惯等角度出发,应当允许双方自主约定公共数据开放许可费支付方式,可以选择以货币形式一次性结清,也可以考虑以数据折价等方式分批分次结清价款。当然,如果公共数据许可交易过程中有第三方,如数据交易所,则应在满足第三方利益需要的前提下自主确定许可费支付方式。也可采取类似“互为数据许可”方式,即双方共同分享和利用各自产生的数据。[5]这种数据许可费支付方式在本质上是双方相互让渡数据使用权,交易双方互为数据提供方和使用方。双方当事人可在特定范围内更充分地使用已有数据资源,减少资料收集、数据采集等重复劳动,[5]实现数据资源利用的效益最大化。数据本身也具有聚合效应,唯有将越来越多分散的、碎片化的、不完整的数据汇集在一起进行重新组合,才能更好地发挥数据所应有的作用,释放其内在的经济社会价值。通过数据交换或实物补偿方式实现数据流通无疑更有利于数据价值的实现。
3.明确公共数据管理部门在公共数据开放许可中的职能定位
在公共数据开放许可实施过程中,公共数据管理部门既是开放许可的发布者,也是开放许可基本服务的提供者,同时还是开放许可数据安全的管控者。
(1)公共数据管理部门是公共数据开放许可的发布者。参照专利开放许可制度,公共数据开放许可声明应由公共数据管理部门负责审查和发布。公共数据管理部门主要审查如下事项:第一,拟授权使用的公共数据是否涉及个人隐私、商业秘密、国家安全等问题;第二,公共数据使用者的身份或资质,即公共数据使用者是否是法律禁止或限制获取公共数据的主体,以及公共数据使用者是否具备公共数据利用能力;第三,公共数据使用者是否会超出授权范围使用公共数据,或者将公共数据用于法律禁止的领域;第四,公共数据使用者是否具备维护数据安全的能力。
实践中,许多省市已经建立公共数据交易平台,即便如此,笔者依然认为应当由公共数据管理部门负责公共数据开放许可声明的审查与发布。公共数据交易平台作为市场主体,虽能审查交易主体的身份与资质,却并无能力审查公共数据是否涉及个人隐私、商业秘密及国家安全等事项。
为规范公共数据开放许可声明审查与发布秩序,统一审查与发布标准,在国家尚未对公共数据利用形成统一规则的背景下,建议由省级公共数据管理部门统一负责公共数据开放许可声明发布工作。
(2)公共数据管理部门是公共数据开放许可基本服务的提供者。在公共数据开放许可实施过程中,公共数据管理部门应当承担起公共数据开放许可基本服务提供者角色。为促进公共数据开放许可的顺利实施,统一公共数据开放许可实施程序,公共数据管理部门可考虑提供必要的标准化服务,如制作公共数据开放许可数据库,提供公共数据开放许可声明与撤回声明模板,提供公共数据开放许可合同模板等。[9]
(3)公共数据管理部门是公共数据安全的管控者。为促进公共数据开放许可有效展开,维护数据安全,公共数据管理部门应切实履行数据安全管控责任,建构起完善的公共数据安全管控机制。具体可从如下角度展开:第一,在公共数据授权使用前建构起公共数据安全风险评估机制。公共数据管理部门应当根据公共数据的特点及利益关系建构针对性的数据安全评估体系,在公共数据许可使用前,针对拟授权的公共数据进行评估,唯有达到隐私安全和信息安全标准的公共数据方能进入市场进行流通。[5]
第二,在公共数据利用过程中建立起规范的数据追踪、管理和评估机制(以下简称为“管控机制”)。一方面公共数据利用管控机制的有效实施有助于公共数据管理部门及时了解公共数据使用状况,督促公共数据使用者严格按照约定的方式与范围进行数据开放利用,降低甚至消除公共数据泄露风险;另一方面管控机制也有助于发现和确定公共数据开放利用的新途径,不断优化公共数据许可方式,最大程度释放公共数据价值,促进数字经济发展和数字治理能力提升。
4.设定公共数据开放许可法律争议解决机制
公共数据开放许可法律争议解决应采取有别于专利开放许可的实现模式。专利开放许可所涉及的法律争议主要是专利许可使用费纠纷,此时由专利行政部门介入便可有效平息争端。公共数据开放许可涉及的法律争议更为复杂,由公共数据管理部门处理既不合适也无效率。公共数据开放许可法律争议主要包括如下两种情形。
第一,公共数据提供者或使用者存在违约行为。如公共数据提供者未按约定提供相应数量和质量的公共数据资源,或其提供的公共数据不符合约定。公共数据使用者违约使用公共数据,超出合同约定范围使用公共数据等。第二,公共数据提供者或使用者存在侵权行为。如公共数据提供者未进行必需的数据脱敏或清洗而直接对外许可使用,导致泄露个人隐私或商业秘密;公共数据使用者因使用不当而导致泄露公共数据信息。
对于这些法律纠纷,由公共数据管理部门参与处理并不合理。一方面,公共数据管理部门本身就是公共数据开放许可的监督者和管理者,在某种意义上是公共数据法律纠纷的利益相关者,应当予以主动回避。另一方面,这些法律纠纷主要涉及双方当事人权利义务关系,事关当事人或利益相关者核心利益,作为行政机关,公共数据管理部门在处理这些纠纷时面临能力不足的缺陷。因此,笔者以为采用仲裁或者司法途径解决公共数据开放许可争议或纠纷更有效率,也更符合当事人利益保护的基本目标。
公共数据开放利用是盘活数据要素的重要举措。以专利开放许可为蓝本建构起规范有序的公共数据开放许可制度是推动公共数据开放利用的有效方案。公共数据基本特征和利用模式与专利开放许可的高度契合性,为公共数据开放许可制度建构提供了理论基础,此外专利开放许可的实施效果已说明以此为模板建构公共数据开放许可制度具有现实可行性。在公共数据开放许可建构时应清晰地确定公共数据开放许可当事人的权利义务关系,规范公共数据开放许可市场化定价机制,明确公共数据管理部门在公共数据开放许可中的职能定位,设定公共数据开放许可法律争议解决机制,以有效保障规范有序的公共数据开放许可利用秩序。