内容提要:在全国首例涉《数据知识产权登记证》语音数据集侵权案中,一审法院认为,涉案数据集合构成商业秘密,并指出《数据知识产权登记证》可作为其持有商业秘密合法采集的初始证据。二审法院同时认为,被告利用共享数据之名,行不正当竞争之实,有违相关行业的诚信原则和商业道德,构成不正当竞争。比较而言,商业秘密保护路径符合数据集合特点,在解决数据集合财产权益保护中具有优越性。本文认为,应当扩大商业秘密构成要件的解释范围,如数据集合在多个用户之间流转,但均须承担保密义务的,可认定具有秘密性;处于公开状态的数据集合,数据处理者采取合理强度的反爬虫或对数据集合内容进行加密等措施,致使他人获取、汇总数据难度较大的,可认定具有秘密性;数据处理者对公开数据进行加工处理等“实质性投入”后生成的非公开衍生数据集合,可认定具有秘密性。此外,数据知识产权登记等数据产权登记证书,可以作为商业秘密保密措施、价值性的证据,弥补数据集合作为商业秘密时交易流通公示作用不足的弊端。数据集合一旦公开进入公共领域,且不符合上述商业秘密认定条件的,应允许其他数据处理者爬取、加工和后续利用。
关键词:数据集合 财产权益 商业秘密保护 司法适用
一、基本案情
原告数据某(北京)科技股份有限公司(以下简称原告)为专业从事人工智能领域数据服务的科技创新企业,花费大量人力财力录制了1505小时普通话语音数据(以下简称案涉数据集)。2021年,原告发现同样从事人工智能领域数据服务的被告非法获取该数据并在其官方网站向公众传播该数据,允许网络用户随意下载。原告认为:第一,原告是案涉数据集的首次制作人和合法权利人,原告依法享有数据权益。虽然数据权益保护制度尚不完善,但数据权益是明确应当予以保护的民事权益。第二,被告与原告同属数据处理行业从业者,均经营向第三方提供数据的业务,有竞争关系,被告通过网络实施非法获取、复制、传播案涉数据等侵权行为,且主观存在过错及恶意,被告应承担相应法律责任。案涉数据属于原告商业秘密,被告非法获取、使用、向他人提供案涉数据构成《反不正当竞争法》第9条“经营者不得实施下列侵犯商业秘密的行为”的不正当竞争行为。
被告隐某(上海)科技有限公司(以下简称被告)辩称,对于原告提出的各项诉讼请求,被告认为既无事实根据亦无法律基础,请求驳回其诉请。具体理由如下:第一,原告诉请保护的数据财产权益并无法律依据。《民法典》第127条仅是引致性条款,并没有规定数据权属如何确定,也没有承认原告所谓数据权益的内涵外延及所享有的权能。第二,原告未能证明其收集的敏感个人信息(声纹)取得了单独同意,应当认定为收集的数据不合法。第三,原告仅提供向上海某大学及米哈某公司转售的证据,而未能提供就转售取得个人单独同意的证据,违反了《个人信息保护法》的相关规定,该交易系违法交易,因此其诉请利益不具有交易价值。第四,原告所谓其享有权益的aidatatang1505zh与被告传播的aidatatang200zh指向的对象不同,原告也未能证明二者内容一致或存在相似度。第五,被告对aidatatang200zh的传播具有合法来源,且依法遵循了开源许可协议,已公开数据不属于商业秘密。第六,被告未侵害原告交易机会,不会获得任何商业利益。
北京互联网法院经审理认为,原告主张已经对案涉数据进行了去标识化处理,案涉数据无法识别到被采集者个人,即仅拥有案涉数据难以对被采集人个人造成实际损害。在无相反证据的情况下,可以认定原告收集语音数据的行为符合法律规定;原告提交的《数据知识产权登记证》,能够证明涉数据集系由原告收集且持有。被告作为一家提供数据存储、标注、训练服务的科技公司,直接将案涉数据集aidatatang200zh作为其官网数据产品的服务内容向网络用户披露,并提供下载链接供用户使用,其上述行为主观上存在过错,应当承担相应的法律责任。北京互联网法院于2023年12月29日作出判决:被告赔偿原告经济损失10万元、合理维权支出2300元;驳回原告其他诉讼请求。
宣判后,被告提出上诉,北京知识产权法院于2024年6月28日作出终审判决:驳回上诉,维持原判。【参见北京互联网法院(2021)京0491民初45708号民事判决书、北京知识产权法院(2024)京73民终546号民事判决书。】
二、数据集合财产权益保护的三种司法路径
厘定数据集合的定义是讨论问题的前提,但目前学界对数据集合并无统一定义。有学者认为,数据集合是指一定数量的数据条目按照特定目的汇集在一起而形成的数据集。【张素伦:《论数据集合的反不正当竞争法保护》,载《河南财经政法大学学报》2023年第5期。】数据集合倘若仅定义为“汇集”,那么数据集合与单个数据并无本质区别。所以,在数据集合的形成过程中,数据处理者需要进行加工或投入,使得数据集合具有新特性,体现更为丰富的价值。据此,数据集合是指数据经过数据处理者的收集、分析而聚合起来并含有新的特性,在聚合过程中经过处理数据的价值也变得更加丰富。【马忠法、胡玲:《论数据使用保护的国际知识产权制度》,载《电子知识产权》2021年第1期。】司法实践中,绝大部分数据集合纠纷发生在商事主体之间,对数据集合财产权益的司法保护主要存在三种路径。
(一)汇编作品保护路径评析
《著作权法》第15条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”依法条规定,数据可以作为汇编作品进行保护。而企业持有的数据形式一般为数据集合,其与汇编作品形式上相似,即符合汇编作品“集合性”的特点。如果在形成数据集合的过程中,对数据的选择或编排能够体现“独创性”,则数据集合享有类似汇编作品的著作权。【崔国斌:《大数据有限排他权的基础理论》,载《法学研究》2019年第5期。】
与此同时,汇编作品所要求的“独创性”即是该保护路径的痛点。汇编作品的“独创性”反映在对作品、数据或者其他信息的选择或者编排上,数据集合能否达到“独创性”标准从而被认定为汇编作品是实践中考虑的前置问题。判断一个数据集合是否达到汇编作品的保护标准具有主观性和不确定性,这给予了法官较大的裁量空间。即便构成汇编作品,《著作权法》保护的也只是数据集合的编排和结构,并不保护数据集合内容本身。但数据集合的价值恰恰体现在其内容上,在选择或编排上的创新程度有限。所以汇编作品保护路径并不符合现实需求,治标不治本。
(二)《反不正当竞争法》保护路径评析
适用《反不正当竞争法》来解决数据财产权益纠纷的路径是数据保护立法缺失背景下的产物,通常援引《反不正当竞争法》第2条作为裁判依据,其以侵权救济方式间接地实现对于企业数据权益的保护。该路径亦为实践中常见的规制方法,主流意见虽然对于数据保护的具体内容存在争议,但不质疑最低限度保护的必要性。【梅夏英:《数据的法律属性及其民法定位》,载《中国社会科学》2016年第9期;申卫星:《论数据用益权》,载《中国社会科学》2020年第11期;龙卫球:《数据新型财产权构建及其体系研究》,载《政法论坛》2017年第4期。】该保护路径在一定程度上弥补了数据保护立法的空缺,维护了数据持有者的合法权益。《反不正当竞争法》保护路径的审判思路如下:首先,确定原告是否合法享有该集合的数据权益。对此通常考虑以下因素:数据持有人对数据的加工处理等形成过程是否投入相应的人力、物力,能否为持有人带来商业价值;数据产生或采集的合法性,如涉及个人信息的数据,是否获得用户授权。其次,判断当事人之间是否具有竞争关系,确认被诉行为对原告的数据权益实有损害。我国《反不正当竞争法》规定,不正当竞争行为是指扰乱市场竞争秩序、损害其他经营者或者消费者的合法权益的行为。司法实践中,法院对竞争关系的认定标准已不再局限于传统的“同业竞争者”。在“腾讯诉搜道案”【参见杭州铁路运输法院(2019)浙8601民初1987号民事判决书。】中,一审法院认为,经营者的生产经营活动只要违反了法律和商业道德、扰乱了市场竞争秩序,即具有了不正当性。但实践中认定竞争关系依旧为适用《反不正当竞争法》的前置条件。最后,分析被诉行为是否具有不正当性,主要分析被诉行为是否违反诚实信用原则或商业道德,并经常涉及当事人间的利益平衡。常见不正当性的被诉行为,例如,违反“爬虫协议”爬取与利用,超出约定范围访问与利用,以获得用户同意之名获取与利用,以及以其他方式获取数据与利用。【浙江省高级人民法院联合课题组:《关于企业数据权益知识产权保护的调研报告》,载《人民司法》2022年第13期。】
与此同时,《反不正当竞争法》保护路径具有“过渡”性质,在相关立法尚未出台的背景下,该路径的出现虽然值得肯定,但并非数据保护的长久之计。第一,《反不正当竞争法》保护范围有限。适用《反不正当竞争法》调整的前提为当事人之间具有竞争关系,虽然我国已将“不正当竞争行为”从传统的狭义竞争关系扩张为广义的竞争关系,【侯利阳:《相对优势地位的理论探索与制度建构——论〈电子商务法〉第35条之适用》,载《竞争法律与政策评论》2021年第1期。】但竞争关系的前置条件在绝大部分类似案件的判定中仍然存在。换言之,无竞争关系的主体对某企业数据或数据集合实施的侵权行为并不受《反不正当竞争法》规制。而近些年,无竞争关系的主体所实施的侵权行为数量不断增多。第二,“一般条款”具有滥用风险。一般条款具有高度抽象性,就《反不正当竞争法》而言,其一般条款高度概括了已类型化不正当竞争行为的共有特征,亦是判别未类型化的不正当竞争行为的原则性条款。【于是:《〈反不正当竞争法〉一般条款适用的泛化困局与绕行破解——以重构“二维指征下的三元目标叠加”标准为进路》,载《中国应用学》2020年第1期。】
(三)商业秘密保护路径评析
在我国法律体系中,商业秘密被纳入知识产权保护客体范畴,但其概念规定于《反不正当竞争法》中,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。据此可知,商业秘密的法定构成要件:不为公众所知悉,即秘密性;具有商业价值,即价值性;采取了相应的保密措施,即保密性。数据只要符合上述构成要件,即可纳入商业秘密的保护范畴。2020年出台的《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》(以下简称《侵犯商业秘密规定》)第1条亦确认了这一点,而数据集合能否落入商业秘密客体的范围,却无相关规定。对于该问题,有学者认为,数据集合是否落入商业秘密客体的范围与数据条目的内容有直接关系,如果数据条目是《侵犯商业秘密规定》所称的“技术信息”或“经营信息”,由此构成的数据集合即可纳入商业秘密保护范围。【崔国斌:《新酒入旧瓶:企业数据保护的商业秘密路径》,载《政治与法律》2023年第11期。】实践中,企业所持有的绝大部分数据属于“技术信息”或“营业信息”,因此,绝大多数数据集合都可适用商业秘密保护路径。
当然,学界对数据集合适用商业秘密保护路径略有争议,即某些数据集合表面上满足商业秘密的秘密性构成要件,但经不起推敲。根据《侵犯商业秘密规定》第3条的规定,不为公众所知悉应包含“不为所属领域的相关人员普遍知悉”和“不容易获得”两部分,既然数据来源处于公开或半公开状态,数据集合就不符合“不容易获得”条件,当然不具有秘密性,无论数据持有人对此类数据集合采取何种保密措施,皆无法被认定为商业秘密而加以保护。
三、数据集合作为商业秘密保护路径的司法适用
目前,法律法规虽构建了数据财产权益保护的法律基础,但仍无法满足数字经济下企业数据保护的需求。在相关立法缺失下,司法任务就是从现有法律框架内求出数据集合保护路径的最优解。有法院案例提出解决数据集合保护问题的路径:如数据集合处于公开状态,并对数据内容的选择和编排具有独创性贡献时,则优先通过汇编作品保护;如数据集合不为相关领域人员所容易获取,则可作为商业秘密保护;如数据集合处于事实上的公开状态并为相关领域人员所容易获取,且数据内容的选择和编排不具有独创性,则可考虑适用《反不正当竞争法》第2条进行兜底性保护。【参见北京知识产权法院(2024)京73民终546号民事判决书。】
但正如上文所述,汇编作品保护路径相较于其他两种,其独创性要求较高,大部分数据集合很难达到《著作权法》意义上的“独创性”标准,并且所保护的客体仅是编排结构本身,因此该路径的适用范围较小,不应作为主流数据集合保护路径。对于适用《反不正当竞争法》第2条的路径,按照“穷尽规则,方可适用原则”的基本法理,一般条款作为原则性条款应当在规则穷尽时方可适用。依据《反不正当竞争法》,权利人可以禁止他人非法获取、披露和使用该数据集合中处于秘密状态的数据条目。从公众的角度看,商业秘密保护覆盖了数据集合中任何具有秘密性的条目,自然也限制了他人对数据集合整体的利用。这一保护力度不亚于数据集合保护专门立法或《反不正当竞争法》对数据集合整体的保护。比如,《欧盟数据库指令》为数据库规定了特殊权利,权利人可以禁止他人获取或利用数据库内容的实质性部分。【Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the Legal Protection of Databases, Article 7.】因此,本文侧重将商业秘密保护作为当前数据财产权益保护的最优路径进行论证。将商业秘密保护作为数据财产权益司法路径,需要审查原告是否有权就涉案数据集合内容主张权利,即认定涉案数据集合的合法性。同时,需要判断涉案数据集合是否符合商业秘密的构成要件,即审查其是否具有秘密性、保密性、价值性。
(一)数据集合的合法性审查
数据收集者在收集数据的过程中,可能侵害他人的在先权益。《数据安全法》《个人信息保护法》均采取以“合规责任”为核心的责任体系,将数据处理者是否适当履行数据合规义务作为责任认定与施加处罚的核心考量。上述规定构成了企业落实数据合规义务的反向激励与刚性保障。然而,当前立法层面的数据合规实体标准有待完善。【齐英程:《数据合规协同激励体系的构建与完善》,载《东方法学》2024年第2期。】
数据集合的合法性是认定原告对数据集合享有权益的前提。其具体包括数据来源的合法性以及数据内容的合法性。《数据安全法》第32条第1款规定:“任何组织、个人收集数据,应当采取合法、正当的方式,不得窃取或者以其他非法方式获取数据。”因此,在数据来源的合法性审查上,法院应当重点关注以下内容:第一,数据收集是否经过授权或许可,是否以不正当方式取得。如收集个人信息是否违反《网络安全法》第41条所规定的合法、正当、必要原则,是否经过数据主体知情同意。第三方企业通过开放平台获取个人信息时,是否经过“个人—平台—个人”的“三重授权”。【参见北京市海淀区人民法院(2015)海民(知)初字第12602号民事判决书、北京知识产权法院(2016)京73民终588号民事判决书。】在缺乏授权或许可的情况下获取数据,通过不正当手段,如黑客攻击、非法爬取等获取的数据显然是非法的。第二,数据收集是否符合行业惯例。如某领域数据收集标准,相关法律、行政法规并未规定,则应当参考同行业数据收集惯例与合法、正当的收集原则,判定收集行为的性质。在数据内容的合法性上,审查数据内容是否影响或可能影响国家、公共安全,承载危害国家、社会、公共安全或其他主体合法权利、涉及国家秘密或法律规定的其他禁止交易或流通的数据应当被认定为非法。
(二)商业秘密构成要件审查
1.秘密性判断标准
商业秘密的秘密性,是指该信息作为一个整体并未被相关人员所普遍知晓(generally known)且不能轻易获取(readily accessible)。数据集合的来源者或处理者可以禁止他人非法获取、披露和使用处于秘密状态的数据集合。收集的数据如果具有秘密性,由此构成的数据集合则具有秘密性。
即使是处于公开状态的数据集合,也应强调该数据集合的任意条目内容被相关公众所普遍知晓或可以轻易获取。如果数据集合的内容被提供给多个用户,且每个用户都承担保密义务,则该数据集合的内容依然处于秘密状态。即便实际获得该数据内容的用户数量很大,也依然如此。【美国联邦最高法院在International News Service v. Associated Press之前的Board of Trade v. Christie Grain amp; Stock Co.案中就已阐明这一点:“The plaintiff does not lose its rights by communicating the result to persons, even if many, in confidential relations to itself, under a contract not to make it public, and strangers to the trust will be restrained from getting at the knowledge by inducing a breach of trust, and using knowledge obtained by such a breach.” 这里的争议信息是交易所的商品价格信息。See 248 U.S. 215 (1918); 198 U. S. 236, 251-252 (1905).】
对于单个数据受控开放的数据集合,如信息查询平台等,认定此类数据集合是否具有秘密性,取决于储存数据集合的后台所采取的保密措施程度与公众通过前台爬取该数据并重新汇总的成本。如数据集合控制者采取合理强度的反爬虫和对数据集合内容进行加密等措施,致使用户获取后台数据并汇总的难度较大,即可认定具有秘密性。相反,数据集合一旦被公开,除非落入《著作权法》保护范围,否则,其传播和利用就不再受到限制。比如,技术信息、科学实验数据和商业经营信息(如股票指数、客户名单等),即便生产或收集耗费了巨大成本,一旦公开就进入公共领域。在著作权法框架下,单纯事实消息或数据集合(假定不具独创性)不受保护,否则会损害公共领域的创作自由和表达自由。【崔国斌:《公开数据集合法律保护的客体要件》,载《知识产权》2022年第4期。】
如果某数据集合仅仅是单个数据的简单相加或汇总,其自然不具有秘密性。但实践中,数据持有人通常会对数据集合进行筛选、整理、加工等,经上述措施处理之后的数据集合是否具有秘密性则需综合考量。对此,应当对数据条目与数据集合的秘密性进行区分,并引入“实质性投入”的标准判断数据集合的秘密性,即数据条目容易获得或被普遍知悉并不等于由此构成的数据集合就容易获得。在认定商业秘密是否“容易获得”时,应当考虑在构成数据集合的过程中是否存在“实质性投入”,并且此“实质性投入”要作扩大理解,其既可能是量上的资本或劳动投入,也可能是质上的劳动投入,即体现了收集者的创造性劳动。总体来说,如果数据来源具有秘密性,那么由此组成的数据集合自然具有秘密性;如果数据集合经过依法有序的数据采集整理、数据聚合和数据分析,已成为生产要素,那么其具有秘密性和价值性。如果数据来源不具有秘密性,但数据收集者或数据持有人对数据来源“实质性投入”,且不对外公开,该数据集合亦具有秘密性。
2.保密性认定标准
只有数据收集者为此类数据集合设置技术措施限制公众对其数据的获取之后,法律才禁止他人对该数据的后续利用。【日本2018年《反不正当竞争法》第2条第7款;韩国2021年《反不正当竞争和商业秘密保护法》第2条第1款第k项。】部分学者认为,采取Robots协议或IP地址限制等技术限制措施是数据集合保护的前提条件。实践中,数据集合的数据处理者绝大多数并不乐见第三方复制自己的数据并对外提供。此时,法律额外要求数据处理者采取技术措施来展现保护意愿,会导致多数数据处理者负担采取技术措施的成本,却不会显著增加公共领域的行动自由。同时,第三方也几乎无需依靠技术措施就能感知多数数据处理者无意容忍平行公开传播行为的主观意愿。【崔国斌:《公开数据集合法律保护的客体要件》,载《知识产权》2022年第4期。】
关于相应保密措施的具体认定,可以参考《侵犯商业秘密规定》第5条规定,并结合数据易复制特点,根据数据集合及其载体的性质、商业价值、保密措施的可识别程度、保密措施与数据集合的对应程度以及权利人的保密意愿等因素,认定权利人是否采取了相应的保密措施。其包括但不限于:签订保密协议或者在合同中约定保密义务的;对数据集合收集者、加工者、访问者等提出保密要求;对数据集合存储地限制来访者或者进行区分管理;以标记、分类、隔离、加密、封存、限制能够接触或者获取的人员范围等方式,对数据集合及其载体进行区分和管理;对能够接触、获取数据集合的计算机设备、电子设备、网络设备、存储设备、软件等,采取禁止或者限制使用、访问、存储、复制等措施(如采取反爬虫措施对数据集合存储与传输加密、脱敏);要求离职员工登记、返还、清除、销毁其接触或者获取的数据集合及其载体,继续承担保密义务。
关于相应保密措施的具体效果,数据集合的保密性认定标准应当是“相对保密”,如果一般人在并未诉诸不法行为的情形下获取信息将变得很困难或代价高昂,那么保密要求就得到了满足。【陈婷:《数据抓取行为的商业秘密规制路径研究——以美国“Compulife案”为视角》,载《电子知识产权》2023年第12期。】例如,数据获取级别的限制、使用技术保护措施以及谨慎的内部数据处理机制,均属于合理的保密措施。【[英]塔尼娅·阿普林:《数字经济中的数据交易:商业秘密的视角》,载[德]塞巴斯蒂安·洛塞等编:《数据交易:法律·政策·工具》,曹博译,上海人民出版社2021年版,第51页。】
3.价值性评估因素
数据本身并不产生价值,其必须经过技术处理转化为能够指导人类行为的信息或知识才能作用于人类认知和客观世界,否则与乱码无异。【齐英程:《个人数据收益共享的法实现》,载《法律科学(西北政法大学学报)》2024年第3期。】数据的稀缺性与可定价性,正是因为数据处理者需要付出相应的劳动与成本,并且数据的供给是有限的,其具有财产价值并可被定价,价值由收集处理数据的社会必要劳动时间和市场供求关系决定。【张新宝:《产权结构性分置下的数据权利配置》,载《环球法律评论》2023年第4期。】
绝大部分数据集合的形成必然要投入人力、物力,因此考虑其商业价值的大小,应当综合考量经营者对数据集合投入成本的大小,涉案数据集合是否具有开源节流、控制风险、辅助决策等商业用途,以及可得利益、可保持竞争优势的时间等因素。实践中,数据产权登记也可以作为价值型认定的参考证据,例如,《数据知识产权登记证》对数据集合的算法应用的价值性,《数据资产登记证》直接对数据资产属性及价值进行评估。
需要注意的是,商业价值包括显在价值与潜在价值,因此不应当要求数据集合必须直接带来实际价值,潜在价值也应当纳入考量因素。
(三)不正当行为认定
除《反不正当竞争法》第9条所规定的传统侵犯商业秘密不正当行为外,还需结合数据集合的新特性对不正当行为范围进行扩张。以美国Compulife案【Compulife Software Inc. v. Newman,959 F.3d1288(11th Cir.2020).】为例,行为人利用程序,通过免费访问网站的方式获取大量数据,该行为违反Robots协议,明显不是传统意义上的盗窃或电子入侵,但行为人使用程序进行数据爬取以创建竞争产品的行为,仍被判定盗用了原告宝贵的商业秘密。因此,针对新型侵犯数据集合类商业秘密的行为判定仍需在司法实践中总结经验。
(四)举证责任分配
“谁主张,谁举证”规定于《民事诉讼法》第67条第1款,是民事诉讼程序中的基本举证原则。如不属于《最高人民法院关于民事诉讼证据的若干规定》规定举证责任倒置的八类案件,则应当适用“谁主张,谁举证”规则。现实中,侵犯商业秘密的方法往往更加隐秘,这就使得原告举证被告使用了不当手段的难度较大,故适用“谁主张,谁举证”规则对原告而言,承担不利后果的可能性较大。我国司法实践更倾向于适用《反不正当竞争法》第32条规定的“实质性相似+接触—合法来源”规则分配举证责任。【杨雄文、黄苑辉:《论大数据的商业秘密保护——以新浪微博诉脉脉不正当竞争案为视角》,载《重庆工商大学学报(社会科学版)》2019年第4期。】
1.“实质性相似+接触—合法来源”规则
《反不正当竞争法》第32条第2款规定:“商业秘密权利人提供初步证据合理表明商业秘密被侵犯,且提供以下证据之一的,涉嫌侵权人应当证明其不存在侵犯商业秘密的行为:(一)有证据表明涉嫌侵权人有渠道或者机会获取商业秘密,且其使用的信息与该商业秘密实质上相同;(二)有证据表明商业秘密已经被涉嫌侵权人披露、使用或者有被披露、使用的风险;(三)有其他证据表明商业秘密被涉嫌侵权人侵犯。”总的来说,在商业秘密侵权诉讼中,举证集中于“接触相似”和“合法来源”两个核心要素。原告负有证明“接触相似”的责任,展示被告所获取商业秘密与其商业秘密在内容上的一致或相似性,以及证明被告有机会获取涉案商业秘密,即存在某种形式的“非法接触”。反之,被告需要就其获取和使用技术秘密的合法性提供证明,这实际上是一种证明责任的倒置,要求被告证明其行为的正当性。【吴汉东:《试论“实质性相似+接触”的侵权认定规则》,载《法学》2015年第8期。】
2.举证责任转移
有学者认为,商业秘密纠纷中“举证难”主要不是举证规则造成的,而是商业秘密的权利属性所致,举证难是其秘密性和保密性等固有特质的产物。【王艳芳:《侵犯商业秘密举证责任的规范分析》,载《知识产权》2023年第7期。】然而,值得注意的是,“举证难”并不当然意味着举证责任轻易转移。《反不正当竞争法》第32条第1款、第2款都提到“权利人提供初步证据”“合理表明”,何为“初步证据”与“合理表明”?对此,针对第1款而言,有一定初步证据证明或者合理表明其为该商业秘密的权利人,同时举证涉嫌侵权人存在侵犯商业秘密的可能,方才允许举证义务倒置。针对第2款而言,可以划分为以下情形:(1)商业秘密权利人对其商业秘密提供初步证据证明或者进行合理说明,且合理表明其存在被侵犯的事实,被控侵权主体才需要对自己未实施侵权行为进行必要的证明。(2)权利人有证据表明被控侵权主体所利用的信息资料与自己的商业秘密具有同质性,并且其存在获取上述信息资料的途径或可能,那么被控侵权主体应当证明其不存在侵犯商业秘密的行为。(3)商业秘密权利人有初步证据证明其商业秘密已被被控侵权主体披露、使用或者合理表明有被披露、使用的风险。(4)其他情形。【王艳芳:《侵犯商业秘密举证责任制度的缺陷与重构》,载《中国法律评论》2023年第3期。】上述内容有助于细化第32条的适用情况,一定程度上防止了举证责任轻易转移。
(五)数据知识产权登记对商业秘密的证明效力
大部分高价值数据同时构成企业的商业秘密,使企业不愿在公开市场交易中直接披露,信息披露问题成为数据交易流通的阻滞因素。有鉴于此,数据产权登记绕开数据内容的直接披露,通过间接传递关于数据质量的信息以促进数据交易流通,为数据知识产权登记与司法案件法律适用提供了支撑。
数据知识产权登记已经在部分省份开始试行。在上文的司法案例中,当事人将自身取得的《数据知识产权登记证》作为合法持有的证据提交,法院在司法裁判中确认该证对数据持有的证明效力,即数据知识产权登记不仅可以作为原告享有数据集合财产权益的初步证据,也可以作为其数据收集行为或数据合法性来源的初步证据,为我国数据知识产权登记实践提供了有力司法支撑,也为数据产品转化为数据资产提供了有益探索。因此,有必要分析数据知识产权登记对数据集合的证明效力。
1.数据知识产权登记的程序审查
作为数据集合赋权与保护的试点,2022年11月,深圳市市场监督管理局印发《数据知识产权登记试点工作方案》。随后,深圳市标准技术研究院建立了数据知识产权登记的配套制度规范——“数据哈希值存证—登记申请—材料审核—信息公示—证书发放”,改革排头兵深圳率先开展数据知识产权登记业务。但数据知识产权登记证书效力究竟如何,并没有统一和明确的认识。本文对七省市数据知识产权登记的审查形式进行了汇总,发现除江苏、山东未明确规定外,其他省市皆规定对数据知识产权登记材料进行形式审查。
从登记的权利客体看,北京、浙江、江苏、深圳均对受保护的权利客体作出了数据来源合法、经过一定的算法加工、具有实用价值及智力成果属性等限定。北京等部分地区规定“处于未公开状态”的限制条件。部分试点地方选择将登记的数据限于未公开数据,这其实遵循的是商业秘密模式,【吕炳斌:《数据知识产权登记:商业秘密模式抑或数据库模式》,载《知识产权》2024年第6期。】亦为司法程序中适用商业秘密保护路径创造了条件。
2.数据知识产权登记与商业秘密的衔接
商业秘密长期以来栖身于《反不正当竞争法》的保护体系,其保护按照行为规制模式,通过对特定行为的反向禁止来实现,而不是对客体进行正面确权,即未将商业秘密上升为绝对权或排他权。【汤贞友:《数据知识产权登记的制度逻辑及完善》,载《知识产权》2024年第3期。】相较于一般条款,商业秘密本就是不正当竞争行为所侵害的客体。由于行为对象明确,商业秘密保护路径可以对具体行为进行规制。其优点在于,区分针对商业秘密和非商业秘密的行为后,对于部分数据利用行为的容忍度更大。依托商业秘密非专有性的保护效果,数据垄断不仅可以被有效避免,还能使企业数据利益与社会公共利益之间达到相对平衡。目前,国际公约和国内立法对商业秘密存在表述上的不同。在国际公约中,会使用“合法持有人”“信息的合法控制人”来称呼商业秘密拥有者。因此,《数据知识产权登记证》可以作为商业秘密持有人的有效凭证,从而保护企业发展核心竞争力,维护竞争秩序。需要强调的是,数据知识产权登记仅是证明凭证,不是一种财产,更非实质性权利。
3.数据知识产权登记在司法中的效力和作用
一是作为数据持有的初始证据。虽然数据知识产权登记不具有确认数据产权的功能,但其具有证明的基础功能,即通过进行数据知识产权登记,并由登记机构颁发证书,可以在数据交易、分配数据收益等情形中起到证明数据权益的归属及内容的作用。【程啸:《论数据产权登记》,载《法学评论》2023年第4期。】司法实践中,可以依据《数据知识产权登记证》对数据集合持有权相关的事实进行推定,如客体、主体、持有状态、持有时间节点等,这与商业秘密的证明要件具有高度契合性。但在提交数据知识产权登记证书的情况下,相对于没有登记的情形,是否适用不同的规则,需要将来在案件审判中确立相应的规则。二是作为相关法律事实认定的证据。例如,登记过程中对于数据合法性基础、数据增加值部分的认定和确认,在具体司法案件中有可能也成为争议点,从而需要法院对于这部分认定的规则和效力进行审查与判断。法院在具体案件中对于登记证书及其法律认定效力的判断和评价,有可能反过来对于登记制度中的相关规则产生影响,加强其中部分规则,促使某些规则和标准进行修改与完善。三是进一步明确数据产权登记行为的作用。通过数据知识产权登记制度来降低数据流通交易成本具有重要实践意义。数据流通中的疑难问题就是如何确保数据来源的合法性,以及保障数据持有者的合法权益,这也是导致数据供给不足的主要原因之一。在本文案例中,一、二审法院均认为,案涉《数据知识产权登记证》可以作为数据集合收集行为或数据合法来源的初步证据。因此,司法实践中数据产权登记将来可以发挥包括争议解决中的权属证明、数据授权和交易中的角色和效力、数据资产化中价值认定等作用,辅之以数据交易流通中合同约定,为符合商业秘密构成要件的数据集合财产权益保障提供充分的救济依据。正如有学者所指出的,数据合同并不会侵蚀知识产权制度,其公平性不宜经由过度赋权数据来源者而矫正,其交易也不必通过事前的绝对排他性财产权而实现。【丁晓东:《企业数据的合同法与侵权法保护》,载《法制与社会发展》2024年第4期。】通过司法确认和司法规则推动的机制完善,数据知识产权登记制度有望在行政机关和司法机关的双重赋能下,在数据要素市场构建和产业激活过程中,承担更加基础性、促进性的重要功能。
四、结语
诚然,有学者认为非公开数据适用商业秘密的相关规则,但企业公开数据无法获得商业秘密权的保护。这使得数据难以投入流通和利用,企业往往会采取措施实现对信息的独占。【参见浙江省高级人民法院联合课题组:《关于企业数据权益知识产权保护的调研报告》,载《人民司法(应用)》2022年第13期;参见程啸主编:《数据权益与数据交易》,中国人民大学出版社2024年版,第213页。】但实践中,更多数据集合是以非公开(或虽然单一数据公开但数据集合未公开)的形式存在,其财产权益保护可以通过商业秘密司法保护路径完成,包括数据知识产权登记在内的数据产权登记可以作为数据集合合规性、持有状态、保密措施及价值性的初始凭证,在数据交易流通中亦可通过合同约定等探索数据权益内容、数据权益的限制以及数据许可使用、数据转让等规则,这更符合数据集合自身特点和实践现状,能更好发挥数据的要素价值。
Abstract:This article discusses the first infringement case involving the “Data Intellectual Property Registration Certificate” for a voice data set in China. The court of first instance held that the data set in question constituted a trade secret, and the “Data Intellectual Property Registration Certificate” could serve as the prima facie evidence for the plaintiff’s legal collection and possession of the trade secret involved. At the same time, the court of second instance considered that the defendant actually engaged in unfair competition under the guise of sharing data, which violated the principle of good faith and business ethics in relevant industry and thus constituted unfair competition. Comparatively speaking, the trade secret approach conforms to the characteristics of data sets and has advantages in protecting the property rights and interests of data sets.
On this basis, this article argues that we should make expansive interpretation of the constitute elements of trade secrets. For example, if a data set is transferred among multiple users and all are obliged to keep it confidential, the confidentiality of the data set can be established. For a data set in public domain, if the data processor takes such measures as appropriate anti-crawling or encryption of the data set, which make it rather difficult for others to obtain and aggregate the data, then the data set’s confidentiality can be recognized. For a non-public derivative data set into which the data processor makes “substantial investments” by way of processing public data, etc, it can also be recognized as having confidentiality.
In addition, data property registration certificates, such as the Data IP Registration Certificate, can serve as evidence of confidentiality and value of trade secrets, offsetting the insufficient publicity in transactions and circulation of data sets when treated as trade secrets. Once a data set enters the public domain and does not meet the requirements for trade secrets any more, other data processors should be allowed to crawl, process and subsequently utilize it.
[责任编辑 邢峻彬]