庄 严 杨 帅 刘照坤 樊景超 周舒雅
(1.中国农业科学院科技管理局,北京 100081;2.苏州市农业科学院,苏州 215155;3.中国农业科学院农业信息研究所,北京 100081;4.国家农业科学数据中心,北京 100081;5.农业农村部农业大数据重点实验室,北京 100081)
农业科学观测数据是基于长期、定位的观测监测站点和数据平台,对农业生产要素进行动态观测、监测、考察或调查,并将获得的原始基础数据、衍生数据以及元数据在科学数据共享网络与平台上汇交,最终形成的全新要素。作为农业生产系统中的信息载体,农业科学观测数据已成为大数据时代最重要的现代战略资源[1]。随着数据密集型科学研究“第四范式”的兴起,农业科学观测数据在农业科技创新和政策制度创设等方面的基础支撑作用日益凸显。
农业科学观测数据因其独特的科学价值,广泛应用于全球农业研究各领域。早在150 年前,英国建立洛桑试验站,构建了7 个长期定位观测“经典试验”,累计保存了超过30 万份土样,形成了海量的观测数据,为研究土壤性质、环境变化规律提供了宝贵的原始资料[2]。基于洛桑试验站长期试验及其保存的土壤样品建立的全球首个土壤碳循环模型,已被广泛应用于全球气候变化中不同耕作系统土壤碳量变化的预测[3]。此外,农业科学观测数据在解决农业重要产业问题中发挥着重要作用。例如,2018 年,我国依托迁飞害虫监测预警体系,实时获取跨地域、多台站迁飞害虫监测数据,科学预测了缅甸地区草地贪夜蛾进入中国的迁飞路径和关键入侵时间,及时组织全国范围内开展区域联防和统防统治,有效降低了害虫的种群规模,使北方玉米免遭损失[4]。
长期以来,农业科学观测能力反映了一个国家农业科技基础水平和实力,具有潜在的开发价值,因而受到世界各国的高度重视[5-6]。基于农业生产要素的动态演变规律,美国、俄罗斯等国家设计长期定位观测方案与标准体系,系统性收集、获取并整理加工形成的科学数据,构建了美国LTAR(Long-Term Agroecosystem Re‐search Network),俄罗斯GEONET(Geographical net‐work)等观测体系,服务本国农业生产和农业科技创新。为进一步加强农业科学观测数据获取、管理与挖掘应用,2017年我国正式启动了农业基础性长期性科技工作,面向种质资源保护与利用、土壤改良、农作物病虫害防控、畜禽疫病防控等领域,搭建了“数据总中心—观测数据中心—观测实验站”为主体的三级网络体系,形成了优势科研院所主导数据管理,中央—省—地市农业科研院所广泛参与农业科学观测数据生产与共享使用的新格局,对保障国家粮食安全、实现农业高质量发展及提升农业科技创新动能具有重要意义。
然而,农业科学观测数据在实际应用中依然存在生产过程复杂、数据主体多元、数据存放分散等瓶颈问题,严重制约着农业观测数据共享应用的深度和广度。特别在现行知识产权法律法规体系下,农业科学观测数据的权属尚且缺乏明确的科学界定,保护路径仍然不够畅通,使得农业科学观测数据在开放共享过程中,数据生产、管理、使用等利益攸关方存在“不愿、不敢、不会”的“三不”问题[7],导致数据在拥有群体“内部封闭式循环”现象较为普遍,对外公开共享较难。全球农业及营养开放数据组织指出,数据权属(特别是所有权方面)缺乏有效制度安排,数据所有者无法从开放共享数据过程中获得利益,制约着数据在农业产业与社会经济活动中良性循环。由此可见,权属界定已成为农业科学观测数据打破“三不”怪圈的源头性问题。
数据权属的构成与界定受到了利益攸关主体认知水平、信息技术水平、数据分析挖掘能力等多方面因素影响而产生较大差异[8]。目前国内外学者对数据权属的研究主要集中在主权和产权两方面。曹磊、肖冬梅[9-10]等学者认为,数据权包含以国家为实施主体的数据主权和以公民为实施主体的数据权利两大范畴,前者注重数据安全保护,后者侧重数据资源的产业化发展。数据主权是我国数据权属研究的焦点。冯伟和梅越[11]认为,数据从生成到应用各个环节均应该通过法制建设强化保护,以避免我国在发生数据资源跨境传输中产生数据泄露、受制于人的被动局面。部分学者注重以物权角度审视数据资源属性,Wallis和Borgman[12]认为应该通过拥有对科研数据的所有权来承担数据责任;Chisholm[13]鉴于数据权属界定难的问题,创造性地提出了以RACI(Responsible,Ac‐countable,Consulted,Informed)模型来梳理数据利益攸关方责权利问题。黄立芳[14]人指出,应以知识产权属性角度对数据产权加以界定和保护,制定数据产权法律法规,设立专业数据产权服务机构,以促进数据产品的确权与交易流通。
本文旨在系统梳理了我国农业科学观测数据治理体系的现状,分析了农业科学观测数据确权与保护面临的问题,并以资产角度划分农业科学观测数据的权属,提出了我国农业科学观测数据保护路径,为全面推进我国农业科学领域迈向数据密集型研究范式提供理论支撑。
在全球数字化深度变革的大背景下,数据治理体系已成为挖掘数据资源价值、支持技术创新和机制创新的重要手段。数据治理协会(Data Governance In‐stitute,DGI)、IBM 数据治理委员会(IBM Data Gover‐nance Council)、国际数据管理协会(The Global Data Management Community,DAMA)等全球性研究机构对数据治理进行了组织、原则、要素模型、过程规定进行了系统性阐释[15]。2018 年我国发布的《GBT 34960.5-2018 信息技术服务治理第5 部分:数据治理规范》将数据治理定义为“数据资源及其应用过程中相关管控活动、绩效和风险管理的集合”[16]。一直以来,数据权属与保护问题是深化治理体系创新与探索的重要内容。
农业科学观测数据是农业科学观测活动中所产生的基本数据系统加工整理的数据集合,凝聚了科学家智力劳动,但与信息、医疗等学科领域不同,农业科学观测数据在时空属性、资产属性、权益属性等方面具有独特的特征,客观上加大了数据治理的难度。
(1)数据积累时间跨度大、周期性强。农业观测数据主要用于数字化记录农业各类自然要素、生产要素的长期演变规律,该类数据时间尺度跨度大,往往基于10 年以上甚至数十年的连续观测记录,部分数据根据农时变化还会发生周期性演变交替。
(2)数据采集需要规范规定,关联性强。数据采集是由数据生产者按照统一的观测方案、遵循一定的观测标准获得,种质、昆虫、土肥等各学科数据间往往存在较强的关联性,农业学科间数据交叉融合越充分,越有利于挖掘自然规律和指导生产。
(3)数据产生涉及多元主体,确权难。农业科学观测数据在生产、加工、挖掘、共享等阶段涉及到数据的生产者、管理者和使用者等多类主体。如何兼顾数据生产者的知识产权保护、数据管理者的应用授权分配、数据使用者的共享应用许可等多主体权益,尚存诸多难题。
(4)数据价值评估缺乏计量标准,资产化难。因种质、土壤、植保、农产品质量等不同领域、不同环节的观测数据,在数据类型、结构模式等方面存在差异,尚未形成广泛接受的计量性方法,致使大量存在于网络空间的农业科学观测数据无法划定其权益归属、无法评估其数据价值、无法转化为计价资产,进而无法实现开放共享。
在农业科学观测数据生产到共享应用的过程中,由于其特殊性,为数据的开放共享的造成了一定客观障碍,从不同利益攸关主体需求角度讲,还存在以下几方面难点问题:
(1)知识产权保护体系不健全,数据生产者共享意愿不强。尽管农业科学观测数据对农业科技、农业产业发展具有巨大价值性,但由于知识产权保护体系不健全,数据生产者投入时间、精力获取的宝贵数据容易被零损耗复制、传播,导致数据共享意愿不强。
(2)数据共享管理制度不完善,造成潜在侵权风险。数据管理者在管理实践中,面向数据使用者如何设置开放范围、防止侵权与剽窃、在合法合理基础上开展有偿数据流通等活动缺乏法律依据和路径参考,一旦数据发生侵权事件,数据管理者无法有效保护数据生产者利益。
(3)数据资源开放存在技术壁垒,易形成利益攸关主体间沟通壁垒。数据使用者获取数据后的开发利用行为缺乏相关的技术性约束,从事农业科学数据生产和管理的具体人员往往不具备数据库、软件等相关管理技术技能,无法支撑数据生产者、管理者和使用者之间的沟通交流和共同开发[7]。
数据权属问题是网络和信息技术发展过程中出现的一个全新问题,其产生根源在于个人、企业和国家在网络和信息技术的冲击下不断地被数字化和虚拟化,个人生活、物质生产和意识形态更易被渗透和重塑。随着互联网、云计算、大数据等技术的快速发展,全球数据量呈现出爆发式的增长,数据的流动属性和资源属性不断增强[8]。我国在农业科学观测数据权属方面还存在生产主体多、生产周期长、信息素养不高、法律意识陈旧等问题,诸多因素叠加造成了数据共享“不愿、不敢、不会”问题的复杂化、难治理,亟需从“数据资产”的理念角度重新审视、推动数据资源确权工作[17]。从长远看,科学数据资源的可计量资产化将成为发挥其战略作用的必由之路。因此,根据特征属性对农业科学观测数据权属进行原则性界定,已成为是保护利益攸关方合法权益的“先决条件”。
农业科学观测数据的所有权归国家所有,国家农业农村行政主管部门作为行使权利主体,拥有处置农业科学观测数据的最高权利。尽管未来在数据共享流通过程中可能存在数据交易相关的市场行为,但由于该类数据属于政府资金支持下科学活动产生的公共数据资源,具有规模大、公益性、部分可能涉密等多元性特点,因此在法律意义上,该类数据应属国有数据,其各利益攸关方均应在农业农村部及地方农业农村主管部门等资助单位的授权下行使相关权利并履行相关义务。
农业科学观测数据的生产权来源于农业农村部的授权,观测实验站及数据中心法人单位为行使权利主体。农业科学观测数据并非由个人意志产生的一般科学数据,而是以国家农业发展重大需求为导向,多领域科学家共同规划设计,中央—省—地方涉农科研单位广泛参与而获取的农业科学基础本底数据,该科学活动行为应获得国家主管部委的授权许可。数据生产权包含数据标准制定权、数据采集与修改权、数据汇编加工权等权利。数据标准制定权是指数据中心在农业农村部授权后,对本领域数据采集方法、观测指标体系、元数据进行统一规范制定的权利;数据采集与修改权是指观测实验站按照数据中心标准开展数据采集以及必要的修正、校准、注释、解读等工作的权利;数据汇编加工权是指数据中心与观测实验站基于统一采集的原始观测数据,开展数据加工、分析、挖掘、汇编等有智力劳动投入的工作,以实现原始数据的脱敏与价值倍增的权利。
农业科学观测数据使用权来源于所有权人的授予,数据使用者须尊重数据生产者的合法权益。由于农业科学观测数据使用及授权使用的行为通常是经过线上门户平台来实现的,使用权的转移并不会影响数据的折旧损耗与品质下降,因此需要农业农村部要求平台法人对使用者明确政策、协议、技术方面的限制措施,在农业农村部、省级农业农村主管部门以及观测实验站、数据中心优先使用的原则下划定数据使用等级,明确数据使用者在引用、标识方面的义务,限制使用权的转授、剽窃等行为。此外,数据使用权的授予应该基于数据进行分级分类管理体系开展,农业科学观测数据按照产生方式分为原始数据、衍生数据和元数据三类,原始数据是农业长期定位观测获取的一手数据,衍生数据是对原始数据加工后产生的间接数据,元数据是对前二者进行描述的数据;按照开放程度分为不公开数据及公开数据两级,其中关涉国家主权安全、原始数据原则上不予公开使用,前者遵照国家相关保密规定使用,后者根据数据生产者意愿限制性使用。
农业科学观测数据的出版权来源于所有权人的授予,原则上由数据生产者优先享有。数据出版是农业科学观测数据产出的重要形式,包括科学数据集、数据论文等具有知识产权的产品。此权属界定应遵循“尊重原创,兼顾公平”的原则,观测实验站及数据中心的权利界定应视其对数据产出的贡献程度,在农业农村部及省级农业农村主管部门指导下合理划定。
农业科学观测数据交易权应由所有权人授权数据平台法人获得,数据交易所得应在按相关管理办法下进行分配。农业科学观测数据对于农业相关产业具有较高价值性,农业农村部通过委托线上平台法人对数据进行加工、整理,形成可计量的数据产品后,进而开展交易活动,农业农村部在充分尊重数据生产者贡献的原则下,对收益进行分配,推动形成数据生产者、数据管理者、数据使用者间价值流通的良性循环。
由此看来,农业科学观测数据通过明确数据相关权属的划分原则,可以有效理顺数据生产者、管理者和使用者三者间的权益关系,为数据最大程度的开放共享建立框架体系。
基于农业科学观测数据治理的特殊性和权属分析,本文建议针对利益攸关方在开放共享中的痛点难点问题,设计一揽子政策与技术保障体系,为实现农业科学观测数据开放共享保驾护航。
(1)优化我国农业科学观测数据保护环境。在《民法典》《科学数据管理办法》《农业科学观测数据管理与开放共享办法(试行)》等法律法规和制度章程基础上,推动各级农业行政主管部门、涉农科研院校等利益攸关主体的相关单位积极出台农业科学数据管理制度,细化不同领域、不同专业数据的定义范围、权属划分、侵权救济方式等,全面加强我国观测数据权属划分与保护。
(2)积极推动国家级数据共享平台确权与授权体系建设。数据共享平台作为政府部门向数据使用者授权的关键媒介,亟需构建数据权属与数据保护一体化的技术管理体系。在对农业科学观测原始数据进行标准化、格式化处理的基础上,根据不同应用需求,整理形成可计量的数据产品;通过国家级数据共享平台对数据生产者单位和人员加以确权,明确每件数据产品的知识产权归属;借鉴国际数字化产品管理经验,如iTunes音乐商店,通过许可使用时间限制、地域限制、平台限制、角色限制等方式,对农业科学观测数据的使用权进行细化,对使用者实现留痕备案管理,以技术、协议方式防范售卖、转发等侵权行为发生。
(3)引导激励农业科学观测数据出版。农业科学观测数据利益攸关方可通过科学数据集、数据论文、数据仓储等模式推动数据出版工作,一方面通过出版过程中专家的评审逐步提升农业科学观测数据的质量,另一方面通过数据维护、元数据构建、数据开发技术进一步加强数据管理者对数据的有效管理,打通不同学科、不同来源数据间的互操作性、可重用性,消除数据壁垒,实现多学科农业科学观测数据的互联互通。
(4)加快推广中国科技资源标识应用。科技资源标识体系是科技资源管理与开放共享架构的关键,广泛应用的数字对象唯一标识码DOI,为论文、数据等分配了永久唯一的标志符,在科学数据出版中具有跟踪、引用、关联等价值,助力科学数据共享[18]。当前,我国正在开展科技资源标识体系的建设工作,中国科技资源“CSTR”标识将成为纳入标识体系所有科技资源的统一代号。农业科学观测数据可以数据集、数据论文等形式,获得唯一的CSTR 科技资源标识符,促进我国农业科学数据资源开放共享与管理使用。
(5)探索构建封闭数据流通技术体系。面向开放共享的数据组织模型也可以成为农业科学观测数据开放共享的重要技术手段。例如朱扬勇等提出的数据盒模型[19],数据使用者通过提交数据使用申请,获得具有隐私保护的数据访问权限,并利用一定技术手段防范避免数据使用者利用数据拼图等非法手段获取被保护的数据资源。此外,该模型的可计量技术算法可对每件数据产品进行定价,破解数据开放共享“不愿、不敢、不会”的难题。
我国农业科学观测数据资源极为丰富、数据生产能力巨大,但距离数据开放共享尚需较长道路要探索。从数据资产管理发展阶段来看,解决农业科学观测数据的权属界定和保护路径问题仅仅是数据治理的初级阶段。本文从农业科学观测数据治理体系、治理对象、权属界定分析等角度,提出了兼顾不同数据利益攸关方合法权益的建议措施,我国需要进一步借鉴国际上先进的数据治理经验,结合国内实际,加快完善符合国情的农业科学观测数据知识产权保护法律法规,在数据开放共享中通过政策和技术措施来满足不同主体的利益诉求,多措并举构建数据确权和保护的制度体系,以提高数据的利用率,优化数据资源配置,更好地为农业科研和农业发展服务。