何 云,濮文辉,黄振远,李 琼,洪青梅*
1. 中国热带农业科学院热带作物品种资源研究所,海南海口 571101;2. 北京航空航天大学软件开发环境国家重点实验室,北京 100191
目前,我国已鉴定的热带植物种类有1.2万种,占我国植物种群数量的30%[1]。热带植物中存在着许多具有特殊价值的基因资源,是我国多种重要战略物资的原材料,在资源利用和集约化生产方面有着巨大的发展潜力。目前我国热带作(植)物种质资源保存数量已达4.7万份,保存于我国热区7省(区)的23家科研机构中。基于信息技术的热带作物种质资源管理是提升种质资源利用效率的新范式。借助信息化平台整合种质资源,通过约定资源配置机制来盘活存量资源,提升资源供给效率,促进热带作物科研、种业的跨越式发展。种质资源管理信息化通过信息管理系统把种质资源收集、保存、鉴定评价、创新、利用等各环节集成起来,共享信息和资源,有效支撑管理者决策,达到激活现有种质资源价值,实现种业乘数效应,扩大热带作物影响力,为我国社会经济发展和国家安全贡献热作力量。近3年,我国已向国内科研和生产单位以及国外的非洲、东南亚国家提供热带作物种质资源共享6万份次,为189个国家自然科学基金、国家重点研发计划等各级各类科技计划(项目/课题)以及国内企业提供了资源和技术支撑,支撑产出论文251篇、论著13部、标准27项、软件著作权10个、专利(含申请)79项、审(认)定品种18个、植物新品种保护权(含申请)12件、科技成果及科技奖励26项。热带作物种质资源共享极大助力国家“创新驱动”“扶贫攻坚”“乡村振兴”“一带一路”等的推进。
传统的信息化管理和安全认证技术具有明显的中心化特性,这与热带作物种质资源的采集环节多、利用链条长、种源基因信息复杂等现状有着难以调和的矛盾。尽管在管理信息化的加持下,热带作物种质资源不断为科研、育种等活动创造价值,为广大从业者带来利益,但也面临着资源流动业务链管理分散、资源及业务链信息数据失真、资源可信惠益分配证据链缺失等问题,主要表现为[2-5]:(1)在种质资源从持有者到共享者的流动中,信息提供主体发生改变,业务管理链条却不能保持前后信息承接的流转链条,导致业务链条信息管理前后脱节,各自为阵,出现信息误差,影响信息管理效率。(2)热带作物种质资源从收集到共享,环节多、周期长,是一个动态的过程,在资源流动业务链中各节点出于利益驱动会随意私自篡改所涉及流程的信息数据,导致资源信息、流程信息失真,给共享各方造成不必要损失。(3)种质资源可信惠益分配证据链不完善。种质资源提供者、共享者的贡献无法通过可信的证据链条得到证明,极易产生利益分配纠纷。目前热带作物种质资源共享者一般以非市场化的方式取得种质资源,种质资源的共享活动没有固定的让渡规则,需要共享双方协商确定,无法通过流程链产生的可信信息形成完整的惠益分配证据链。随着热带作物种质资源共享活动的不断增加,资源的权属、流向、惠益分配等问题对热带作物种质资源共享、利用的制约愈加凸显。与权属相关的数据溯源、安全传输、可信转让等环节亟需可靠、高效的解决方案。而区块链技术具有去中心化、不可篡改、全程留痕、可追溯、公开透明等特点,能够解决信息不对称问题,从而实现热带作物种质资源的众多有关机构和环节的协作信任与一致行动,可以有效地解决上述问题和挑战。
目前,国内将区块链应用在农作物种质资源管理的研究主要集中于数据管理层面。中国农业科学院作物科学研究所刘海洋等[6-8]针对种质资源管理工作中的数据溯源、安全传输、品种确权等问题,提出了基于区块链的解决方案。将当前农作物种质资源数据管理模式中的数据传输节点按照区块链中的网络节点进行建模,将数据采集、存储、共享分成三大类型(完备级、次完备级、普通)节点;根据数据标准规范及区块链存储特征对作物种质资源进行存储;节点之间进行数据共识则通过“双中心化”节点;种质资源数据加密主要通过非对称加密技术。高阳阳等[9]将区块链技术应用于品牌农产品溯源,将品牌农产品关键生命周期信息上链,采用多方验证参与的模式,基于区块链分布式存储、点对点传输、共识、可溯源、不可篡改等技术特性,构建整个品牌农产品的全产业链关键信息强信任背书追踪溯源能力。
自从2008年NAKAMOTO[10]提出区块链以来,建立了以区块链技术为基础的比特币网络,网络中的节点均存储有记录网络交易信息的账本,采用了P2P技术[11],可以跳过第三方机构直接进行金融交易,其底层的区块链技术逐渐引起了产业界的广泛关注[12]。随着技术的发展,人们对其进行不断更新演进。其中,智能合约应运而生,即第三代区块链技术[13]。目前,区块链作为一种新兴创新技术,已融入不同行业、不同领域、不同产品中[14-17],促进产业更新升级。
区块链系统层次架构如图1所示,包含数据层、网络层、共识层、激励层、合约层和应用层[18-21]。其中,数据层为区块所含数据,即数据加密、时间戳等基础数据和基本算法;网络层包含分布式网络、数据传播、数据验证方法等;共识层包括区块链节点达成共识所需要的各类共识算法如PoW、PoS等;激励层主要包括激励的发行和分配方案等;合约层主要包括链上脚本、算法和智能合约,是热带作物种质资源管理与服务区块链系统的研发重点;应用层主要包括各种场景下的应用程序。
图1 一般区块链系统的层次架构Fig. 1 The hierarchical architecture of a general blockchain system
在区块链的层次结构中,位于合约层中的智能合约(smart contract)可以通过编程方式在一定条件下自动化完成区块链上一系列操作,是支撑和灵活实现各类型交易流程的基础,也是按需构建各类型应用服务的关键。此外,区块链系统中的智能合约模块还需对区块链网络的链码进行编译、维护等操作,并且为系统的其他基础模块和审计模块提供灵活、关键的中间支持。
区块链主要包括公有链、联盟链和私有链3种类型。其中,公有链较为开放,难以管理;私有链的应用场景较窄,缺乏开放性;联盟链能够很好地对链上数据隐私问题进行控制,且具有一定的开放性。因此,联盟区块链技术适用于热带作物种质资源管理服务的应用场景。本研究提出的技术方案选用联盟链类型,构建面向我国热带作物种质资源管理与服务的区块链系统。
面向热带作物种质资源管理的区块链系统(Blockchain System for Tropical Crop Germplasm Resources Management, BTCGRM)分为3层:底层支撑层、服务管理层和应用层。底层支撑层提供区块链的支撑技术包括数据存储结构、网络通信、共识算法、激励模式以及智能合约执行环境等核心技术,实现弹性存储管理、热插拔数据库管理、容器管理与集群管理等;服务管理层包括智能合约管理、安全管理、运营监控、查询引擎、区块链开发SDK等核心服务,并向上层提供区块链数据访问和修改、智能合约管理和访问控制的API;应用层则构建面向种质资源管理与服务的应用,也是资源管理系统与区块链系统交互的核心。其层次架构见图2。
图2 BTCGRM的联盟区块链Fig. 2 Consortium blockchain of BTCGRM
在热带作物种质资源管理与服务区块链中,通过执行不同的智能合约所产生的交易来完成对种质资源的各类型操作(收集、保存、鉴定、上链、浏览和交易等)。BTCGRM架构为联盟链,由异地多节点组成,节点之间使用PBFT(practical byzantine fault tolerance)算法形成共识,该算法形成共识的操作流程如图3所示,其中C为客户端,0~3表示服务节点,0为主节点,3为故障节点。整个算法的基本过程如下:客户端发送请求(request),激活主节点(0)的服务操作;当主节点接收请求后,启动3阶段的协议以向各从节点广播请求。所有节点拥有完整区块链数据并运行相同智能合约,对提交到核心节点的种质资源操作信息进行审核记录。系统中所有对种质资源操作的行为由智能合约进行约束、管理和记录。
图3 PBFT共识算法流程Fig. 3 PBFT consensus algorithm flow
在种质资源管理与服务区块链网络中,主要包括集中架设的CA节点和Orderer节点,统一监管平台、统一服务平台、服务方在线服务系统、所有方在线系统均需架设的Peer节点及多类型的终端用户Client节点(图4)。
图4 BTCGRM技术架构Fig. 4 Technical architecture of BTCGRM
(1)CA节点。主要任务是通过对加入链内的所有节点(包括上层的终端用户)颁发证书来实现对节点的授权认证,各节点使用证书作为交易流程中的身份识别,其中通过证书认证身份合法性的步骤如下:①客户端收到证书后进行证书的有效性验证;②客户端使用本地公钥对收到的服务端传来的证书进行解密,得到证书明文和数字签名;③CA公钥解密数字签名,拿到数字摘要;④hash证书明文本地生成数字摘要;⑤校验数字摘要是否相同(相同则代表证书明文未做过篡改);⑥利用服务端的公钥,利用公钥交换对称密钥进行之后的加密通信。
(2)Peer节点。参与交易的主体代表每个参与到链上的成员,负责储存完整的账本数据即区块链数据,负责共识环节中智能合约的执行。其中维护完整账本数据的Peer节点称为记账节点(Committer),并根据具体的业务划分背书策略决定。每个参与到链上的成员都是一个Peer节点,是参与交易的主体,负责储存完整的账本数据即区块链数据,负责共识环节中智能合约的执行。其中根据节点在交易中的不同角色可以分为背书节点(Endorser)和维护完整账本数据的Committer。
(3)Orderer节点。该节点主体功能是收集网络中的交易请求并对交易排序,排序的原则为First in First Served(FIFS),是由到达Orderer的时间来决定,从而保证各Peer节点上的数据一致性,然后打包产生新的区块,此外还包含ACL访问控制。
(4)Client。Fabric对各种类型的终端用户提供了SDK,开发人员可以使用SDK发起交易,能够更容易地对接到区块链内的交易环节。
为了兼顾热带作物种质资源易于管控和灵活、可信服务的2种需求,在热带作物种质资源管理与服务区块链中,共设置4种角色。
(1)种质资源监管方:依托中国科技资源共享网和中国热带农业科学院热带作物品种资源研究所,联合建设种质资源监管平台,行使管理和考核评价职能,包括种质资源采集监控及统计、种质资源流转监控及统计、种质资源数据质量评测、用户满意度调查、服务性能监测等具体管理任务;
(2)种质资源服务方:依托中国科技资源共享网和中国热带农业科学院热带作物品种资源研究所,联合建设种质资源服务平台。还包括为种质资源需求使用方提供各类服务的其他机构,包括已经建立的国家热带植物种质资源库,以及其他社会资金建设的种质资源库、各育种机构等。以上种质资源库和机构均应建立自己的在线服务系统(如网站);
(3)种质资源所有方:种质资源的产权或其他同类型权益的所有方,既可以独立加入种质资源管理与服务区块链,也可以委托种质资源服务方代理。在有些情况下,种质资源服务方自身也可能持有种质资源的所有权,此时将兼具种质资源服务方、所有方双重角色;
(4)资源需求使用方:种质资源的终端用户,包括(国内外)科研机构、企业或个人等。
在BTCGRM中,一个典型的共享流程如图5所示。详细共享流程如下:
图5 BTCGRM典型共享流程Fig. 5 Typical sharing flowchart of BTCGRM
(1)首先由Client(监管方用户、服务方用户、所有方用户或者种质资源需求方用户)发起共享请求。
(2)根据事先指定的背书策略,要求监管方Peer节点、所有方Peer节点和服务平台Peer节点中的部分节点参与共享活动,因此Client将请求分别发给对应的Peer节点。背书策略主要包含主体、门阀阈值。主体定义了期望的签名来源实体,门阀阈值包括阈值和主体,如T(2, ‘A’, ‘B’, ‘C’)表示需要A、B、C中任意2个主体的签名背书。
(3)每个Peer节点接收到Client节点的共享请求后,执行各自对应的智能合约产生交易并签名后,分别将输出结果返回给Client。
(4)Client在收到所有交易后打包一起发送到Orderer节点。
(5)Orderer节点将接收到的此次共享在共享池里进行排序并组合打包生成一个新的区块,Orderer将新的区块发送给所有的Peer节点。
(6)每个Peer节点接收到新区块后,对其中的每一笔共享结果的签名进行验证是否符合背书策略,并比对读写集合(Read-Write Set)与本地的版本是否相同,如满足所有条件则将新的区块写入本地账本内完成交易。
测试环境为MacOS系统,运行在Mac mini 8G 512G版本的电脑上,使用Java语言搭建热带作物种质资源管理服务系统,系统首页如图6所示。
图6 热带作物种质资源管理服务系统首页Fig. 6 Home page of Tropical Crop Germplasm Resources Management Service System
用户可以登录网站,对需要了解的种质资源进行搜索,也可以查看种质资源的统计分类、种质圃(库)、种质新闻以及特色资源,并能通过QQ、电话等方式联系到系统管理员。管理员将时政新闻发布在新闻资讯栏目,新闻详情页面包含当前所在位置、新闻标题、新闻内容、资讯来源、发布时间、浏览量等信息,数据从数据库实时获取,保证了新闻的时效性和发布内容的可控性。
同时,系统管理员还可以在系统后台实现新闻的发布、种质资源的管理、新增、认定、上链等功能。种质资源信息由管理员或用户提交,经由执行智能合约、产生交易、打包为区块,达成共识提交至区块链,种质资源的上传、下载、传输、授权等过程信息均存储在区块链网络的区块内,包含种质资源基本信息、收集信息、保存信息、鉴定信息、共享信息等模块,实现了对种质资源数据的保护确权,结合区块链技术实现对种质资源的管理和服务。
系统主要包含资源管理模块、文章管理模块、消息管理模块、区块链管理等模块,各模块主要负责功能如下:(1)资源管理模块。对于所有纳入系统管理和服务的种质资源,种质资源各方应提供种质资源在全生命周期各环节的详细数据,包括采集、培育、利用等操作记录和相关数据;(2)文章管理模块。负责系统中的新闻、科技咨询等文章编写与发布;(3)消息管理模块。负责对种质资源反馈、意见提交处理等;(4)区块链管理模块。主要负责种质资源溯源、智能合约部署、区块链节点管理、区块信息查询等。
系统的核心流程如图7所示。在系统中资源管理角色主要分为:采集员、鉴定员、保存员、共享人员、区块链管理人员、普通人员。各人员的功能如表1所示。
表1 资源管理角色对应功能Tab. 1 Resource management roles corresponding function table
图7 热带作物种质资源管理系统核心流程图Fig. 7 Core flow chart of tropical crop germplasm management system
热带作物种质资源管理服务系统中资源上链算法流程如表2所示,其中表2算法流程中第5步服务器与区块链节点进行上链交易的共识过程可分为4步:(1)各节点独立执行自己的区块;(2)区块链节点间交换各自执行结果;(3)统计交换结果;(4)如超出2/3的节点执行结果相同,则进行交易、出块操作,否则交易失败。
表2 系统算法流程Tab. 2 System algorithm process
本文针对当前热带作物种质存在的资源流动业务链管理分散、资源及业务链信息数据失真、资源可信惠益分配证据链缺失等问题,结合区块链技术提出了热带作物种质资源管理区块链系统方案,利用区块链的分布式架构、去中心化、不可篡改等特点,实现了在热带种质资源的全生命周期中,对种质资源的各种处理做到全程留痕,以满足在任意环节发起对种质资源的精准溯源。最终加强和促进热带作物种质资源的管理与服务,由此推动并带动区域产业发展升级,解决信息不对称问题,为今后农业领域与计算机领域相结合、资源溯源问题等研究工作奠定基础。但该系统也存在一定的不足之处,如系统在溯源中会产生较多的区块,需要进一步对合约优化;系统对多资源同时上链会有一定的效率低下问题,需要采取多线程进一步优化。