李阳 赵启阳 何云 濮文辉 李琼
(1.北京航空航天大学/软件开发环境国家重点实验室 北京 100191;2.中国热带农业科学院热带作物品种资源研究所 海南海口 571101)
农业种质资源包括作物、畜禽、水产、农业微生物等,是遗传信息由上一代传给下一代的载体。简单地说,农业种质资源是农产品的最初源头,也是人类赖以生存和发展的重要物质基础,是重要的国家战略资源。目前市场中种质资源的窃取、假冒、滥用等问题较为严重,种质资源的重要基因信息的安全保护同样面临困难,这些问题都需要引起足够的重视,以防止重要种质资源流失。
面对这些问题与难点,需要利用先进的软件技术与工具,设计一个热带种质资源信息管理及溯源方法,构建更加安全高效的管理平台,以推动种质资源的采集保存与开发利用,加强种质资源的全面管理。2019年,刘鹏飞等[1]提出基于软件工程的基本思想,即利用UML建模,结合Hyperledger Fabric 1.0开源区块链结构,将药品溯源中所有的标准信息化,永久记录在区块链账本中,做到从药品生产到流通、使用全程可溯源[1],如查询药品基本信息、查询药品成分和中转信息等,可有效避免传统溯源系统存在的成本高昂、效率低下、数据造假等问题[2],在药品供应管理体系中建立起信息共享的相互信任机制。中国农业科学院作物科学研究所刘海洋等[3-5]提出的区块链存储模式是对数据传输节点按照区块链中的网络节点进行建模,将数据根据规范存储在区块链中,数据共识由“双中心化”的网络节点来达成,利用非对称加密技术,使用数据提交节点的私钥在数据通过审核后对其进行签名,进而实现对数据的加密。目前在种质资源管理平台上对于区块链的应用,并非完全“去中心化”,在种质资源审批的过程中,仍然需要中心化机构的参与,这使得平台的底层架构依旧类似于传统的中心化架构,计算效率不高,交易流程上也有不足,难以满足更大的用户量与数据量、实时交易、便捷溯源等需求。
本文基于区块链技术,设计了一种热带作物种质资源登记与溯源方法,可将种质资源生命周期中不同环节的新增信息加上时间戳打包成区块上链,由于区块链技术本身的特性,上链后的区块是天然可溯源的,可以方便地追溯种质资源生命周期中信息的增加与修改。由于区块链本身具有集体维护和不可篡改等特点,保障了种质资源的存储与数据安全,如果资源在某个环节上出现了流失、篡改或伪造等问题,也易于通过溯源查找到责任方[6]。
区块链由Nakamoto[7]在2008年首次提出,以区块链技术为基础,建立了比特币系统架构,这是一个点对点式的电子现金系统[8],是去中心化的分布式系统,双方在进行在线交易时可以直接面向对方进行交易,而不必通过第三方机构。比特币金融系统自启动起,一直在稳定地运行和发展。而比特币分布式的底层结构也开始被信息从业者注意和讨论[9],人们将这种基于分布式数据库的技术称为“区块链”技术。相较于传统的中心化体系架构,区块链作为一种去中心化基础架构和分布式计算范式[10],具有去中心化、集体维护、不可篡改、时序数据、可以追溯等特点[11-24],能够更好地与种质资源采集、保存、利用及其复杂的基因信息等特点相适应。区块链不将数据库建立在中心机构上,而是建立分布式系统结构,在分布式节点间通过纯数学方法建立信任关系,进行数据的验证、记账、存储、维护和传输等,保证去中心化分布式系统的可信任性。区块链系统的不可篡改性通过区块链技术中的非对称密码学原理对数据进行加密来保证;此外,分布式系统的部署也使得对某一数据的篡改在系统各个节点强大算力的抵抗下无法实现[25];区块链的数据存储在链式区块结构中,除了数据原本的字段外还增加了时间戳,增加了数据的时间维度,基于此可对数据进行验证与追溯[26];区块链为用户提供的脚本系统可由用户根据自身需求自行编写智能合约,使得对区块链的应用更加灵活[27]。随着区块链技术的发展以及信息数据存储需求的增加,传统的区块链中所部署的脚本已难以满足日益复杂的需求,区块链技术逐渐发展至第三代[28],“智能合约”的出现使得根据需求自行设定区块链交易规则得以实现。现如今,区块链技术已经被应用到金融、物联网和物流、公共服务、数字版权[29]、保险、公益、医疗[30]等领域中,为这些领域数据与信息的管理与溯源提供了强大的技术支撑。
生物多样性是人类生存发展的关键所在。对生物多样性的保护核心在于生物种质资源多样性的保护和发展[31]。生物种质资源的保护对于国家可持续发展以及人民生命安全具有重要意义,针对生物种质资源建设信息化平台符合国民经济和国家安全的需要,开展种质资源保护并使其健康发展是国家长期规划的重要内容[32]。丰富优质的种质资源是选育优质农作物品种的基础,优质农作物品种是提高农作物产量的基础,农作物品种与种质资源密切相关[33]。美国在农作物种质资源保护方面走在世界前列,其最早开展农作物种质资源信息共享与利用方面的工作,对农作物种质资源进行了全面规范的标准化整理和数字化表示,实现了对农作物种质资源的信息化管理[34]。现有种质资源数据量较大,利用传统人工对种质资源进行管理服务的方法效率较低,难以避免数据篡改等问题。本文通过对种质资源进行信息化、数字化及高可信化转换,实现数据的比对、挖掘、可视化,发现种质资源间的潜在规律和隐含价值。
针对当前热带种质资源数量多、管理效率低、信息化程度低、可信化实现难等问题,提出了一种热带作物种质资源溯源技术。该技术利用区块链技术的去中心化、不可篡改、可溯源等特点,设计开发了种质资源溯源区块链系统,系统的基础架构如图1所示。区块链系统架构主要分为合约层、应用层、管理层、基础设施层和节点。层级之间相互衔接,共同维护系统的正常运转,各个层级的功能各不相同,以下对区块链系统架构的每个层级逐一介绍。
合约层:合约层结合区块链的特点,使用编程的方式定义数据操作流程,自动执行相应操作,保证了合约的透明性与公平性,实现了自动化与智能化,减少了时间成本,提升了各方合作的效率。合约层主要有资源收集、运输、保存信息登记合约、记录种质资源的采集流通情况,完成种质资源信息以及流通信息的上链。资源溯源查询合约则是为用户提供了查询种质资源溯源信息的接口。面向资源登记与溯源的区块链系统技术架构见图1。
应用层:应用层通过web端开发直接面向用户,为客户提供了种质资源信息的登记和溯源服务,将系统底层的记录与数据直观显示出来。
管理层:对种质收集、运输、保存过程所涉及的单位信息和种质本身的信息进行管理,以确保信息正确安全地上传到区块链网络并进行永久存储,为监管、追责预警等做数据保证。
基础设施层:选用FISCO BCOS区块链平台作为底层实现基础,通过对智能合约的设计,完成对种质资源流通的永久记录和追溯。
节点:主要包括种质资源收集、运输、保存的单位、用户、监管部门等,由他们共同维护整个基于区块链的种质资源登记与溯源系统的生态平衡,确保系统可以稳定运行,对种子资源的保护进行监督。
图2为种质资源登记与溯源业务流程图。本研究提出的种质资源登记与溯源系统主要包括收集环节、运输环节、保存环节,各环节采集的溯源信息不同。
图2 种质资源登记与溯源业务流程
收集环节:种质资源收集单位主要到实地收集种质,并对收集的种质根据编号进行标识,记录其名称、资源类型、特性、用途、收集时间、收集单位等信息,并将信息上传到区块链中,这是种质资源登记与溯源系统的重要组成部分。
运输环节:种质流通运输是种质资源保护的中间环节,是种质资源分散的收集地点和保存地点之间的连接方,主要工作包括提供种质的发送地、目的地、配送人员信息,运输种质并对其信息进行核对,再将运输信息上传到区块链中。
保存环节:当种质通过运输环节到达对应的种质保存单位时,保存方通过上游机构提供的追溯信息进行比对与反馈,最后将保存信息包括保存单位、保存地点、所属种质圃、圃编号等上传到区块链中。
收集方、运输方、保存方以及普通用户分别作为区块链中的参与组织,为其分配节点。收集方、运输方与保存方根据各自的不同分工,对所负责登记的内容进行收集,将数据上传至区块链节点中,区块链节点调用智能合约对上传的数据进行审查与验证,确认合法后再将区块上链。普通用户可对溯源区块链数据库发起溯源查询请求,通过唯一的溯源码对种质资源进行定位,并返回种质资源的溯源信息。
种质资源溯源流程如图3所示。在输入框中输入种质资源所对应的唯一溯源码,区块链数据库中可以将其定位到与之相对应的唯一的种质资源数据表中,若表中无此溯源码所对应的种质资源,则结束查询流程;若有,则对该区块的信息进行访问,查询该区块的信息是否为最初信息;若是,则将查询到的溯源信息返回给发起溯源请求的用户;若否,则通过区块头中的上一区块哈希值访问上一条信息,而后重复上述步骤直到访问至最初的信息,再将全部的溯源信息返回给发起溯源请求的用户。
图3 种质资源溯源流程
测试环境为MacOS系统,在Mac mini 8G 512G版本的电脑上运行,开发语言为Java语言,使用SpringBoot、Vue等框架搭建了热带作物种质资源溯源系统,采用MySQL作为系统数据库与区块链数据库。数据库中录入的信息包括种质基本信息与收集信息,为方便数据的分类管理,根据种质资源信息的不同类型分为2个表,分别是种质资源基本信息表(表1)和种质资源收集信息表(表2)。其中,种质资源基本信息表包含了溯源码、种质名称种质外文名称、科名、属名或亚属名、种名、种质资源类型、主要特性、主要用途、资源描述等与种质资源本体相关的信息,种质资源收集信息表则包含了溯源码、收集号、采集号、引种号、收集单位、收集时间、来源国、来源省、来源地、土壤类型、生态系统类型等与种质资源收集环节相关的信息。
表1 种质资源基本信息表
表2 种质资源收集信息表
系统首页如图4所示。在系统首页展示了热带作物种质资源管理服务系统底层区块链的区块数量、区块链内上链的资源总数量、上链未成功的资源数量、区块链的同步状态等。在首页左边侧边栏有系统管理的功能,包括资源异议处理、资源申请处理、反馈处理、管理员列表、角色管理等功能,涵盖了热带作物种质资源管理所需要的功能模块。
图4 热带作物种质资源管理服务系统首页
热带作物种质资源管理服务系统的种质资源信息保存在区块链上,图5为区块详情页面。在该页面中,含有目前的区块高度、区块的哈希地址、上一区块的hash值等内容。在区块详情页面,可以通过点击查看上一区块的详细内容。
图5 区块链详情页面
基于本文所述技术,一份种质资源从收集到入圃(库)保存到共享的全链条过程如下:种质资源收集者在收集一份资源时将资源的收集信息上传到区块链节点中→运输者、保存者将运输信息、保存信息上传到相应的区块链节点中→区块链节点调用智能合约对上传的数据进行审查与验证,确认合法后上链。普通用户可对溯源区块链数据库发起溯源查询请求,通过唯一的溯源码对种质资源进行定位,并返回种质资源的溯源信息;如用户对信息有异议,可从信息查看页面(图6)
图6 种质资源追溯信息
提交,从而实现种质资源全链条跟踪、追溯,保障各环节参与者的利益。
本研究针对当下基于中心化组织的种质资源管理平台与热带种质资源收集链条繁琐、生命周期长所造成的种质资源数据丢失风险较高、种质资源责任主体不清、信息化管理水平不高、溯源难度较大、共享程度较低等问题,设计和实现一个基于区块链的资源登记与溯源系统。通过对智能合约的编写、编译、部署与调用,实现种质资源全生命周期中各个环节信息的可信存储、登记与溯源访问,保证了种质资源的安全性与易用性,为今后热带种质资源信息化等研究性工作奠定了基础。