孙传恒 于华竟 徐大明 邢 斌 杨信廷
(1.国家农业信息化工程技术研究中心, 北京 100097; 2.农产品质量安全追溯技术及应用国家工程实验室, 北京 100097)
近年来,农兽药残留超标等农产品质量安全事件频发,不仅危及人们的身体健康,同时也对农产品出口贸易造成不利的影响,因此成为社会关注的热点[1-2],农产品追溯系统成为保障农产品安全的重要手段。农产品追溯系统能够记录、存储供应链从生产到销售的数据信息,一旦发生农产品质量安全问题,系统能够快速追溯产品来源,并且定位责任主体,及时召回有问题批次的产品[3]。
目前,追溯系统的研究主要集中在射频识别[4]、二维码[5]、无线传感网络[6]等物联网技术对追溯信息的采集方面,但国内农产品供应链具有链条长、生产分散、信息多源异构等特点[7],供应链上下游主体由于复杂的利益博弈关系,造成各节点间信息不对称、信任成本较高等问题,影响了整体追溯效率。同时,传统追溯系统存在无法将供应链各环节的追溯信息进行准确关联、由企业中心数据库自主管理供应链数据等问题,导致追溯信息不精确、不完整[8],产生纠纷时举证困难、责任难以明确[9]。因此,传统追溯技术无法完全解决我国农产品供应链追溯中存在的问题,探索有效的技术方案成为国内外研究的热点。
区块链技术基于分布式存储、点对点传输、共识机制、加密算法等关键技术,具有去中心化、数据不可篡改、可追溯、高可用等特点[10],能够有效解决供应链上下游数据在传递过程中的信任问题,从而构建与追溯需求吻合的可信交易环境。区块链技术与农产品追溯相结合,能做到分散资源集中管理、集中资源分散服务,为解决目前传统追溯体系存在的问题提供了技术支撑[11]。近年来国内外学者从不同角度研究了区块链技术在供应链追溯中的应用,如KORPELA等[12]、KSHETRI[13]和MEZQUITA等[14]从交易管理方面探讨了区块链技术在供应链上的应用,KAMILARIS等[15]和FRANCISCO等[16]从供应链数据透明管理方面探讨了区块链追溯的应用,AZZI等[17]和LU等[18]从区块链架构方面讨论了区块链技术在供应链上的应用,BUMBLAUSKAS等[19]和ZHAO等[20]从系统集成方面研究了区块链在果蔬农产品供应链上的应用,KAMATH[21]结合具体案例认为,区块链在沃尔玛食品供应链中具有快速可信追溯的优势。在整个供应链或部分生产和使用环节自动获取产品历史、应用情况或所处位置等信息之间相互关联或相互作用的区块链农产品追溯系统成为国内外研究的热点和方向[22]。
本文综合分析国内外区块链追溯技术研究进展,在对比传统追溯技术和区块链追溯技术基础上,分析区块链追溯的概念;并从区块链追溯链上链下数据协同、区块链追溯共识机制和区块链追溯数据隐私保护等方面阐述区块链在农产品供应链上的关键技术研究进展,最后从多链和跨链技术以及与新一代信息技术融合方面展望区块链追溯的发展趋势。
追溯是指通过记录或标识,追踪和追溯客体的历史、应用情况或所处位置的活动,追溯系统指基于追溯码、文件记录、相关软硬件设备和通信网络,实现现代信息化管理并可获取产品追溯过程相关数据的集成[23]。农产品供应链追溯重点跟踪记录农产品在生产、加工、运输、销售等环节的数据,实现“从农田到餐桌”的全环节监管[24]。表1列出了国内外在水产品、农产品、果蔬等大型生鲜农产品领域建立的典型追溯系统[25-26]。
从表1可看出,传统农产品追溯系统存在人工干预数据录入、依赖第三方机构监管数据安全、数据存储在企业本地数据库等问题,极易引起数据传递和共享过程中的篡改和泄露危机[31]。
区块链是多方参与共同维护的持续增长的分布式数据库[32-33],基于分布式网络、密码学和共识机制建立信任关系,通过智能合约构建价值互联网。区块链的本质是共享账本[34],通过开发分布式平台解决主体协作、信息误传、缺乏监管的问题;基于全网节点的计算、存储和网络共享模型,提供大数据共享和证据保存;通过零知识证明[35]和安全多方计算,实现数据的验证而不披露。区块链网络架构下所有节点互联互通、对等通信,共同查询、记录、维护账本数据,打破信息孤岛,扩展网络化运行的边界,实现区块链网络的去中心化[36]。
区块结构由区块头和区块体组成(见图1)。区块头存储上一区块的哈希值,实现链上数据的可信追溯,在长链中修改任一区块的数据将导致本区块哈希无效,从而引起断链,需要消耗巨大算力重新计算本区块和所有后续区块哈希值;根据区块头存储的Merkle根能够快速验证交易数据的篡改,以上两种机制保证了区块数据一经验证写入便不可篡改[37]。区块体则包含了经过验证的、块创建过程中发生价值交换的所有追溯记录,具体追溯记录字段因节点不同而存在差异。
根据节点参与方式,区块链可划分为公有链(Public Blockchain)[38]、私有链(Private Blockchain)[39]和联盟链(Consortium Blockchain)[40]。根据节点参与权限,区块链可划分为许可链(Permissioned Blockchain)[41]和非许可链(Permissionless Blockchain)[42]。表2分析了不同类型的区块链在节点参与、记账权、读写权限、激励方式以及网络特征等方面的特点。
表2 区块链类型Tab.2 Type of blockchain
区块链追溯系统是在追溯系统中引入区块链技术,实现农产品生产信息、加工信息、运输信息以及销售信息的数据一旦验证通过写入区块账本就无法修改,保证数据的真实、透明、可靠[43]。表3列出国内外主流组织和权威学者对区块链追溯的定义。从中可以看出,农产品区块链追溯目的是实现农产品全生命周期跟踪追溯,构架农产品供应链间的沟通桥梁,提升信息的透明度和真实性,在追溯平台信任得到了良好的维护。
我国农产品供应链追溯参与主体多、链条复杂,产业链呈现“两头小中间大”特征,通过联盟链多中心化网络结构平衡多参与主体问题,有效提高农业生产活动中各参与主体的协作效率,构建透明、真实、可信的农产品追溯体系。表4列出部分农产品供应链追溯体系,从表4中能够看出基于联盟链开展区块链追溯研究已成为国内外热点和共识。
基于联盟链的农产品供应链追溯系统利用各种物联网采集和保存方式,获得农产品在生产、加工、运输以及销售过程中的关键数据,同时利用智能合约自动执行交易条款,基于非对称加密和数字签名保证交易数据的唯一性和安全性,通过多通道的事务隔离性提供隐私保护,确保了信息流、资金流、物流和商流的可靠流转,在离散程度高、链条长、参与主体多的农产品供应链中实现多组织高效协作、资源共识共享共治的智能化配置,大幅降低农产品供应链成本。区块链技术涉及到组网建链、数据协同、共识算法、智能合约、隐私保护和模式标准等系列技术,限于篇幅,本文重点从区块链追溯链上链下数据协同、区块链追溯共识机制和区块链追溯隐私保护方面分析区块链追溯关键技术的研究进展。
表3 区块链追溯定义Tab.3 Concepts of blockchain traceability
表4 区块链追溯系统Tab.4 Blockchain traceability system
国内联盟区块链追溯的发展重点方向是链上链下的数据协同[57],在区块链追溯系统中链上需要链下的信息系统扩展计算和存储能力,链下的信息系统需要和链上对接实现异构信息共享解决信息孤岛问题[58]。区块链追溯链上通过哈希函数的单向加密和不可碰撞性保证链上信息完整性,但却无法解决链下虚假数据或真实数据上链过程的真实性问题[59],为实现大批统一的区块链应用落地,区块链链上链下数据协同能力成为目前研究热点。
区块链追溯系统通过第三方机制下的预言机、状态通道等实现链上对链下数据的可信访问。预言机是一种通过签名引入外部世界状态信息的可信任的实体,响应链上智能合约提出的数据交互需求,通过单向的数字代理以加密的方式将不经过计算就能够证明的外界数据提交给智能合约进行加工处理实现数据协同[60]。如WANG等[61]、ADLER等[62]和LO等[63]分析预言机将外部数据带入区块链的数据协同问题。状态通道[64-65]对区块链进行初始化、终止化或净额结算,把链上的数据操作转移到链下的状态通道中加工处理后上链计算结果。状态通道能够显著提高链上交易效率、降低数据协同成本,并且在数据协同方面具有天然的安全性优势[66]。表5列出将数据在链上链下分类存放以实现区块链追溯链上链下的数据协同。
表5 区块链追溯链上链下数据协同技术Tab.5 Traceability data cooperation based on blockchain technology
区块链分布式网络处理容错的核心是共识机制,全网节点在预设规则下与其它节点交互达成对数据、行为或流程的一致,实现交易的不可变、全局一致的注册[69]。公有链常用工作量证明机制PoW(Proof of work)、权益证明机制PoS(Proof of stake)和委托权益证明机制DPoS(Delegated proof of stake)等共识机制;联盟链常用实用拜占庭容错算法PBFT(Practical byzantine fault tolerance)、Kafka等共识机制;私有链中常用Raft共识机制。表6对不同区块链网络中的共识算法进行了分析对比。
工作量证明机制(PoW)通过结果认证证明完成了相应的数学计算,具有完全去中心化的优点,在以工作量证明机制为共识的网络中,节点可以自由进出。权益证明机制(PoS)根据节点持有代币的比例和时间,依据算法按币龄权重等比降低寻找随机数的难度值。委托权益证明机制(DPoS)一方面集成了权益证明机制的币龄优势,另一方面由持币人选举公证人节点参与验证、记账,对去中心化做出了一定妥协。张利等[75]提出的基于区块链的农产品追溯系统中节点通过工作量证明共识机制竞争记账权。LENG等[76]考虑农业经营中的激励权重问题,在权益证明机制共识机制的基础上,提出一种考虑农企权重的一致性共识算法。梁昊等[77]设计的农产品信息区块链技术架构使用委托权益证明机制共识机制通过节点表决认可农产品信息的准确性。
表6 区块链追溯共识算法Tab.6 Consensus algorithm of blockchain traceability
实用拜占庭容错算法(PBFT)不仅考虑节点宕机且支持节点主动作恶情况,算法分为预准备、准备、确认3阶段,保证全网三分之一节点的容错性,在划分主节点和副本节点上,袁勇等[78]提出一种基于监督模型的共识算法MBFT(Multisignature byzantine fault tolerance)解决主节点出错问题,任守纲等[79]在农作物全产业链追溯信息平台中提出一种信誉监督机制拜占庭容错共识算法CSBFT(Credit-supervisor byzantine fault tolerance)解决副本节点身份确认问题。王志铧等[80]使用Hyperledger fabric平台设计的生姜区块链追溯系统采用Kafka共识机制同步数据,实现数据存储安全、追溯数据清晰。未来针对不同品类的农产品供应链应用场景,开发适配不同应用模式的共识算法将是重要的研究方向之一。
区块链基于对称加密算法、非对称加密算法、哈希算法保证数据完整性、隐私性和有效交易凭证[81],并使用数字签名保障交易安全,尤其以椭圆曲线加密算法生成公私钥对和椭圆曲线数字签名算法保障交易不可抵赖为代表,并通过零知识证明和多方安全计算实现数据的安全验证[82]。表7对比分析了隐私保护加强技术。
表7 隐私保护加密技术Tab.7 Cryptography technology of blockchain traceability
根据表7的对比分析可知,对称加密简单快捷、密钥较短但破译困难,在对称加密方面,于合龙等[11]设计的基于区块链的水稻供应链追溯系统采用对称加密AES中的密码分组链接CBC (Cipher block chaining)模式加密隐私数据,并使用椭圆曲线算法ECC(Elliptic curve cryptography)加密密钥实现密钥授权。李文勇等[83]改进对称加密算法AES,实现了一种基于嵌入式平台的可直接加密十进制数据的农产品追溯码加密算法,设计基于地理坐标编码方式的农产品追溯码。
非对称加密采用公私密钥对保证数据隐私。在非对称加密方面,马腾等[84]结合RSA加密算法和ASCⅡ码设计农产品原产地可信追溯系统。张旭凤等[85]采用RSA加密算法设计基于区块链技术的农产品物流信息系统。王乃洲等[86]通过RSA加密算法和共识算法保证基于区块链的用户身份认证信息的安全性。基于非对称加密的数字签名能够保证交易凭证和识别交易发起者身份,徐蜜雪等[87]针对区块链安全问题设计的拟态区块链使用一种异构签名算法,采用3种签名算法代替单一的签名算法签名消息应对安全威胁。
Hash函数可识别源数据的任何更改且具有单向不可还原特点,在哈希算法方面,李宣等[88]基于区块链和物联网设计的双区块链防伪追溯系统,基于私有链存储交易数据,交易明文经过Hash函数加密后的密文上传到联盟链。杨信廷等[48]设计的农产品区块链追溯系统信息存储模型将追溯明文信息存储在各节点本地数据库,上传MD5哈希算法加密数据的密文到区块链。
零知识证明和安全多方计算强调输入数据的保密性,弥补区块链重视计算的可验证性而忽略数据验证性的问题。李佳潞[89]在基于区块链的粮食供应链追溯方案研究中,设计基于零知识证明算法的共识机制用以验证链上隐私数据的一致性和完整性。黄建华等[90]在利用区块链构建公平的安全多方计算中,基于区块链智能合约构造惩罚机制提出公平的安全多方协议。
从上面分析可以看出,未来基于上述数据隐私保护技术开发可插拔的加密算法,将是农产品供应链追溯的重要方向,同时在应用方面结合权限控制体系和证书认证体系管理多组织间信息传递或共享,将权限管理紧密结合供应链追溯业务场景,将加速促进区块链追溯的应用落地。
在区块链追溯应用实践方面,国内外商业公司进行了积极的探索。比较典型的是蚂蚁集团研发的蚂蚁链、京东集团研发的智臻链以及江苏中南建设集团股份有限公司联合黑龙江北大荒农业股份有限公司设计构建的区块链大农场。其中,蚂蚁链通过将网络准入权限与支付宝绑定,实现一键式快速部署,已应用于奶粉、大米、红酒、蜂蜜等全球30亿件商品的原产地或境外溯源保真,溯源产地覆盖120个国家,支持14万类商品,解决溯源信息的真实性问题[91],智臻链已有超13亿条上链数据,700余家合作品牌商,5万以上SKU(Stock keeping unit)入驻,逾280万次售后用户访问查询,解决价值网络中信息流转不畅、信息缺乏透明度、信息不对称等问题[92],区块链大农场应用于北大荒高度组织化的农场种植模式,有9种物联网数据采集标准,112个电子表单,63个农作物种植规范,覆盖北大荒近百万公顷土地,解决北大荒自然资源向数字资产可信转移的问题[93]。
目前区块链大规模商业化应用仍处于前期阶段,阻碍其大规模应用的原因复杂,其中区块链通用底层平台欠缺[94]、基础设施不健全且性能不完善[95]、兼容性不足,导致绝大部分与区块链结合的追溯的商业场景仍然处于探索期[96]。另一方面,技术发展初期的缺陷暂时无法解决,如区块链单链存储结构[97]难以负载海量数据存储压力,多链间数据隔离[98]难以做到数据的动态扩展,都限制区块链追溯网络进一步扩大。同时联盟链网络缺乏统一的行业标准,难以构建联盟链统一生态网络架构[99]。
在解决区块链追溯大规模应用方面,可以从技术和经济两方面协同推进。技术方面需要开发区块链追溯行业通用支撑服务平台[100],降低企业使用门槛,支撑区块链追溯应用快速落地,另一方面针对供应链区块链追溯链条长、多主体离散程度高等问题研究区块链追溯共识算法,提升共识算法效率和区块链性能,同时解决突破多链、跨链、链上链下数据协同机制,进一步扩大追溯生态网络[101]。经济方面充分利用区块链的智能合约和共识算法,解决供应链追溯跨主体多方协助合理的分配机制和激励机制[102],实现追溯数据存储在网络中,让追溯数字经济在价值互联网中可靠传递,解决价值传递过程中存在的基础资产真实性低、资产流通成本高、流动性差等问题。
5.1.1多链技术
农产品区块链追溯规模化应用后,受到共识速度的限制,节点的执行性能难以线性扩展,链上交易在区块链单链账本中串行处理,难以获得接近中心化系统的性能表现。未来区块链的发展趋势将改变单链主导,实现多条同构链或异构链并存的区块链新生态系统,解决供应链中存在的上下游博弈问题,实现多组织的信息对称并降低上下游组织信任成本。刘家稷等[103]设计使用公有链和私有链构建追溯系统,使用私有链存储企业产品信息,使用公有链保证链上数据的可验证和不可篡改,实现数据的可靠存储和企业自管理隐私数据。LENG等[76]提出的基于双区块链的农产品供应链系统选用公有链存储公共服务平台上企业用户信息,在私有链上存储企业隐私数据和交易数据。DING等[104]提出了双链的追溯许可链共识机制,主层部署联盟链用来追溯信息查询共享,辅助层部署私有链存储追溯信息,在保证追溯链私密性的同时,系统也随着参与节点的增加保持高效的运行效率。
5.1.2跨链技术
区块链在农产品供应链追溯具体的应用场景中需要适应多样化的业务需求,方便跨企业、跨生态业务数据的共享。在大批统一的区块链应用场景下,采用不同的通信协议、编程语言、共识机制和隐私措施搭建的相对独立的、缺乏统一的互联互通机制的异构链难以做到价值互通、适应不同的场景需求,因此,异构链间实现跨链的价值传递将是区块链追溯生态健康发展的必然要求。跨链[105-108]通过中间件实现异构链的互联互通,实现账本的跨链互操作,为追溯行业跨生态、跨行业的多维协作解决信息孤岛问题,从追溯异构链“孤岛”发展成为异构链“网络”。
以物联网、大数据、人工智能、云计算和5G为代表的新一代信息技术和区块链的深度融合为农产品供应链追溯行业提供了巨大的潜在空间[109]。新一轮科技革命中各有侧重并相互关联,物联网负责收集数据,全网海量数据汇集存储在链下云端形成追溯大数据,云计算完成数据的高效查询操作,大数据为人工智能提供训练数据集不断优化模型参数,构建辅助决策生产模型改进供应链上下游智能决策;区块链作为信任桥梁稳定涉及数据操作的信任机制,保证数据传递、共享的稳定可靠[110]。
5.2.1区块链+物联网
区块链是构建物联网真正分散、无信任和安全环境的缺失环节,通过区块链的分布式网络、不可篡改和可追溯的优势为物联网的安全应用提供媒介[111]。区块链+物联网实现物物之间信用的无风险、无杠杆的高效率传递,链上实现资金流、物流、信息流三流合一[112],在物联网万物互联的基础上保证万物可信,实现物理世界和数字世界的映射,保证上链信息的真实性和完整性,进一步助力智慧供应链追溯发展。表8列出了部分区块链+物联网模式在追溯方面的应用。
表8 基于区块链和物联网的追溯技术Tab.8 Traceability based on blockchain and IoT
在区块链农产品追溯系统中使用RFID标签、无线传感器WSN(Wireless sensor network)、北斗卫星导航系统BDS (BeiDou navigation satellite system)等物联网技术对生产信息、加工信息、运输信息以及销售信息按照一定的格式发送到数据中心进行“一物一码”标识,将搜集的数据自动上传区块链存证,利用区块链技术保证数据的隐私保护和不可篡改[119]。消费者或监管部门可通过追溯码查询商品流通环节数据信息,实现“一物一码”正品追溯。从中可以看出,物联网技术和区块链技术相辅相成,二者结合将会实现物理世界和数字世界的映射,实现农产品供应链中的数字孪生。
5.2.2区块链+大数据
区块链技术具有加密共享、去中心化、信息防篡改等特性,对解决数据流通、价值共享、数据孤岛等方面提供了解决方案,而大数据技术具备海量数据存储和灵活高效的深度分析挖掘等功能,二者有机融合不仅保证了大数据分析结果的正确性和数据挖掘效果,还极大提升区块链数据的价值和使用空间。大数据管理聚合海量数据,将离散的数据需求聚合成数据长尾从而满足数据治理需求。运用大数据管理的虚拟性有利于追溯信息跨行业、跨生态的应用和管理,避免供应链各环节存在的断链情况,准确关联各环节的追溯信息,提供精准、完整的追溯数据。赵嘉承等[120]从大数据挖掘角度剖析区块链追溯过程中的信息真实性问题。CHEN等[121]设计的农产品监管系统使用云计算技术进行追溯环节中物联网应用产生的大数据处理,并结合机器学习技术,建立模型预测对作物品种选择、生产和栽培管理以及上市时间等给出最佳的选择方案。
5.2.3区块链+人工智能
区块链技术能够链接供应链各环节信息,促进跨行业、跨生态的数据流动、共享,让人工智能可以根据不同用途、需求获取更加全面的数据,真正变得“智能”。利用区块链+人工智能技术研发农产品可信追溯系统,把追溯技术从过去的纯数字空间防伪保护,升级为“物理空间+数字空间”的联合保护,同时使用人工智能技术结合机器学习边缘计算、自动化控制研发高速追溯数据采集系统,通过深度学习方法等自动识别农产品复杂供应链条中生产、加工、物流、销售等全环节人工干预的操作,实现行为数据上链存证保证数据的不可篡改将是二者结合的重要方向。