司海平,宋佳珍,李雨杰,李伟霞,Fernando Bacao,孙昌霞
(1. 河南农业大学信息与管理科学学院,河南郑州 450046;2. 河南省农作物生产监测大数据分析与应用工程研究中心,河南郑州 450046;3.NOVA Information Management School (NOVA IMS),Universidade Nova de Lisboa,Campus de Campolide,Lisboa 1070-312)
随着知识经济的迅猛发展和经济全球化的不断加强,知识产权作为拥有先进技术水平、自主创新能力以及未来发展潜能的标志,对其创造、保护和运用愈发成为在农业国际竞争中取得优势的关键。调查显示,全球农业领域30%~50%的增产要素来源于新技术或新产品,农业知识产权具有巨大的经济效益[1]。近年来,中国农业知识产权事业得到了快速发展,以农业领域专利为例,中国专利产出优势突出,2014—2021 年间农业专利申请量稳居世界前列,已成为全球最大农业专利产出国。与此同时,专利保护问题逐渐凸显,有研究者对我国32 家科研机构进行了调查,结果发现这些机构全部有被侵权记录,且由于保护成本高、流程繁琐等基本都采用协商解决的方式[2],足见知识产权侵权现象较为严重,至今还没有很好的解决办法。侵权问题难以解决,使得专利保护和知识产权的有效转化和利用受到一定的制约,农业领域知识产权能力与发达国家仍存在较大差距。这种情况下,通过增强知识产权保护意识,利用高新技术培育知识产权驱动的农业产业链,建立知识产权保护机制,可以逐步解决知识产权保护和转化利用中存在的问题,为农业领域的发展提供更广阔的空间。
农业知识产权保护领域目前已有不少成果,比如致力于构建互联互通的全国农业科技成果转化系统的全国农业科技成果转移服务中心、提供专利检索和专利预警与侵权服务的内蒙古农业大学高校国家知识产权服务中心、中国农业科学院技术转移中心研发建设的农业国际合作知识产权服务平台以及江苏省知识产权保护中心发布的农业技术知识产权公共服务平台等。然而随着信息技术和现代生物学的突破性发展,农业知识在网络上的传播更加便捷且具有隐蔽性,侵权行为的防范也更加困难,进一步增加了农业知识产权保护难度,且知识产权确权耗时长、成本高、存在单点故障等问题是这些传统企业无法解决的,帮助产权方进行维权的机构较少,通常需要举证方自行寻找侵权证据,导致侵权举证和产权溯源也异常困难。而区块链技术去中心化、可追溯及不可篡改性等技术特征可以解决上述传统知识产权系统存在的问题[3]。
区块链技术自提出以来发展至今,即将迎来3.0时代,开始拓展到金融领域之外落地应用项目,为各行各业提供去中心化解决方案[4]。知识产权管理方面的应用被认为是区块链技术最有可能落地的应用方向之一,诸多学者也对基于区块链的知识产权保护方案进行了研究。其中,宁梦月等[5]分析了当前知识产权领域存在的问题,构建基于Polkadot 的异构多链知识产权保护模型,实现节点地址、权限流转记录、维权信息在区块链内的永久记录,并对模型进行科学性及应用可行性分析;阳真等[6]使用AES 和改进的CP-ABE 算法对测试任务与代码进行访问控制实现隐私保护,结合区块链与IPFS 进行测试报告与被测代码的可信存证与实时确权,实验与分析证明了众测知识产权保护方案的实用性和有效性;孙嘉豪等[7]在改进的PBFT 算法基础上,构造一种区块链知识产权保护模型,设计了包括产权登记和转让智能合约的知识产权管控协议,提供了解决数字作品产权登记困难和交易混乱问题的方法;张海强等[8]针对基于区块链的知识产权管理平台竞争策略,提出了基于 Hotelling 模型的三阶段博弈模型,并分析新兴的基于区块链的知识产权确权渠道,探索了不同市场环境下平台确权渠道的最优决策问题,为确定知识产权代理平台的最佳确权可信能力提供启示。理论层次也有很多学者,例如,华劼[9]分析了区块链技术和智能合约应用于知识产权确权和交易领域的法律规制问题;黄武双等[10]分析了区块链技术对知识产权的确权帮助作用以及侵权证明作用;乔瑜[11]指出了区块链技术在文化创意产业知识产权保护中的应用困境和保护路径。
上述研究多是从区块链和知识产权相关法律法规、区块链应用场景、基于区块链的知识产权保护理论上的可行性、相关算法及系统架构等方面进行探讨,但针对区块链背景下完整的知识产权保护系统构建的研究相对较少,且专注于农业领域知识产权系统的开发基本没有。本文通过研究Hyperledger Fabric 联盟链、IPFS、加密算法、数字水印技术以及CouchDb 数据库,以联盟链网络结构设计农业知识产权登记、查询与转让等智能合约实现数据的可信存证与溯源追踪,解决了农业领域专利申请时间长、成本高,侵权诉讼举证困难、公证处证据固定耗时久等问题,实现了农业知识产权的有效确权保护。
作为非对称加密技术、时间戳、共识机制等一系列技术的集成,区块链概念一经提出就掀起了一股金融科技狂潮,2016 年相关企业投资达到数十亿美元,2017 年中国政府网发表《我国区块链产业有望走在世界前列》向大众普及区块链技术并公开支持区块链发展。区块链以其去中心化、公开透明及数据不可篡改等特征,在金融、物联网、医疗、能源等多个不同领域的应用加速落地[12]。其主要开发平台包括完全去中心化、人人可参与的公有链如以太坊,部分去中心化、写入权限仅限系统参与者的联盟链如Hyperledger Fabric 等[13]。
联盟链是指多个机构或组织参与管理的区块链,其中每个组织成员都拥有一个或多个Peer 节点,节点间共同记录交易数据[14]。随着IBM 推出Hyperledger Fabric,联盟链这一去代币化的区块链模型成为国内产业区块链的基础模型,国内大量产生的产业区块链绝大多数是以Hyperledger Fabric 为参考的联盟链应用体系。不同于涉及加密代币的工作量证明(PoW)共识机制,联盟链系统中的共识算法多采用经典分布式问题中的拜占庭容错算法PBFT和RAFT 算法,通常需要CA 证书体系进行准入控制以抵御可能出现的“女巫攻击”[15]。Hyperledger Fabric 克服了公有链项目交易公开无隐私保护、共识算法低效及吞吐量低等缺点[16],不仅拥有存证和溯源的基础能力,还具有交易速度快、易扩大规模、成本低等优势,被广泛应用于知识产权保护领域。故本文使用交易效率较高、适合商用、包含身份认证、访问控制和智能合约等服务的Hyperledger Fabric 平台构建系统。
智能合约是运行在区块链数据库上的一种计算机程序,能够让用户自己定义所需交易逻辑,是应用系统与区块链底层交互的中间件,可以在满足其源代码设定条件下自行执行,其主要应用场景包括比特币、以太坊以及Hyperledger Fabric 联盟链等项目。以智能合约从协商、开发、部署到执行的生命周期为顺序,主要过程包括合约各方协商确定合约内容后开发标准合约代码;然后将合约以P2P 方式发送至每一个节点,待所有节点达成共识后即可以区块形式将合约集合发送至全网各个节点,最后通过外部事件触发合约自动执行[17],进而实现账本的更新和维护。整个合约处理过程都由区块链底层内置的智能合约系统自动完成,公开透明,不可篡改。
本文智能合约采用Go 语言编写,部署在Peer 上,单独运行在Docker 容器中,外部应用程序通过命令行或SDK 对账本进行操作,采用JavaScript 语言的相关API 来实现对链码的部署及调用执行,以此实现对分布式账本上键值对或其他状态数据库的读写操作。在知识产权保护区块链网络中,通过智能合约的调用实现自动化存证、数据交易以及用户维权,既可以保障知识产权交易安全性与实现确权保证,又为农业知识产权维权提供有力凭据。
数字水印(digital watermark),是将标识信息直接嵌入数字载体(包括文本、图像、音频和视频等)中以解决网络环境中产权保护问题,并实现防伪溯源,包括嵌入信息能被看见的明水印和一般状况下无法被发现的隐藏式暗水印。隐藏式水印的重要应用之一就是产权保护和用户维权。基于本文研究对象的PDF 特征,选取隐藏式文档数字水印算法,在相应PDF 文档中嵌入产权和交易信息等水印信息,对知识产权数据保护和交易进行可信管理。
设M为待添加水印的文档,W为原始水印信息,由于目前数字水印技术不如密码技术那样成熟。需要配合密码学技术才更可信赖,K表示加密算法,处理后的水印信息由W表示,由函数F定义如式(1):
编码函数设为E,水印文档嵌入可表示为式(2):
必要的时候对水印进行提取以确认文件所有权和跟踪侵权行为,水印提取过程中需要用到解码函数D,输出一个判定水印信息是否存在的0-1 决策,为提取出的水印,水印信息检测函数用C表示,δ为决策阈值,水印信息提取和检测公式如式(3)—(4):
根据提取到的水印信息与原始水印进行相关性测试,Corr 取值在[-1,1]之间,相关值超过该阈值,则认为水印存在,计算如公式(5):
本文选取行末标识符作为水印嵌入点,利用PDF 文档中空白字符不会在页面上显示的特性,对交叉引用表中行末标识符进行同等大小的替换,实现水印信息嵌入。如图1 所示,水印嵌入阶段用户以formData 格式传入PDF 文档和水印信息,对行末标识符进行统一修改,然后加密水印信息并将密文编码为二进制数据流,再据此对交叉引用表中行末标识符进行修改,重新生成PDF 文档,完成水印嵌入工作。水印提取则是将上述嵌入过程逆转,根据已嵌入水印文档中行末标识符还原水印二进制数据流,经过解码、解密处理得到水印明文[18]。
图1 水印嵌入与提取流程
星际文件系统(inter planetary file system,IPFS)旨在创建持久且分布式存储和共享文件的网络传输协议,利用分布式存储和内容寻址技术,将点对点的单点传输变为P2P 传输,具有数据安全防篡改、无单点故障、访问速度快以及有容灾备份机制等优势。IPFS 存储文件时将文件等大小分块,再构建各块Hash 值和文件检索表,之后将文件分块存储在分布式服务器上。查找时只需输入存储文件时返回的HashID,系统根据文件检索表和内部路由表自动查找并合并各文件块组成原始文件[19]。
据统计,2016—2021 年我国农业专利申请量均突破十万,为满足基于联盟链的农业知识产权保护系统后续推广需求、处理大规模数据,故选择IPFS作为链下存储系统辅助存储,以减少链上存储消耗,缓解存储压力。在IPFS 上实现水印文档的加密存储,链上仅保存少量关键信息以及链下数据的存储位置索引信息,从而扩展现有区块链应用系统的数据存储能力。
本文结合区块链技术和数字水印技术,将嵌入水印的文档通过哈希加密生成IPFS 地址,再将地址信息和数据摘要存储在区块链上,等同于将原始数据简化成IPFS 地址后上链,极大缓解了区块链节点的存储压力,为后续农业知识产权保护系统的推广使用提供了有利条件。通过在区块链上存储嵌入水印的文档的IPFS 地址和数据摘要,提供了溯源和证明知识产权的凭证,后续出现侵权行为时,亦可通过提取文档中的水印信息即在文档中嵌入的可识别和追溯的标识,包含产权人信息、时间戳等内容,以证明知识产权的归属和侵权事实,作为维权的重要依据之一。
基于区块链技术、数字水印算法和IPFS 星际文件系统,本文以农业种植技术领域相关专利为研究对象,提出了一种农业知识产权保护模型,如图2所示。模型主要包括数据确权、数据交易以及用户维权3 个部分,用户可在客户端操作,通过调用智能合约实现整个专利保护流程。
图2 知识产权保护模型
数据确权部分包括:(1)将文档数字水印算法应用于PDF 文档中,实现水印信息的嵌入,含水印文档储存于IPFS 星际文件系统并生成唯一地址哈希;(2)将获得的IPFS 哈希地址与数据摘要上链存证。
数据交易包括:(1)购买方从客户端发起查询,从链上找到相应数据后发起交易请求;(2)触发交易,返回购买方对应文件的IPFS 哈希地址;(3)交易完成后,交易信息储存在区块链分类账本中,对应水印信息进行变更,完成专利权转移。
用户维权包括:(1)产权方发起维权申请,从联盟链上获取数据交易凭证;(2)根据IPFS 哈希地址提取文档水印信息获取产权信息;(3)用户采集被侵权证据并实现链上存证,完成证据固定工作;(4)根据上述的水印信息、交易凭证、已存证侵权证据及时间戳等进行维权,证据一目了然、在特定条件下是完全可信的。
在数据存储方面,本文采用链上链下存储结合的方式,链下存储加密原件于IPFS 星级文件系统上,链上存储专利数据的摘要信息及IPFS 哈希地址等必要数据信息。鉴于区块链不可篡改和IPFS 系统分布式存储的特性,保证了某一节点发生故障时数据的安全性并减小了数据的存储消耗,提高了系统中数据的传输速度和检索效率。
基于Hyperledger Fabric 的知识产权保护系统总体架构可分为业务层、合约层、网络层和存储层四层。业务层给用户提供API 方式调用身份、账本、交易和智能合约等信息。合约层主要包括用户身份管理合约、确权、交易以及维权智能合约,身份管理部分提供注册、登记和申请证书等功能,用户只有通过PKI 证书体系获得唯一的数字证书才可加入到联盟链中。其它链码服务包括确权存证、数据交易以及维权涉及分布式账本的存储、交易排序及背书功能,记账节点对排序后的交易进行校验,将合法的交易写入账本并存储于支持富查询的CouchDB数据库中。链码文件采用GO 语言编写,单独运行在Docker 容器中,其执行与共识机制分离以提高效率,链码安装及实例化成功后通过gPRC 协议与联盟链中同一通道内的节点连接。网络层给各个通信节点提供P2P 协议和网络协议,以保障区块链分布式存储的一致性[20]。存储层包括IPFS 和CouchDB数据库,由于区块链不适合存储较大的文件,所以本文采用链上链下协同存储,将知识产权相关信息和交易信息存储在区块链上,原文档嵌入水印后存储于IPFS 系统。
IPFS 将每个文件分成小块,IPFS 网络在全国各地都有服务器,部分服务器失效、被篡改之后,仍然可以通过其他服务器的备份文件块来还原,因此可以实现永久保存[21]。该优势可保证后续侵权证据固化过程中数据的真实性。
将IPFS 与区块链联系起来,联盟链系统负责维护证书吊销列表CRL,访问IPFS 需要CA 颁发的证书。确权过程中产权人将已嵌入数字水印的PDF 文档上传到IPFS 数据库,存储后返回的CID 作为元数据与数据摘要一起存储在区块链上,完成专利数据的确权存证。交易阶段买家发起交易后卖家将生成的HashID 添加到合约中,完成交易,并更新IPFS上文件水印信息。修改IPFS 内容时我们可借助IPNS重新发布,IPNS 允许节点域名空间中引用一个IPFS hash,可通过节点ID 对项目根目录的IPFS hash 进行绑定,并通过节点ID 访问网站[22]。用户维权过程则可根据HashID 实现水印信息的提取和证据固定。
面向农业知识产权的联盟链智能合约设计主要是编写实现完整的链码,并通过调用链码中各个函数以实现对数据状态的操作,功能设计如表1 所示。通过调用智能合约可实现水印的嵌入和提取、含水印文档的存储、产权信息存证、买卖双方自动化交易以及交易信息的存储与水印信息变更等功能。所有的交易记录都将保存在区块链中,可追溯且不可篡改,保证知识产权确权方案的有效性和可行性。
表1 智能合约接口
2.4.1 数据确权存证
智能合约安装在相应的peer 节点,使用Go 语言开发,运行在Docker 容器中,通过gRPC 协议与Peer 节点交互。首先调用shim.Star()方法进行注册、调用Init()方法实现链码初始化,之后Peer 节点即可通过给链码发送消息实现对智能合约的调用,从而完成用户确权、交易以及维权等一系列操作。
数据确权步骤是:用户从web 端登录,通过对应界面调用Add(info)方法完成专利数据文档的水印嵌入并存入自己的IPFS 节点,请求调用Save(info)方法实现数据摘要及生成的HashID 信息在web 端录入后在链上同步产生,联盟链中其它节点接收到请求之后验证上传者签名,验证通过则广播给其它节点,达成共识后将交易记录写入账本,用户收到上链成功的反馈。具体流程如图3 所示。
图3 数据确权存证流程
2.4.2 农业知识产权交易
农业知识产权交易步骤是:买家注册登录,调用Query 方法查询需要的专利信息,之后调用Invoke方法发起交易,产权人接收到交易信息后根据设计的智能合约自动完成交易过程,达到交易条件后系统返回给买方对应的HashID,节点间达成共识后将交易记录存入账本,并借助IPNS 更新文档水印信息后重新发布,实现专利权的变更。具体流程如图4所示。
图4 农业知识产权交易流程
2.4.3 产权人维权
产权人维权步骤是:产权人发现自己被侵权后,在web 端相应功能界面实现图片或者视频等侵权证据上传,调用Save2(info)方法同步上链存证,根据Get 函数获取历史交易记录得到交易信息并完成水印提取作为维权凭证,根据已存证的侵权证据、历史交易记录、水印信息以及时间戳等实现举证维权。具体流程如图5 所示。
图5 产权人维权流程
本系统开发和测试所用的环境为Windows10 操作系统,配置为CPU AMD锐龙75700U,镭龙显卡1.80 GHz,内存16 GB,VMware 虚拟机安装Ubuntu20.04系统。使用Hyperledger Fabric 联盟链为开发平台。环境配置及Hyperledger Fabric 版本如表2 所示。
表2 开发环境配置
Hyperledger Fabric 网络中节点部署成功后可以看到两个peer 节点,一个orderer 节点,一个CA 容器及一个CouchDB 容器,代表已成功创建了一个新的网络,可以随SDK 一起使用,参与联盟链的节点包括参与交易的普通用户、进行背书认证的相关机构、负责维权保护的知识产权法庭等。据佰腾网统计,自1998 年3 月4 日至2022 年5 月27 日,小麦、玉米、水稻三大农作物种植技术领域的专利文献有689件,文件大小在147 k 到619 k 之间。
用户在客户端使用Fabric-SDK-Go 提供的接口对象调用相应的API 访问链码,以实现对分类账本中的状态进行操作。通过Save 函数实现链码调用,执行用户专利信息上链存证交易,从而改变状态数据库,向分类账本中添加交易变化记录。所有数据的最新值都存储在CouchDB 状态数据库中。通过实现信息存证,用户可以完成专利数据存证,实现专利的确权。
这个过程中,参与交易的各方都会获得一份交易记录,并在分类账本中更新最新的交易状态,从而确保所有节点都同步更新数据。当发布专利信息成功时,交易编号会被记录在链码事件中,链码的执行结果也会被记录在 CouchDB 状态数据库中,以便后续查询。
数据成功上链后,即分类账本状态已添加,便可根据指定条件查询出相应的状态,专利申请号和授权公告号唯一,用户可通过查询专利名称、专利类型等了解所需要的各种专利信息,并选择合适的交易项目。本文定义查询函数编写相应链码可实现根据专利名称、申请号及授权公告号的查询功能,产权人在维权环节查找历史交易记录时则可根据唯一的申请号和授权公告号实现精准查找。
Hyperledger Fabric 网络环境下,可调用智能合约实现专利交易的自动化操作,实现专利权人变更和变更后查询功能。为保证产权信息可追溯,编写链码函数来添加新状态,而不是删除之前的状态。专利权人变更记录会永久存储于区块链上,相关信息也会以水印方式嵌入对应专利的PDF 源文档中,用户在进行侵权诉讼时即可通过查询区块链上的存证信息和提取文档中水印信息为自身维权提供凭证。
本文对数据上链平均时延和交易查询平均时延进行了测试。测试中选择普通用户节peer0.org1.com作为发起数据上链交易的节点。在加入联盟链并开始进行查询访问之前,普通用户节点、国家知识产权局以及知识产权法庭等都需要向fabric-ca 服务器申请账号证书。peer0.org1.com 封装组织1 在身份管理模块生成的联盟链授权证书。通过使用这个授权证书,可以确保peer0.org1.com 节点在联盟链中的身份得到有效验证,并获得相应的访问权限。验证证书的序列号、有效期和指纹等信息,可以确认证书的真实性和完整性。
利用数据上链时间和交易查询时间这两个指标对系统进行测试时,记录下每次实验所需时间,测试5 次后得到平均时延,共测试50 次,数据上链和交易查询平均时延如图6 所示,随着交易次数的累积并不是完全呈上升趋势,呈稳定波动状态,平均时延分别为31.714 4 s 和34.208 s,能够满足农业知识产权系统数据确权与维权需求。
图6 测试结果
农业领域海量知识产权信息的可信确权与维护是我国智慧农业和创新驱动发展战略实施面临的一个难题。针对传统农业知识产权保护方案中存在的确权耗时长、维权成本高、侵权举证难和产权溯源困难等问题,本文对区块链技术在农业知识产权保护领域展开研究,提出了一种基于联盟链的农业知识产权确权方案,将产权信息和交易信息存储在区块链,原文档嵌入水印后加密存储于IPFS 系统。链上存储的交易信息以及嵌入的水印信息可为专利数据确权提供凭证,用户亦可通过时间戳、链上交易记录以及IPFS 系统中数据水印信息的提取完成维权申诉。本方案有完善的产权信息上链和交易信息查询模块满足用户需求,能切实保护用户权益。本方案还有一些不完善的地方,目前系统数据主要是农业种植技术领域的专利文件,下一步工作重点会扩充农业知识产权数据量,同时考虑本系统在农业知识产权领域的应用与推广。