张梦迪,高振记
(1.中国地质调查局发展研究中心,北京 100037;2.自然资源部地质信息技术重点实验室,北京 100037)
近年来,区块链技术作为信息化时代的新兴前沿技术,受到了政府层面及社会各行各业的广泛关注,在金融、物流、政务、司法、医疗、教育等领域均得到了一定程度地推广,特别是在产品溯源、跨境支付、数字产权保护等方面,体现出了极大的技术优势,取得了显著的应用成效,逐步形成了产业生态体系。2016年,国务院印发的《“十三五”国家信息化规划》中,指出要强化区块链等战略性前沿技术研究;2018年,工信部印发的《工业互联网发展行动计划(2018~2020年)》中,提出鼓励区块链等新兴技术在工业互联网中的应用与探索;2019年10月,国家主席习近平在中央政治局第十八次集体学习时强调,把区块链作为核心技术自主创新重要突破口,加快推动区块链技术和产业创新发展。
在云计算、区块链等新兴技术的推动下,大数据突破了传统行业的应用局限,正逐步上升为国家重要的基础性战略资源。地质科学工作属于数据密集型,地质数据多元化、海量、异构的特点非常突出。2017年起,中国地质调查局组织建成了国家首个地质调查综合信息服务平台——“地质云”。截止目前,平台梳理形成了涵盖基础地质、能源、矿产、水工环地质等12大类别的国家核心地质数据库体系,包含96个数据库,覆盖我国陆域及海域、“一带一路”沿线国家及全球70余个国家。在“加快建设世界一流的新型地质调查局”的目标指引下,进一步汇聚共享行业地质数据,打破传统行业壁垒,结合新兴技术,消除“数据孤岛”、加强数据资产管理、保护数据知识产权,是当前地质工作的重中之重。
现阶段,区块链在地学领域中的应用仍处于初步探索中,其在数字存证、产品溯源方面所具备的技术与经验能否成功移植到地质领域、如何利用区块链技术解决地质行业的传统技术瓶颈、区块链地质行业应用中需解决的关键技术点,是当前需要深入研究的问题。
区块链技术起源于2008年由中本聪发表的《比特币:一种点对点的电子现金系统》一文,其最初是一种按照时间顺序将数据区块以链条的方式组合成特定的链式数据结构,并以精确加密算法保证其数据不可篡改的分布式共享记账系统。随着应用场景的不断丰富,区块链逐步发展为一种去中心化基础架构与分布式计算方式,由数字货币向智能合约、去中心化互信行业应用扩展[1]。
区块链系统架构由数据层、网络层、共识层、激励层、合约层和应用层组成(图1)。数据层封装了链式存储的数据区块、非对称加密、时间戳等技术。数据连同相关信息被以特定方式编码封装到某区块中,同时给此区块加盖时间戳,并将此区块与整个区块链进行时序链接,构成区块链系统的数据基础;网络层包含了分布式组网机制、数据传播机制和数据验证机制等;共识层封装网络节点中的工作量证明机制(POW)、股权证明机制(POS)、授权股权证明机制(DPOS)等算法;激励层集成了发行机制和分配机制等经济因素;合约层封装各类脚本、算法和智能合约;应用层封装各种应用场景与案例,可采用公共链、联盟链、私有链等不同的应用模式[2-5]。
图1 区块链系统架构Fig.1 Structure of blockchain system
点对点分布式技术(P2P)、非对称加密技术、哈希算法、共识机制、智能合约是区块链的技术核心。因其去中心化、时序性、不可篡改、可编程性等特征,造就了成本低廉、安全性高、透明性强、扩展性大等诸多优势。
1) 去中心化:区块链系统基于分布式架构,各节点均保留相同且完整的数据记录库,且权利与义务均等。因此,较之于传统的中心集成化网络管理,区块链系统建立了分布式节点间的信息关系,且不存在单个中心被攻击导致整个数据网络瘫痪的缺点。
2) 时序性:区块链采用带时间戳的链式区块结构存储数据,区块间通过加密算法首尾链接,从而增加了时间维度,保证了可验证性与可追溯性。
3) 不可篡改性:区块链系统采用非对称密码学进行数据加密,新生成的数据块需全网其他节点共同核对,得到超过系统中多数节点的认证才会被添加到区块链中,一经添加将永久保存;所有节点共同维护,单一节点无法篡改记录;这种方式确保了区块链系统不可篡改与伪造,具有较高的安全可信性。
4) 可编程性:提供灵活的脚本代码,支持用户创建高级的智能合约及其他去中心化应用;智能合约可以替代现实中的合约,来执行产权交易等行为,其程序可实现自动运行和维护。
区块链的研究与应用呈现出爆发式增长态势,逐步从货币交易延伸至金融、供应链管理、物联网应用、数字产权保护等领域。IBM区块链发展报告中指出,全球90%的政府正在规划区块链投资,区块链将成为全球技术发展的前沿阵地。2018年美国《财富》杂志发布的新一期世界500强排行榜上,中国上榜的120家企业中46家都涉足区块链。工业和信息化部2018年统计数据显示,我国区块链产业新成立公司自2016年起有了显著增长,未来有望成为新的经济增长点。
区块链在金融领域的应用场景主要有数字货币交易、跨境支付与结算等,分布式账本技术保证了数字货币支付流通的安全可靠、公开透明,交易结算的自动化和瞬时效果[6];数字资产管理方面主要通过智能合约建立和执行数字知识资产协议,出现了一系列区块链技术支撑下的数字身份认证平台与资产登记系统[7-9];此外,区块链在医疗卫生、物流供应链等领域主要保障了电子病历管理、智能化物流跟踪防伪等环节[10-13]。
在地学领域,区块链的应用仍处于初步探索阶段。目前来看,在地下水监测与保护、自然资源确权登记、野外地质勘查设备供应等领域有了初步的探索经验与成效[14]。IBM公司利用物联网与卫星数据传输技术,将地下水数据记录在区块链平台上,供多方主体实时监测与跟踪,并利用智能合约促进加利福尼亚州地下水使用份额的交易,实现了地下水资源的可持续利用;武大吉奥信息技术有限公司于2018年推出了自然资源区块链版产品,旨在用区块链解决自然资源管理痛点;部分石油、天然气等地质资源相关勘探公司与供应商,将区块链技术应用于在勘查设备运输溯源、数据追踪保护等环节,“数字油田”“数字勘探”未来将不断涌现。此外,区块链在数字资产管理方面的应用也对地学文献资料的管理保护提供了相关经验。
大数据时代的到来为信息化建设提供了良好的发展机遇,但真正落实到数据的共享利用与产权保护等方面,目前仍存在种种技术壁垒和思维瓶颈。
1) 共享理念方面,目前大多数观念停留在数据共享是为了保管数据这一层面,而非更好地利用和挖掘数据,实际上,数据共享不只在“管”,更重在“用”。
2) 地质调查具有专业特殊性,所采集到的涉密数据及资料较多,数据加密保护技术研究基础薄弱,技术创新能力不强,导致数据共享成本高。
3) 海量的地质大数据中除结构化数据外,有很大一部分是碎片化的非结构数据,不同类型地质数据的应用场景与要求具有一定差别,这在一定程度上提高了数据共享的技术门槛与科学研究的时间成本。
1) 理论研究滞后,目前除矿产资源勘探发现权、著作权、专利外,其他权利的相关研究较少,对知识产权的保护主权、对象、范围、特征、原则等认识较模糊。
2) 信息技术的发展大幅降低了公众获取受知识产权保护客体的成本,而知识产权保护方面的监管控制停留在传统手段上,监管程序复杂,导致监管成本较高,产权保护效果不佳。
3) 产权保护方面的法律制度较笼统,且产权保护相关技术较落后,数据生产者和产品开发者的权益未能得到完善的保障,导致共享应用积极性不高。
如何突破目前地质大数据应用的种种瓶颈,利用区块链等前沿技术促进地质数据共享,提升知识产权保护能力亟待探索与研究。
从本质上讲,地质数据即是一种无形资产,同数字资产领域众多应用场景类似,地质数据也涉及从获取、存储到更新的全过程,同时存在专利认证与产品交易等环节。可借鉴区块链在数字资产管理方面的经验与技术,实现对地质信息资源的存储、确权、授权和实时监控[15]。
结合地质大数据的使用主体、属性类型、开放程度的差异,可构建公共链、联盟链、私有链融合共生的地质数据区块链架构,针对权属为国家、地调机构、个人的数据,满足其在互联网公开共享、内网申请共享、个人产权交易等不同的场景与需求(图2)。
其中:公共链针对地质调查中可对公共开放的数据资源,应用主体为关注地质的普通大众、个体形式的地质研究人员;联盟链针对以集体形式参与地质数据共享的组织机构,如地调机构、科研院所、高校等,共享数据涉及核心专业的地质数据资源、自主研发的软件和技术等;私有链针对机构内部对涉密数据的交换共享(表1)。同时可引入数据交互审计节点,便于跨链资源信息共享。
图2 地质数据区块链架构Fig.2 Structure of geological data system based on blockchain
表1 区块链地质数据应用模式
Table 1 Application mode of block chain in geology data
类型数据类型应用主体开放程度公共链可公共开放的数据资源普通大众完全去中心化(全网节点均可参与共识)联盟链专业地质数据资源、软件、技术地调机构、科研院所、高校部分去中心化(指定节点共识)私有链涉密数据机构内部权限由内部指定
这种混合型架构模式是一种目前理论上可行的地质数据应用框架,可在地质数据管理中建立去中心化、可信任的共享交换环境。实施过程中可从单一架构切入,逐步向混合架构模式扩展。
在公共链、联盟链、私有链混合架构基础上,去中心化、不可篡改、瞬时记录等特征为区块链在地质数据产权保护中的应用提供了技术可行性。借鉴数字资产管理中的应用经验,结合地质数据的行业特征,在数据产权保护的技术实现上,首先需要解决的是数据信息的确权存证、数据资产的唯一标识、产权交易中的智能合约这几个关键技术点。
4.2.1 数据信息的确权存证
数据信息的确权存证是区块链系统中的关键环节,也是地质数据知识产权保护的核心步骤。以一份地质数据为例,作者把数据上传到原始区块链系统中后,数据及其相关信息以特定的编码方式储存到一个区块中,通过与已上链数据的比对进行确权,而后此区块被加盖相应时间戳,并依据数据及信息的特征加密抽象为缩略版的版权信息,同时依据一定规则生成版权认证证书,并根据信息的生成和更新形成按时间顺序连接的链路。保存在区块链中的时间戳能够被全网中各参与主体看到,它提供了某人在特定时间访问了特定文件的证据,地质数据的创作者通常是第一个访问该文件的人,其作者身份因此能够得以证明。经过确权认证,系统当即生成认证证书,并进行全网同步(图3)。此后这份数据经历的每次访问与修改均会被系统记录并在网络各节点进行同步更新。
图3 区块链知识产权确权流程Fig.3 Process of intellectual property confirmation in blockchain system
4.2.2 数据资产的唯一标识
地质行业涉及岩石、地层、构造、矿产、水文、环境等诸多方面,勘查手段也极其丰富。地质数据获取难度大、成本高,其混合性、变异性、相关性等随时间、空间及地质体的不同而各异。同一区域的地质调查成果数据,往往因为地质勘查手段、勘查时间、勘查尺度的不同而产生较大差异,同时,数据可能来源于野外勘查、内业数据处理与分析、单位业务管理、成果汇交与存档等全流程中的各个环节,并且成果数据往往具备再研究挖掘的价值。因此,较之普通的数字资产,地质数据具有数量庞大、内容复杂、体系众多、衍生性强等特点。
区块链系统对上链数据的任何一次访问、更改等操作均进行哈希编码并记录,在保证过程记录完整性的同时,也造成了同一份地质数据的多个记录版本,造成有效内容比对过程复杂,导致管理成本高等问题。因此,针对行业地质数据,在确权认证后,有必要进行资产唯一标识。可借鉴出版行业普遍使用的数字对象唯一标识符(digital object identifier,DOI),依据地质数据的采集区域、采集手段、专业类别、数据格式、数据尺度、涉密级别、提供单位等信息,设计相关编码方案,针对确权比对后的数据,生成唯一标识码,同时,可形成二维码、条形码、字符码等形式的版权认证证书。版权认证证书是地质数据唯一确定的标识认证,同时也便于数据版本更新、衍生研究等不同情形下的产权溯源与原始标记。
4.2.3 产权交易中的智能合约
智能合约技术是区块链在产权交易场景的技术基础,也是解决区块链在地学领域产权交易应用的关键所在。智能合约在区块链可编程性的基础上设计,其核心是存储于区块链上的一组程序代码,它规定了产权交易的预定义状态、转换规则、触发合约的条件、特定情景下的应用措施、违约条件及责任等(图4)。这组编码能读取区块链中的数据,自动执行合约内容。交易程序中包含公钥和私钥, 私钥本质上是由产品拥有者持有的一组加密数组,能生成对应的公钥和地址,用于后续交易[16-17]。
针对具备自主知识产权并有产权交易意向的单位或个人,在用户于系统中发起数据购买或产权交易申请后,系统根据数据的相关信息通知数据所有者,并在所有者和使用者达成合约共识后形成智能合约,在无需第三方监督的情况下,系统自动执行合约内容,促进交易的高效完成。合约执行后,数据使用者获得带有相关权限规定的文件与解密密钥,进行数据的使用。同样,此过程的相关信息被同步更新到区块链系统中(图5)。
图4 区块链智能合约运行机理Fig.4 Operation mechanism of smart contract
图5 区块链智能合约操作流程Fig.5 Transaction procedure of smart contract
去中心化、可追溯、不可篡改等种种能够解决信息时代“痛点”的技术特征,使得区块链从金融领域逐渐扩展应用到多个行业,在全球掀起了一场技术革新与产业变革。目前,针对区块链技术的行业规范与安全保障体系正在建立与完善,对其技术风险的分析研究也在不断深入与成熟。未来区块链技术有望在推动科技创新与经济融合发展中起到更重要的作用。
现阶段,区块链在地质领域的应用尚在初步探索中,其在数字货币、资产交易中的核心优势为地质数据知识产权保护带来了技术可行性。如何延续区块链技术的成功经验,解决应用的关键技术点,仍需进一步研究与挖掘。在地质调查信息化转型的背景下,机遇与挑战并存,唯有不断提升原始创新能力,加快核心技术突破,找到新兴技术与传统行业的契合点,分析主要矛盾,对症下药,才能真正实现技术创新、技术落地,为新时期地质调查工作创造价值。