蒋 宇 , 关克平
(上海海事大学 a. 商船学院; b. 全球航行状况研究中心, 上海 201306)
如今政府和企业越来越依赖于信息系统的可靠运行,关键性行业数据成为最重要的社会资产。在过去的10 a里,Browser/Server 模式的海事信息查询服务被广泛采用,大多是基于中心化公钥基础设施认证中心(Public Key Infrastructure/Certificate Authority,PKI/CA)的认证架构[1],潜在的安全风险使数据的可信度面临严峻的挑战[2],利用海事局后台漏洞,利益团体多次入侵、添加及篡改执业认证;境外组织针对中国海事窃取敏感信息[3],严重侵害海事信息安全。
由于海事管理的特殊性,依赖于港口终端之间的往返运输,涉及复杂的信息交互,呈现点多、线长、面广、错综交叉和各自分散的特点。数据在局部节点处堆积,产生行业、地区隔离,甚至形成信息孤岛,为此需要现场走访,工作时常难以推进,给从业人员、企业单位和管理部门带来困扰。海事有大量的身份认证,而适任证书的登记、注册及海事检查等需通过纸质文件进行验核。管理上存在诸多不便,资历伪造、套牌证和假证等时有发生。近几年,特别是针对涉外检查,造假查处的困难尤为突显,比如怀疑外籍船员或船舶持假证,现场却无法利用自有系统核查其真实性而须委托证书发放机关配合支持,常致使相关工作难以展开。针对这一情况,相关研究相对较少,比较有代表性的是彭国均等[4]引入欧盟MONALISA海事工程中船员身份远程认证技术,结合海事身份认证卡与船舶自动识别系统(Automatic Identification System,AIS)通过岸基数据校对,完成验证,由于缺乏数据共享资源,难以广泛实施。黄鹏飞等[5]利用射频识别(Radio Frequency Identification,RFID)、指纹识别改进该系统,后续设计开发查验终端[6],而实施过程人工较多,不具备自适应性,岸基数据共享尚未解决导致难以在跨区域、多部门信息协作中展开,以上现状迫切需要新思路加以解决。
为减少纸质证书的管理负担,提高信息核对效率,国际海事组织第40届会议对《电子证书使用导则》内容和要求进行更新,鼓励各海事成员国接受、使用电子证书[7];因为缺乏有效共识机制且验证技术不统一,不同地区的海事部门常否认使用电子证书的有效性,阻碍涉及更广泛的海事参与主体信息协作。区块链技术的出现使得这类问题能够得到较好的解决,聚合相关信息形成新的“航运护照”,实现“一个窗口”简化操作。
作为比特币的底层技术,区块链广泛的应用前景引发了现象级关注。国内研究联盟相继成立,同时政府肯定了区块链的发展:2016年12月区块链写入《“十三五”国家信息化规划》;2018年3月,工信部在《2018年信息化和软件服务业标准化工作要点》中提出推动形成区块链标准规范。集中在金融、能源、医疗和供应链等沉淀了丰富的研究成果与实践案例[8-9],LARIMER于2014年提出股份授权证明(Delegated Proof of Stake,DPoS)共识算法以解决权益证明(Proof of Stake,POS)中节点离线也能累积币龄的安全缺陷,同时加快区块同步速度。[10]为获得更好的区块链扩展性,蔡维德等[11]开发摒弃挖矿机制的北航链,采用信誉机制来决定投票节点,优点是吞吐强度大、延迟低、出块迅速和鲁棒性好。FROMKNECHT等[12]提出以比特币区块链网络为框架的去中心化 PKI 认证体系,使用Certcoin代替CA,数据记录储存在区块链外部。
针对现有海事管理中的难题,本文提出基于区块链技术的海事信息管理模式,设计并应用模型,以区块链技术优势和原理为出发点,广泛扩展海事信息管理的适用范围,实现高效、平等和信任的多部门信息协同。
区块链是比特币的底层技术,首次定义区块链是NAKAMOTO[13]发表的论文《比特币:一种点对点的电子现金统》中提出的,划时代地构建无需第三方信任(公证)节点即可完成交易的点到点数字货币体系,具有去中心化、信息可追溯、不可篡改、公开透明兼具保护隐私的优势[14],解决困扰已久的“双重支付问题[15]”和“拜占庭将军问题[16]”两大问题。2009年1月9日出现序号为1的区块,与创世区块相连接形成链,标志着世界第1条区块链的诞生。区块链技术具有以下特征:
1) 去中心化:区块链分布式网络结构见图1。其最突出的特征是去中心化:通过分布式计算和存储,不依赖第三方中心治理,容忍多节点崩溃而保持稳定;基于协商一致的技术规范,由多方参与共同管理和维护,达成全网共识后,能实现自适应地信息管理和价值传递,具有高容错、抗攻击和防合谋等优点。
a) 传统中心化网络结构
b) 层级式网络结构
c) 区块链分布式网络结构
2) 开放性:区块链网络各成员节点组成系统本身,数据高度冗余,除各方的敏感信息外,全局系统信息对外公开,高度透明。
3) 不可篡改:按照时间线形顺序成链,数据一旦被验证就不可再逆转。
4) 可追溯:区块链上存储着自创始区块诞生以来的所有事务记录,可还原所有历史操作包括信息查询,便于事中监督与事后审计。
5) 数据冗余:区块是具有联系的前后指向存储单元,冗余存储保证全节点保持完整可靠的历史事务记录。
6) 安全性:区块链采取的是完全冗余、节点共同治理的策略。更改某一区块的数据必须保证大多数全节点被同时修改形成最长链,这种情况近乎不可能,信息欺诈不再具有可实施性,使得链上数据更安全。区块链能够有效预防故障与攻击,自2009年运营至今的比特币网络验证其健壮性。针对著名“51%攻击问题”[17]以比特币网络为例作简短的安全分析。其攻击原理是:最快地计算正确的解以造成区块链分叉,形成最长链,所写入的信息将被接受为真实信息,以达到篡改数据的目的。TOP 500 LISTS是始于1993年每半年发布已安装的全球500强超级计算机排行榜,取2017年11月最新的TOP 500超算峰值速度数据[18]进行累计求和,累计浮点算力统计见图2。
图2 TOP 500超算浮点运算峰值累计
TOP 500超算集群单精度浮点运算峰值速度为1 339 339.1TFLOPS记Rpeak,而12 700次单精度浮点运算(12 700FLOPS)约等于1次SHA-256散列运算[19],因此,可换算得到超算散列率为105.46TH/s记为Hpeak(区块链处理事务的能力)。2017年同时刻比特币网络散列率为10 309 520 TH/s,见图3,记为Hbitnet。假设TOP 500超算组成算力集群加入比特币区块链,则占到整个网络的算力占比为
(1)
由式(1)得散列率占比P为1.023×10-5,为整个区块链算力的十万分之一,以目前的比特币全网积累的算力来看,超算集群为超越最长链,试图篡改区块数据而进行“51%攻击”不具有可观的实施性,并且操控51%算力所需的资源成本远超可预计回报,人总是趋向有利的一面,在诚实劳动所能获得的酬劳远高于非法牟利时,很少有人会花费力气进行欺骗;另外,篡改要经受全网节点的高冗余检验,区块链的时间戳技术与链式结构的最长链原则,决定了制造欺骗出现前所未有的困难。因此,区块链的全节点越多,系统的可靠与安全性越强,欺骗变得近乎不再可能。但是对小型公有链来说来自成规模的矿池“51%攻击”威胁依旧存在。
图3 比特币区块链网络散列率
随着我国海事信息化工作的建设,以海事局为中心的管理部门建立了大量业务管理信息系统,实现申请和查询等业务办理电子化来代替部分纸质化办公流程,覆盖交通运输部海事局直属海事局以及分支局工作站。近期上海海事局海事系统共享数据库建设工程解决了业务系统异构产生的通而不联的难题,起到了极大的行政支持,但因早期复杂业务需要和软件招标采购等原因,多级系统内部数据相对分散,目前没有完全实现内外数据同步。多部门协同机制的差异且信息资源共享存在着分歧,通常数据交换需要人工核对,甚至现场走访,如港口相关记录、海关货物信息、边检出入境信息和水利污染等,造成行政能力的浪费。[20]
围绕船员和船舶的身份认证贯穿海事多个环节,冗杂的纸质办公耗费了管理资源,经欧盟提议,2013年国际海事组织第39届会议通过《电子证书使用导则》鼓励各海事成员国认可并使用电子证书,弥补纸质证书遇到未及时送船在港口国检查中视作缺陷处理等困扰。避免过度依赖纸质文件而在登记、鉴定和海事检查中,消耗行政资源受理相关事务,减少对港口国监督检查官(Port State Control Officer,PSCO)、在船人员和相关部门带来人力消耗与额外负担。
丹麦海事局首先在2016年中旬宣布对船舶签发电子证书,给一百多年来传统的船舶纸质证书认证的方式画上句号。2016年11月新加坡海事管理部门宣布并通过电子证书以替代法定纸质证书。随后,新加坡、挪威和日本等国也陆续完成多种重要电子证书的核发。全球范围内船舶证书的电子化发展趋势不可逆转,但限于未达成有效共识,验证接口不一致,因此阻碍电子证书的进一步扩大应用。同样面临挑战的是安全问题,2017年马士基航运集团曾遭受“NotPetya”网络攻击,服务器大面积宕机,电子货单、符合证明等锁死,无法追踪货物,造成数亿美元损失。强健的中心化信息管理结构也可能因此面临安全威胁,所以如何保障网络储存安全、认证信息准确有效、广泛认可是海事信息管理中亟待解决的问题。
传统的海事信息管理系统主要由单一机构管理和维护,拥有绝对的控制权,上下位机构无法完整了解数据的更新过程。在多方参与横向协作的场景中,由于缺乏有效信任机制,往往都会独自构建承载自己业务信息的数据系统,技术标准不一致,信息在单个节点处堆积,造成通而不畅的信息孤岛问题[21],系统对接引起繁琐的人工校对和沟通争议,信息流转周期较长。区块链用技术机制解决管理上很难平衡的信息协作和多方信任问题。为阐述区块链的海事场景应用,以船员信息管理为典型演示,并作有针对地展开。
以太坊创始人提出区块链从架构上可划分为公有链、联盟链与私有链等3种类型[22],贴合于海事应用场景的需要,联盟链提供一种混合折中的模式,链上预选管理节点为特定海事相关机构所组成,确保与实际海事行政机构等主体对应,规则制定较公有链更为灵活。根据共识机制,预选管理节点可对全局网络实现多方共同治理,例如区块的生成可能需要20个预选节点中的11个来完成确认,未经授权的节点仅能通过此区块链对外开放的应用程序编程接口(Application Programming Interface,API)接口进行查询,但不参与共识过程。对于需要内网物理隔离的保密数据,私有链是更合适的选择。
海事信息管理体系区块链基础架构见图4,区块链可分为:数据层、网络层、共识层、激励层、合约层和应用层。
3.2.1数据层
区块链中的每一个区块由区块头和区块体组成。其中:区块头包含版本号、前一区块哈希(Hash)、时间戳和随机数;区块体包含数据信息和公私钥的具体操作。大量运用密码学和安全技术的研究成果以保护区块中最长链的信息安全,涉及哈希函数、公私密钥对、数字签名(公私密钥对解密,信息摘要与原始数据进行匹配),其中哈希函数将任意大小的数字、字符串或其他信息转化成长度固定且唯一的安全散列算法码(Secure Hash Algorithm,SHA),形成信息摘要以便统一储存与识别,整个过程具有单向性和隐秘性,既不能反向解出原始信息又无法尝试找到输入值,在非对称加密体系下,能够保证海事信息的安全与隐私。
图4 海事信息管理体系区块链基础架构
数据层区块结构与成链方式见图5。图5中灰色区域箭头指向组成链状结构,前后相连的区块哈希值保持一致,是一串表明数据存储的地址,区块头内哈希指针指向上一区块头哈希,从而为信息可溯源提供路径。时间戳通常是一串数字序列,包含在区块头中,唯一能标识某一创建时间,区块内部的哈希指针形成Merkle树(大多为二叉Merkle树),数据被两两分裂成较小单位经过哈希函数挂载在上一层的父节点,最终得到一个总的哈希值(即图5中哈希123456)直至Merkle根,这种结构极大地提高了区块链的整体效率和可扩展性,使得区块头不必封装所有底层元数据,网络中轻量节点如移动设备也能有效参与。
区块链形成演示见图6,成链过程(不包括链变化)每个新的区块都包含上一个区块的哈希,前后指向关系,实现了防篡改,所有区块按序相连就形成区块链。
为确保区块链具有不可篡改性,任意部位的数据变更致使下一区块的哈希指针错误,产生区块链分叉,备用链成为新的最长链。另外,这种非循环排列的Merkle树是区块成链结构的实现方式,可提供简洁的归属证明,使得区块链上的信息能够快速校验同时可追溯。在实际运营中,每个区块包含到目前为止的所有海事数据信息和区块元数据,一旦被海事管理节点共同确认出块后就不可篡改。
图5 数据层区块结构与成链方式
图6 区块链形成演示
3.2.2网络层
包括去中心化的点对点组网机制,数据交换协议和验证访问机制,具有健壮性和高容错。节点之间通过共同维护区块链结构以广播的形式发送给其他节点来保持信息联动与验证。
3.2.3共识层
DPoS股份授权证明机制是实现去中心化的有效共识、共同治理的前提。首先预选的海事相关机构成为链上管理节点,进行类似董事会投票,产生2n+1个管理节点清单,在每个维护周期内,清单重新随机排序。如果管理节点由于算力不符或宕机故障不能在权限时间内履行出块职责时,则会跳过此节点且剔除出队列,出块权限轮转给下一管理节点。与比特币区块链采用的共识机制工作量证明(Proof of Work,PoW)相比,本文所采用的DPoS有效地减少不必要的工作量,胜任记录要求,很好地解决出块速度和性能需求以及PoW能耗过大的平衡问题。
3.2.4激励层
由于涉及行政推动和公共管理需求,弱化了激励层的作用,DPoS股份授权证明机制补偿这部分机制的内容。
3.2.5合约层
能够封装服务于海事信息管理的各类脚本与可编程的智能合约[23],在海事区块链网络达到某个确定的约束条件的情况下自适应执行,是区块链去信任的表达与实现层。
3.2.6应用层
借助全网络算力可封装部署海事相关链上应用,可编程海事体系也可搭建在应用层,类似现有海事信息Web查询与“口袋工程”等,可插拔设计,模块化拓展方便,实现高内聚低耦合。
根据区块链技术路径,以证书为例,海事信息认证与验核管理的实现流程见图7。
图7 海事信息管理认证与验核实现流程
3.3.1海事信息认证
证书持有者向海事相关机构所组成的管理节点提交申请,如适任证书更新、注册和注销等操作,在确保证书信息有效和身份匹配核实后,反馈给证书持有者。全网广播证书信息认证,证书持有者利用私钥进行认领,全网管理节点完成新区块的同步。通过区块同步信息,可追溯出具体到某一管理节点对认证信息的验核情况,多节点冗余信息和时间戳来验证证书本身的内容。作为整合利用和补充,还可筛选收集原有数据库信息(适任证书,服务簿号码,培训合格证,签发机关和签发日期),服务资历(任解职记录,船名、航线、吨位、职务、时间)和广义的职业信息(个人信息,职业与教育背景,海龄,曾供职的公司等)以规范格式提交记录,打包成总的信息摘要,最终通过Merkle根锚定到海事信息区块链中。尤其是链上认证信息应当符合《电子证书使用导则》要求,与本国认可的国际海事公约一致并遵守相应海事法规,存储相关认证信息的节点可位于某一地区、国家,但链上信息摘要将是国际性的。
3.3.2海事信息验核
证书持有者向应用节点(跨域海事、主管机关、招聘企业)提交区块链账户地址,用于验核信息。应用节点通过联盟链链上的智能合约与验证应用提交查询请求,证书持有者用私钥进行数字签名,系统返回查询结果,比对无误后完成信息验核。区块链的不可篡改的特性和时间戳的存在,使得网络内任何授权节点均能够快速便利地验证证书真伪,而利用后台漏洞篡改证书信息的信用欺诈似乎不再可能。
基于联盟链架构,目前采用DPoS共识的行业落地应用已经达到秒级的共识验证;在每秒事务处理量(Transaction Per Second,TPS)方面,能够实现并行处理事务数千甚至上万次,从已经落地的区块链应用来看,大多数TPS日常需求约在3 000,满足功能需要,吞吐量已不再是主要瓶颈。
不同于比特币或以太坊等公有链,涉及频繁的交易事务,数据体积存在无止境膨胀的情况,本文针对的海事应用,静态信息大小是长期可预期的,区块增长和网络需求接近于线型,节点硬件和带宽水平可以较好地在初期进行规划。
以中国为例,截至2017年底,注册海船船员共计71万人(不包括内河)[24],假定每名海船船员的认证信息所需数据空间为100 KB单体配额(充裕),总计约67.7 GB,海员队伍规模相对稳定,故链上数据在此基础上的增长有限。关键数据上链和非关键数据信息指纹上链,可实现进一步压缩。针对非关键数据,利用SHA256 等算法,将任意长度的数据信息转换为固定字节的哈希,通过上述 Merkle 树的记录方法,迭代解算出Merkle 根的哈希值,作为总哈希值挂载在区块头内,利用式(2)中实现方式能够大幅缩减数据体积。
HashFinal=Hash(Sha256,hash(SHA256,N))
(2)
式(2)中:N为迭代次数。
在实际跨部门部署中,可不改变原有多方信任体系的认证方式,将各域的信任锚嵌入区块链环境,以实现跨部门认证,系统的可扩展性强,形成海事相关部门信息联动,解决现有海事信息管理的异构劣势。避免重复建设和浪费行政资源,链上信息不是从零开始,而是借助于既有的中心化数据库将关键信息二次筛选适当转化,化零为整,作为区块链的初始数据使用。
与现有的海事信息管理方式相比,引入区块链技术可涉及更广泛的参与主体,扩大适用范围,一系列新的成员节点诸如培训学校、航运公司、涉及水上交通的其他部门(如海警、海关、边防、港口等)及跨国海事主管也都可加入其中。有效改进信息交互模式,解决因为核验技术、标准不同妨碍电子证书认可的问题,有利于跨区域的信息协同。适应简政放权中“放管服”改革要求,推动相关海事部门集中投入到事中事后的引导监管。
区块链的信任机制优势使得船员适任证书在广泛区域有序流动成为可能。通过区块链公证与技术背书,疏通国际求职通道,帮助本国船员“走出去”。链上数据的整合沉淀,可帮助跟踪管理船员,建立职业信用机制,真实描绘船员群体画像,辅助行政部门作出宏观决策,从单一对象管理转向生态级数据治理,最终赋能海事;同时为“21世纪海上丝绸之路”沿线国家的海事基础信息协作保驾护航,是国家战略下“海事作为”的实现路径。
作为国际海事组织A类理事国、航运大国和船员大国,尽早结合区块链技术进行海事应用,搭建自主研控的底层区块链,确保核心技术、必要标准不受制于传统海事强国,结合智能合约,给未来无边界的海事体系多元治理提供可用选项,实施广泛规模的高效协作,以构筑强有力的海事共同体。