闾海荣,姜楠,许瑞坤,周容辰
1.清华大学自动化系,信息国家实验室生物信息学研究部,北京 100084
2.北京爱医声科技有限公司,北京 100083
自 1999年麻省理工学院首次提出物联网的概念以来,随着相关研究的深入以及技术的发展,物联网的定义从最初通过无线射频识别设备相互连接的网络不断丰富延伸。今天,物联网将接入的所有物体数字化以实现物理实体的信息化,并依赖组网技术为物体之间、物体与人之间提供高效稳定的资源共享与信息交流通道,作为物理空间与信息空间融合的桥梁,物联网是比互联网更广范围的信息交互处理网络[1]。
虽然物联网技术的发展仍属于初期,但因其在提高生产效率和改善生活质量方面的巨大潜力已被广泛试用于社会的各行各业当中。无论是在传统行业的农业种植、工业生产、物流流转、金融融资, 还是在新兴产业中的智能家居、智慧医疗、智能电网等领域,都能发现许多物联网应用的案例[2]。特别是在近年来以 5G 为代表的移动通信技术迅猛发展的背景下,许多研究者预估,物联网将会成为一种新的产业革命,是一支推动如工业 4.0 与工业互联网等产业变革的重要力量[3-4]。
目前,物联网距离大规模成熟应用还有一些亟待解决的问题:(1)物联网中设备之间差别大,共享信息为异构数据,互操作性弱;(2)传统物联网多由分布式设备和中心化数据处理节点构成,在实际运转及接入新设备时会存在通信延时高与易受DDoS 攻击等问题,从而导致物联网可扩展性差;(3)物联网中共享的数据往往涉及用户隐私,保密程度深,安全要求高,物联网可能会因此被恶意攻击[5]。
区块链的出现有助于解决传统物联网的上述缺陷,作为支撑比特币[6]的底层技术——区块链最早被当做比特币的代名词,涵盖了密码学原理、共识机制与链式结构等定义,具备匿名、可追溯、不可篡改与去中心化的核心特征。其后以太坊[7]中应用的智能合约增加了区块链对于数据处理的执行功能。经过最近几年研究人员的不懈探索,区块链与物联网的结合正逐步成为一个很有前景的研究领域[8]。本研究从SCI、EI 等收录的核心期刊中选取了近年国内外具有前沿创新性的75 篇论文[8,13-87]。本文主要整理了这 75 篇期刊文献,并辅以陈超美教授开发的CiteSpace[9]对文献进行计量分析,总结区块链在物联网中应用的研究热点和前沿,归纳区块链和物联网结合的应用态势。
1.1.1 基础架构
物联网的基本组成元素包含传感器、执行设备、计算服务器和通信网络。传感器采集状态信息,通过网 络传输至计算服务器进行存储。按照用户需求,计算服务器调用算法处理数据得到控制指令,最终通过网络传输对执行设备进行操控。
传感器是物联网感知物理环境的终端,并不局限于工业场景中监测温度、湿度或压力等狭义传感器,还包括了手机、电视甚至微波炉等其他提供自身或环境状态信息的终端。执行设备指可影响周边环境状态的设备,例如空调调节环境温度,台灯改变环境亮度等。一般情况下,由于物联网终端设备存储与计算能力欠缺,其仅能对采集的状态数据进行预处理,大规模的数据存储与处理仍需依赖独立的计算服务器。物联网终端设备之间及其与计算服务器之间通常以无线形式连接,因为实际应用场景中的物联网各设备所处物理位置分散且相距较远,所以常见的网络拓扑结构有 Mesh、星型等[10]。
如图1 所示,常见的物联网结构分为五层:感知层、传输层、处理层、应用层和业务层。
图1 物联网五层架构Fig.1 Five layers of Internet of Things
(1)感知层:本质是物理层,由各种采集环境参数及识别其他物联网设备的传感器组成。
(2)传输层:通过网络将传感器数据在感知层与处理层之间双向传输,主要网络种类包括 4G、5G、WLAN、LAN、蓝牙和 NFC 等。
(3)处理层:又被称作中间件层,利用数据库、云计算、边缘计算与机器学习等技术,存储、分析及处理传输层提供的海量数据。
(4)应用层:根据用户需求提供物联网定制服务,例如智能家居和智能医疗等。
(5)业务层:负责管理整个物联网系统,涉及到应用、运营、商业模型、用户隐私与数据安全等各方面业务。
1.1.2 问题与挑战
物联网通过网络连接大量不同的终端设备,搭建物理域和信息域之间的桥梁,其发展仍有不少需要应对的问题与挑战,主要可以概括为以下三个方面:
(1)互操作性:物联网的终端设备包含许多传感器与执行器,它们的运行机理、操作方式和功能作用各有不同,由此也导致彼此采集或接收的数据标准不统一,例如温度传感器工作在弱电区间,采集的数据为连续浮点型,而智能开关工作在强电区间,接收数据为布尔型。除此以外,不同设备之间连接的通信协议也有差异,例如有线与无线、NFC 与 RFID 之间的转换等同样制约着物联网的互操作性。
(2)可扩展性:物联网在扩展或并合时,存在不同结构的网络融合的问题,例如mesh 结构网络与星型网络的融合。并且如果物联网中存在中心服务器,在接入其他物理距离较远的物联网时,会引发通信延迟的问题。
(3)隐私安全:物联网中传输的数据与家庭生活或者企业运转等息息相关,海量的数据深处隐藏着个人隐私和商业机密。物联网处理层的第三方服务器在解决终端设备能力不足问题的同时,也带来了隐私泄露的风险。而随着物联网不断接入新的设备,仅仅依靠权限认证、访问控制以及数据加密等传统安防手段,一方面会降低物联网的运行效率, 另一方面也会因不断变化的恶意攻击面临安全漏洞。
1.2.1 简介
区块链最早作为分布式账本出现,账本中记载着各方的交易信息,p2p 网络中的所有节点共同维护一个相同的账本。区块链技术保证了这份交易账本的安全、可追溯与不可篡改,同时因为用户信息加密和去中心化,还保护了交易双方的隐私。根据用户权限的不同,区块链分为如下表1 所示的公有链、联盟链和私有链。
表1 区块链分类Table 1 Types of blockchain
区块链的结构如图2 所示,顾名思义,区块链是由多个区块以一定形式链合而成。区块由区块头和区块体组成,区块体记录具体的交易信息,而区块头则包含了时间戳,前一区块哈希值,区块体中所有交易构成的Merkle 树根节点以及共识达成时的验证参数。
区块链的底层技术包含数字签名、哈希函数和 Merkle 树。简而言之,数字签名是指加密用的私钥 Sk与解密用的公钥 Pk不同,其中公钥 Pk可由私钥Sk求得,但是私钥 Sk无法由公钥 Pk求得。数字签名常用于身份认证等场合,即对某一用户的密文进行解密并与明文比对以验证信息是否由用户本人发出,同时因私钥 Sk不可知而无法伪造加密过程。哈希函数ℎasℎ(m) =ℎ是一种不可逆的伪随机数生成算法,其将任意数据 m 映射到固定长度的哈希值ℎ。一般对于不同的 m,其哈希值ℎ一般不同。Merkle 树本质是许多数据的哈希树,叶节点代表了数据,父节点则是子节点两两相接后的哈希值。
用户加入区块链网络,服务端会向用户发送由随机数生成的私钥Sk,同时将公钥Pk作为地址以代替身份信息。用户在匿名状态下以智能合约形式相互交易,固定时间窗口内所有交易组成 Merkle树并被打包成新区块。新区块在连接到区块链前,需经过共识机制以解决一致性问题。每隔一个周期,区块链网络中的各节点会自动同步到最长的区块链。
图2 区块链基本结构Fig.2 Basic structure of blockchain
1.2.2 共识机制
共识机制是区块链技术的基础与核心,它决定了各方节点如何就延长区块链的问题达成共识。共识机制在区块链技术中的应用,是为了在去第三方的前提下解决故障节点或恶意攻击的问题,保证各节点账本数据的一致性。目前,常见的共识机制算法包括工作量证明算法(PoW)、权益证明算法(PoS)和实用拜占庭容错算法(PBFT)[11]等。不同的区块链系统采用不同的共识机制,以平衡去中心化、效率和安全的三角矛盾。
1.2.3 智能合约
智能合约是一段可执行的计算机代码,具有去第三方中介、自我验证和自动执行的特点。区块链上的智能合约因为去中心化、可编程、可追溯以及不可篡改等特点,在未来的信息共享、资产管理和契约执行等领域大有前景。
上半年来,全球经济出现复苏,发达国家失业率持续下降,欧美经济保持了增长的态势,但复苏基础并不稳固,复苏节奏也不均衡,欧元区经济增速放缓,新兴市场经济动荡加剧(见表1)。
智能合约根据签订方需求编写,并发起“合约创建交易”,经过共识机制,智能合约会被存储在区块链的某区块中。同时,用户得到返回的智能合约地址和接口等信息。在调用智能合约时,由用户发起智能合约调用交易,参与共识机制的节点收到交易后在本地沙箱中执行调用的智能合约 代码[12]。
1.2.4 与物联网的契合度
区块链将节点间通讯与合作抽离出来,各节点只需要按照区块链协议进行作业,在满足安全条件(如比特币诚实节点算力占总体50%以上)下即可信任和放心使用自己所存储的全局数据和信息,并安全地提交和确认自己的提案。区块链的高速发展带来了大量的可选择方案和开源项目,很容易移植到物联网,并与物联网进行融合。融合后互操作性、可拓展性和隐私安全等物联网问题可以交由专业的区块链机制解决,节点在实现区块链协议之后,就可以专注于自己的业务和工作。
为探究国内区块链在物联网中应用的研究热点,本文以SCI、EI 等为文献来源,共检索得到关键字同时包含” 区块链” 和” 物联网” 的国内外期刊论文 75 篇。这些论文的研究主题可归纳总结为三个方向:(1)区块链对物联网数据隐私和安全的保护; (2)区块链加物联网在社会经济中的应用场景; (3)区块链和物联网结合在大数据时代的机遇挑战。
本文利用 CiteSpace 工具对上述 2016年 2020年的75 篇文献以年为单位分割,选取每个时间分区的全部节点数据进行关键词共现分析,所得结果如图3和表2 所示。CiteSpace 的关键词共现分析参照了网络结构洞思想,节点的中介中心性能可引导我们发现当前的研究热点。
图3 区块链加物联网的研究热点Fig.3 Research hotspots in blockchain and IoT
通过分析 CiteSpace 的关键词共现分析结果, 本文得出区块链在物联网中应用的三个主要方向的研究热点:(1)智能合约及去中心化的共识机制是区块链保护物联网数据隐私和安全的基础方法; (2)传统产业为主的数字经济、金融科技和保险科技等是区块链加物联网的主要应用场景;(3)大数据、云计算、人工智能和5G 等新技术的产生发展是区块链和物联网结合的重要机遇挑战。
表2 CiteSpace 节点的中心度Table 2 Node degree centrality in CiteSpace
物联网中数据的全生命周期从产生、存储、管理再到共享,其中的数据隐私和安全保护涉及节点(物联网设备和用户)接入、访问控制和行为监管等流程,研究者针对上述阶段,利用区块链去中心化、匿名性、数据可溯源与不可篡改等特性,通过智能合约和共识机制等区块链技术设计了相应的解决方案。
3.1.1 节点接入
3.1.2 访问控制
访问控制决定物联网中的用户权限,是保护数据隐私和安全的重要方式之一。OAuth 协议作为用户资源授权的标准,提供安全开放的认证服务,在物联网中被广泛应用。为了减少过度依赖权威机构对资源授权认证,研究者[46-47]提出了基于区块链的分布式OAuth 协议,探索了去信任网络中用户的身份认证和资源授权。研究者[48]定义了设备之间的数据交换协议,通过区块链实现了动态访问控制流程,但该方法因为过于简单的智能合约设计,而无法支持复杂的访问控制策略且无法对重复的访问请求信息进行有效的验证。近期,越来越多的研究工作提出使用智能合约来管理物联网环境中的资源授权,实现去中心化的权限管理。研究者[49]提出了使用以太坊及其智能合约平台来管理物联网设备,基于以太坊账户模型进行设备的身份管理,将访问权限策略部署到智能合约上,并通过执行智能合约去操作链上的资源。相似的,研究者[50]介绍了基于OMAM(Objective Model & Architecture mechanism)[51]
授权模型,通过智能合约定义了资源授权、资源获取、资源委托和访问权限撤销等授权操作,实现隐私安全的自主访问控制。研究者[52]则提出了另一种基于智能合约的物联网访问控制方案,该方案将物联网和区块链分为公有和私有两类,引用智能网关既作为私有物联网和区块链的中心管理节点,也作为公有区块链的挖矿节点,通过访问控制合约对用户进行授权。此外,研究者还探索了将区块链作为访问控制模型中可信实体的可能性。例如,一种被称为基于区块链的物联网访问控制(BBIAC)结合了基于属性和基于权能的访问控制模型的属性和令牌的概念,将属性作为基本决策要素,并把权限映射为代币(token)以减小区块链对访问控制性能的资源消耗[53]。针对基于属性的访问控制模型,研究者[54]还引入智能合约实现模型的属性权威、策略决策点和执行点,并在统一描述主客体和权限的实体属性中加入信任度量,根据信任值和诚实度动态调整访问控制策略。一些研究方案则从物联网的系统架构出发,使用区块链作为物联网的底层基础设施,为物联网提供基础支撑。IBM 与三星联合打造了去中心化的物联网系统ADEPT(Autonomous Decentrialized P2P Telemetry)并提出了概念原型,通过结合三种不同的技术协议来解决物联网中的设备交互问题,基于以太坊的智能合约平台、BitTorrent 的文件共享协议以及telehash 的点对点信息交互协议,为物联网提供新的分布式架构。ADEPT 在性能和稳定性方面仍面临着许多挑战,主要还是受限于区块链本身的共识机制,设备需要花费大量时间和计算力来达成状态的共识,因此无法有效支持海量设备同时接入。因为物联网设备的硬件计算能力瓶颈,基于区块链的物联网架构需要着重考虑轻量级架构。当前,研究者[55]为智能家居打造了一个基于区块链的轻量级访问控制机制,提出了使用覆盖层(overlay)来解决安全攻击和性能问题,通过使用专用计算机来维护区块链账本以及局部网内容的设备信息,有效减少物联网设备的计算消耗。研究者[56]则根据设备异构性和可扩展性评估了多种不同的物联网访问控制机制,设计了轻量级的共识机制和区块链存储方式,并提出了访问控制的研究热点正从中心化管理模式转变到基于区块链的去中心化管理模式的观点。
3.1.3 行为监管
物联网加区块链的行为监管[57]既涵盖了设备采集数据的行为,也包括了用户使用数据的行为, 研究者大多聚焦于利用智能合约和共识机制来监控和管理这些行为。在一种高效隐私的区块链认知物联网框架中[58],区块链通过信任算法为物联网服务提供者和请求者之间搭建信任关系,智能合约自动执行请求者所需服务,共识机制防范物联网中出现的欺骗和攻击行为。为了同时监管物联网设备和用户的行为,研究者提出了一种信息共享机制[59],机制采用数据区块链和交易区块链双链模式。其中,数据区块链利用改进的实用拜占庭容错共识算法形成账本,防止采集的数据受到篡改破坏;而交易区块链则使用部分盲签名算法和一次性公钥地址,避免交易的源头锁定,从而保护用户隐私。研究者还提出了物联网数据资产化的方法[60],以使从数字货币衍生而来的区块链更直接地监管物联网行为。该方法包括转移数据所有权的设备签名传输协议,提供数据验证的数据全生命周期管理智能合约和实现数据可变现性的物联网数据订单智能合约。
区块链填补了物联网信息交流过程中的安全缺失,进一步提高了物联网的可用性,更带来了一些新的应用场景。当前,国内对区块链加物联网应用场景的研究分布在传统产业优化、金融科技和保险科技三个领域。
3.2.1 传统产业优化
针对电力设备、油品净化、食品安全、冷链物流和医疗健康等产业的需求,研究者们提出了一些区块链加物联网的解决方案,这些方案以区块链增强了物联网系统,具体应用场景见表3。
表3 传统产业应用的区块链加物联网方案Table 3 Blockchain plus Internet of Things solutions for traditional industry applications
3.2.2 金融科技创新
区块链加物联网在金融科技中的应用集中于供应链金融领域。供应链是经济活动中的一条重要链条,连接了供应商、制造商、运输商、零售商以及消费者。不少研究者探索应用区块链技术以及智能合约技术,记录保存供应链中上下游各主体从原材料供应、产品制造加工、物流运输及销售的所有数据,这些数据公开透明、可溯源且不可篡改。隐私数据经过加密处理,解决了供应链的信任问题、监管溯源问题和数据隐私保护问题。同时研究者采用如二维码、RFID 和 NFC 等物联网技术自动化录入数据,减少了人工失误,提高了录入效率[68-70]。尤其对拥有许多动产的小微企业来说,利用区块链加物联网技术,一方面可以帮助信贷机构监管监控企业在供应链中的物流存货[71-72],防止在商品质押过程中因出现流失等情况而导致资金端出现呆账、死账,从而有利于降低供应链的融资风险;另一方面确认供应链中的质押商品交易真实性,在资金追踪层面,运用智能合约限定资金用途,并通过共识机制进行确认,最后利用时间戳进行资金溯源追踪[73],最终有助于解决供应链中小微企业长期存在的“融资难”问题[74-75]。
3.2.3 保险科技创新
保险科技是指利用如大数据、人工智能、数据挖掘、物联网和区块链等新兴技术来设计新产品、改进定价机制、提高潜在客户命中度以及提供理赔方案,提升客户满意度和体验[76]。
设计保险产品和制定产品价格过程中最重要的就是对标的精确建模,其依赖对海量标的数据进行感知搜集。利用物联网技术 “万物互联” 的特点,相关人员可在标的及周边环境安装物联网传感器采集数据。物联网中的数据除了支撑精确建模,也可通过区块链链上存储为日志文件,利用区块链可追溯及不可篡改的特点,异常的日志文件可在理赔环节作为勘损支持文件,从而降低潜在的逆向选择,减少可能的骗保行径,并监督监管保险公司履行保险义务行为,引导鼓励参保客户树立诚信保险意识[77-78]。
区块链完善了物联网的功能,但区块链不是万能的,还需要进一步的改良和创新。边缘计算、大数据、人工智能和 5G 通信等新兴技术的突破,给区块链加物联网既带来了机遇,也同时带来了挑战。
3.3.1 区块链性能受限
在大数据时代,物联网设备数以千万计,产生的数据杂乱复杂且数量庞大,负责数据维护管理的区块链需要容纳海量设备用户,实时跟踪数据生成采集,高并发处理物联网中发生的数据交易。但目前的区块链解决方案受账本一致性的约束,难以协调吞吐量和节点数的矛盾。采用公有链共识机制,则吞吐量普遍较中心化系统低多个数量级;采用许可链共识机制,则接入节点数普遍不超过一百个。如何用区块链控制物联网所有设备,自动执行物联网的各种行为,扩展区块链加物联网的容量,提高数据处理的速度成为了大数据时代带来的机遇挑战[79]。除了侧链、子链、分片、隔离见证、多中心化等吞吐量扩展技术,研究人员对区块链固有的链式结构的改进也进行了探索。IOTA 作为针对物联网的加密货币技术,其底层的tangle 机制采用了有向无环图(DAG)结构,实现了异步共识机制,使交易数量不再受限[80]。在此需要注意,有向无环图结构依然需要节点尽可能地获取和存储全局数据,以达成共识和安全。
3.3.2 端设备性能有限
物联网端设备大量且廉价,特别是一些移动设备没有固定电源,更是为了增加工作时长而减少耗电量,使得端设备的计算和存储性能有限。区块链的共识机制常常建立在互不信任、存在拜占庭攻击的基础上,参与节点需要自己存储完整的账本并进行一定的计算以完成验证和共识过程,这对于端设备而言是不现实的。目前,研究人员引入了边缘计算技术,依赖边缘设备提供算力和存储等,辅助端设备接入区块链网络。ADEPT 将节点分为三类:轻节点、标准节点和交换节点,只有交换节点具有完整的账本副本,轻节点只需要管理轻量级钱包,标准节点辅助轻节点工作[81]。端设备和边缘设备依托虚拟化技术也可以组建P2P 局部边缘网络,形成一个小的许可链,丰富整个区块链系统的层次,提高安全性[82]。
3.3.3 智能合约不够智能
区块链智能合约的“智能”体现在提供图灵完备的程序执行上,实际上无法支撑大规模的计算,输入输出也受到极大限制,常常只用来处理预设的简单业务逻辑,所以仅凭区块链无法对大规模的物联网数据进行有效分析和利用。随着机器学习和知识图谱等人工智能技术的发展,论文[83]提出了智联网的概念,即通过物联网从虚拟世界的信息互联网中获取智源和知识,进而实现人机物智能实体之间知识的互联互通。构建智联网,研究人员需要在物联网的基础上依序从互联网中智能体感性混杂的数据中自动化获取知识,协同表征与传递知识,最后建立联合知识空间以联结和协同运行知识。区块链则支持智联网中知识的协同运行方式在分布式的架构下实现自动化运行和自主性进化。论文[84]将区块链技术应用到物联网智能家居中,使分散的物联设备如移动手机、传感器、智能点灯等连接起来协同运作并实现设备之间的安全信息共享,同时还可以在人-设备和设备-设备之间在精确区域内提供访问授权。
3.3.4 带宽高消耗和低时延需求
区块链的全网共识达成需要大量的广播和节点间实时通讯,当节点数量巨大时,网络带宽和时延将成为技术瓶颈之一。5G 的出现极大缓和了这一问题,使区块链在5G 物联网中广泛应用成为可能。物联网在 5G 时代的应用场景主要包括了大规模机器类通信(mMTC)和超高可靠低时延通信(uRLLC)[85],其原有基于 TCP/IP 协议的架构已无法应对这些应用模式带来的异构性、可扩展性、移动性和安全性四大挑战。论文[86]提出了基于命名数据网络(NDN)架构的物联网构建方法,旨在以NDN 的网络层命名、缓存以及端到端解耦等特性使得物联网能够在 5G 时代大规模应用。同时,研究者还探索了在基于 NDN 架构的物联网中利用区块链设计分布式跨域安全保障机制的可能性,提出了亟待解决的区块链资源调度调配,信息实时更新和高动态环境下稳定运行等问题。论文[87]概述了区块链技术在面向5G 的物联网以及工业自动化领域中的潜在应用,从分布式和可扩展性、身份管理、自主治理、隐私安全等五个方面探索了区块链技术对物联网带来的好处和技术性变革,在供应链应用、智能城市、无人驾驶等领域中考查现有技术方案,提出了5G 物联网未来面临的挑战包括区块链可扩展性问题、协议标准化和互通性、高速连接网络和区块链能源消耗双驱动下的设备能源效率等问题。
物联网是互联网的升级,通过将物理实体相连,物联网中的数据直接描述了客观世界的基本属性和关联关系,而区块链以分布式结构充分保障数据可靠、隐私、安全和权益,因此区块链加物联网将会是未来有效融合物理空间和信息空间,实现技术变革的重要发展方向。本文选取了SCI、EI 等收录的国内外75 篇期刊论文,采用文献计量工具 CiteSpace 分析归纳了区块链在物联网中应用的研究热点集中于数据隐私和安全保护、应用场景以及新技术带来的机遇挑战方面。同时,本文根据这些热点领域的论文,总结出当前研究者主要通过区块链、智能合约和共识机制在节点加入、访问控制与行为监管三个阶段保护物联网数据隐私和安全;数字经济、金融科技和保险科技是目前区块链加物联网的主要应用场景;同时,诸如边缘计算、大数据、人工智能和 5G 通信等新技术是区块链加物联网当下所要面临的机遇和挑战。
利益冲突声明所有作者声明不存在利益冲突关系。