王浩远,彭新潮(北京电信规划设计院有限公司,北京 100048)
由国务院发布的《交通强国建设纲要》提出,要充分利用大数据、互联网、人工智能、区块链、超级计算等多种新技术,推动交通行业的深度发展。交通领域由于自身的特性,数据来源广、类型多、体量大、密度低、失真高[1],在交通数据中心的建设中,往往会产生数据治理难、数据流向单一、安全性难以保障、数据流通共享过程繁琐复杂等一系列难题,严重影响了交通数据资源的应用价值和效益。
另外,随着城市化的快速发展,人、车、路、环境、互联网等各种交通数据资源呈现指数级的增长,各种交通问题会愈发明显。如何对交通数据中心架构进行合理优化,提高数据中心效率,从而助力城市的智慧交通良好发展是本文重点研究的内容。
本文首先对区块链技术进行了简要的分析,随后根据现阶段交通数据中心的架构设计及存在的难点,提出了基于区块链技术架构的设计方案,并简述了方案中所解决的问题以及挑战。
在概念上,Wikipedia 中提到将区块链技术类比为分布式的数据库技术,通过维护数据块的链式结构,可以维持持续增长的、不可篡改的数据记录[2]。区块链基于分布式存储、共识机制、密码学原理和智能合约等多个核心技术,具有去中心化、公开透明、不可篡改、可追溯等特点[3]。区块链结构共包括3 个部分,其中交易指对账本的操作,导致账本状态的一次改变;区块是记录一段时间内发生的所有交易和状态结果,是对当前账本状态的一次共识;链为区块按照发生顺序串联而成,是整个账本状态发生变化的日志记录。
当区块链节点发起一项交易时,此交易会被广播到区块链网络中等待确认,网络中的节点将收到的等待确认的交易记录打包在一起,组成一个候选区块,其中包括前一个区块头部的哈希值等信息,如图1 所示。当多数节点对候选区块验证符合约定条件之后,便生成了一个新的区块[4]。
图1 区块链结构示例
区块链根据不同的参与者可以分为公开(public)链、联盟(consortium)链和私有(private)链[5]。其中公开链指任何对象都可以参与使用和维护,可发送交易信息且交易能获得有效确认,具有去中心化、完全公开、多方参与、匿名等特点;私有链通过集中管理者进行管理限制,写入权限仅在一个组织或者少数人手里,其读取权限或者对外开放,或者被任意程度地进行了限制,具有交易速度快、成本低、隐私性高等特点;联盟链介于两者之间,由若干组织共同合作维护一条链,该链的使用带有权限的限制访问,具有节点易连接、灵活性强的特点。
传统的交通数据中心建设是在中心化的基础上,采用一体化分层的模式进行统一建设,如图2 所示。采集层基于信号机、违法采集设备、视频等前端感知设备的数据采集,以及与其他业务系统通过数据交换共享平台实现交通数据资源的汇聚,为基础数据资源的统一存储与应用提供支撑[6]。中心层分为2 个部分,第一部分是以数据共享交换平台为基础,汇聚前端感知设备、业务系统等数据资源,形成以人、车、路、环境为要素的主题库以及以业务为导向的交通管理业务库,其中包含了能够支撑各项业务应用的完备交通数据信息资源,以及能够支撑解构交通系统的完备的身份检测数据信息;第二部分则是共性能力支撑平台,为交通业务的应用建设提供通用的技术能力支撑,提高技术和数据的标准化水平。应用层则是以中心层为基础,各个应用系统将中心层的主题库、业务库作为输入,构建智慧交通综合知识图谱,并通过数据挖掘、分析计算、模拟推演等手段,支撑业务发展;另外,通过共性支撑平台中的功能模块,辅助自身业务的建设,并通过统一的消息机制总线,使各个应用系统之间互联互通,进行统一的业务协同。
图2 传统交通数据中心架构图
传统的交通数据中心架构以自身交通业务为主,基于现有的交通数据资源开展信息化建设。目前与其他部门相关数据共享交换缺少统一标准,导致交通业务相关的数据信息资源没有进行统一的整合管理,造成业务单一化发展;其次因交通业务的数据量较大、数据质量低且安全性无法保障,导致管理效率低下,具体体现为以下几点。
a)数据质量较低:交通领域因数据体量大、样式多、密度低等,往往在数据源头发生数据缺失丢帧现象。另外,物联网设备安全性低、个人隐私无法保障、架构僵化等,导致交通相关数据信息在共享上产生的价值较低。
b)数据协同共享流程复杂:在数据信息的采集、汇聚、共享、质量、安全等方面缺少统一标准规范,导致业务系统之间对接繁琐,且数据信息的共享交换多采用“一对一”的方式,随着数据量的增多,数据的质量、可信、隐私等方面无法保障。
c)数据安全性较低:基于传统交通数据中心的架构在数据共享交换过程中无法对数据进行加密处理,导致数据泄露风险较大。另外,在数据使用过程中,无法实现数据的流程溯源,因数据自身质量或数据泄露出现问题时,容易造成权责不清。
在交通数据治理和政务服务方面,虽然传统的交通数据中心总体架构已经在信息系统整合共享上有了一定的成效,对于政务数据的“烟囱林立、条块分割”状况有了一定的改善,但是现有设计与应用偏向于数据的流程梳理,对于数据交换共享过程中的责、权、利的界定有所忽略。另外对于数据的时效性、真实性、同步性难以保证,造成交通数据难以治理,从而导致相关业务难以有效协同。
基于区块链的交通数据中心架构包含了数据采集、数据资源中心、区块链应用层、业务层四大部分,具体如图3所示。
图3 基于区块链技术的交通数据中心架构设计图
a)数据采集层:各政务业务系统作为单独的节点,通过区块链数据共享交换平台进行数据交换,根据数据共享交换平台的统一标准汇聚跨地区、跨部门的数据信息资源,并构建可信、统一、可监管的交通数据目录体系。
b)交通数据资源中心:主要包括数据计算层、数据管理层、数据资产层。
(a)数据计算层:通过区块链数据共享交换平台从原始数据中提炼有价值的数据资源,对所输入的结构化数据和非结构化数据进行统一加工处理,其中包括对数据的存储、加工、分类、计算、转换、排序、推导等系列运算,实现数据价值的最大化。
(b)数据管理层:对用户的权限进行变更、调整以及数据接触点的流程管理等,主要是对于数据本身的管理,包括数据质量管理、标注管理、资产管理、模型管理、安全管理等,保障数据的高质量,使不同业务系统之间具有可共享性、统一性、规范性和有效性。
(c)数据资产层:对各类数据资源进行接入、汇聚,对业务实体、业务流程和业务关系建模,形成标准化数据模型,并根据各类数据应用的实际需求,生成对应的数据产品,形成数据资产层,包括基础数据库、业务数据库、主题数据库、数据地图等。
c)智能中枢层:包括区块链应用和共性能力支撑平台2个部分,其中区块链应用主要包括数据保护、数据可信共享、数据可信恢复、数据资产交易。
(a)数据保护:基于区块链的访问控制权限和密码学安全算法的密钥管理机制,保障数据的安全性,并对所有数据进行链上存证,确保数据流转过程中的安全可控,为数据的共享提供可信、可靠的信源。
(b)数据可信共享:在数据及数据权属转移的过程中,由数据的受让者来确认数据的有效性,解决原始数据及数据的持有者在传递数据过程中的缺失丢帧和版本更新等问题。
(c)数据可信恢复:在数据存储丢失的情况下,对数据进行实时备份,保障数据索引与凭证无篡改。
(d)数据资产交易:结合数据治理的一系列共性服务,实现数据资产从数据采集、清洗、共享、整合到资产形成、共享、交换的全流程服务。
d)业务层:通过交通数据资源中心的数据资源与中枢层的功能模块,支撑主要交通业务的开展,主要包括交通治理、交通组织、应急管理、信息发布、出行服务等业务场景的应用。
本文的设计方案主要有以下优点。
a)确保上链数据质量:一方面,物联网感知设备有局限性,安全措施较低,从而导致受攻击或非法接入的风险较高,区块链的验证和共识机制可以有助于识别接入的物联网节点,确保上链数据的安全性;另一方面,通过将数据标准写入区块链的智能合约,可以确保数据上链的完整性,提高数据中心的数据质量[7]。
b)简化数据共享流程:基于区块链技术的数据交换共享流程将交通业务相关数据作为单独的节点,通过共享交换平台进行上链,数据使用方发出获取数据请求,通过内嵌的智能合约,解决数据交互的一致性问题,将数据授权机制通用化、标准化、扁平化,如图4所示;同时利用区块链技术的可追溯性,实现数据访问的全程留痕,并将相关业务数据进行有序关联,达到安全高效的数据共享模式[8]。
图4 基于区块链技术的数据共享流图
c)实现数据全流程溯源:利用区块链分布式记账、不可篡改等特点,可以有效进行数据确权。数据的产生者以及使用者作为节点加入到区块链网络,利用区块链详细记录数据产生、流转等全部环节,通过节点标识每笔数据对应的产生者以及使用者身份。区块链不单记录数据本身信息内容,对于数据的原始上传方以及数据被访问的全部历史都进行实时记录,实现数据确权及精准授权,从而促进数据的共享和流通[9]。
区块链技术给政府治理应用开发提供了广阔的平台,给政府的数据治理提供了一种新的思路,但与此同时,也给传统政府治理带来了一些挑战。
a)缺乏统筹规划和顶层设计,导致数据共享流通过程中面临巨大挑战:一方面,将数据流通信息记录在区块链可以实现对数据的流程追溯,但是在大规模数据收集和数据共享流通错综复杂背景下,由于缺乏统一的顶层设计,如何实现数据的跨部门、跨平台、跨领域共享是一个难题。
b)区块链自身技术的挑战:一方面,区块链自身的存储需求限制、隐私与安全、可扩展性和互操作性等方面还存在大量待解决的问题[10]。另一方面,对于节点的多方参与在政务数据治理上缺乏相应的监管,相应的评价标准与评估规范成为亟待解决的问题[11]。
c)对政府管理和企业管理提出的挑战:区块链的去中心化特性将打破传统的中心化管理方式,对政府和企业的管理权威带来挑战;同时,去中心化特性还会使数据安全和保密的责任置于多方,存在数据隐私泄露的风险。
近些年,随着智慧城市的快速发展,交通数据中心存在的各类问题也愈发明显。区块链技术因为去中心化、非信任、可追溯等核心优点,和数据量繁而杂的交通领域结合点较多。本文提出了一种基于区块链技术的交通数据中心总体架构设计方案,解决了交通数据信息在共享、治理安全等方面的一些痛点问题,为未来交通数据中心的建设提供理论指导和建设思路。