张静波
(辽宁石化职业技术学院,辽宁锦州,121000)
近年来,随着大数据的蓬勃发展,数据交易成为新兴的热门领域。以贵阳、北京、上海等地为代表的多个地区,一批大数据交易所(或中心)快速兴起,引发了社会各界的广泛关注。数据交易是大数据发展到一定阶段的必然需求,对推动我国数据公开化、共享化,建立健全以数据为基础的科学化社会体系具有重要意义。数据交易依赖于完善的数据治理体系,进而确保良好的数据质量和安全的交易环境。而我国现有的大数据交易体系面临两个方面的主要问题:
(1)源数据和目标数据难以匹配的问题。数据产生和应用的环境不同直接导致数据的提供方与需求方对数据的要求不一致,较大程度的影响了数据交易的效率。因此,现有数据交易过程是提供方(或第三方交易场所)列出能够提供的数据清单,需求方根据自身需要进行有限的选择。
(2)数据交易过程中的安全保障问题。不同于其他的实体物品交易,数据的只能在网络上进行,这就为数据交易过程中进行数据篡改提供了可能。
解决上述两个问题的关键是建立一种协同共治、安全可信的数据治理体系,区块链技术为建立这样的体系提供了技术可能。
区块链是一种新型的数据库技术,具有去中心化、防信息篡改等典型特征,使其在金融、征信等领域得到广泛应用[1]。区块链技术适用于相关方互相不互信,而又对信息安全要求比较高的环境。因此,是解决数据交易现存问题的一种理想技术手段。
区块链技术采用链式结构组织数据存储节点,也即区块的概念,采用时间的先后顺序,利用密码学的技术建立起链式结构[1]。相比原传统数据库的“增删改查”操作,区块链形式组织的“数据库”仅具有“增”和“查”的操作,且增加的数据需要各参与方的共同认可,有效的保障了数据的安全性和可靠性。
按照系统是否具有准入管理机制,区块链的可以分许可链和非许可链。在许可链中,加入和查询需要经过系统的许可。根据拥有许可权限的范围,许可链又可进一步分为联盟链和私有链,加入和读取的权限分别控制在“联盟”和少数私有人手中。非许可链式完全开放的,又称为共有链,加入和查询等相关操作在符合系统规则的前提下完全自由。
区块链技术已经应用在金融、征信、医疗等诸多领域。部分学者已经开始将区块链技术应用在政府数据管理、数据一致性等相关领域[2,3,4]。部分学者开始关注区块链技术在隐私保护领域的应用[5,6]。这些研究都为在数据交易领域引入区块链技术奠定了良好的基础。
参与交易的数据需采用区块链的技术进行存储,仅有链内可以参与交易。图1为用于交易的数据区块链结构,每个区块链具有以下几项关键要素:
a.基础功能组件。实现数据库的基本功能,如与其他区块节点建立联系,数据的读取、加密、接口等,实现数据管理的基础功能,确保数据数据可以按照安全的、按照指定的形式由卖方转移至买方,确保数据交易过程顺利完成。
b.数据校验(账本)。所有参与交易的数据必须满足交易双方以及数据管理方共同约定的数据格式与存储要求,可以采用现有的元数据管理方式,建立相应的数据字典。也可以更广泛的对数据清洗、隐私保护等提出约定。账本功能是对本节点是否满足事先的约定进行校验,通过校验方可建立相应的区块,并存储相应的数据。
c.共识,管理存储数据和获取数据的操作过程。参与数据交易的各方,是区块链的管理与使用方。共识要素用来确保满足条件的数据是经各方认可后存储,也是经各方认可后进行查询和读取。
图1 区块链模型
d.操作指令集合。用于实现区块链操作过程中的各项指令。如文献[1]所述,指令集合既可遵循图灵完备性,也可不遵循图灵完备性,需要根据双方交易的数据类型和交易之前的约定确定。指令集合是具体交易的编码实现。
e.数据存储区。用于存储交易所需的数据。考虑到现有交易的数据种类多样,不仅局限于原有的关系数据类型,采用NoSQL技术对数据进行存储,将数据存储为对象的范式,建立适用于多种数据类型的数据库体系。
基于上述区块链模型的数据交易,改变了传统数据交易的基本流程,主要涉及三个方面:
a.数据交易不再是基于现有数据,而是采用预约交易的方式。数据买卖双方与数据交易平台实现对相关数据达成共识,形成约定。相关数据的产生、清洗、存储、交易等多个环节均由数据交易参与方共同参与管理。区块链模型可确保参与交易的数据产生、交易全流程能够符合事先的约定。
b.数据交易平台职能弱化,交易平台仅是区块链数据库系统的建设者和维护者,其虽参与交易过程,但并不实质性的参与交易,更多的承担交易监督者的职能。
c.交易重心不再是交易本身,而是交易之前的约定,约定一旦达成,不能更改,参与交易的各方均是遵从合约的行为,各方的地位更加平等,交易更加公平。
图2 系统模型结构
系统模型,也即数据交易场所的管理系统模型。基于前述的区块链模型和数据交易流程模型,系统模型重点是实现对多个区块链存储系统的综合管理,其基本架构如图2所示。
系统模型逻辑上可分为三层,即应用层、区块链层以及基础设施层。
应用层。通过调用区块链层和基础设施层相应的功能,为系统的使用各方提供基础的展示功能和简单的数据应用。例如,提供数据样例的展示、较为简单的数据分析功能等。
区块链层。基于上述区块链模型,为每个交易行为建立对应的区块链数据库。交易行为与区块链数据唯一对应。区块链采用联盟链的形式,只有交易相关方和平台的管理方是联盟的成员,可以对链数据库进行相应的操作。交易完成后,其对应的区块链随即删除。
基础设施层。包括CPU、GPU、网络、I/O、存储等基础硬件,以及使用云平台所需的中间件等基础软件。
区块链技术突破性的解决了安全环境和可靠交易的问题,具有良好的发展前景和广泛的应用领域。目前,对区块链技术的研究还处于起步阶段。本文是基于区块链技术的通用技术特征,对应用区块链技术建立数据交易模型,解决数据交易面临的问题,进行了有益的探索。长远来看,随着区块链技术的不断发展和应用的逐步成熟,其与云计算、大数据等关键技术将有机结合,成为促进我国数据交易环境不断完善,数据共享能力不断提升的有效途径。