齐兵*,金颖彤,李晨旭
基于blockchain技术的数据交易方式设计
齐兵*,金颖彤,李晨旭
(吉林省长春市吉林大学计算机科学与技术学院,吉林长春,130000)
伴随着大数据时代的来临,数据交易的兴起是大势所趋。但当前交易模式的诸多不足影响了数据交易产业的发展,如:交易平台对数据的托管、交易双方隐私性难以保证、数据所有权证明困难、小型数据拥有者没有交易渠道以及数据质量的参差不去。基于区块链技术,设计新型数据交易平台,消除数据交易产业发展的阻碍。
区块链,数据交易,大数据,匿名性
随着大数据时代的来临,数据交易必然会受到越来越多的关注。数据交易可以使数据最大限度地在各个行业领域流通,打破以往的数据信息闭塞现状。与此同时,显著提高了数据利用率,满足日益增长的大数据需求。然而当前数据交易有着诸多不合理之处,如:当前数据交易依赖于可信任的第三方;无法保证交易双方的隐私性;数据所有权证明困难;个人和小型企业难以参与到数据交易中;数据质量参差不齐。很多数据企业并不愿意将自己的数据通过现有的交易方式出售,购买者也难以用现有方式得到所需的准确数据。这对数据共享、流通的大趋势,产生了一定的限制。
数据交易平台,让信息不再局限于单一领域。在大数据时代要实现数据的有效利用和流通,满足市场需求,构造完善的交易流程和流通环境,必须采取平台化运营。只有确定数据所有权,制定全面的定价规范,产生健康的交易环境,并通过大数据技术进行处理、分类,才能使大数据产业被社会接受,而不仅仅是小范围内的使用。
考虑到数据的特性与传统商品的差别,如:数据所有权证明难以实现、数据价值具有时效性、数据所有权转移后数据原拥有者仍具有转卖的能力,建立一个流程算法公开、运营透明的专业数据交易平台是大势所趋。该平台必须充分考虑到数据的特性,解决上述难题,才能使数据作为一种特殊商品真正参与流通和交易。
基于当前数据交易领域的诸多阻碍,如:过于依赖可信第三方,数据存在被第三方复制备份的可能性;交易双方在交易时即暴露自己的身份,隐私受到侵害;所有权证明困难;小型数据提供者或购买者难以参与数据交易过程以及数据质量控制难以实现。我们的设计目的在于,实现基于blockchain技术的一定程度的去中心化的,不依赖于第三方数据交易中心的,可保障交易双方隐私不被泄露的交易方式。不依赖第三方数据交易中心,是指不像传统数据交易方式一样将数据托管给第三方,即第三方不会得到交易的数据,只作为一个维护整个交易方式的平台,提供用户查询,交易,所有权证明等功能。该交易平台同时面向大型企业用户和小型个体用户,在增大流通范围的同时,控制数据的质量。
区块链(Blockchain)技术作为比特币的底层技术,具有去中心化、去信任化、不可删除、修改,匿名等特点。从blockchain技术的特点来看,非常适合应用于数据交易。首先,为了保证第三方无法在交易过程中得到数据,采用了blockchain的去中心化思想,去除第三方数据交易中心的托管功能,第三方无法得到源数据,数据经过约定好的加密算法后流通,只有交易双方可以得到。同时,交易过程完全记录在一条不可修改的区块链上,用于所有权证明和溯源。其次,交易平台以密钥对作为用户的唯一识别,交易双方都使用各自公私钥对集合中的一个,完成交易过程,无需身份信息,可有效实现交易的匿名性。
2.3.1 系统核心
该交易方式设定为需要三条不同的区块链,分别为用于购买者查询欲购信息的查询链、保存交易记录用于维权的交易记录链、以及用于支付的比特币等类似电子货币链。
首先,查询链保存了数据拥有者提供的数据的索引信息,用于查询用户所需的数据。同时提供数据价格和数据拥有者的比特币等类似电子货币的地址,用于后续的支付阶段。并且,该链保存数据的hash值,用于后续阶段的验证。
交易记录链记录了完整的交易消息,包括交易双方的签名以及交易时间、数据内容的hash等,以便于维权处理。
支付链需借助其他匿名的电子货币链,如比特币,来完成交易过程。交易双方和交易平台的一切支付行为都利用该条链实现。
2.3.2 用户注册
为了实现交易平台的匿名性,采用非对称密钥中的公私钥对作为用户唯一的身份证明,不再使用传统的用户名和密码,用户可以申请任意数量的密钥对用于交易。因此,用户的隐私得到最大程度的保护。
考虑到当前数据交易几乎全部面向大型企业,为了进一步扩大数据流通范围,将用户类型分为两种:
(1)个人以及小型企业
(2)拥有大量数据的大型企业
其中,个人及小型企业的参与,将极大带动数据产业的发展,推动数据交易的普及化。以上两种类型的用户都可以根据自身的需要,选择是否向交易平台注册真实身份。具有高价值数据的企业可以注册身份,增加自身可信度,有利于数据的出售,使效益最大化。而注重交易机密性的用户可以选择采用密钥对的方式进行数据交易,保护自身隐私。
2.3.3 待出售数据概要上传
(1)卖方用户上传
卖方用户计算待售数据的hash值,选取自己的一个密钥对,构造数据提交包,其中包括:数据标题,数据描述,数据hash值,出售价格,卖方自身公钥,用于支付的电子货币地址,以及上述内容的数字签名。
卖方将数据提交包向全网广播,网络中所有节点收到数据提交包后,提取公钥对数字签名进行验证,然后使用工作量证明机制,将一定时间段内收到的数据提交包汇总,生成一个新的区块,将该区块链接进数据查询链,并向全网广播。已加入查询链中的数据无法修改和删除,若要对数据进行补充修改,只能通过发送新的数据包,并被全网认可,加入到数据查询链的新区块中。系统中每个用户都可以下载、查询该链,以验证是否成功上传。
交易平台作为对等网络中的一员,将查询链中的数据进行整理、归纳,提供友好的用户界面与信息出处,方便用户使用。
(2)平台根据用户需要采集数据
用户可向交易平台提出数据请求,交易平台按照用户需要,利用网络爬虫等合法途径采集要求的数据,经整理、分类、脱敏等处理后,产生和上述相同的数据提交包,向全网发送,待网络验证后放入新的区块,链接进全网共同认可的区块链,用户即可进行后续的交易。
2.3.4 数据交易流程
(1)想要购买数据的用户在查询链中查找所需数据,构造交易请求包,内容包括:买家公钥,卖家公钥,标题,数据描述,数据hash值,价格,支付地址和数字签名。购买者将交易请求包发送给数据交易平台。
(2)数据交易平台收到交易请求包后,通知数据拥有者。拥有者用买家的公钥加密数据以及卖家私钥签名后的hash值,将加密后的密文发送给数据交易平台。
(3)数据交易平台通知买家付款。
(4)买家用户在比特币等匿名电子货币支付链上付款给交易平台。
(5)数据交易平台查询支付链,待找到付款记录后,将数据密文用平台私钥进行签名,并发送给购买者。购买者依次使用平台和数据提供者的公钥进行解密,验证密文是否由数据拥有者发送、数据是否与查询链中的hash一致,以及是否由交易平台正确转发,最后得到购买的数据和卖家私钥签名后的hash值。
(6)数据交易平台在支付链上付款给数据提供方,并将一段时间内完成的所有交易的记录信息整合为一个新的区块,向全网广播,待网络各节点审核交易双方数据所有权无误后,将其加入交易记录链,该链与查询链类似,主要存储两次支付地址等交易记录信息。
支付链采用比特币等电子货币技术,其匿名的特性满足了用户对隐私保护的要求。同时,作为比特币底层技术的区块链技术使得,转账记录永不可逆和更改,而且整个网络的转账记录是完全公开的,用户以及交易平台随时可以查证转账是否达成。
2.3.5 数据分析服务
当前数据环境下,并不是所有用户都希望交易得到原始数据。作为一个完善的数据交易中心,必须考虑为没有大数据分析能力的个体用户提供分析、脱敏等数据服务,减少不必要的技术研发成本和时间的浪费,有效实现数据价值。
基于区块链技术,建立新型数据交易平台,使交易不依赖于可信第三方,从整体机制上,保障交易用户隐私,并提供有力的所有权证明,为更广阔的使用范围提供更高质量的数据交易服务。
[1] 杨茂江. 基于密码和区块链技术的数据交易平台设计[J]. 信息通信技术, 2016, (04): 24-31.
[2] 刘楠, 魏进武, 刘露. 大数据交换信息链[J]. 电信科学, 2016, (10): 130-136.
[3] 骆慧勇. 区块链技术原理与应用价值[J]. 金融纵横, 2016, (07): 33-37+76.
[4] 李继红, 吴筱潇, 燕浩扬. 基于VEC模型的比特币的需求与价格关系研究[J]. 西南民族大学学报(自然科学版), 2016, 42(06): 702-708.
[5] 张偲. 区块链技术原理、应用及建议[J]. 软件, 2016, 37(11): 51-54.
Design of Data Trading Mode Based on Block Chain Technology
QI Bing*, JIN Yingtong, LI Chenxu
(College of computer science and technology, Jilin University, Jilin Changchun, 130000, China)
with the advent of the era of big data, the rise of data transactions is the trend of the times. But many deficiencies in the current trading patterns affected the development of data transaction industry. For example, trading platform can back up data , the privacy of the two parties is difficult to guarantee, proof of data ownership is hard, small owners of data have no trading channels and the quality of the data is irregular. Based on block chain technology, a new data trading platform is designed to eliminate the hindrance of the development of data trading industry.
block chain; data transaction; big data; anonymity
10.19551/j.cnki.issn1672-9129.2018.01.008
TM73
A
1672-9129(2018)01-0018-02
齐兵,金颖彤,李晨旭. 基于blockchain技术的数据交易方式设计[J]. 数码设计, 2018, 7(1): 18-19.
QI Bing, JIN Yingtong, LI Chenxu. Design of Data Trading Mode Based on Block Chain Technology[J]. Peak Data Science, 2018, 7(1): 18-19.
2017-11-06;
2017-12-27。
齐兵(1996-),男,汉族,辽宁省葫芦岛市,本科,研究方向:计算机。E-mail: 2209282216@qq.com