杨春雨
北方工业大学/信息学院 北京 100144
区块链是一种以加密技术为基础的数据链,利用加密技术来进行数据的非篡改和非伪造,它具备分布式数据存储、点对点传输和共识机制等计算机技术的新型应用模式。
整体上,采用块链型的数据架构进行资料的校验与储存,并使用分布的结点一致性运算进行资料产生与更新,并以加密的方法确保资料传送及存取之安全性。同时采用基于自动指令码的智能合约对资料进行程序设计和处理,是一种基于程序的新型结构和运算方法。简单来说,让所有人都能通过各自的计算机网络接口参加网络交易。它具有如下特点[1]:
1.1.1 开放性。区块链技术的技术根基是开源的,除了对交易双方的私人资料进行加密之外,其他的都是对公众开放的,可以在电脑上使用公共界面进行查询。所以,整个系统的资讯是非常透明化的。
1.1.2 独立性。区块链技术的实质就是一个分布式存储的数据库,它以共识为基础,完全不依靠中心处理点和其他专用的存储装置,在没有人工干扰的情况下,可以安全地在系统内部进行数据验证和交换。从而确保了高度分散的优点。
1.1.3 安全性。如果双方都控制不住51%的数据,就无法肆意操控修改网络数据,避免了主观人为的数据变更。因此区块链技术具有高度的安全性和稳定性。
1.1.4 溯源性。在双方进行交易时,系统会用加密的方法将各种交易信息都写在一起并进行信息上链,这样就可以追踪到所有的交易信息。因此,区块链技术具有高度的可溯源性。
在网络技术迅猛发展和全球一体化的推动下,通信、零售业等产业经营方式地不断改变。而大数据的应用,也推动了整个行业的发展,从原来交易渠道的点对点,到数据化,再到高效的运营,营销渠道朝着多元化方向发展。
然而,由于交易额不断上升,以及病毒、木马等新型的网络攻击手段层出不穷,商业资料的安全性也逐渐受到各大公司的重视。近年来,出现了大量的用户数据泄露、数据被盗用等问题,这引发了社会各界的高度重视。而区块链技术开放性、独立性和可追溯性的特质也吸引了许多公司和学术界,其纷纷将目光投向了该行业。目前,区块链技术在主要下列方面得到了广泛的运用[2]:
1.2.1 信贷评估。由于数据具有不可伪造和追溯的特点,可以通过对持卡者的个人数据、就业状况等数据的分析,构建起人社系统的诚信评估系统,从而为社会提供更加客观、精准的个人征信。
1.2.2 个人账户支付。区块链技术在我国在数字货币中得到了广泛的运用,其发展对金融业的发展起到了推动作用,为参保人群提供了更多的选择和可能性。
1.2.3 身份核实认证。将所获取的身份信息保存到一个区块链中,从而确保了其不可被篡改和伪造,提高了验证的正确性,减少了交易过程的复杂性和冗余。
大数据在其战略位置上的作用不仅仅在于它庞大的信息量,还在于它能够准确分析,从而实现其价值[3]。
业态创新和新技术应用促进了我国的经济转型,数据量也在快速增长,但数据泄露和滥用等问题也越来越突出。目前中国数据交易普遍存在数据流转规范不统一、数据安全隐患、交易监管机制不健全等问题[4]。
2.1.1 大数据易受到不正常的袭击。大数据存储的数据信息量非常大,而且通常都是分散存储。这种存储方法因其主视图清晰,使得信息的保存十分单一。网络黑客很可能会通过系统的弱点来进行非法的行为,从而造成安全风险[5]。
2.1.2 大数据存在信息泄露的风险。在新的大数据环境下,一个重要的问题就是如何保证用户的个人数据不会被非法的泄露和使用。大数据的数据要比传统的数据要更加的繁杂,当前的数据保密措施能否满足对海量数据和数据的要求,这是一个必须要解决的问题。
2.1.3 大数据传输情况存在安全风险[6]。
2.1.3.1 资料存续期间的安全性问题。在信息传递的各个阶段和各个环节中,逐渐显现出大量的安全风险。比如,在传输大数据时,除了有泄露和造假风险,也有被数据流网入侵利用的风险。
2.1.3.2 贮存场所的安全性问题。云计算技术是海量信息的传递与聚合的重要载体和手段,它提供了存储场所、安全通道、数据存储的场所。所以,存储在云计算平台上的数据的安全性成为阻碍大规模信息技术发展的障碍。
2.1.3.3 涉及的个人信息的安全性。在当前网络发展的进程中,有关个人信息泄漏的法律法规还不够完善,使得网络上的个人信息难以得到有效的保护。如何有效地处理和保护用户的隐私,同时又能确保有效地进行数据的传送是当下应当思考的问题。
2.2.1 个人隐私维护的需求。数据信息是公司的重要资本之一,其移动性差、隐私权不突出。罪犯和居心叵测者通过各种不同的资料关联,可以对网络上的各种数据进行分析和泄露。因此在构建大数据的安全性与隐私权保障体系中,需要重点研究的问题是如何对其进行有效的保密和保密[7]。
2.2.2 对跨境数据的流动问题解决的需求。在当今社会,资料的流通尤其是跨国的资料流通,具有独有的特性。所以,从法律体系、数据外包服务等各个层次来保证数据的安全就显得非常必要。因此,在构建大数据检验规范的架构时,必须从收集、储存、处理等方面对传统数据检验规范的适用范围进行分析。
2.2.3 传统的安全防范措施不可以融入问题解决的需求。常规的安全保护手段无法将大量的、多源的、异构体的问题融合在一起,由于其动态特征,使得其海量存储结构复杂、对外开放、分布式存储和高精度等特点,传统的安全防护手段无法应对。为此,亟待健全与之配套的保护与控制制度。
2.2.4 平台安全体制亟待健全的完善的需求。以前需要 ORACLE数据库,而在大数据时代,它主要基于Hadoop。在 Hadoop体系结构下,用户认证和授权访问等安全性问题的处理效率很低。同时,一些开放源码的Hadoop组件并未被发现,可能会出现一些问题,例如系统和恶意软件等问题。
随着交易过程中数据安全问题的暴露以及对社会产生的威胁,越来越多的学者将目光瞄向了区块链技术。区块链系统可以存储的数据多元化,可有效满足企业之间不同业务的交易往来。
3.1.1 数据存储。为了更好地分类储存资料,并且降低资料的重复,可以将区块链的资料储存模式分成两种:一种是链内储存,另一种是链下储存。
3.1.1.1 数据链路。链上的存储流程是利用区块链的方式,将所有收到的节点进行分组,然后在区块链中进行大规模的广播,这样的协议就会被称为“链路上的数据”。符合此情况的资料将会被储存在区块中。
3.1.1.2 链上链下协同存储。在链下链下,由一个块结点组成一个散列表,在结点间设置一个数据的指标,获得一个结点的存贮地址,再由结点的安全检查,并利用传送特征的代码进行探测。若无问题,将会对所储存的资料进行散列化,以产生对应的 Merkle树状结构,若出现问题,则表示资料遭到恶意攻击或被修改[8]。
3.1.2 隐私安全。隐私数据可以划分为2类:身份隐私和数据隐私。下面分别对这2种隐私数据的安全保护措施进行阐述。
3.1.2.1 个人信息。首先,所有的参与方必须签署和整合这些业务,以便将多个转移业务整合为一个转移业务,从而掩盖发送方和接收方账户的联系。
3.1.2.2 资料保密性。为了保护个人资料的保密,可以使用公证通建立的公证书,首先进行下一步的密码,然后进行上一步的密码,然后在下一步进行保密。同时将密码文件上传到链路上,用密钥进行加密,最终采用链下集中的方法进行管理。
在区块链资料的处理过程中,要依据使用者的身份对资料进行存取许可从而保证资料的安全性。
3.2.1 身份认证。身份验证是指在 PKI中使用区块链技术进行身份验证,其主要的工作步骤是:进行用户的身份登记,将用户的身份数据封装在一个区块中,然后进行登记;公开密钥运算,将用户标识与凭证公开密钥相联系;验证,通过区块链的公开密钥验证,验证身份证明的合法性[9-10]。
3.2.2 权限访问控制。首先采集并分类了各节点所需的数据,并依据所搜集到的数据,全面地搜集了用户的权限存取控制,以了解用户的存取权利的合法性。最终实现了与区块链的互动,防止了用户和权利之间的一一对应,简化了权限的控制[11]。
数据交易数据交易安全架构的体系结构,包含了基础安全、数据安全、交易安全等方面的问题。这些问题,除了采用常规安全运维、标准规范等规范之外,还可以采用“三分三合”的技术体系结构来实施。
“三分”技术体系结构是将试验和计算的配线分开,将业务流、计算流和资金流分开,并将计算和安全监控分开。
“三合”是指运用模式和资料的联合计算环境,利用区块链存证和流通环境,并通过控制中心来达到一个统一的监控环境。数据流转期间,需要对数据流转中的关键信息进行统计。基于区块链的非伪造属性,可对所有参与数据的交易进行信任存储,保证记录的真实、有效和可追溯性[12]。
随着区块链技术的日益深入,其数据的安全性将越来越受到人们的重视。本文从数据安全的观点,结合企业的发展动向,对数据存储安全、隐私安全等问题进行了综述。
即便是在可追溯性、独立性和开放性的情况下,并且它具有一定的安全特性,但其数据真实性和匿名性还有待进一步研究。要想以区块链技术来实现数据的安全性,就必须在数据隐私保护、区域间信息的保护上下功夫。