基于区块链的数据治理协同方法

2018-10-16 08:23宋俊典戴炳荣蒋丽雯王晓强
计算机应用 2018年9期
关键词:用词行业标准区块

宋俊典,戴炳荣,2,蒋丽雯,赵 尧,李 超,王晓强

(1.上海计算机软件技术开发中心,上海 201112; 2.上海海事大学 信息工程学院,上海 201306;3.南京航空航天大学 计算机科学与技术学院,南京 210016; 4.绿地金融投资控股集团有限公司 运营技术部,上海 200023)

业务的数据化和数据的业务化,是当前各行业、各领域数据应用创新的重点和趋势。在当前大数据环境下,数据日益成为企业基础设施的一部分,成为了战略资源,如何更好地把数据资源进行变现,产生更大的价值是企业共同的关注点。数据治理的概念应运而生,通过数据治理,建立数据应用策略、挖掘未被满足的需求以及解决潜在安全问题等,使数据的采集、管护、存储、访问以及使用策略均实现标准化,满足各个部门和岗位的不同需求。另一方面,数据治理能平衡不同部门之间存在冲突的需求,在安全性与访问需求之间进行协调,确保高效安全的数据管理策略,从而为企业带来更大的数据变现价值。数据治理已广泛应用于证券、银行、国资等行业,并体现了良好的应用效果。

在大数据环境下,在寻求新技术来支撑大数据的应用、获取更大应用价值的同时,数据开放与隐私保护、数据应用创新与风险合规等已成为当前数据治理领域面临的巨大挑战,有效的数据治理模型构建和治理方法流程成为研究者关注的热点和重点[1]。更加深入的分析可知,业务流程交互及数据融合的迫切需求统一底层数据的标准规范、实现数据的安全可信和可控,底层数据源复杂分散,数据海量且缺乏统一标准等问题逐渐凸显。技术和实现层面,数据治理及数据标准化都是基于传统的元数据管理理念,聚焦从源头解决“数据孤岛”的问题,然而在实际应用过程中,不同应用系统数据源的差异、业务应用的需求不同,使得研发有效高效的数据标准管理工具,可信的数据共享发布规则变得十分困难[2]。

近年来,区块链技术以其去中心化、去信任、不可篡改以及可追溯特性在多方协作、多主体等行业领域具有天然的应用场景,通过一系列技术的组合和模式的创新,为相关行业及领域的业务流程优化、数据交换共享等提供了良好的解决方案[3]。针对数据治理领域中涉及的多部门协作、流程的复杂多样、追溯成本高等问题,区块链可在其中发挥重要的作用。

本文结合区块链去中心化、链式存储和智能合约等技术的研究,提出基于区块链的数据治理协同方法,为数据标准的制定管理、监督维护提供了可行的解决方案。结合去中心化的思想,将数据标准的构建过程开放给各个参与者;通过链式存储的机制实现数据的可追溯性,保证数据的安全可信。在具体实现过程中,使用智能合约技术代替传统的人工审核机制,按既定的协同规则,触发自动化脚本代码,高效地实现数据标准管理维护的高效性。

1 相关背景

1.1 数据治理

在数据战略、组织和架构的保障下,数据治理应用的基础是数据的标准化。数据标准化指的是对分散在各系统中的数据作出数据命名、数据定义、数据类型、赋值规则、科学流程等方面的统一。通过开展数据治理应用,进行数据标准共建,可以确保数据的优质性,维持数据模型的一致性,提高实际应用场景下数据管理的高效性,保障数据的开放、共享和安全,从而提升行业的数据应用水平。

数据治理的目标主要有四点:战略一致、风险可控、运营合规和价值实现。治理保障分为内外部环境和促成因素两大部分。治理域主要包括战略、组织、架构、元数据管理、主数据管理、数据生命周期管理、数据质量管理、数据安全与合规、数据应用与服务创新。

当前在数据治理过程中,数据标准的制定大多都基于元数据管理,利用中心化的方法实现其开发、候选、批准、驳回、归档等构建工作,数据标准的制定过程相对封闭和垄断,维护工作量巨大,且建设周期长,缺乏有效的多方参与机制。文献[4]引入行动者网络理论分析数据治理框架中的人与非人因素及其关系,构建了大数据治理行动者网络,并利用Petri网对数据治理实施过程进行抽象建模,从而能够推动数据标准化的实施。文献[5]通过大数据平台和信息架构来实现大数据与企业数据的灵活集成,结合企业数据的获取、存储、组织和分析作出科学决策,以实现企业大数据治理。文献[6]从利益相关者视角分析了大数据环境中个人隐私治理问题,提出多元主体协同治理机制,为平衡数据挖掘和隐私保护提供参考。以上的数据治理模型及框架虽然提到了数据标准化的构建方法,但基本上还是在相对封闭和固定的流程中实现开发、候选、批准等构建工作,构建周期较长,交互工作繁琐,不能很好地高效、安全完成数据标准制定开发。如何在多方参与、多方协作的环境下,高效安全地完成数据标准的制定、开发及共享应用等成为数据标准化工作的重点,也是实施数据治理应用的基础。

图1 大数据环境下数据治理框架

1.2 区块链

区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问安全、利用自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式[7]。区块链核心技术包括分布式账本、加密算法、共识机制等,作为一个独立的技术解决方案,其应用已经从单一的数字货币延伸到经济社会的各个领域,具有显著的应用优势:去中心化的分布式结构应用于现实中可节省大量的中介成本,不可篡改的时间戳特征可解决数据追踪与信息防伪问题,安全的可信机制可解决当前信任成本问题,灵活的可编程特性可帮助快速达成业务结果[8]。

区块的结构如图2所示,主要包含两个部分:区块头和存在区块中交易。区块头包括了版本号、前个区块哈希值、默克尔根、时间戳、难度值和随机数[9]。

图2 区块结构

版本号 存储区块链系统和协议的相关版本号。

前个区块哈希值 记录前一个区块的哈希值。根据父区块哈希值,所有的区块可以连接在一起形成区块链。

默克尔根 区块链中默克尔树根的哈希值能够用于快速检查当前区块中所有存储事务的正确性。

时间戳 以年月日小时和秒记录区块生产时间。

难度值 工作量证明算法要解决的目标难度值。

随机数 记录当前的工作量证明算法的解决方案。

另一部分为存储在当前区块中的所有交易信息,这一块的设计可根据不同的应用场景和目的进行调整和改变。

以太坊的出现标志着区块链发展到了新的阶段,使区块链真正具有了图灵完备的特性,为智能合约的实现提供了良好的载体,衍生出了多领域的应用[10]。

如图3所示为以太坊的交易示意图,其中交易中每一块的含义如下所示。

From 来自用户控制的账户的签名,从而授权交易;

To 交易的接受者,可以是用户的地址或合约的地址;

Data 包括创建新合约的合约代码或合约的执行说明;

Gas Price 当前使用以太币购买燃料的转换率;

Total Price 交易可消耗的最大燃料;

Nonce 记录账户交易次数的一个计数器。

以太坊中大约每15 s便会创建一个区块,能够更好地为开发者提供区块链应用的各种部署和测试,方便开发者进行系统验证和实现。

图3 以太坊交易结构

区块链技术为数据治理模型及数据标准的构建提供了新的思路和方法。区块链技术能让参与者以多中心化的方式参与数据标准的制定和维护[11]。在区块链社区的对等网络中,是一个分布式集体运作的端对端自组织网络,利用密码学原理让所有参与节点集体维护一套能记录时间先后的、可信任的数据库。通过共识机制,区块链能保持完整性、连续性和一致性,即使部分参与节点作恶也无法篡改区块链中已形成的标准数据[12]。因此,本文基于区块链技术研究,从数据标准模型结构及流程、数据标准共享和访问控制、数据更新和智能合约方面论述数据治理协同模型的形成和应用。首先,数据共享程度越高,则数据标准发展水平越高。访问控制指将所有数据信息标识出来、划分起来、组织起来、托管起来的一套方法,有助于促进数据标准共享的可持续发展[12]。其次,智能合约作为区块链数据库上的一个触发器,能够高效地进行数据读取和更新。最后通过区块链权限管理的激励制度,增强数据治理落地的积极性,增加各部门及用户黏性,解决“数据孤岛”问题,实现数据标准互联、互通、互信。

2 基于区块链的数据治理协同方法

2.1 基于区块链的数据质量协同模型

通过对大数据环境下的数据治理需求分析可知,数据标准化、数据质量管理、数据安全与合规等问题是数据治理面临的首要挑战。数据标准化层面包括元数据管理和主数据管理,从基础上保障数据的一致性、规范性和完整性,提升数据质量。区块链的分布式账本特性能够保障数据安全和共享,加密机制保证了参与方及用户的隐私,共识机制能够保证多方协作环境下的高效意见达成。基于区块链的数据治理协同模型如图4所示。

图4 基于区块链的治理协同模型

数据治理主要包括数据标准化、数据质量管理、数据安全合规等方面,通过三者的协同治理,最终达到战略一致、风险可控、运营合规、价值实现的治理目标。在大数据治理过程中,战略一致应满足组织持续发展的需要,大数据既是组织的价值来源,也是风险来源,有效的大数据治理能够避免决策失败和经济损失,降低合规风险;同时组织的运营应符合国内外法律法规和行业相关规范,运营合规可以帮助组织有效地提升自身信誉,增强在不同监管环境下的生存能力和竞争力,最终通过大数据与业务的融合实现保证数据价值实现。

治理目标的实现主要基于区块链分布式账本、加密算法、共识机制特性,通过治理模型结构和方法流程、数据共享和访问控制、数据更新和智能合约三个方面来实现。本文提出基于区块链的数据标准构建模型,利用区块链技术数据公开透明、可追溯的思想,实现行业标准库链每条记录从后向前有序链接,具有安全稳定、无法篡改以及可追溯的特点。行业标准库链网络是由加入的各个节点(即注册用户)共同构建的端到端分布式网络,需要全部节点共同维护,通过建立基于规则的数据和标准化智能合约,能够利用互联网获取的外部数据以及读取区块链自身存储的内部数据,实现复杂的业务逻辑,最终构建形成数据标准化的应用方案,实现数据治理的重要目标。

2.2 多方协作的标准构建

区块链作为比特币等加密货币存储数据的一种独特方式,是一种自引用的数据结构,常用来存储大量交易信息。本文在综合考虑数据标准管理模型的基础上提出基于区块链的数据标准管理方法,利用区块链技术其数据公开透明、可追溯的产品架构设计思想,实现了每条记录从后向前的有序链接,具有安全稳定、无法篡改、方便溯源的特点。具体结构模型如图5所示。

图5 基于区块链的多方协作数据标准共建

整个模型分两个阶段:第一阶段在链外,主要由身份认证模块、权限管理模块、监督管理模块组成,主要负责验证用户状态,给予用户奖励以及监管用户行为;第二阶段在链内,主要由行业标准库链组成,其中包括各个行业标准库链,此模块负责存储和读取行业标准库链的数据信息。用户通过身份认证模块验证成为注册用户,注册用户通过调用智能合约进行阶段一和阶段二之间的交互,涉及的用户行为及功能模块解释如下。

身份认证模块 用户必须调用身份认证模块的注册功能检验其是否成功注册成为注册用户,通过返回状态确定用户身份。返回状态包括“注册成功”和“注册失败”。“注册成功”表明该用户成功注册为注册用户,可见其相关的注册信息、积分信息和监管信息等。用户提交的注册信息不完整或信息已有重复,则表明“注册失败”。

权限管理模块 在用户成为注册用户后,调用权限管理模块为其反馈该注册用户的积分拥有情况。积分信息是注册用户用来交换整个行业标准库链开放情况的数字媒介,积分决定了注册用户对行业标准库链内数据信息的使用范围。

监督管理模块 监督管理模块主要有安全维护和行为监察的作用。安全维护指的是实时防止黑客攻击,保证整个网络中所有节点(即注册用户)及各个功能模块安全、稳定、有序运行。行为监察指的是对注册用户的行为进行检测,并且能及时将监督信息反馈给注册用户从而防止注册用户作恶,保证行业标准库链中的数据质量。监督信息是注册用户行为监察的具体反馈信息,即通知注册用户当前违规行为和警告情况,并帮助权限管理模块决定注册用户的权限。

行业标准库链 各个行业标准库链(如图5所示的行业标准库链1~n)分别对应存储该行业的数据标准库,数据标准库具体指的是标准用词(即利用命名规则生成的所有标准项目名,如实体名、实体的属性名、表名、列名、域名等)。每个行业标准库链都由众多区块从后向前有序连接而成。新的区块经过共识算法验证,通过后链接至标准库链,标准库链高度加一。这种方式保证了每个区块指向前一个区块,形成一个巨大的稳定的行业标准库链,同时也保证了整个流程的公开透明,让数据标准库的信息更加权威。

基于区块链的行业数据标准共建管理算法和过程如下。

步骤1 用户提交注册申请,通过身份认证模块,验证其身份可获得相应的返回状态。“注册成功”则成为注册用户,反之则“注册失败”。

步骤2 注册用户通过权限管理模块拥有相应的积分信息。

步骤3 注册用户通过监督管理模块拥有相应的监管信息。

步骤5 数据标准库链借助智能合约自动完成相应操作。

数据标准化需要遵循一定的标准化原则,标准化原则可以最大限度改善数据质量、保证标准化实现、形成数据共享机制。基于区块链的行业数据标准共建方法,统一了数据标准的规则,统一了数据查询接口,可以实时数据共享。通过权限管理的激励制度,增强用户黏性,消除“数据孤岛”问题,实现数据标准互联、互通、互信。

2.3 安全可靠的数据共享和访问控制

数据共享指在不同地方,使用不同计算机、不同系统的用户能够读取他人数据并进行各种操作运算和分析。行业标准库链集实现数据标准库的共享,充分使用已有数据资源,减少资料收集、数据采集的重复劳动,而把精力重点放在数据标准完善或有针对性的个性化使用中。访问控制指将所有数据信息标识出来、划分起来、组织起来、托管起来的一套方法,只需提供一个简单的、唯一的接口,便可决定参与者是否拥有对数据信息的读取或写入的权限。访问控制有助于促进数据标准共享的可持续发展。数据标准共享模型如图6所示。

行业标准库链集由若干个行业标准库链(如图6所示的行业标准库链1~n)组成。所有注册用户即注册用户集(如图6所示的注册用户1~m)通过调用智能合约可对行业标准库链集进行写入和读取操作,并由智能合约返回给注册用户相关反馈信息。写入操作指的是注册用户从选择行业、提交申请,到成功验证“合法”备选用词的过程。读取操作指的是注册用户查看行业标准库链集中各个行业标准库的操作。查看标准用词数量的多少取决于注册用户拥有的积分情况。用户注册成功后可以查看通用标准库。通用标准库通过调用智能合约的计数模块形成,其中包含统计频率较高的标准用词。

图6 行业数据标准共享示意图

每个注册用户都有查看通用标准库的权限,但查看具体行业的数据标准库则需要通过扣除积分的行为来实现。积分的获取通过该注册用户上传excel文件,并为标准库的完善所作出的贡献而定,积分的奖惩规则如表1所示。

整理完整的excel文件指的是经过转换管理过程数据有效性较高的文件,注册用户上传数据有效性较高的文件可获得积分奖励;上传数据有效性较低的文件(即质量较差的excel文件)将被扣除积分作为警告。上传的excel文件中,通过调用智能合约验证判定其中备选用词的质量。验证反馈信息为“合法”的备选用词,则予以积分奖励肯定该用户对扩展行业标准库的贡献;为 “同义”的备选用词,也予以积分奖励肯定该用户对提炼通用标准库的贡献;为杜绝注册用户反复上传相同excel文件,对“重复”的备选用词不进行积分上的奖惩;为“缺损”“无效”的备选用词,将进行积分扣除警告该用户改善上传文件中数据的质量。

数据共享程度越高,则数据标准发展水平越高。访问控制管理,旨在于助力形成数据共享的氛围。通过用户管理以及注册用户的奖惩机制,既能激励用户主动分享所属行业的相关数据信息,又能防止注册用户通过大量上传低质量或重复文件恶意赚取积分,从而降低行业标准库的权威性。

2.4 高效准确的数据更新

行业标准库链网络是由加入的各个节点(即注册用户)共同构建的端到端分布式网络,需要全部节点共同维护。区块链是一个不可更改的分布式数据库,智能合约是数据库上的一个触发器。通过建立基于规则的数据和标准化智能合约,能够利用互联网获取的外部数据以及读取区块链自身存储的内部数据,实现复杂的业务逻辑。每个注册用户节点提交更新数据以及调用智能合约自动化验证模型如图7所示。

图7 基于区块链的自动化验证流程

注册用户进行数据标准申请时,先预选待更新信息的所属行业。再将整理完整的excel文件上传,经过转换管理成为统一标准格式的备选用语。依次通过智能合约的验证模块,判断其中的备选用词是否已经在行业标准库链上的行业标准库中存在,是否有同义,是否有缺损,是否无效以及是否验证通过为合法。验证后自动将验证反馈信息填入备注栏中,用户可以在申请页面刷新查看。验证反馈信息为“合法”的备选用词,则可记载于区块上,为“重复”“缺损”“同义”或“无效”则不被记载于区块上。计数模块调用读取模块,再对“合法”“重复”和“同义”的备选用词进行比对,执行计数后调用写入模块,最后将“合法”的备用词写入行业标准库链中。涉及的用户行为及功能模块解释如下。

创新是企业发展的关键,是企业的第一驱动力。而核心能力是一种与众不同的能力,它不是企业中某一种具体的能力或优势,而是一种将多种优势进行整合后形成的能力,它为企业带来长期持续的竞争优势并使其获取超额利润,且一旦形成,便具有相对稳定性,不易失去。企业核心能力是指在企业发展过程中整合能力已经达成重要共识的能力,唯有如此才能培育出属于本企业的持续竞争力,也才能提高企业的综合能力,从而奠定企业更坚实的技术和管理基础。

Excel文件 注册用户选择需要申请成为标准用语的数据表(仅包含表头,不需要具体的值),整理完善至excel文件中。

选择行业 由于行业标准库是根据不同行业作细分采集,因此注册用户在上传之前,必须预先选择待提交的excel文件所属的行业,才能较好地对该行业数据标准的完善作贡献,增加注册用户申请的标准用语验证通过率。

转换管理 excel文件的数据内容可能会有重复项、规格不统一、空值、需要丢弃的乱码等问题。转换管理旨在于ETL(Extract Transform Load)的过程,即将数据从来源端经过抽取(extract)、转换(transform)、加载(load),形成统一格式的备选用词。

验证模块 验证模块是指对统一格式后的备选用词依次调用智能合约进行比对和验证,即将备选用词和行业标准库链中的标准用语进行文本分析和比对,验证该备选用词是否能够写入标准库中。如果在已存标准用语中有一模一样的备选用词则判定“重复”;有意思相近的备选用词则判定“相近”;语义不完备的备选用词则被判定“缺损”;毫无意义的备选用词则被判定为“无效”。只有语义完备且对比已存标准用语,无重复、非近义、有意义的备选用词才能通过验证判定“合法”,成为标准用语写入行业标准库链中。

计数模块 在验证模块中,通过验证的“合法”备选用词计数加一。被判定“重复”和“同义”的备选用词,都将对该行业标准库链中已存标准用词(即被“重复”/“同义”的标准用词)计数加一。通过计数模块可以高效完整地统计适用于全行业的通用标准用词,为后期权限管理和访问控制提供依据。

读取模块 执行读取行业标准库链中标准用词信息的操作,协助计数模块进行比对操作。

写入模块 执行将“合法”的备选用词写入行业标准库链的操作。

行业标准库链 细分领域下,某一行业的标准用词集。

智能合约程序代替传统的人工审核机制,是一个可自动执行的计算机程序,同时也是一个系统的具体参与者。本文提出的方法旨在减少数据标准化过程中不必要的人工干预,保证系统按照事先商定好的规则绝对可信地执行审核操作,实现数据标准维护的高效性和客观性。

3 实验及分析

本文基于某证券公司大数据风控管理平台作了实验对比和分析,该平台包含四个应用系统,分别为信用风险、市场风险、操作风险、非现场监控等风控系统,四个风控系统共计3 073张数据库表,经数据标准化后共计10 281个数据字段。本实验通过传统数据标准管理系统与基于区块链的数据标准管理系统进行了标准用语申请的比对和分析,区块链环境采用以太坊平台搭建,部署了4个节点,设定区块难度值,使得区块出块时间与以太坊公链大致相同,均为13.55 s。实验结果表明,本文提出的模型和方法能够高效、安全地对数据标准进行管理,减少过度的人为干预,提高行业数据标准制定、监督维护的效率。

3.1 高效性分析

传统模型和方法中备选用词申请成为标准用语的时间如式(1)所示:

(1)

T为备选用词申请成为标准用语所用的时间。传统模型中,用户逐个提交备选用词申请标准用词,需人工审核(即人工检阅通过后反馈是否通过)。在这个过程中,用户提交后得到反馈的时间主要取决于参与审核人员的工作时间。因此可分两种情况,情况一(最短用时):用户提交申请,审核人员立即查看,此时审核人员审查所用时间为t1,提交后马上被人工审核的备选用词数量为n1;情况二(较长用时),审核人员非即刻查看,此种情况备选用词梳理为n2,此时审核所费时间为t2(t2呈指数分布),根据公司对审核人员的要求,标准用语申请提交后三个小时内内基本会得到处理,因此本文得出t2的概率密度函数为:f(t)=e-(0.08t-0.08)。

本文提出的模型中备选用词申请成为标准用语的时间如式(2)所示:

T=(n3+n4)×t3+n3×t3+(⎣n3/(tx×t4)+1」)×t4

(2)

T为备选用词申请成为标准用语所用的时间。区块链模型中,注册用户可通过上传excel文件的方式批量提交备选用词申请标准用词,通过调用智能合约进行备选用词的验证。在这个过程中,注册用户提交后得到验证反馈信息的时间主要取决于读取智能合约以及写入区块链的时间。根据验证反馈信息,注册用户提交的备选用词可被分为两类:可被存入区块链的备选用词(即验证反馈信息为“合法”的备选用词)和不被存入区块链的备选用词(即验证反馈信息为“无效”、“同义”和“重复”和“缺损”的备选用词),其数量分别用n3、n4表示。首先所有被提交的备选用词(即n3+n4)需要依次调用智能合约进行验证对比,然后符合要求的n3数量的标准用语需要再次调研智能合约写入区块链中,设调用一次智能合约所用时间为t3。考虑到以太坊的每秒并发数为tx,区块的生成时间为t4。综合以上条件,备选用词申请成为标准用语的时间如式(2)所示。

根据市面上已有的数据标准管理系统,经实际操作估算,两种模型n1和n2以及n3和n4的数量均占总审核备选用词数量的50%。传统模型中t1为1 min(根据实验监测得到),t2取时间指数函数的积分;本文以太坊区块链环境智能合约调用平均时间t3为0.012 s(根据实验监测得到),t4为13.55 s(当前以太坊一个区块生成的平均时间)。经过实验测算得到两种模型所用的审核时间对比如图8所示。

图8 备选用语审核时间对比

由图8所示,用户申请相同数量备选用词,区块链模型所用的审核时间明显比传统模型所用时间短,且申请的备选用词数量越多,两者耗时差距越明显。区块链模型在申请验证过程中时间效率显然优于传统模型。

从商业角度来看,不同于区块链模型的机器验证方式,传统模型的人工审核模式不仅放大了审查人员的权威性,更在系统维护、数据维护和数据扩展等方面存在巨大劣势。两者进一步对比如表2所示。

表2 传统模型与区块链模型对比

3.2 安全性分析

人为作恶是指黑客破坏整个网络、篡改数据或用户通过不良行为自己牟利,直接或间接地对现有数据标准体系进行破坏和影响。本文所提出的基于区块链的行业数据标准共建模型,在抵御人为作恶保障网络及信息安全方面具有以下3个方面的优势。

1)利用分布式数据存储和数据共享模式,有效防止单点攻击。

本模型不同于由大型企业、银行机构、政府部门等第三方实体主导的,用中心化服务器存储数据的信息化系统,基于区块链的数据存储本质上是一种多中心、分布式结构。在区块链社区的对等网络中,区块链技术利用节点间端到端的通信方式,不仅解决了分布式数据存储问题,也解决了存储时的分布式一致性问题。

模式对比图如图9所示,区块链的数据共享模式可取代传统模式下中心化服务器,形成一个特有的、多中心、分布式数据库。每个节点的数据都相同,这意味着攻击者攻击任意单个节点都不会影响整个系统的数据安全,不会形成单点故障。

2)利用密码学的相关原理进行数据验证,数据可靠不能篡改。

本文提出的模型利用数字签名技术保证用户在注册成功后无法被恶意实体假冒,有效杜绝恶意实体扰乱注册用户秩序的潜在危险。写入区块链的数据经过共识机制已被全部节点验证通过,恶意实体无法通过攻破所有节点掌控整个区块链网络,更无法篡改链上数据。

3)通过业务方法平衡链上和链下的数据,用户行为可被审计。

在真实业务场景下,用户登记体系不完备,导致了数据的来源、流转过程不透明,数据采集质量不可控,也使得数据标准化的制定混乱。本文通过业务方法来平衡并保证两者的数据一致性以确保信息安全。区块链上的数据,即行业标准库链内数据信息在计算以及结果输出的每一步记录都会被留存在区块链上,因此具有可追溯特性;区块链下的数据,即用户的注册信息是监管模块对其进行监管的追责依据。通过业务方法结合链上链下数据,可实现对不良数据和不良用户行为的双重审计。

图9 单点攻击下传统模式与区块链模式对比

4 结语

本文提出的基于区块链的数据治理协同模型以及多方协作行业数据标准共建方法,解决了当前数据标准的产生和利用只能停留在封闭环境之内的两难境地,为数据治理模型的应用及多方协作的数据标准共建提供了可行的路径。该模型的价值在于利用区块链技术和智能合约技术充分汇聚行业多方资源,实现数据治理价值以及高效安全的数据标准加载、融合及开放。仿真实验也表明本文提出的方法的高效性和安全性。在未来工作中,本研究将开展进一步实验,从而帮助完善基于区块链的数据治理协同方法实施细则,并开展多方协作行业数据标准共建模型的深入应用。

猜你喜欢
用词行业标准区块
15项行业标准将于2023年4月1日起实施
15项纺织行业标准复审结论
苍凉又喧嚣:《我与地坛》中的用词
2020年7月1日将实施的55项纺织行业标准(表4)
《红楼梦》的数字化述评——兼及区块链的启示
近期发布的相关行业标准(2020年3月01日)摘选
区块链助跑财资管理
一场区块链引发的全民狂欢
区块链助力企业创新
相似的内容,灵动的表达