■ 安徽 刘扬
编者按:本文梳理了新时代大数据监管工作的工作标准——实时、精准、有效与安全,构建了基于数据校验思想的大数据监管系统的概念架构,为大数据监管系统建设、网络信息安全防护体系建立提出建议。
开展大数据监管系统建设,以大数据监管系统为技术基础构建保护个人隐私的网络信息安全防护体系成为监管部门大数据监管能力建设核心内容。
要实现上述目标,首先要有评价标准——大数据监管的工作标准。而这需要理清大数据系统的特点。
基于大数据的4V特征,结合已经发布的《信息技术大数据系统通用规范》国家标准,从数据的角度来看,大数据系统包含以下特点:
一是实时性强,延迟极低。二是准确性强,偏差极少。三是数据价值总量大,易受攻击。
因此,工作标准可以概括为四项:实时、精准、有效和安全。
实时是大数据系统的共同特点,而大数据监管工作本身也要依托大数据监管系统开展,对被监管节点实时监测,实时纠正。
射频治疗疼痛的方法近年来也出现了一些新的变化,从以往的被动的神经治疗,到今天的主动治疗,针对神经受压根源来进行根源性的治疗,从而调整神经传导,增加神经血流,产生保护的效果。经过这些年的治疗,结果表明该方法是一种比较可行的疼痛缓解的方法,同时,该方法的副作用也比较少,不良反应的情况十分罕见,即使存在不良反应也可以在比较短时间内康复。
精准包含两个层面的概念,一是精益,二是准确。精益指监管数据提取最小化,降低大数据监管系统内包含的数据价值。准确指在监管时直接定位到末梢,减少不必要环节。
有效是针对技术手段效果的评价。在用户个人隐私保护实践中,有效既可以是被监管节点运用匿名化技术防止数据还原,也可以是被监管节点通过加密传输防止数据被违规获取等。
安全是大数据监管工作面临的最大挑战。被监管节点中所包含的数据价值越大,越容易成为被攻击的目标,甚至大数据监管系统本身也存在被攻击的可能性。
在建立了工作标准后,需要选取合适的技术手段进行组合搭配。在本研究中,将数据校验思想作为选取原则。
数据校验的概念,可以追溯到计算机通信领域的数据传输。其本质是为保证数据经过传输后的数据完整性而进行的一种验证操作。
从数据校验的相关研究来看,主要包括以下三方面:
一是提升数据传输的效率。例如通过低密度奇偶校验码的压缩感知重构,在误码率不变的前提下实现低信噪比的高可靠性通信。
二是提升数据传输可靠性。以CRC直驱表法为例,在200Mbps的码率下,可实现HOTLink总线接口下40米零误码可靠传输。
三是保证信息传输的完整性、发送者的身份认证和防止交易中的抵赖发生。杨占民等人提出一种基于MD5和数字水印的电子签章文件校验方案,实现了文档的防篡改、文档的合法性验证。
其中,在网络信息安全领域,数据校验应用于MD5和数字签名等,其思想实质是计算与比对哈希值,检验数据本身是否完整或被篡改。
基于数据校验思想实质,本研究对大数据监管的监管对象——数据的概念做了进一步拓展。即在大数据监管系统中,数据由数据本体与附属组成。
数据本体即通常意义上的数据,比如对被监管节点进行监测时提取到的用户数据。
图1 大数据监管系统中的数据概念
数据附属则是提取数据的过程记录,包括监管节点与被监管节点的节点标识、时间戳以及所提取数据的生成记录、访问记录、修改记录和哈希值等。如图1所示。
采用数据校验思想选取技术手段,主要有以下三方面的优点:
一是与当前网络信息安全防护发展的总体趋势保持一致。目前,网络环境趋于复杂,攻击手段不断升级,呈现出从黑名单、白名单转向关注行为的发展趋势。将提取数据的过程转化为数据的附属结构,可以更及时有效的追溯可能出现的违规访问、篡改数据等异常行为。
二是与监管部门自身监管能力建设的发展方向保持一致。随着大数据监管系统的建设,监管系统本身的数据价值也会随之增长,也存在成为被攻击目标的可能性,因此需要在开展大数据监管工作的同时防止监管节点可能出现的各类异常监管行为。
三是基于数据校验思想拓展的数据概念与区块链基本组成单元区块的结构相似。区块由区块头和区块体组成,区块头记录区块本身各项特征值,区块体记录数据。因此,区块链的不可篡改、可溯源等特性可更方便的应用到基于数据校验思想建设的大数据监管系统上。
基于数据校验思想,大数据监管系统建设中需要的技术基础大致有以下三类:
一是被监管节点配置的各项网络信息安全技术。这些技术包括TLS/SSL协议、入侵防护技术、追踪溯源技术、新型加密技术(混合加密、同态加密等)、数据匿名化技术、基于数据失真和加密的技术、访问控制技术等。
二是检测被监管节点已部署的网络信息安全防护技术能力的监测技术。包括流量识别技术、安全审计技术、数据挖掘技术等。
三是记录监管节点开展监测全过程的支撑技术,包括区块链、边缘计算等。区块链具有不可篡改、可溯源等特点,目前在物联网、隐私保护等领域广泛应用。边缘计算把计算、存储、带宽、应用等放在网络的边缘侧,减小传输延迟和带宽消耗。区块链与边缘计算的结合,可以有效减轻中心节点的压力,便于监管节点的大规模部署。
图2 基于数据校验思想的大数据监管系统的概念架构
基于数据校验思想,结合工作标准,可以明确数据校验各环节的数据校验重点与对监管节点的功能要求。
(1)在各环节中,监管节点都要达到实时监测、不收集与监管无关的数据、对于异常行为的防护与追溯的功能要求。
(2)在数据收集环节,数据本体与附属均需校验,在遇到异常时可精确定位到被监管节点的末级节点。
(3)在数据存储环节,数据本体与附属均需校验,可对第三方存储数据的完整性进行验证。
(4)在数据处理环节,数据校验重点是数据本体,可对隐私数据的不可还原性进行验证。
(5)在数据使用环节,数据校验重点是数据附属,可对访问行为有效记录。
综合大数据监管系统建设需要的技术基础,基于数据校验思想的大数据监管系统的概念架构如图2所示。
构建保护个人隐私的网络信息安全防护体系,大数据监管系统是技术基础。在这一基础上,建立起监管部门、用户与企业通过系统平台沟通、协作与联动的监管机制。从而将技术手段无缝融入到网络信息安全防护体系中,保障个人隐私安全。
本文梳理了新时代大数据监管工作的工作标准,构建了基于数据校验思想的大数据监管系统的概念架构,为大数据监管系统建设、网络信息安全防护体系建立提出建议。