贾静丽,杨 扬
(1.国网河南通信公司(数据中心),河南 郑州 450052;2.国网河南省电力公司信息通信公司,河南 郑州 450052)
信息技术的高速发展和社会经济的快速增长,极大地推动了数据的快速发展,并在一定程度上促使数据成为社会发展和进步的重要推动要素。在大数据时代的社会大背景下,企业在经营过程中产生了越来越多的数据,数据被窃的问题出现的频率也在提升,这对企业的数据安全和正常经营产生了较大的不利影响。所以,如今有越来越多的企业倾向于将部分资源用到数据安全技术这一方面上,以确保能够以最低的成本来确保数据信息的安全,提高企业的经济效益。除此之外,根据相关的调查结果来看,数据被窃所能够获取的不法利润非常高,并且这一问题发生的原因往往是由于内部工作人员缺乏谨慎性,这较为清晰地表明敏感数据具备非常高的安全风险,提高其安全性成为了相关专业人士重点研究的内容。
数据脱敏指的是在既定的标准体系之下来将敏感数据进行一定转换的一项技术,可以极大地提高敏感数据的安全性,减少敏感数据被窃问题发生的概率。现如今,数据脱敏已经成为相应企业进行正常性运营、发展战略决策等环节的重要速成部分。我国由于数据脱敏的起步时间相对而言比较晚,整体的脱敏技术还有极大的发展空间以及较多尚待完善的不足之处,例如应用对象范围较为狭窄、应用流程较为复杂、相关技术人员储备不足、后期维护工作难度较大等等。
敏感数据也被称作是隐私数据,涵盖了诸多重要的数据与信息,和个人生活、工作有着极其密切的关系,并且受到了国家所制定的相关法律的保护。若是拥有用户敏感数据的企业或者政府机构不能够保证其安全性,那么将会在用户之中树立起一个无法能够被信任的外在形象,并且将接受法律的制裁。敏感数据在应用的各个环节都存在着有可能被他人所窃取的安全风险,例如内部人员缺乏谨慎性、内部人员存储数据不当等等。绝大部分企业往往都是把安全工作主要放在外围安全以及终端防护之上,并进行相应的安全配置,然而,这一系列行为并不能够真正地保护敏感数据不被泄露。随着大数据时代的快速到来和不断发展,数据价值将变得愈发重要,企业必须要将足够的安全志愿放置到敏感数据保护之上。
数据脱敏在确保数据原有内容不受损害的前提之下,根据实际的需求来借助相应的技术对敏感数据进行转换。只有特定的工作人员以及用户能够在特定的情况下,借助相应的设备和软件来了解敏感数据的原有真实内容,从而可以在很大程度上提高敏感数据应用过程之中的安全性,可以说是现如今的社会大环境之下最佳的敏感数据安全保护方法。所有和敏感数据有关的行业都对数据脱敏有着一定的发展需求,例如政府机构、电子支付行业、教育行业等等,都需要涉及到身份证信息、用户姓名等重要的敏感数据信息,具有较高的泄露风险。而若是应用数据脱敏技术,借助各项工具、设备来对相应的敏感数据进行特定的脱敏,增强访问的限制性,从而可以极大地保障敏感数据的安全性。
智能大数据脱敏系统架构主要是由四大模块组成,分别是资源模块、数据模块、服务模块、应用模块,具备安全管理、运转管理这两大重要作用。资源模块主要是为数据脱敏工作的开展提供各项所需要得资源,例如数据资源库、运转资金成本等等。数据模块涵盖了一系列数据储存库,是确保智能敏感数据脱敏的重要保障和不可忽略的组成模块。其能够根据所需要脱敏的敏感数据的实际内容、性质等来选用出对应的脱敏标准、脱敏例子、脱敏技术等,确保敏感数据脱敏的高效性。除此之外,其还涵盖了敏感数据访问权限标准,极大程度上决定了智能敏感数据的可访问标准。服务模块指的是为智能数据脱敏提供相应的服务和设备支持,确保智能数据脱敏系统能够稳定、集中地进行运转。应用模块指的是根据智能敏感数据的类型、内容等,在进行相应的脱敏技术处理之后,来将脱敏后的敏感数据进行应用以保证其价值不受损害。
基于大数据的智能数据脱敏系统远转主要由五个环节组成,即用户需求配置、敏感数据识别、脱敏策略配置、脱敏服务运行、脱敏状态监管。用户需求配置这一环节会在综合分析用户敏感数据的价值、私密性等基础之上,来对智能敏感数据进行合理的定义。敏感数据识别这一环节指的是借助智能化识别技术来提取敏感数据中的重要内容等,根据相应的分析、处理标准来识别其中的组成结构等,进而选择出需要进行脱敏的智能敏感数据。脱敏策略配置这一环节提供了两种脱敏策略的配置方法,其一是根据智能数据脱敏系统所本身就拥有的敏感数据类型配置库,来选择特定的脱敏策略配置;其二是根据用户自己所提出的只能敏感数据脱敏方法、要求等来配置脱敏策略。
脱敏服务运行这一环节就是根据用户的选择来决定静态数据脱敏还是动态数据脱敏。脱敏状态监管这一环节指的是实施对智能敏感数据脱敏的进程进行监管,当发现其中存在问题时及时地采取有效的针对性措施来解决问题。并且需要在一定的时间间隔后向用户反馈实际的敏感数据脱敏情况,以此来更好地满足用户的脱敏需求和要求,为智能数据脱敏系统今后的运转和发展提供较为重视的用户基础。
智能敏感数据识别在智能数据脱敏系统之中占据着非常重要且核心的地位。在大数据的时代背景之下,非结构化数据占据了绝大多数,所以非结构化数据的敏感数据识别、脱敏等成为了现如今最为重要的研究和发展内容,对于智能数据脱敏系统的实际效用具有非常积极的作用。一是数据源注册环节。数据源注册的时候,智能数据脱敏系统将会和注册的数据源产生一种联系,在审定数据源的安全性等方面的同时,将从数据源之中提出一些数据样本等来对其敏感数据进行初步的识别工作。二是智能敏感数据脱敏工作开展环节。为了确保能够充分地识别出所有的智能敏感数据以及提高敏感数据脱敏的效率和精确性,智能敏感数据脱敏工作开展环节的工作将主要集中当长字段当中。
智能数据脱敏系统的主要功能根据相关标准大致上可以分为三个部分,即数据库脱敏、敏感数据识别、智能敏感数据脱敏检测。数据库脱敏指的是根据数据形态的类别,在不损害其内容、确保数据具备应用价值的前提基础之上,对智能敏感数据进行脱敏。并且,不同类别的数据类型所采用的脱敏设备、技术等都有着不同程度上的差异性。敏感数据识别指的是借助智能化识别技术来是设计出敏感识别技术应用系统,提高敏感数据的识别效率和全面性,及时地提取出重要的智能敏感数据以进行后续的脱敏工作(如图1)。
图1 敏感数据识别技术原理图
智能敏感数据脱敏检测指的是借助对应的检测系统来对脱敏的智能敏感数据进行检测,以确保敏感数据的价值、内容、实用性都没有受到损害,能够更好地满足用户的需求。
伴随着大数据技术的不断发展和完善以及相应计算机信息技术的高速发展和应用范围的扩大,建立在大数据平台之上的智能数据脱敏服务为数据产品安全性的提高等创造了更大的全新发展空间,能够在很大程度上提高智能数据脱敏系统的实用性以及应用价值。
根据动态数据脱敏的相关运转原理理论知识和实际的应用发展情况,把智能数据脱敏系统的数据储存、计算等工作借助大数据平台来开展,提供数据脱敏服务。数据脱敏服务主要是以集中控制、分部代理方式来进行,根据各个行业不同的数据内容、类型等来选用合适的智能数据脱敏服务。建立在大数据之上的智能数据脱敏平台作为连接智能敏感数据拥有者以及智能敏感数据使用者的主要平台,必须要严格而全面地保护敏感数据不被泄露。智能数据脱敏系统利用多种方式来处理、保护智能敏感数据,为企业提供符合企业实际情况和需求的服务,一方面不会提高企业维护智能敏感数据库等所需要投入的成本资金和各项资源应用比例,另一方面也不会对智能敏感数据应用过程之中所涉及的各方群体产生一定程度上的干扰和影响。
在信息化技术的不断完善和推动下,大数据得以了极大的发展和广泛的应用,在这样的社会大背景下,敏感数据脱敏成为了现如今诸多现代化企业进行正常性运营和发展的重要安全保障,将会对企业在市场中的竞争力产生非常积极且深远的影响。同时,在今后的发展历程之中,智能数据脱敏系统将会更加符合用户的实际各项需求,具备更高的精确性和实用性,能够更好地抵御系统外部不法分子的数据窃取情况的发生,这对于信息时代的发展具有非常积极的现实意义和发展价值。除此之外,基于大数据的智能数据脱敏系统符合了现如今信息化时代和经济全球化发展整体态势,对于增强我国的综合实力、推动我国社会经济的长远健康发展具备一定意义上的积极发展意义和推动价值。