王东 陈静
摘 要:在当前移动互联时代,云计算、物联网等新的信息技术的发展,大数据逐渐成了通信运营商关注的焦点。文章结合大数据的相关概念,对大数据平台建设中所面临的安全问题进行分析,希望为运营商大数据平台的安全建设提供一些借鉴。
关键词:大数据;安全;数据脱敏;数据防泄漏
自移动互联网、云计算之后,现在最流行的词语莫过于“大数据”。随着各种网络的融合、移动终端设备便捷消费与服务的兴起,所积累的数据也在呈几何级增长,这些数据量大、移动速度快,我们通常称之为“大数据”。大数据已经无处不在,当人们晚上在家看电视剧时,拿着手机在浏览新闻页面时,或是使用各种手机软件时,无形中大数据已经包围着我们形成了一个流量的气场。
1 大数据的相关概念
大数据,是指由许多不同的数据集汇合而成的数据集合,规模极其庞大复杂,采用当前常规的数据处理工具和数据管理技术无法进行有效处理。当前,业界广泛认同的大数据的特征,主要体现在4个方面,即容量、类型、价值以及速度[1]。
(1)数据量巨大,数据成倍增长。最近几年,全球数据量呈现出前所未有的增长趋势,计量单位由TB级别跃升到PB、EB乃至 ZB级别(1024进制),其所带来的技术挑战,是巨量数据存储技术。
(2)数据类型多,包括了结构化数据、半结构化数据以及非结构化数据,而且数据也不再是单一的文本形式,而是包括了日志、图表、视频等,对于数据处理能力提出了更高的要求。多样化的数据类型所带来的挑战,是非结构化数据处理技术。
(3)价值密度低,在庞杂的数据中,可能仅仅只有极少的数据才有相应的价值,如何对数据进行提纯和深入挖掘,找出有价值的信息,是一个亟待解决的问题。
(4)处理速度快,要求实现信息的实时获取,其所带来的挑战是实时数据处理技术。
2 大数据的安全
随着数据资产价值持续攀升、大数据产业规模不断壮大,大数据技术在改善社会生产生活的同时,其安全问题也逐渐显现出来。2017年1月,大数据基础软件陷入一场全球范围的大规模勒索攻击,Hadoop集群被黑客锁定为攻击对象。同时,据Shodan互联网设备搜索引擎的分析显示,因Hadoop服务器配置不当导致5 120 TB数据暴露在公网上,涉及近4 500台HDFS服务器。同时,近年来全球数据安全事件层出不穷,如何在大数据时代处理好数据安全问题成为全球普遍关注的热点[2]。
下面针对某运营商关于大数据安全问题进行详细介绍。
2.1 大数据中心面临的安全挑战
大数据中心面临的安全挑战如图1所示。
数据安全风险分析如图2所示。
2.2 大数据安全发展的建议
面对大数据时代严峻复杂的安全问题,亟需采取针对性的手段措施,构建大数据安全保障体系,为大数据产业健康发展保驾护航[3]。
2.2.1 安全防护技术体系架构
安全防护技术体系架构如图3所示。
可以看出,大数据在不断发展的同时,也伴随着巨大的风险。接下来针对国内某运营商关于数据安全中的数据脱敏以及数据防泄漏进行详细介绍。
2.2.2 数据脱敏
数据脱敏,又称数据漂白、数据去隐私化或数据变形。数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其他非生产环境以及外包环境中安全地使用脱敏后的真实数据集。
2.2.3 数据脱敏系统
针对敏感数据的脱敏工作,建设数据脱敏系统。系统功能架构至少包含数据源管理、分类分级、敏感数据自动发现、敏感数据手工定义、敏感数据分布视图、支持脱敏算法类型、静态脱敏、动态脱敏等。
系统架构按照“高内聚、松耦合”的设计原則,脱敏节点具备良好的可扩展性,在数据源管理上实现数据库创建、数据库编辑、数据库列表查询、数据库联通性测试、数据库删除等功能[4]。
(1)敏感数据分类分级。
敏感数据分类管理,支持将企业的敏感数据分类信息进行电子化管理,根据实际情况,业务上满足分类信息多层级联。系统主要实现分类信息的创建、分类信息编辑、分类列表查询、分类信息删除等功能。
敏感数据分级管理,支持将企业的敏感数据进行敏感定级,根据敏感数据对企业的重要程度,来规划数据敏感级别,由高到低可以分为:高敏感级、中敏感级、低敏感级。管理上根据敏感级别来设定脱敏策略。系统主要实现分级信息的创建、分级信息编辑、分级列表查询、分级信息删除等功能。
(2)动态脱敏。
动态脱敏系统包括默认脱敏策略管理、代理管理、脱敏特性几大模块。
默认脱敏策略管理针对动态脱敏任务,为每种敏感数据标签设定默认脱敏算法。如有特殊需求,可以配置例外,即针对某数据库,根据访问用户的不同,修改脱敏算法配置。
代理管理可配置代理主机、代理程序、代理端口等内容,配置完成后,用户通过代理通道进行数据库业务访问。
关于脱敏特性,系统将实现数据库函数脱敏,函数包括不限于acos(),asin(),acos(),asin(),acos(),asin();实现敏感数据迁移脱敏,当用户将某张表的敏感数据迁移到新表中,随后用户对新表进行查询操作,对于新表中的敏感数据同样需要进行敏感数据处理;实现跨schema访问脱敏,同一数据库用户,一次查询的数据来源于多个schema时,对多个schema中存在的敏感数据进行脱敏;实现分权限脱敏,当多个不同数据库用户访问同一份敏感数据时,可以根据预先设定的规则,做到不同的数据库用户查询到不同的敏感数据。
(3)静态脱敏。
静态脱敏包括默认脱敏策略管理、脱敏任务管理、调度任务管理、子集模板管理几大模块。
针对静态脱敏任务,为每种敏感数据标签设定默认脱敏算法。使用默认策略,降低了每个任务的配置工作量,提升效率。如有特殊需求,在脱敏任务中可以修改敏感数据的脱敏算法;支持默认脱敏策略查询;支持默认脱敏策略列表展示;支持通过标签进行条件查询;支持默认脱敏策略编辑。
脱敏任务管理要求系统在脱敏任务中配置源库、目标库、数据表范围、任务级脱敏算法等信息。脱敏任务一次配置,支持多次执行。脱敏任务执行过程中提供数据表脱敏进度条提示。脱敏任务执行后,有详细的脱敏任务报告。同时脱敏任务可兼容执行过程中遇到的异常情况,支持跳过异常数据继续执行任务。
调度任务管理需要脱敏任务按时间维度配置定时调度,解决周期性脱敏工作需要手工执行的问题,包括调度任务创建、编辑、列表查询、删除等功能。
子集模板管理中可以指定从表中抽取固定条数,也可以指定where条件,将满足条件的数据脱敏。同时系统支持子集模板的创建、子集表的配置、子集模板查询、子集模板删除等功能。
2.2.4 数据防泄密系统
数据防泄密(Data Leak Prevention,DLP)系统,将DLP管理平台、第三方权限控制系统实现无缝结合,支持大规模的网络快速部署,实现最完美优化整合。
平台集中部署,用户终端设备通过部署在DMZ区的认证中心对应用进行访问;管理员通过访问部署在内网的核心服务器、应用服务器核心机密数据进行管理。结合DLP系统平台架构和模块特性,考虑到核心业务模块如数据库、应用等具备热备能力,核心服务器应具有负载均衡能力,进行服务器功能调整,通过对物理机划分虚拟空间的做法,实现服务器划分主备,从而达到热备及容灾的功能。
DLP系统提供了一整套完整的公钥、私钥生成、管理、回收机制和审计机制,可以覆盖海量用户管理全生命周期过程。
(1)集中管理、权限管理。
DLP系统提供完整的配置集中管理功能,管理人员可以通过配置集中管理服务,对DLP系统进行配置的集中管理。
DLP系统提供完整的权限分类分级管理功能,管理人员可以通过权限分类分级管理服务,对DLP系统进行权限的集中管理。所有管控权限均在一套完整的体系系统中实现,具备多层横纵管控体系设计,整体权限管控明晰、隔离、合理。
(2)文件识别与防护。
DLP系统具有完善的文件加密功能。
按文件类型分DLP系统支持文件类型包括word,ppt,pdf,excel,txt,常见的功能类文件,设计文件和信息系统运维类文件。
按文件来源分,DLP系统支持业务系统数据和后台系统数据。
业务系统:业务系统数据可通过接口方式实现数据重定向,从业务系统的下载数据转存到数据防泄密系统的个人文件夹中。
后台系统数据通过运维工具的统一管理直接实现数据下载管理。
(3)用户认证。
DLP系统支持多种认证实现方式:支持LDAP认证、支持Radius认证、支持AD认证、支持短信认证等各种二次认证方式,具有豐富的认证对接经验。
支持用户名密码认证、临时用户认证、机器捆绑认证、手机短信认证、AD域认证、LDAP认证、U-KEY认证等;可查看登陆状态、登录时间等。
(4)数据防泄密功能设计。
DLP系统要全天候地为用户提供工程系统故障维护、故障设备维修服务及受理用户各类投诉,以保证用户系统能连续、高效、稳定运行。
具有完善的防泄密文件服务管理功能。企业可通过文件集中存储服务器对企业数据进行统一管理,通过对文件的归集和管理,实现对文件流向的管控和事后审计;通过对文件的加密、转换实现对外发文件的保护;通过对文件的备份、打水印等操作实现对核心文件的保护;通过提供的在线查阅、在线编辑功能,实现云端文件保护;通过文件数据接口与三方系统和底层存储设备通信,达到文件存储的适配性以及文件交互的通用性。总之,通过DLP系统文件服务器,可以实现文件的集中存储、统一管理。
拥有完全独立且可配置配额的个人文件夹,以非对称加密进行加密存储日常工作中的各种数据。
客户端作为加密客户端的计算机,其下载的文档自动加密,加密文档在内部授权环境内可正常使用,未经授权无法使用。
系统通过透明加密的模式,实现了电子文件无论是由人工生产还是由应用系统生成的,只要写在磁盘上就是加密存储的;文件生成的参与者被系统授权许可使用这些加密的文件,可以接触操作这些内容;如果未经合法许可将加密文件数据体带走,加密文件内容将不能够被正常打开,文件内容不会因为文件数据体扩散而扩散。
系统采用系统内核层文件过滤驱动实现文件的加密、解密,速度快、安全、稳定,不易损坏文件。采用符合国家标准的国密算法,保证了加密过后的文件的安全性。最大支持1024位的秘钥长度,也大幅度提升了加密文件的安全级别。
2.3 本章小结
本章节通过对国内某运营商进行分析,将其在大数据中心实际运营中所遇到的问题进行列举,并重点针对其中的数据脱敏与数据防泄漏进行详细介绍,将数据脱敏系统与数据防泄漏系统的建设方案与所实现的功能一一讲解。
3 结语
大数据时代已经到来,运营商在意识到其中数据价值重要性的同时,关于随之而来的大数据安全性也应该给予重视。在网络时代,犯罪分子能够更加容易地获取他人的信息及隐私,犯罪手段和方法也在不断增加。如何保护用户的信息安全是大数据时代一个很重要的课题。随着大数据的不断增加,在数据存储安全方面的要求也会越来越高。总之,运营商在运用大数据创造价值的时候也要有效地解决好安全问题。
[参考文献]
[1]赵跃东,王隽峰,曾王平.电信运营商大数据应用系统建设方案研究[J].中国新通信,2015(4):81-82.
[2]冯明丽,陈志彬.基于电信运营商的大数据解决方案分析[J].通信与信息技术,2013(5):35-40.
[3]赵晶.针对运营商的大数据建设方案研究[J].电信工程技术与标准化,2015(3):17-21.
[4]高智衡.运营商勇闯“大数据”机遇大于挑战[J].通信世界,2012(29):33.