大数据基础平台安全要求研究与分析

2018-12-07 11:54马卓元杨向东
网络空间安全 2018年5期
关键词:大数据平台大数据

马卓元 杨向东

摘 要:数据日益成为人们的重要资产之一,大数据时代已经来临。然而,大数据面临的安全威胁日益严重。文章分析了大数据基础平台所面临的安全风险,并为大数据基础平台安全防護提出了相关要求。

关键词:大数据;大数据平台;安全要求

中图分类号:TP309;TP311.13 文献标识码:A

1 引言

由于风险监控与防范机制不够健全、开源生态环境的安全缺陷,大数据基础平台面临各类安全风险,其安全问题已成为制约大数据基础平台建设部署及业务发展的重要阻碍。然而,目前现有研究主要聚集在安全体系架构、隐私保护、安全管理、服务能力要求方面,仍缺乏对大数据基础平台的通用安全技术要求的研究,无法实现对大数据基础平台安全性的统一评价。因此,本文对大数据基础平台安全要求进行了研究分析。

2 大数据基础平台安全风险

2.1数据采集安全风险

数据采集环节是大数据基础平台的入口,其安全性直接关系到整个大数据基础平台数据入口的安全。数据采集环节面临的安全风险包括五个方面。

(1)采集系统未对实施采集的接入终端开展身份认证,造成终端非法接入进行数据采集。

(2)采集人员较多且权限和角色分配不明确,造成非法采集或数据泄露。

(3)传输加密机制不完善,造成数据被恶意截获。

(4)采集过程中临时数据存储到不可控区域,引起数据泄露。

(5)缺乏对采集账号、采集人员、采集行为、采集操作等的审计手段[1]等。

2.2数据存储安全风险

采集到的数据需要在大数据基础平台进行存储后,才能进行计算处理。数据存储环节面临的安全风险包括四个方面。

(1)存储系统自身的安全配置无法满足基本安全配置要求,为攻击者所利用,造成数据非授权访问。

(2)存储系统未安装防病毒软件或病毒库未及时更新,造成病毒软件入侵,导致敏感数据泄露。

(3)传统数据库、HDFS以及MPP数据仓库等多种存储系统共存,一旦账号权限管理不当,有可能造成同一账号在不同存储系统间的数据越权访问。

(4)不完善的容灾备份机制会使得发生意外情况时,数据无法及时恢复,从而影响业务的正常开展等。

2.3 接口传输安全风险

大数据基础平台接口包括内部接口和外部接口,内部接口主要是平台内部各组件之间的接口,外部接口包括数据源到平台设施之间的接口、平台设施到数据消费之间的接口。接口传输环节面临的安全风险包括三个方面。

(1)数据源头与大数据基础平台之间、大数据基础平台与上层应用之间通过不安全的通道进行数据传输时,有可能出现中间人攻击等安全隐患。

(2)大数据基础平台内部授权、认证、访问控制等功能的不完善,可能会造成平台内部数据泄露。

(3)大数据基础平台存在多种途径供上层应用访问,一旦权限控制不当,容易出现非授权用户越权访问或者合法用户对数据的非授权访问等。

2.4 大数据组件安全风险

大数据基础平台承载着众多组件,如Hive、Hbase、Impala、Solr、Spark等,完成大数据的存储、处理工作,是大数据功能的实现基础。大数据基础平台组件存在四项安全威胁。

(1)组件间存在不兼容问题,造成数据存储、处理过程中发生错误,丢失、损坏数据或影响上层业务的正常进行。

(2)组件的漏洞未及时更新版本或打补丁。

(3)外部机器仿冒集群内服务器或假冒合法客户端与其他机器进行通信,造成数据泄露。

(4)隔离或控制措施不当,多个租户之间的业务可能会相互影响,甚至有恶意用户利用漏洞偷窥其他租户数据等。

3 大数据基础平台安全防护要求

3.1 基础设施安全要求

(1)操作系统:定期评估,对补丁进行及时更新;采用严格身份鉴别技术用于主机系统用户的身份鉴别,限制匿名用户的访问权限;授予不同用户各自所需的最小权限等。

(2)数据库:配置连接数据库的白名单列表;严格控制数据库操作权限;完整的数据库审计方案及实施;定期做好数据库的备份容灾等。

(3)中间件:及时更新系统补丁;异常界面替换或重新设定,防止系统信息泄漏等。

(4)虚拟机:禁用多余或危险的系统后台进程和服务;根据虚拟化平台的具体实现,采用无代理或有代理的方式部署;实施严格的访问控制,防止虚拟机之间的非法访问等。

3.2 数据存储安全要求

(1)访问控制:用Kerberos认证、细粒度授权等做好用户或应用程序的访问控制;纳入多人操作的金库管控模式,使得单人无法拥有重要数据的完整操作权限等。

(2)加密存储:根据数据机密不同级别实现HDFS、HIVE结构化和半结构化数据透明加密;对部分安全性相关配置数据进行加密存储,防止篡改;根据数据密级采用不同的安全存储机制等。

(3)备份和恢复安全:支持增量或全量备份;支持备份主数据或备份元数据;支持手动触发备份或按周期或预约执行;可由任意备份点进行恢复等。

(4)残留与销毁:通过剩余信息保护的手段来进行数据删除;严格规范各类数据和文件的存储生命周期;定期对临时数据及文件进行清理等。

3.3 接口传输安全要求

(1)外部接口:对采集终端和采集人员开展接入鉴权,并对采集行为进行监控;限制采集系统的IP地址、端口号等;对采集数据的传输、存储及分类分级实施严格的安全要求;严格限制采集过程中临时数据存储区域,不得任意修改存储区域地址;对采集到的数据按照数据的重要性及敏感度进行分类分级处理;对采集行为进行日志记录,并对异常采集行为及时告警;对所有接入的用户或业务进行身份接入认证和权限控制;定期对大数据基础平台对外接口进行渗透测试和漏洞评估;针对大数据执行逻辑代码进行严格的代码安全审查;对应用的非授权访问行为进行监测与告警等。

(2)内部接口:接入平台的应用需要经过身份认证;系统对接口的调用需要经过鉴权,并记入日志,进行定期审计;关键信息的传输应支持安全信道传输或加密传输;检查输入数据的有效性;对出口数据进行敏感性检查和脱敏处理;限制用户对接口的访问次数;限制接口的最大连接量;实时监控大数据基础平台与系统之间接口的流量,对流量异常的情况进行告警与控制等。

3.4 平台管理安全要求

(1)管理平台:严格控制所有存储资源的访问权限;仅安装需要的组件和应用程序;筛查恶意代码和相关漏洞;集群服务器节点之间开启认证机制;资源以租户为单位进行计划和分配等。

(2)组件及补丁:各个组件可配置自己的访问控制策略;根据用户的选择为集群中的机器配置相应的补丁;提供完善的补丁管理、分发、升级功能等。

(3)安全事件:支持告警响应行为的定义和设置告警响应的方式,能够开启和关闭告警响应;监控所有软硬件告警;设置告警触发的条件阈值等。

(4)安全态势感知:利用大数据分析技术建设集中化安全管理平台,形成整体性安全风险关联分析及态势感知能力等。

(5)容灾备份:为关键数据、关键应用建立异地备份;建立系统备份和处理机制等。

(6)日志审计:对访问层、应用层、数据存储层、数据获取层、元数据管理和数据质量监控等日志记录进行审计;实现日志的自动分析、异常检测和基于风控模型的风险报警等。

4 结束语

本文研究了大数据基础平台面临的安全风险,并在基础设施、数据存储、接口传输、平台管理等方面提出了统一的安全要求,对加强大数据基础平台安全技术防护,支撑上层大数据业务的安全健康有序发展具有重要意义。

参考文献

[1] 于乐,冯运波,江为强,任兰芳.大数据平台安全防护研究[J].电信工程技术与标准化,2017,30(11),6-11.

猜你喜欢
大数据平台大数据
Hadoop性能测试自动化研究
基于大数据的智能停车场管理系统设计
基于大数据分析的智慧仓储运营支撑平台设计
袜业行业大数据平台的应用研究
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索