广东省工伤康复医院 郭泽炎
大数据环境下的数据安全研究
广东省工伤康复医院 郭泽炎
随着现代互联网技术不断发展,全球数据几何增长,开启了大数据时代。大数据环境具有数据量庞大、类型多元化、运算高效等特征,蕴含着巨大的价值。但受网络开放性等因素影响,数据安全问题面临较为严峻的挑战。数据安全是实现大数据价值,促进大数据健康发展的基础保障。笔者从大数据环境特点及面临的挑战入手,就数据安全发展对策,发表几点看法。
大数据环境;数据安全;数据挖掘;云计算
大数据环境是指数据信息规模极为庞大的一种环境,具有数据量庞大、数据类型多样化等特征。大数据在实际运行中会产生大量具有价值的信息,但由于网络开放性等因素影响,大数据环境数据安全面临着较为严峻的挑战。如何提高数据安全性,实现大数据价值,促进大数据环境健康发展,成为现代社会关注的重点课题。
一般情况下,大数据是指一种数据规模庞大且种类多元化的非结构化数据。随着大数据不断发展及对其的研究不断深入,对于大数据的定义不在局限于数据本身,而是扩展至数据存储平台、采集工具、分析系统等要素,其基本特征如下:
(一)数据量庞大
数据量庞大是大数据环境的最基本特点,信息时代各种移动设备、网络社会、智能终端等不间断地产生的数据,数据总量呈几何增长,为大数据环境奠定了庞大的数据基础。
(二)类型多元化
数据几何成长不仅导致数据总量不断提升,还促进了数据种类多元化的进一步发展。传统数据以二维结构为主,随着信息技术发展,音频、图片、视频、GPS、RFID等产生种类丰富的非结构化数据,且每年增长量庞大。
(三)高效运算特征分析
以云计算技术为基础构建的Hadoop大数据框架,通过集群的存储和高速运算,实现了一种分布式的运行系统,从而提高了访问数据的流畅性和应用程序的适用性。此外,随着语义引擎、数据挖掘等技术的不断发展,无论是数据提取或是数据深度分析效率,均得到了极大的提升。
(四)数据价值特征分析
大数据本身蕴含丰富的数据信息,在其运行过程中,会产生大量具有价值的信息。随着社会发展,数据信息资源的效用逐渐受到人们的重视,尤其在商业领域,信息资源已经成为企业良性发展的重要保障。但受大数据数据量庞大特征影响,其数据价值具有低密度特性,用户需对数据进行深度挖掘,才能获取真正有用的数据信息。
大数据环境背景下,互动性社交网络、大容量数字化存储、以及智能终端的普及无时无刻不在产生数据信息,目前信息技术已经渗透至各个领域,并在不同的领域发挥着积极的作用,数据提取分析技术和快速处理技术的发展,提高了数据信息的有效利用率,使得有价值的数据可以更好地被用户使用。但大数据环境也面临着较为严峻的安全挑战,具体内容如下;
(一)网络化社会安全挑战分析
大数据环境下,网络化社会的形成为不同领域的数据互通和资源共享提供了渠道和平台。以云计算技术为基础构建的网络化社会,创造了一种相对开放的数据环境,使得不同地区的数据资源可以动态配置、快速整合,从而实现了数据集合的有效共享。并且,数据流和网络访问的发展,为数据个性化服务和快速弹性推送奠定了相应的基础。但网络环境的开放性特征,使其已成为黑客的攻击目标,且受数据相互关联影响,黑客可以通过较低的成本获得巨大的收益。
(二)非结构化数据发展带来的挑战分析
在未形成大数据环境前,数据存储主要分为文件服务器和关系型数据库两种形式。大数据环境下,给结构化数据数量不断增多,数据类型愈发复杂。虽然NoSQL数据存储具有良好的可用性和可扩展性,为大数据的存储提供了解决路径,但NoSQL数据存储客观存在以下几点问题:(1)隐私管理及访问控制严格。目前NoSQL不能直接使用SQL模式,且NoSQL模式尚未发展成熟;(2)由于NoSQL数据存储使用新代码,虽然有传统数据存储经验可以借鉴,但仍存在较多的漏洞;(3)由于NoSQL软件内置安全缺失,在身份验证、输入验证、以及授权过程中存在大量的安全问题。
(三)技术发展带来的挑战分析
新一代信息技术的发展,极大地提高了数据的分析、处理能力,大数据的价值受到越来越广泛的关注。但由于大数据环境存在较大的安全漏洞,随着大数据价值的提升,也相应吸引了越来越多的黑客对其进行非法攻击。
随着大数据价值受到越来越广泛的关注,促进了数据安全技术的进一步发展。通过科学、系统的数据安全保护手段,就可以避免网络异常行为、黑客入侵、网络攻击等问题。
(一)大数据存储安全对策分析
现阶段,大数据存储主要利用虚拟化海量存储技术完成,全面覆盖数据隔离、传输、以及恢复等环节。提高大数据存储安全的对策,主要有以下几点:(1)数据加密。数据加密可有效提高数据存储安全性,在大数据安全服务相关设计中,可根据数据安全存储实际需求将大数据存储在任意存储空间内容,利用SSL加密,即可完成对大数据的保护;(2)加密数据和分离密钥。用户可利用加密将数据保管和使用区分开,并将密钥和保护目标数据互相隔离,以提高数据存数安全性;(3)使用过滤器监控数据,如数据离开用户网络,则自动断开数据传输;四,数据备份。针对重要性数据,用户应做好数据备份工作。
(二)大数据应用安全对策分析
大数据应用工具、技术飞速发展背景下,大数据应用安全对策,主要包含以下几点内容:(1)防治高级持续性威胁(Advanced Persistent Threat,APT)攻击。在大数据处理技术基础上,针对APT潜伏期长、攻击隐蔽、攻击路径不确定等基本特征,设计相应的流量审计方案,增强数据应用实施检测和事后回溯两方面能力,及时发现带有病毒的应用程序;(2)用户访问控制。大数据在进行跨平台的传输过程中会产生一定的安全风险,应依据用户的实际需求和数据密级程度,设定不同等级的用户权限,进行科学的权限控制;(3)数据实时分析引擎技术。该技术全面融合了机器学习、云计算、语义分析等多个领域知识,可实现对大数据应用的实施监控,从而第一时间发现非法操作、黑客攻击等不安全行为,并相应发出警报。
(三)大数据管理安全对策分析
数据管理在大数据安全中占据重要地位,其安全管理对策主要包括以下几点:(1)规范建设。规范、标准的运行机制和制度,对于大数据建设具有重要意义;(2)以数据为中心建立相应的安全系统。
综上所述,大数据具有数据量庞大、种类多元化、高效运算等特点,蕴含着大量有价值的数据信息。但由于网络环境开放性等因素影响,大数据面临着较大的数据安全挑战。针对这种现象,应从大数据存储、应用以及管理三方面入手,采取相应的安全措施,全面提升数据安全,以更好地实现大数据价值,促进大数据健康发展。
[1]曹珍富,董晓蕾,周俊等.大数据安全与隐私保护研究进展[J].计算机研究与发展,2016(10).
[2]吕欣,韩晓露.大数据安全和隐私保护技术架构研究[J].信息安全研究,2016(03).
[3]吕欣,韩晓露.健全大数据安全保障 体系研究[J].信息安全研究,2015(3).
[4]叶润国,胡影,韩晓露等.大数据安全标准化研究进展[J].信息安全研究,2016(05).
[5]张小松,杨浩淼,汪小芬等.面向大数据安全的密码技术研究[J].信息安全研究,2015(03).