徐培德 郭德成
摘 要:大数据是国家重要的战略资源,其应用前景极其广阔,已渗透进了各行各业当中,为社会各领域的发展带来前所未有的发展机遇。大数据及其应用价值日渐凸显,其带来的数据安全问题已成为影响其应用发展的一个重要因素。如何实现对大数据的安全应用,发挥其重要的战略作用,是当前国内外学者高度关注的重要课题之一。
关键词:大数据;应用;安全
Security Research on Big Data and Its Application
Xu Peide,Guo Decheng
The Party School of Qinghai Provincial committee of CPC,Xining,810001
Abstract:Big data is an important strategic resource of the country. Its application prospect is extremely broad. It has penetrated into all walks of life and brought unprecedented opportunities for development in all fields of society. Big data and its application value are becoming increasingly prominent, and the data security problems it brings have become an important factor affecting its application development. How to realize the safe application of big data and play its important strategic role is one of the important topics that scholars at home and abroad pay attention at present.
Keywords:Big data; Application; Security
隨着社会网络化和信息化的快速发展,各类数据得以迅速增长、膨胀,据统计,全球的数据量每两年便会翻倍增长,且短短两年所产生的数据量几乎与之前多年产生的全部数据量持平。由大数据引发的信息风暴使信息形态实现量变到质变地跨越式发展,当前大数据成为了一种重要的生产要素,表现出极其广阔的应用前景,并渗透进了各行各业当中,为社会各领域的发展带来前所未有的发展机遇。我国在“十三五”十四大战略中提出了“国家大数据战略”,大数据被视为重要的战略资源,甚至上升为国家战略的高度,这对大数据的应用发展起到了宏观的推动和指导作用。大数据及其应用价值日渐凸显,其带来的数据安全问题已成为影响其应用发展的一个重要因素。如何实现对大数据的安全应用,发挥其重要的战略作用,是当前国内外学者高度关注的重要课题之一。
1.大数据的内涵及其应用特点
大数据(big data)又被称为巨量资料,从字面理解,可将其视为具由互联网、移动网络等的发展应用产生的具有较强决策力和流程优化效果的海量、高增长率及多样化的信息资产。 但大数据的内涵远远超出了其字面上的定义,而是呈现出了更为深刻、抽象的概念。全球知名咨询公司麦肯锡指出大数据是时代创新和生产力发展的前沿力量,是有别于传统数据库范畴的收集、存储、管理和分析数据信息的新型方式,该公司认为,大数据的数量呈现出不断增长的状态,且不同机构所需的数据集存在着差异,这也意味着其本身具备的数据集不同,因而大数据具有不断增长、日益庞大,且具有时效性,以多样化形式存在等新的特质,这是基于数量、速度、种类这三个方面维度的阐述,而对大数据的控制同样也基于三个方面维度。尽管当前学界对大数据的定义各执一词,但对其基本要素的界定却是一致的,即包括数据的生成、采集、存储和处理。大数据极大地改变了信息的形态,呈现出非常广阔的应用前景和广泛的应用范围,能用以推测趋势,或是预测社会现象、开展个性化预测,剔除个体数据,辨识真相,为用户提供决策、营销等方面的依据等,这为各行各业的发展创造良好的机遇。结合大数据的内涵,可以将其应用特点概括为几点:其一是大数据的数量极为庞大,且增长速度通常呈现出几何级数的发展事态;其二,大数据种类多样、类别繁多,可分为原始类数据、函数数据、多元型数据等。其三,当前数据的处理速度日益加快,且处理分析的能力日益增强,能更持久、广泛地服务于用户,为用户提供大量有价值的信息参考依据。
2.大数据的应用及安全隐患
大数据的应用历经了诸多演化过程,从最开始的不成熟逐步走向成熟,最终得以广泛地应用在社会各个领域当中,被广大用户所熟悉和使用。最早的大数据应用是从互联网搜索平台中检索海量数据,且经由互联网搜索平台的推动,大数据的应用模式也逐渐增多。首先是在商业领域中,商业网站通过构建关系型数据库系统,用以收集并存储企业的数据,利于查询及处理。随着网络和移动通讯的普及,互联网用户越来越多,商业网站的用户信息随之增多,可通过网站抓取数据日志和用户行为,这为商业企业深入地分析用户、施行商业决策提供了基本数据。其次,互联网应用领域中,网络在线社交的普及应用,各种结构类型的数据(诸如图片、视频等)不断涌现,互联网的功能日益丰富,非结构化的数据技术日趋成熟。再次,科学研究领域需进行大量数据的收集,并研究数据分析、共享的平台,为大数据的广泛应用创造条件。
俗话说:“任何事物总是利弊交织,像一把双刃剑”,大数据及其应用同样如此。大数据在社会经济各个领域中发挥作用的同时,其安全隐患也较为突出,国内外发生数据泄露的事件屡见不鲜,用户的个人隐私被泄密等现象不一而足,隐私受到极大的挑战,随着互联网的深入普及,大量的用户信息,甚至是姓名、电话、地址等敏感数据被集中于不同的应用服务提供商系统中,信息的暴露点越来越多,发生数据泄露的风险也随着增多,而一旦发生大量数据的集中及信息泄露,其后果将不堪设想。尤其是一些关键领域的网络及系统极易成为网络竞争攻击的重要目标,尤其是在数据驱动的环境下,一些存储着重要敏感信息的系统更是遭受频繁的网络工具,极大地影响了大数据应用的安全性。大数据是国家重要的战略资源,其安全应用直接影响着国家的科技、经济发展,因而做好对大数据的开发及应用,保障其安全性,是当前亟待解决的重要问题。
3.大数据的安全应用路径探讨
当前,大数据数据安全问题已经成为国内外专家学者非常关注的事情。大数据环境下,数据一方面成为人们获取各类信息的关键,越来越的企事业单位和个人更多的依赖大数据带来的价值,但是另一方面数据的安全问题也不断暴露,由于大数据中有大量具有商用价值的数据,这些数据必然就成为众多黑客所觊觎的目标,同时,因为数据规模大,种类繁多,结构越来越复杂,对数据的成本变得非常高,怎么样确保数据的安全转移,以及控制数据不发生冗余现象,都是我们所必须要及时应对的棘手问题。
3.1保持数据隐私的安全性。
大数据中,数据采集和信息挖掘时数据隐私的安全性是一个重要话题,数据信息量的超大量增多,数据处理的陆续开放,数据获得渠道的变多,这会加急数据隐私被泄露,给数据隐私的安全性造成非常大的挑战。数据隐私主要是敏感的数据信息,包括个人的隐私,也包括没经过许可的信息。个人隐私主要指使用者个人的兴趣爱好,家庭关系等信息在毫无征兆的状况下被获取,同时甚至被大数据分析出来的信息也毫不知情。其次是没经过许可的信息,也就是通过大数据的分析获取的信息,没有得到使用者的许可,就随意的将信息进行传输与应用,在传输应用过程中存在信息的泄露问题。大数据存在非常多的数据存贮需求,在分布计算的信息传输与数据交换时,对保存点中的使用者隐私数据不被非法泄露与应用是关键问题。但是大数据的数据比传统数据更为复杂,在数据隐私保护方面,传统数据是静态数据,而大数据是动态数据属性,因此对于使用者隐私数据的保护需要做到这几个方面:一是替换、混合等数据加密,增强数据库的安全度,二是做好隐私保护的宣传工作,提高网络安全防范意识,养成良好的上网习惯,如上网过程中,电话号码,身份证号,家庭住址等个人信息更是不能轻易泄露。三是完善我国网络立法制度。
3.2保证大数据的质量
企业和个人对大数据的获取最终目的是得到数据的价值。数据的价值是通过大数据分析处理后的最终结果,并在企业应用过程与使用者感知中衡量大数据分析与预测结果的价值。大数据的价值体现不仅是海量的数据,来源的多样性,快捷的速度,还有数据中所体现的质量,质量的高低成为影响大数据健康发展的一个重要因素,低劣的质量数据会造成網络资源的浪费,同时也会让使用者不能被有效使用。数据的质量认定是通过数据的精准性、数据可用性、数据真实性、数据的时效性、数据的冗余度、数据的一致性、数据的完整性、等方面体现,影响数据质量的因素包括数据的生成、数据的搜集、数据的输送与保存等方面有关。当前,在数据的质量提升方面,有关的专家学者是通过消除数据的冗余问题来提升质量,但是这只是一个方面,另外还要考虑数据的自我修复与自我检测的能力。通过对上面分析,在大数据质量方面的构建措施,可以采取以下几个方面:一是在数据的搜集过程中加强对数据的保护和甄别验证,确保数据的真实与有效性。二是大数据保存过程中,为了确保数据的可用性、完整性、私密性。还需要加强一定的技术保障措施,如利用校验措施确保数据的完整性,以及利用冗余方式确保数据的可用性。三是加强大数据的分析处理来提升数据的质量,可以采用读写操作的权限设置完成安全性管理,采用各种分析办法所形成的结果,来彼此验证,以确保数据分析获得结果的准确无误性和可使用性。四是采用设置访问控制、认证授权等措施确保获得的结果进行安全保护。五是强化大数据处理流程的整体管理,如在数据的保存形式中,所选择的方式,需要考虑所搜集的大数据类型而定。
3.3 完善大数据的安全机制
大数据种类的越来越丰富, 以及大数据应用的过程中,网络共享平台深入开放,给数据的安全带来非常大的风险,随着计算机病毒、黑客时有入侵,对商业机密和个人隐私等形成了巨大威胁,通常“一个数据造成的损失可能会导致154美元损失,数据攻击者几个小时就可以获得数据,一旦进入数据库,便可以悄无声息地把数据拿走……”过去采取小规模加密措施已经无法有效地在大数据环境下运用。为了有效确保数据的安全,必须对大数据的安全机制进行完善,应根据数据结构与非结构数据的差别,数据加密措施应有所不同。随着大数据应用增强,还要提升对数据的隔离办法增强研究,以及构建数据可追溯机制,让数据在高效使用时能够获得具有可用性和完整性的保持。
3.4发展大数据备份和恢复技术
人们利用计算机进行学习与工作,会产生大量的数据与信息,计算机数据库就成为容纳这些数据与信息的重要工具。为了避免数据在输入输出中发生损失等安全问题,大数据备份和恢复技术也是计算数据库技术所面对的一个热门话题。大数据备份主要是将现有数据复制拷贝出同样一份,作为后备副本。在大数据备份过程中可以采取定期备份与不定期备份,定期备份是在一定的时间周期中实施备份,时间可以设定为一天,一周,一月进行备份。不定期备份没有规定一定时间,随机性强,只要计算机数据库在运行,对重要文件随时进行备份。在采取不定期备份时,要构建备份日志的建立工作,目的是当计算机发生故障时,数据可以及时恢复,这样可以杜绝滞后状况出现。在数据备份中,我们还可以采取数据远程复制备份措施,该方法是利用软件数据复制和硬件数据复制技术完成,当出现人为的误删,修改,软硬件的故障与黑客入侵,病毒植入使得数据的完整性与可用性遭到破坏后,能够确保本地数据中心和远程备份数据中心的数据一致性。
其次是数据库恢复技术。当数据库发生故障后,使得前后数据存在差异时,把数据恢复到正常的情况,该技术的完成本质就是冗余,也就是数据库是不是可以在冗余空间中完整地保存数据。在数据库恢复的过程中,按照实际的不同需求采取不同程度的恢复措施,如全盘恢复、指定文件恢复和重定向恢复等。全盘恢复是发生火灾等不可抵抗因素时,将所有的信息都恢复到以前的某一个状态,这类恢复会使得一定程度的数据丢失,所以很少使用。指定文件恢复是将被用作单一文件的恢复,主要是对已经完成的文件备份,就可以实现单个文件的恢复。重定向恢复类似克隆的方式,是在新的境况中建立起与当前数据库一样的一个新数据,重定向恢复与定向恢复原理一样,但是具有对文件恢复的便捷性和适应性,可以适应不同的需求。
3.5 优化信息安全技术
大数据时代下,以往的信息体系架构已经完全改变,数据仓库已经变成流动的、连接与信息共享的数据池,能够让人们在使用时变得更全,尤其是以往不能使用的多种数据类型也被大家所利用。但是在数据的信息量增加,处理形式的变化,信息安全的问题也更加突出,有必要针对大数据信息安全保护采取一定的优化措施,例如,针对入侵日志情况,通过分析可以找到里面隐藏的安全漏洞,这样能够实现对更高级别的安全威胁处理。又如,针对计算机病毒和漏洞认识,可以对计算机病毒或者漏洞存在的某些类型特征掌握,以更好的应对这存在的威胁。
参考文献:
[1]安晖.大数据竞争前沿动态[J].人民论坛,2013年,(15):14-16页
[2]周锦昌,孟昭莉.大数据应用的转变.逻辑判断到系统思考[J],通信世界,2013年,(22):29页
[3]冯永强.张良.冯怡等.大数据应用的现状与展望[J].信息化建设,2015年,(12):292页
[4]李烨. 云计算安全防护技术探索与研究[J]. 数字技术与应用,2017年,(06) :219-223页
[5]何亨.黄伟.基于SDS架构的多级DDoS防护机制[J].计算机工程与应用, 2016年,(1):P81-88页
[6]维克托·迈尔-舍恩伯格.盛杨燕.周涛 译.大数据时代[M].杭州:浙江人民出版社,2013 :267页