徐培德
摘 要:大数据是国家重要的战略资源,其应用前景极其广阔,已渗透进各行各业当中,为社会各领域的发展带来前所未有的机遇。大数据及其应用价值日渐凸显,其带来的数据安全问题已成为影响其应用发展的一个重要因素。如何实现对大数据的安全应用,发挥其重要的战略作用,是当前国内外学者高度关注的重要课题之一。
关键词:大数据;应用;安全
一、大数据的内涵及其应用特点
全球知名咨询公司麦肯锡指出,大数据是时代创新和生产力发展的前沿力量,大数据的数量呈现出不断增长的状态,且不同机构所需的数据集存在差异,这也意味着其本身具备的数据集不同,因而大数据具有不断增长、日益庞大,且具有时效性、以多样化形式存在等新的特质,这是基于数量、速度、种类这三个方面维度的阐述,而对大数据的控制同样也基于三个方面维度。尽管当前学界对大数据的定义各执一词,但对其基本要素的界定却是一致的,即包括数据的生成、采集、存储和处理。结合大数据的内涵,可以将其应用特点概括为几点:其一是大数据的数量极为庞大,且增长速度通常呈现出几何级数的发展态势;其二,大数据种类多样、类别繁多,可分为原始类数据、函数数据、多元型数据等;其三,当前数据的处理速度日益加快,且分析处理的能力日益增强,能更持久、广泛地服务于用户,为用户提供大量有价值的信息参考依据。
二、大数据的应用及安全隐患
最早的大数据应用是从互联网搜索平台中检索海量数据。首先是在商业领域中,通过构建关系型数据库系统,用以收集并存储企业的数据,利于查询、分析及处理。其次,在互联网应用领域中,随着网络在线社交的普及应用,各种结构类型的数据(诸如图片、视频、音频等)不断涌现,互联网的功能日益丰富,非结构化的数据技术日趋成熟。再次,科学研究领域需进行大量数据的收集,并研究数据分析、共享的平台,为大数据的广泛应用创造条件。当前,大数据在诸多领域中得以广泛应用,并形成相应的数据应用模式,表现出极为广阔的发展前景。譬如在商业领域中的应用实现了商业智能,通过对用户资料、产品、服务等用户行为综合分析,挖掘用户的行为习惯和喜好,得出精确、细化的结果,从而有针对性地调整、优化营销策略、产品、服务,制定个性化的用户策略,这在商业营销中的占比越来越高。
三、大数据的安全应用路径探讨
(一)保持数据隐私的安全性
数据隐私主要是敏感的数据信息,包括个人的隐私,也包括未经许可的信息。大数据存在非常多的数据存贮需求,在分布计算的信息传输与数据交换时,对保存点中的使用者隐私数据不被非法泄露与应用是关键问题。但是大数据的数据比传统数据更为复杂,在数据隐私保护方面,传统数据是静态数据,而大数据是动态数据属性,因此对于使用者隐私数据的保护需要做到这几个方面:一是运用替换、置换、混合等对数据加密,增强数据库的安全度;二是做好隐私保护的宣传工作,提高公民网络安全防范意识,养成良好的上网习惯,如上网过程中,电话号码,兴趣爱好、身份证号、家庭住址等个人信息更是不能轻易泄露;三是完善我国网络立法制度。
(二)保证大数据的质量
数据的质量认定是通过数据的精准性、数据可用性、数据真实性、数据的时效性、数据的冗余度、数据的一致性、数据的完整性、数据的易于理解性等方面体现的,影响数据质量的因素包括数据的生成、数据的搜集、数据的输送与保存等方面。当前在大数据质量方面的构建措施有以下几个方面:一是在数据的搜集过程中加强对数据的保护和甄别验证,确保数据的真实性与有效性;二是大数据保存过程中,为了确保数据的可用性、完整性、私密性,还需要加强一定的技术保障措施,如利用校验措施确保数据的完整性,运用访问控制、安全审计作用确保数据的安全性,以及利用冗余方式确保数据的可用性;三是加强对大数据的分析处理来提升数据的质量,可以采用读写操作的权限设置完成安全性管理,采用各种分析办法所形成的结果,来彼此验证,以确保数据分析获得结果的准确无误性和可使用性;四是采用设置访问控制、认证授权等措施对获得的结果进行安全保护;五是强化大数据处理流程的整体管理,如在数据的保存形式中,所选择的方式,需要由所搜集的大数据类型而定。
(三) 完善大数据的安全机制
大数据应用的过程中,网络共享平台开放,给数据的安全带来非常大的风险,计算机病毒、黑客时有入侵,对商业机密和个人隐私等形成了巨大威胁,经常“一个数据造成的损失可能会导致154美元损失,数据攻击者几个小时就可以获得数据,一旦进入数据库,便可以悄无声息地把数据拿走……”过去采取小规模加密的措施已经无法有效地在大数据环境下运用。为了有效确保数据的安全,必须对大数据的安全机制进行完善,根据数据结构与非结构数据的差别,应用不同的数据加密措施。随着大数据应用增强,还要加强对数据的隔离办法的研究,以及构建数据可追溯机制,让数据在高效使用时能够获得具有可用性、可控性和完整性。
(四)发展大数据备份和恢复技术
为了避免数据在输入输出中发生损失等安全问题,大数据备份和恢复技术也是计算数据库技术所探究的一个热门话题。在大数据备份过程中可以采取定期备份与不定期备份的方式。在采取不定期备份时,要构建备份日志的建立工作,目的是当计算机发生故障时,数据可以及时恢复,这样可以杜绝滞后状况出现。在数据备份中,我们还可以采取数据远程复制备份措施,该方法是利用软件数据复制和硬件数据复制技术完成的,当出现人为的误删、修改、软硬件的故障与黑客入侵、病毒植入,以及数据的完整性与可用性遭到破坏时,能够确保本地数据中心和远程备份数据中心的数据一致性。
其次是数据库恢复技术。在数据库恢复的过程中,按照实际的不同需求采取不同程度的恢复措施,如全盘恢复、指定文件恢复和重定向恢复等。全盘恢复是发生火灾等不可抵抗因素时,将所有的信息都恢复到以前的某一个状态,这类恢复会使得一部分数据丢失,所以很少使用。指定文件恢复用于对单一文件的恢复,主要是对已经完成的文件备份,就可以实现单个文件的恢复。重定向恢复是用类似克隆的方式,在新的境况中建立起与当前数据库一样的一个新数据,重定向恢复与定向恢复原理一样,但是更具便捷性和适应性,可以适应不同的需求。
(五) 优化信息安全技術
大数据时代下,以往的信息体系架构已经完全改变,数据仓库已经变成流动的、连接与信息共享的数据池,可使用的信息增多,许多以往不能使用的数据类型也被大家所利用。但是随着数据的信息量增加、处理形式的变化,信息安全的问题也更加突出,有必要针对大数据信息安全保护采取一定的优化措施,例如,针对入侵日志情况,通过分析可以找到里面隐藏的安全漏洞,这样能够实现对更高级别的安全威胁处理。又如,对于计算机病毒和漏洞,可以掌握计算机病毒或者漏洞存在的某些类型特征,以更好地应对这类存在的威胁。
四、结语
大数据在社会经济各个领域中发挥着重大作用,同时,在数据驱动的环境下,一些存储着重要敏感信息的系统更是频繁遭受网络攻击,其安全性直接影响着国家的科技、经济发展等,因而做好对大数据的开发及应用,保障其安全性,是当前亟待解决的重要问题。
参考文献
[1]安晖.大数据竞争前沿动态[J].人民论坛,2013(14).
[2]维克托·迈尔·舍恩伯格,盛杨燕,周涛,译.大数据时代[M].杭州:浙江人民出版社,2013.
[3]周锦昌,孟昭莉.大数据应用的转变:逻辑判断到系统思考[J].通信世界,2013(22).
[4]汪为,张雅雅.大数据环境革新官方统计[J].浙江经济,2013(21).
[5]冯永强,张良,冯怡,等.大数据应用的现状与展望[J].信息化建设,2015(12).