甘建哲
现如今,在目前信息时代化的背景之下,大数据的运用已经发展成为主流趋势,且现在已经上升成为国家战略,在现在和后期的一段时间之内,要充分的将自身的作用充分的发挥出来。所在,针对大数据治理过程之中发生的各类安全问题予以重视起来,逐步的加大数据治理过程之中的安全可靠性,确保大数据治理可以更好的服务于大众。鉴于此,本文主要分析大数据治理中的安全问题。
【关键词】大数据 治理 安全
1 大数据的定义与特征
美国的麦肯锡在2011年5月,首先提出了大数据,并将其定义为大小已经超越了典型数据库软件的采集、储存、管理以及分析能力的数据集。从技术与数据的角度阿里进行分析,基本上可以将大数据划分成两个方面:大数据平台以及大数据生命周期。其中,大数据平台可以很好的为大数据生命周期之中每一个环节需要的各项基础设施、存储处理平台与数据分析算法等等,这同时也是大数据框架之中关键技术;大数据生命周期主要涵盖收集、存储、使用、分发以及删除阶段。数据利用所收集到并及进入到大数据平台实施必要的储存,并积极的碗蕨出来其自身的优势,利用传递分发、数据共享以及结果分析,再到之后的删除不想关的数据。所以,大数据的生命周期,主要就是数据之间的有效转换。
2 大数据治理存在的安全问题分析
2.1 数据传输过程产生的数据安全问题
目前,在大数据时代背景下,数据在网络之中实现有效的传输,另外,传输的方式也十分的多样化,值得注意的就是也会加大信息传输过程之中的安全可靠性。当然在目前所处大数据时代的背景下,大数据之中的所具备的潜在价值也会更多,那么先前物理区域之中隔离的方法,已经无法很好的确保信息在具体传输的过程之中的安全可靠性,目前严重威胁到大数据时代之中数据信息安全性主要有两个方面,分别是电磁泄密以及窃听信息。
2.2 数据处理过程中产生的数据安全问题
在部分大数据平台之上,各个服务商均将先前较为复杂的物理设备配置实施必要的改善,将诸多的虚拟技术进行一一部署,针对各项基础设施的虚拟性之上,但是会导致数据在安全防护以及处理的过程之中出现部分隐患风险。像是在针对一部分数量加大的数据而言,其在实施信息管理的过程之中,来实施必要的身份认证和访问控制权限,确保这些数据信息仅仅可以由具备相应权限的人员来获取,这样一来,就可以很好的预防一些并不具备相应权限的人员访问,甚至是实施数据之前的各项操作。但是基础社会的脆弱性和大数据平台的虚拟性,数据在处理的过程之中会受到窃取和随意篡改、非法攻击以及伪装身份侵入等等违法犯罪的行为,导致无法有效的保障数据自身的安全可靠性。
2.3 用户对个人数据信息失去有效控制
在大数据时代的背景,其自身所收集和整合、个人直接性产生的各项有效的价值信息,这样一来,对于分析数据的过程而言十分的有利,但是在企业以及政府运用这部分大数据的时候,以个人的名义很难有效的获取到管控大数据的资格。比如在部分大型电子商务网站之中,用户根本就无法了解到网站收集到的個人信息具体运用在哪里,也无法从根本之上来确保自身个人信息的安全性,更别说是自己管理控制个人信息数据。
3 大数据治理中安全问题的应对建议
3.1 完善相关法律法规
2017年5月12日,我们国家诸多高校受到了网络勒索病毒攻击的现象。调查显示,针对受到攻击电脑之中,各类文档资料均被黑客锁定,相应在弹出界面之中显示,必须要支付价值约合人民币2000元的300美元才可以。从去年的“徐玉玉事件”到今年的“比特币勒索病毒事件”,这些充分的表面,在目前大数据时代的形势下,个人和社会数据的安全出现了安全风险方面的情况,因此我们国家务必要运用行之有效的措施来确保各项数据信息的安全可靠性。
3.2 建立政府大数据服务平台,维护政府权威与公信度
这和国际之上所实施数据信息平台建设基本保持同步,要积极地构建官方数据服务平台,推动政府公共数据查询服务各项工作的公平公正。在保护政府官方网站、个人信息基础、商业机密以及国家机密实施必要保护为基本,将在线政府大数据信息平台构建起来,逐步的向社会公众公开其中非泄密的相关数据。另外,值得注意的就是要在公共服务场来积极的进行数据查询服务基础设施的建设工作,可以从根本之上来进一步的强化数据的有效性以及可以获取性。
3.3 安全存储技术
这部分数据在经过采集、汇聚与之后的整合处理之后才可以入库,依据数据的类型与数据运用的途径,数据最终进入到管理库、配置库、缓存库、历史库、关联库、专题库以及基础库等等。在这之中,管理库、配置库、关联库以及基础库运用的是MPP数据库,确保各项数据更新的及时性与频率,另外还得要加大数据访问的效率与质量;历史库与缓存库则对于实时性的要求较低,专题可以运用的是Hbase以及NoSql数据库来实现储存的目的;值得注意的就是,还得要针对图片数据或者是流数据来主要运用的是Storm或Spark等等,进而实现图计算的最终目的。
从最终实现的角度来进行分析,缓存库可以运用性能高一些的Oracle数据库服务器来构成,其主要是被应用在整合数据的时候数据缓存与ETL处理中间库;基础库主要涵盖全量数据与流水数据更新的两种形式,再全量数据与流水数据一起双向整合在MPP与Hbase之中,其可以在最大限度之上来实现实时、全方位的查询的需求以及离线数据分析目的;问题库以及历史库最终整合到Hbase,专题库主要依据的实际大数据应用的实际需求来建立起来,那么随即在Hbase之中来及时的完成专题分析数据与整合模型,之后再将其同步到MPP之中。
总之,目前,在大数据时代背景下,数据治理可以很好的将数据信息潜在的价值发掘处理,其可以有效的为各项决策提供一个坚实的基础。大数据治理,实质上值得就是将这些数据来作为一种十分关键的资产,针对数据信息实施搜集、开发、整合与运用,使其在经过合理化的分析与处理之后,进而很好的决策来进行服务。因此,本文的研究也就显得十分的有意义。
参考文献
[1]常春光,王雪龙,张瑜.大数据时代下城镇安全治理问题研究[J].辽宁经济,2017(07):28-29.
[2]周学静.大数据时代下的网络问政研究[D].河北师范大学,2016.
作者单位
广州市疾病预防控制中心 广东省广州市 510440