王 媛
(中国联合网络通信有限公司安顺市分公司,安顺 561000)
现阶段,各个领域中开始大量运用数据,在信息技术领域中,大数据是继云计算、互联网、物联网之后又一显著标志。因其数据系统的复杂性和庞大性,加大了人们深入分析和研究数据信息的难度。对于这种复杂的数据系统,处理和管理起来更需要全面的安全以及隐私保护,然而现阶段大数据的信息安全问题和隐私问题越来越突出,整个信息技术行业都应该引起高度的重视,同时积极寻求有效的解决方案。
大数据指规模庞大而又复杂的数据,而且必须用新型的处理模式进行处理,通常也被称为巨量数据集合。高速性、多样性记忆大规模性是大数据的主要特点[1]。大数据主要由人、物、机中得来:由人得来的数据主要是指人们在对互联网的使用过程中留下的信息数据,比如文字、图像以及视频等。由物得来的数据主要是指通过各类设备采集而来的数据;由机得来的数据则指的是通过计算机系统产生的数据。目前在各个领域中,大数据的运用颇为广泛,其主要意义不单是掌握大量数据,更重要的是如何处理大量复杂的信息,让大数据技术产生的效益实现最大化。
大数据比传统的数据库拥有更多的信息量,分析和查询的难度也相对较大。大数据具有规模大、多样性、高速性、较大价值性和双面性等特点。第一是规模大,大数据的信息量非常巨大,在2015年就高达了8ZB;第二是多样性,大数据中的数据信息类型丰富多样,其中包含视频、图像、图片、文字以及音频等;第三是高速性,在新形势下,人们都希望能快速的获取信息,而大数据从大量信息中提取到人们想找的信息只需要一秒钟;第四是价值性,只要人们对大数据进行合理应用,将会收获到许多有价值的回报;第五是双面性,大数据的应用有利也有弊,不仅可以获得极大的效益,同时又有诸多不良影响和弊端存在。
主要分为结构化和非结构化两种数据类型,对结构化数据进行保护时应该对用户的数据发布状态以及次数作出明确规定,这也是数据保护的重要前提,也就是一次静态发布[2]。在此形势下,对标识符进行属性分组,将相同属性分一组,以便于对匿名信息集中处理,其中有元祖泛化和抑制处理两种分组处理方式。将匿名模式设置为K 匿名,这种匿名处理方式具有一定的普适性,但如果单一标识符属性较为特殊,就不能将这种模式的作用充分发挥出来。站在理论的角度来看,这种数据匿名技术具有可行性,但在实际情况中,却不能有效满足前提条件,不能一次性完成用户数据发布。进而为攻击者提供了可乘之机,让其可以从不同发布点对收集整理各用户的信息。非结构化数据指的是通过边和点组成的图结构数据,然而攻击者的切入点正是点和边的属性,因此应该严格把控点和边是安全和保护技术。在进行用户标识匿名以及用户信息点属性匿名处理过程中,运用措施主要让其毫无可见性,针对边属性的匿名处理时,应该将传递信息的双方用户间的连接关系设置成仅对方可见,这样攻击者就看不见隐藏的信息了。
水印技术也就是将可标识信息基于不对数据使用和数据信息产生影响上,用一些很难发现的方式在数据载体中嵌入,这种方法在多媒体数据版权保护中较为常见。在具体实施的过程中,可以借助集合的方式在某一固定的属性中嵌入数据,这种方式可以有效防止数据攻击者破坏水印。此外,可借助在水印中录入数据库指纹,将信息的所有者和被分发的对象识别出来,这对在分布式环境下追踪泄密者极为有利。除此之外,可以运用独立分析技术,这样能够将无密钥水印验证顺利实现,使数据的安全性得到保证。同时,还可以运用数据溯源技术,因为数据的来源多种多样,因此应把数据的来源和其计算、传播的过程记录好,确保之后的决策和挖掘有据可循。
就结构化数据而言,想要对用户数据隐私和和安全进行彻底保护,其中关键之处是对数据的匿名保护,这种技术应该被不断的挖掘和完善。目前数据发布匿名保护技术的基础理论有很多,设动环境对于数据的发布应该是静态地、一次性的。比如在对标识符分组的过程中可以利用抑制处理以及元祖泛化,在匿名处理有共同属性的集合时运用K 匿名模式,然而这样很容易遗漏某种特殊属性。但在一般情况下,现实有较强的变化性,一般数据都是多次、连续的发布。大数据的环境非常复杂,对于实现数据发布的匿名保护技术有较大的难度。攻击者可以根据发布点的不同以及渠道的不同获取各种信息,借此助力,确定好其中一个用户的信息。信息科技的研究人员对于这一点还应该花费更多的精力对其更深入的研究。
以角色为基础的访问控制是现阶段使用最为普遍的访问控制模型,角色访问控制最初运用的是“由上而下”的模式,但是现阶段人们发现在这种模式下,可以将算法的编制顺利完成,可以更好地完成角色的优化和自动提取,以对用户角色进行整合和分配的方式,使用户的相关权限得到有效控制,同时实现优化植绒和角色提取[3]。角色挖掘技术除了可以为用户提供更好地服务,同时还可以对一些用户行为进行监控。使用此技术,确保了大数据发展的安全性。但是现阶段想要广泛运用还需将数据集的动态变更等问题。
随着大数据的迅猛发展,其在带给我们诸多方便的同时,也出现了各种各样不安全的因素。若是要有效保护但数据的隐私、确保大数据安全,就应以大数据安全漏洞为切入点,积极发展,采用各种保护技术,将安全问题有效解决,使个人隐私得到有效保护。相信在社会的不断发展下,这些问题都可以被解决。