探讨云计算与大数据时代下的隐私与策略

2017-03-09 18:02李华恩
网络安全技术与应用 2017年1期
关键词:密钥时代用户

◆李华恩

(五邑大学计算机学院 广东 525300)

探讨云计算与大数据时代下的隐私与策略

◆李华恩

(五邑大学计算机学院 广东 525300)

互联网时代进入了云计算阶段加之智能移动设备的推广普及,人们无时无刻享受着云带来生活与工作上的便捷与高效。但在享用科技成果的同时,我们也受到了来自大数据对隐私的威胁。本文重点探讨云计算时代诞生后对个人用户信息的变化以及从社会及技术层面尝试探讨如何解决其带来的负面影响。

隐私; 云计算; 大数据; 安全; 网络

1 云计算时代

自从人类进入第三次科技革命时代,电子计算机变得愈发普及,互联网设备也开始与人们形影不离。人们通过互联网记录、交互、分享信息。这里我们将这种自我有意识地将其公开或在某些协议背景下分享给某人的数据称之为自我数据,而另外一种,是互联网或商业公司,会在供应于用户使用的应用程序中收集用户操作时的行为、习惯、行踪等数据,它们以此来提高用户体验,尽管用户在使用程序前同意了某些协议,但这更多是一种被迫,而大多数用户也许根本不清楚自己同意了什么内容,这种人们所没察觉到,却被使用的数据我们可以将其称为忽略数据。放在10年前,自我数据量与忽略数据量或许只有十年后今天的十万分之一,原因在于计算机时代的初期,无论是计算机的运算能力或者是硬盘的储存数据量都是极为有限的,但2006年一项技术的推广与普及,完全将整个局面颠覆,那便是云计算技术。

云计算(Cloud Computing)的组成包含了分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)、热备份冗余(High Available)等传统计算机和网络技术,我们不妨将上述五种主要组成云计算的传统网络技术做个简化。首先分布计算原理即是将一项工程,分布于整个可利用的大系统中,以最有效率的途径拆分给各部分系统完成,之后汇总结果,我们可将其视为协同工作; 并行计算,即在处理这项工程时,调用可供其使用的计算机资源来解决复杂的计算任务,我们将其视为云处理能力。网络存储,即通过汇聚独立储存设备的容量进行统一扩容,资源储备,我们可将其类比为云记忆能力; 效用计算,即无需用户或企业组建自己的数据中心,而由网络存储内容中资源共享来完成数据中心的职责。

我们再将上述从云计算提取出来这几项核心部分与人类大脑进行对比。可以发现,除了缺少“思考”功能,其余每一项对应的恰恰是我们人脑在解决问题时的核心功能。人类只需要将云计算得出的数据协助自己的工作,配合数据操控者的思考能力,一个前所未有的高效率时代——云计算时代便如此降临。

2 大数据

数据并不是什么高深的专有词汇,它可谓是人类社会最重要的组成之一,但大数据,却是云计算时代才得到诞生。根据全球网络报告,截至2016年全球网民数量已经接近总人口的一半,达到34.2亿人口。在以往,无论是超级计算机还是极高容量的存储设备都是是无法收集、存储及运算如此庞大的用户信息,因为无论这些设备再强大,都是个体,但云概念的诞生,它共享与融合的本质,使得整个系统的运算能力与存储能力得到爆炸式的提高,由此诞生大数据的概念。

3 隐私

大数据涉及的方面十分广泛,但本文只讨论其在互联网世界中对用户隐私部分的影响及探讨如何解决。上文详细分析了云计算及其衍生出的大数据时代,我们不妨将这项跨时代的网络成果的运用推演在一位普通上班族用户身上,看看会是什么结果。A先生是一位普通的上班族,属于轻度网络社交群,网络购物平台的多样性与便捷性使得他的主要购物渠道是线上,乘坐交通工具上下班的A先生习惯在路途中拿起手机,浏览了一下更新的微博与当天的新闻动态,在遇到感悟时会社交平台抒发一下自己的感受。回到家后,洗漱完毕的他开始在浏览器上搜索起自己感兴趣的词条,当然其中还包括某些不为人所知的爱好。有时候,在网上找到与自己兴趣相投的论坛,A先生会注册一个该社群的账号,发帖留下了自己的联系信息以此认识些志同道合的朋友,但谨慎的A先生也不太希望网络世界介入自己的生活,所以他也拥有自己的社交小号。

以上便是A先生的一天,可能他的生活代表着以亿万计市民的生活,但在他背后的云计算能将其信息搜集到什么程度?我们不妨一看。

首先,在网购的时候A先生需要填写自己的收货信息,其中便包含了他的实名认证手机号码、常驻住址或公司地址,真名或习惯用的匿名; 而网购平台也会记录下A先生所购买产品品种、类别。而在他使用的智能手机中,手机厂商会在默认的情况下开启定位记录A先生的位置,以此进行某些服务,在他使用微博与浏览新闻的过程中,程序厂商也在记录着A先生在关注何类话题,关注哪类用户或在什么内容上停留的时间更久; 当A先生回家使用电脑浏览论坛时候,他的IP也会记录在他驻足的每一个页面处。

以上便是大概估算下一天中A先生在网络世界所发送出去的数据量,当然,也可能是你我一天发送出去的数据量,当这些数据从一天延伸到一周,一个月,一年,通过云计算的收集、分析、推演,恐怕不难得出一个比我们自己更为了解的“自己”。

由此可见云时代的来临,我们每一个人都很难独善其身,即使你不使用互联网设备,你身边的人记录的点点滴滴也会在大数据的整理下一定程度将你的行踪暴露。虽然有一些文章与书籍介绍如何尽可能地安全使用互联网设备,但这些充其量只能使我们的重要信息难以落入陌生黑客的手里,但对于我们日常生活所需软件背后的互联网公司而言,我们这些资料数据早已以合同的方式自愿为他们使用。若这些公司将这些用户大数据运用得当,我们会发现当自己再次打开购物软件时映入眼帘的全是自己感兴趣或即将需要的货物的优惠页面,当打开导航软件,它能准确为什么实时规划最合理省时的路线; 它们将会化成比自己更了解自己的智能管家,无时无刻推送着我们感兴趣的内容,做着最合我们心意的事。但若我们的这些大数据被泄露或被以坏处利用,我们行踪将无处可逃,它也将会令一个个诈骗剧本在大数据的素材下编织得天衣无缝。

4 应对策略

上文在探讨云计算与大数据带来的隐私问题,并不是希望社会否定及杯葛这项跨时代的技术。趋于统一是世界的发展的趋势,互联网的诞生恰恰就是将世界联系在一起,而云计算机则是这项技术的成熟与后续,我们要做的是面对,接下来本文将尝试从社会责任与技术两个层面去讨论这项技术带来的问题的策略。

5 社会责任

如今,不少用户会对自己个人信息较为敏感从而不愿意主动提供给软件服务公司,因此很多公司遮遮掩掩试图让用户忽略式地同意软件隐私合同。这种做法恰恰令隐私安全问题成为隐患。李克强总理曾在首届世界互联网大会上推广互联网+的概念,这也意味着国家鼓励以及重视新时代中互联网与传统行业结合发展,其中,云计算下的大数据更是其中不可或缺的一环。互联网公司不必胆怯,而是应该让用户清楚明白在使用此款软件时需要收录他们何种资料及数据,他们有权选择是否使用。在这种人人皆知自己信息要为软件程序使用的背景下,社会的关注度也会随之上升,相关法律法规及监督机制也会完善与规范。

6 技术层面

Behrouz A.Forouzan曾在其著作《计算机科学导论》关于安全的章节讨论过,数据安全的三个目标:机密性、完整性、可用性。

由于篇幅有限,本文中我们主要讨论涉及用户数据私密数据的安全部分即机密性与完整性的改进空间。以现阶段技术层面来讲,能对数据机密性产生威胁的手段有两种:嗅探与流量分析。首先讨论嗅探,嗅探是指对数据的非授权访问或侦听。但不法分子能通过嗅探来获得用户资料加以利用的前提是该数据是未经加密或者只做常见的加密处理,据世界互联网安全大会统计,目前全世界仍然有约百分之二十甚至更多的软件在传输客户资料数据时不对数据进行任何的加密,这无疑是对用户资料的不负责任。由此看来,在政策层面要求涉及用户隐私数据交换分析的软件公司实施强制性的用户资料加密处理是很有必要的。

另一种会对数据机密性造成威胁的技术是流量分析,流量分析是指攻击者通过在线流量进行监控和收集,这种攻击技术虽然不受数据加密的约束但它只能通过对流量的监控来推断数据的类型,而对用户数据内容并没有窥视与窃取的能力。

第二个重点需要解决的便是数据的完整性,传统观点认为数据完整性的攻击威胁主要在篡改、假冒、重放和抵赖四种方式上。经过对四种方式进行分类讨论之后我们不难发现,篡改、重放与抵赖都是基于信息被侦听的情况下才能发生。结合上述对机密性的讨论,由此可见,安全性问题在技术上最根本的研究方向应该是需要一套完善的对数据加密与解密的体系。

目前传统大企业对于公司内部机密文件采取的是对称密钥密码术。具体地讲,假如A公司有一份机密文件‘Am’需要传送给B公司,首先A公司会将机密文件‘Am’从明文经过加密算法转换成密文‘SAm’,此时他们通过一个普通信道(该信道并不隐蔽)进行传输,之后A公司与B公司便需要另一个安全通道来传递解开密文的算法(密钥),密钥可能是通过双方见面的方式递交也可能通过互相连通的安全信道进行传递。诚然,这种方法在安全性与保密性方面都能很好地兼顾,他能帮助公司解决内部文件的传达。但若要为如今互联网时代庞大的用户数据交换选择一种类似的保护措施,传统的对称密钥密码术便存在很大的漏洞。首先是人为的安全性问题,密钥的公式是由某一方的公司所设计,且不说既得利益方会不会出卖密钥,在传递或传输的过程不被拦截或窃取就已经很难保证,另一个缺点就是时间效益,毕竟用户大数据的交换要比公司的机密文件传达频繁得多,假如每一次的资料传输都要选择一个安全的信道或者见面传递,无疑是经济与时间上的严重浪费。

我们可以尝试在这种方案上进行改良。在对于需要公司内部或者合作公司之间甚至是公司与国家之间对用户的隐私数据进行传输时,可使用由国家层面的授权机构开发的将明文按照某一随机规律转换密钥,这种转换密钥安装在需要用户提供资料的软件接口,所有传输的用户数据都将以密文的形式进行传递,而传递到目标机构后,再由该机构以某种身份确认的方式(如生物指纹识别、工作卡授权)等向密钥机构核实身份,由密钥机构提供对应的密钥,由于整个过程都是在互联网层面进行,不仅耗时短,也降低了用户资料泄露的风险。

7 总结

在早已进入云计算时代的今天,数据的收集量与分析能力已远超以往任何一个时代,近年来手机程序愈发智能为人们提供了无限便捷的同时,我们也目睹了越来越多的用户信息遭受泄露,一个个网络或电话欺诈案例导致无数家庭损失惨重,这背后若无大数据的分析,单凭骗徒们的花言巧语是不可能达成的。用户的隐私泄露已经到达一个我们无法想象的程度,但却没有多少人愿意正视这个问题,本文是对这个云时代用户隐私的探讨,希望引起更多人的注意,有抛砖引石之用,使得我们在享受技术发展带来果实的同时也能共同解决双刃剑带给社会的伤害。

[1][美]Behrouz,A,Forouzan.计算机科学导论[M].北京:机械工业出版社,2015.

[2]云创大数据.云计算是什么意思 什么是云计算[EB/OL].云创大数据.

猜你喜欢
密钥时代用户
幻中邂逅之金色密钥
密码系统中密钥的状态与保护*
TPM 2.0密钥迁移协议研究
一种对称密钥的密钥管理方法及系统
关注用户
e时代
e时代
e时代
关注用户
关注用户