面向时空大数据的隐私保护理论基础研究

2018-10-21 10:52何英付达杰
现代信息科技 2018年8期
关键词:保护技术

何英 付达杰

摘 要:大数据与地理时空下的数据几乎相互融合,时空大数据逐渐成为市场分析、商业选址、物流、外卖等服务的重要保障,也为智慧城市的发展和个人定位服务提供發展机遇,同时也存在许多安全隐患。本研究从时空视角出发,探讨大数据时代下的隐私保护理论背后的认知机制。从而揭示了时空大数据的生命周期及隐私风险、以及时空大数据的隐私保护技术,不仅深化了传统“小数据”理论框架下研究大数据隐私保护的问题,更为其进一步构建空间大数据隐私管理框架提供参考。

关键词:时空大数据;隐私风险;保护技术;隐私管理框架

中图分类号:TP311.13;TP309 文献标识码:A 文章编号:2096-4706(2018)08-0166-03

Abstract:The big data and data in the geographical space and time are almost integrated,and the space-time large data has gradually become an important guarantee for market analysis,business location,logistics,takeout and other services. It also provides opportunities for the development of intelligent cities and personal positioning services,and there are also many security hidden troubles. From the perspective of time and space,this study explores the cognitive mechanism behind the privacy protection theory in the era of big data. It reveals the life cycle and privacy risk of space-time big data,and the privacy protection technology of space-time big data. It not only deepens the traditional“small data”theory framework to study the problem of big data privacy protection,but also provides a reference for the further construction of space large data privacy management framework.

Keywords:spatiotemporal big data;privacy risks;protection technology;privacy management framework

0 引 言

随着科学技术的不断发展,大数据已经深入应用到医疗、电子商务、金融等各大行业,本文提到的时空大数据是将大数据与地理空间下的数据相互融合,并以统一时间和空间为基准来探讨该基准下活动与位置的关系数据。据Levinson研究发现,绝对空间参照框架利用地心引力来确定坐标原点,用以描述空间中关系事物的准确位置[1]。本研究将从时空视角出发,讨论时空大数据隐私保护技术问题。

1 时空大数据的隐私类别

根据时空大数据的特点,将隐私类别分为以下三类。

1.1 位置数据隐私[2]

第三方可以通过手机隐私的越轨行为,在未经过用户许可的情况下私自采集隐私数据,通过个人位置信息,挖掘分析身份和工作地点等行为。针对该类隐私可以利用扭曲法、政策法和加密法的隐私保护等技术。

1.2 查询隐私

大数据最终要被访问,这也是大数据价值的实现。对数据使用者来说需要查询隐私,而对数据服务提供商来说需要数据隐私和查询隐私。该类隐私通常利用数据管理技术、密码与信息安全等技术。

1.3 发布隐私

用户可以通过手机、可穿戴等设备,利用微信、微博、社交网站平台的签到功能发布时空隐私数据。该类隐私可利用发布隐私数据时的匿名保护等技术。

2 时空大数据的生命周期及隐私风险

基于时空大数据的本质内容和空间特征[3],本文研究的时空大数据处理框架包括大数据发布和采集、存储服务器、分析和处理、决策与应用4个部分,同时这4个部分也是时空大数据的整个生命周期全过程,在时空大数据生命周期各阶段都存在数据隐私风险。如果在使用时空大数据时既要共享信息和应用数据,又要不过分进行数据保护,就需要根据时空大数据生命周期各阶段的隐私风险,研究时空大数据隐私保护的关键技术,从而提高时空大数据的发展安全。

2.1 时空大数据发布和采集带来的隐私风险

通过手机、传感器、可穿戴等设备可以收集空间大数据,这些信息包括个体出行的过程信息、消费记录等信息。时空大数据具有采集数据来源广、数据格式多和非结构化等特点。用户只需要通过随身携带的移动终端就可以随时随地享受互联网提供的各种软件、计算和位置服务。用户如果发布了自己的时空行为信息,这些数据会自动进行隐私数据信息的收集,进而暴露用户的个人身份和兴趣爱好等隐私信息[4],如果将这些数据直接外包,空间数据将面临巨大的隐私安全风险。

2.2 时空大数据存储带来的隐私风险

时空数据与传统的数据相比较,数据类型通过点、线、面表示,位置关系通过包含、相邻、重叠来表示。因此,时空数据可以采用多种存储方式,对数据类型多、格式繁多的数据进行存储,例如分布式的存储方式。从存储需求来看,能够快速得到数据。当前使用空间数据管理技术来存储时空数据,可以增加更高性能的CPU、高容量内存、高速磁盘等来提升存储性能[5]。具有空间扩展的数据库系统大多将空间和安全部分划分成为两个独立的模块,并没有把二者结合起来。如果时空数据服务器受到攻击或第三方出于商业目的而泄漏时空数据服务器中的用户数据时,将会导致返回查询的数据不正确或者结果不完整的情况。此外,时空数据隐私数据具有敏感性,时空数据的拥有者和用户并不希望第三方服务器获知空间数据的具体信息,从而带来信息泄露的隐私风险。

2.3 时空大数据分析和处理带来的隐私风险

非结构化时空数据的快速处理能力是大数据分析的重大挑战,很难依靠某一种或少数几种方法解决所有的大数据分析问题,需要针对不同类型数据的特点研究相应的分析技术。时空数据在分析和处理环节存在非授权使用和被破坏的风险,而且时空数据具有非结构化、数据源广、关联等特点,还存在因关联分析而造成个人信息泄漏的风险。

2.4 时空大数据应用与决策

时空大数据在城市智能化和社会经济发展中的应用越来越普遍化,与此同时,对数据安全的需求也愈来愈大。如果时空数据在使用过程中没有被妥善处理,会对用户的隐私信息带来极大的风险[6]。通过分析时空数据,发现用户的兴趣爱好等隐私数据,从而提供针对性的服务,这在很大程度上给用户的隐私信息泄露埋下了隐患。

3 时空大数据隐私保护的关键技术

3.1 时空大数据发布隐私保护关键技术

在时空数据发布过程中可以使用匿名方法[7]保护敏感信息,当前比较成功的匿名方法包括为位置k匿名和轨迹k匿名。匿名方法是通过位置记录泛化,将用户所在特定的时间范围和空间区域泛化在相同的空间区域,进而避免攻击者识别特定时间范围和空间区域的特定用户[8,9]。

3.2 時空大数据存储隐私保护关键技术

由于普通用户没有控制存储在云服务数据的权限,如果不可信的第三方云服务提供商将用户数据进行篡改或丢弃,将对用户产生极大的侵害。因此,数据拥有者或者第三方机构可以对云服务中的数据进行完整性审计,从而确保数据不会被篡改或丢弃,使用户的隐私信息不会被泄露出去[10]。

3.3 时空大数据分析隐私保护技术

随着移动互联网的迅速发展,现有的数据分析和处理能力已经不能适应海量数据猛增的速度。因此,需要研究更可靠和更有效的时空大数据分析处理技术,并且针对时空大数据分析隐私保护技术的发展极为重要。目前已经研发出来的技术有数据失真和加密的技术,它不仅可以提高数据可用性,而且可以防范利用数据分析方法引发隐私泄露的风险。

3.4 时空大数据应用隐私保护技术

时空大数据已经应用在智慧交通、智慧物流和智慧医疗等领域,为提高时空大数据在访问和使用过程中的隐私保护问题,目前可以采用时空大数据资源权限控制技术,该技术可以确保时空大数据在合适的时间和地点,让合适的用户进行访问和使用。

4 针对时空大数据隐私管理框架的几点建议

本文提出的时空大数据隐私管理框架是针对时空大数据隐私风险建立的,这也是解决时空大数据隐私问题的当务之急。时空大数据隐私管理框架可以从目标设定、需求分析、框架设计等步骤来讨论隐私保护的技术及方法。

4.1 目标设定

有效的隐私保护机制可以在共享和应用时防止时空大数据生命周期中各阶段的隐私泄露,时空大数据隐私管理框架是针对时空大数据隐私风险进行主动评估和追踪问责来开展深入分析的。通过时空大数据隐私管理风险监测和评估机制来对隐私泄露进行追踪溯源。

4.2 需求分析

时空大数据生命周期各阶段隐私风险都需要被主动监测和评估,目的是避免时空大数据隐私信息的泄露或过度保护,平衡时空大数据的隐私信息应用和隐私保护之间的关系。有效的风险评估机制可以对时空大数据隐私泄露进行追踪溯源,并分析泄露的原因,从而弥补现有时空大数据隐私保护技术的不足,并对时空大数据隐私风险评估机制的有效性进行反馈。

4.3 框架设计

非技术层面的隐私风险管理。法律法规可以有效对隐私侵害行为进行制裁和问责,这是时空大数据风险隐私保护手段。因此,制定和完善时空大数据隐私保护法律法规是非常有必要的。

技术层面的隐私风险管理。在讨论时空大数据隐私管理框架之前,需要从隐私生命周期建模、隐私风险评估和时空大数据隐私溯源问责几个模块进行研究。

(1)隐私生命周期建模模块。根据时空大数据隐私生命周期的形成和演化规律来构建时空大数据隐私生命周期模型;(2)隐私风险评估模块。针对时空大数据隐私生命周期各阶段的隐私泄露风险,研究时空大数据信息共享和应用的约束概率和影响程度,为了起到风险预警作用,建立隐私风险评估机制;(3)时空大数据隐私溯源问责。时空大数据具有动态性、复杂性和异构性特点,可以构建动态信息追踪模型,利用时空大数据溯源技术,建立隐私溯源问责机制。

5 结 论

时空大数据的应用已经慢慢深入到社会的各行各业,具有非常广阔的发展前景,但机遇始终与危机共存,时空大数据在发展的同时也面临着许多的风险和挑战。因此,时空大数据隐私保护技术的研究是必不可少的。本文提出的面向时空大数据的隐私保护新理论和新方法可以通过追踪溯源,分析时空大数据隐私信息泄露的原因,进而完善隐私风险评估机制,形成有效的隐私保护技术。有效的隐私保护技术是时空大数据应用的前提条件,可以为解决时空大数据隐私保护问题提供新思路和解决方案。

参考文献:

[1] 刘晋升.时空认知框架不对称? [D].南京:南京大学,2017.

[2] 徐建刚,杨帆.基于社会感知空间大数据的城市功能区识别方法探析 [J].城市建筑,2017(27):30-34.

[3] 李朋德.空间大数据的新机遇 [J].中国建设信息化,2017(13):8-9.

[4] 王璐,孟小峰,郭胜娜.时空数据发布中的隐式隐私保护 [J].软件学报,2016,27(8):1922-1933.

[5] 钟运琴,方金云,赵晓芳.大规模时空数据分布式存储方法研究 [J].高技术通讯,2013,23(12):1219-1229.

[6] 黄世荣.大数据应用模式与安全风险探究 [J].科技资讯,2017,15(1):12-13.

[7] 张海涛,刘钊,朱云虹,等.感知敏感序列规则的在线时空K-匿名方法 [J].南京邮电大学学报(自然科学版),2016,36(4):68-76.

[8] 郭会,韩建民,鲁剑锋,等.实现轨迹k~m-匿名的最小变形度算法 [J].计算机工程,2015,41(11):180-185+201.

[9] 朱麟,黄胜波.不确定环境下轨迹k-匿名隐私保护 [J].计算机应用,2015,35(12):3437-3441.

[10] 魏凯敏,翁健,任奎.大数据安全保护技术综述 [J].网络与信息安全学报,2016,2(4):1-11.

作者简介:何英(1983-),女,汉族,江西九江人,助教,硕士。研究方向:移动互联网、安卓开发;付达杰(1983-),男,汉族,江西九江人,副院长,教授,硕士。研究方向:多媒体技术、信息系统与信息管理。

猜你喜欢
保护技术
煤矿地面变电所和主通风机房框架构建下的欠压保护技术改造思路探索
无线传感器网络数据隐私保护技术
网络隐私探究
阿荣旗低山丘陵地区黑土地保护利用技术模式
数字档案信息开发应用管理中的图像水印保护技术研究
浅谈电子文档与纸质文档在保护技术上的差异
云计算环境中分布式数据存储关键技术的研究
电子商务时代信息安全保护技术探讨