赵明烽,Lei Chen,钟洋,熊金波,3
移动边缘群智感知动态隐私度量模型与评价机制
赵明烽1,Lei Chen2,钟洋1,熊金波1,3
(1. 福建师范大学数学与信息学院,福建 福州 350117;2. College of Engineering and Computing, Georgia Southern University, GA, 30458;3. 福建省网络安全与密码技术重点实验室,福建 福州 350117)
移动边缘群智感知中,用户执行感知任务采集数据所包含的隐私量是动态变化且不直观的,数据上传亦缺乏隐私风险预警值,提出一种动态隐私度量(DPM)模型。给出用户参与感知任务所获数据的结构化表示并转化成原始数值矩阵,引入隐私属性偏好与时效性因素实现对该矩阵的权重叠加,以度量数据所含隐私的动态变化,基于权重叠加后的矩阵合理计算用户个性化隐私阈值,并进行差分隐私处理。在此基础上,设计一种隐私度量模型评价机制。仿真结果表明,模型是有效且合理的,根据所给范例,差分隐私处理后的数据效用达到0.7,随噪声水平增加,隐私保护程度(PDD)可显著提升,适应物联网移动边缘群智感知范式。
动态隐私度量;个性化隐私阈值;差分隐私;模型评价;移动边缘群智感知
作为一种新颖的物联网感知模式,移动边缘群智感知(MECS)[1]借助各式各样的智能终端[2-3]、可穿戴设备协同完成一些泛在智慧型深度社会感知任务,帮助推动现代城市的立体功能延伸和功能耦合,高度响应了国家政府和产业界对智慧城市建设[4-5]的号召。同时,随着第五代(5G)移动通信网络[6-7]的到来和“万物互联”建设脚步的加快[8],人们对移动应用服务的需求量日益剧增,由此催生的海量移动数据包含着用户众多的隐私信息。数据俨然已经渗透到各个行业和领域,成为重要的生产要素。
在实际应用中,感知用户在感知活动结束后需要上传自己的感知数据来获得相应的报酬[9]。同时,他们面临着隐私泄露的安全隐患。感知用户对自身参与感知任务所产生数据的隐私量没有直观的认知。在采用隐私保护技术隐藏某些隐私信息之后[10],经过处理的数据仍然会泄露隐私,例如-匿名技术无法抵抗同质攻击和背景知识攻击[11]。如何确定隐私泄露的风险界限[12],以及数据的后续效用对任务报酬有多大影响,这些都是帮助用户更好地管理自身隐私信息资产的重要因素。若不能有效地度量用户参与感知任务的数据隐私及数据效用等[13-14],帮助用户进行更加理性的感知上传行为,将会导致用户对自身隐私泄露风险的错误认知,进而产生消极的任务参与态势,导致应用服务商获得质量低下的感知数据而无法提供优良的移动服务,以此往复形成恶性循环。
数据隐私度量较为复杂,因其在不同环境中都具有鲜明的敏感特征和属性,且在任务联动、时空变换情况下会对数据特性产生动态影响。目前,国内外针对MECS网络中的隐私度量方法研究主要分为3种[15]:一是利用信息熵[16],根据隐私信息中所包含的不确定程度来度量隐私;二是基于概率统计的方法[17],利用概率分布信息来推断隐私信息的可能性,以此度量隐私泄露的风险;三是结合集对分析理论[18],一种将定性与定量相结合并解决确定与不确定性问题的方法。上述方法存在一定的缺陷,且考虑因素单一。例如,基于信息熵的度量本质是对信息混乱程度的界定,在对隐私风险泄露度量方面具有较好的效果,但在面临MECS中多源数据类型时,不同用户的数据分为敏感性或非敏感性,单一考虑信息混乱变化因素将无法适应MECS范式的数据;基于概率统计的方法则需要掌握一定程度的事件发生概率的先验信息,具有一定的局限性;基于结合集对分析理论的方法主要是针对两数据集之间的关联隐私信息的不确定性进行度量,因此需要具有给定数据集的前提条件,对于MECS中数据的实时性等问题无法进行有效度量。由此,基于数据结构化、概率论及高阶矩阵范数等理论,本文考虑多隐私属性、用户隐私偏好权重和时间等多维因素,提出一种针对MECS范式数据的动态隐私度量模型和评估机制。其主要贡献总结如下。
(1)针对MECS服务中的用户参与感知任务所产生数据设计一种动态隐私度量模型,分析了多隐私属性、用户隐私属性偏好以及时效性等隐私度量因素,以动态度量用户参与任务的数据隐私量,并提出一种面向用户的个性化隐私阈值计算方式。
(2)基于拉普拉斯噪声机制对所提模型进行差分隐私处理,并提出一种动态隐私度量模型评价机制,从隐私量、数据效用以及隐私保护程度等方面对模型效果与性能进行综合评估与分析。
(3)仿真实验结果表明,所提模型能够有效刻画用户任务数据的隐私量变化,正确反映模型的数据效用和隐私保护程度之间的关系,且能证明个性化隐私阈值计算的有效性与合理性,并为用户在上传感知数据时提供客观的隐私度量值和对应的隐私泄露风险界限,且适合MECS范式。
关于利用信息熵的相关隐私度量方法,Shi等[19]针对社交网络服务中保护图形格式数据的隐私方法缺少评价标准的问题,提出了一种利用复杂网络中网络静态特征之一的网络结构熵进行隐私度量的方法,且给出了隐私度量指标(PMI)来度量图结构的隐私保护能力。在基于位置的服务中常常会因为位置信息暴露用户的家庭地址、健康状况以及购物习惯等,Shaham等[20]针对该问题,考虑了基于用户连续位置变换而产生的新的边信息,并提出了一种新的隐私度量方法——传递熵来研究隐私保护问题,此外,还提出了一个贪心算法来提高虚拟生成算法的传递熵性能。在开放和动态计算环境中,度量隐私损失和信任获得是一个有意义的课题,针对相关现有工作在度量过程中没有考虑到隐私信息与动态信任变化之间的关系,Gao等[21]提出了一种新的基于信息论的隐私度量方法,通过条件概率计算信息公开时的隐私损失熵和信任收益熵,并通过调整熵的权重,灵活地应用于不同的应用中,实验结果表明该度量方法具有显著性能,在实体之间进行隐私信息交换时,可以减少隐私损失,获得更多的信任。针对云数据间的关联性问题,张宏磊等[22]引用条件熵提出了一种对云数据操作过程中的隐私信息泄露风险的度量方法,但只考虑了在攻击者无相关背景知识条件下的隐私度量。针对这一问题,文献[23]基于条件熵、互信息等概念提出一种拥有背景知识攻击者攻击的隐私度量方法,并通过举例位置隐私场景,构建了具体的信息熵模型及隐私保护机制和攻击者能力的度量及分析方法。针对移动服务中用户不得不向运营商披露个人信息而构成的隐私威胁,文献[24]基于信息熵和马尔可夫链建立了移动服务隐私安全风险评估模型,给出了合理的风险度量和评估方法。
对于基于概率统计的方法,马蓉等[25]从隐私敏感属性的角度考虑度量问题,借助公众属性和个性化属性等度量指标以及历史数据统计,对时空感知数据进行隐私度量,从而帮助选择最佳用户参与任务。Wang等[26]也从该角度提出了一种基于属性的统计模型,可用于基于个人可识别信息的隐私暴露度量和隐私影响评估,涉及隐私属性、隐私敏感性和属性相关性3个重要因素。Liu等[27]则从用户态度的角度对隐私进行测量,基于个体的内在和外在敏感度,提出了一种用于移动参与式感知系统的个性化隐私测量方法(PriMe),实验结果表明PriMe提供了合理而准确的结果,而参与者反过来也高度信任该系统。此外,根据隐私属性值的概率分布,文献[28-30]从基于贝叶斯概率的度量角度,提出了基于贝叶斯推理的度量隐私信息泄露的方法,通过分析和比较推测的信息与隐私信息之间的差异度来度量隐私信息泄露的风险,两者之间的差异度越小,隐私信息泄露风险越大。Zhang等[31]针对现有位置服务隐私保护机制(LPPM)缺乏隐私度量评估的问题,提出了一种基于贝叶斯条件隐私的隐私度量模型,通过关于敌手估计误差的条件隐私的一般定义来比较不同的基于位置服务(LBS)的隐私度量。为了改进对车载自组织网络(VANET)中暴露的隐私程度的度量,Han等[32]创建了一种以用户为中心的隐私计算系统,依赖于事件发生的概率提出了一个风险评估函数和一组决策权重来模拟决策意图,并结合信息熵知识构建了混合区自适应动态生成机制。对于一些匿名化技术忽视用户的信息自主权问题,Tesfay等[33]提出了一种基于组合概率数学模型和机器学习分类器的以用户为中心的隐私风险检测和度量框架,使用户能够控制自己的数据发布。
对于集对分析理论的度量方法,文献[34]基于该思想提出了一种集对分析隐私度量方法,通过对数据集之间的关联关系进行度量分析,考虑对相邻数据子集的同一度、差异度和对立度特性进行度量描述,且具体讨论了数据库隐私保护、位置隐私保护和轨迹隐私保护3种不同模式下隐私保护机制的集对分析方法实例。攻击者可以利用大数据分析技术通过社交网络发布的数据发现用户的隐私,针对背景知识未定义情况下的隐私度量问题,Huang等[35]借鉴集对分析理论,提出了一种新的网络环境下的隐私度量方法,将个人隐私度量的结果分为确定值和不确定参数两部分,其中,确定值可以反映隐私暴露程度,不确定参数可以反映背景知识的变化对隐私暴露程度的影响,从而令隐私分析可以在不断变化的背景知识中进行动态调整。
综上所述,目前关于隐私度量的工作比较丰富。现有方案主要涉及对隐私敏感属性、用户个性化隐私偏好、数据关联性、时空状态变化等度量因素和标准的考量。然而,大多数方案均考虑单一的隐私度量标准或因素,对于适应MECS网络中同时具有复杂隐私属性特征、隐私属性偏好、时间变化等的感知数据隐私度量方法目前还比较匮乏。因此,从多方因素出发构建新的动态隐私度量模型对于适应MECS范式类型的感知数据非常重要。
由于任务类型的关系,数据表中可能含有非数值型数据,为了便于后续隐私敏感度的计算,采用非负数值映射方法,将数据表转化为数值矩阵。该映射定义如下。
定义1 非负数值映射[36]
表1 任务全周期的结构化数据形式表示
定义2 隐私属性偏好向量
进一步地,考虑到用户的隐私偏好会随时间迁移而变化,即隐私偏好是具有时效性的。换句话说,某一用户对某一隐私属性的重视程度会随着时间的增加而改变。为了度量隐私属性偏好的时效性,这里引入隐私属性偏好函数。
定义3 隐私属性偏好函数
特别地,有3类隐私属性偏好函数。
差分隐私[37]作为一种基于数据失真的隐私保护技术,即通过对敏感数据添加随机噪声使数据结果与原始数据发生一定的偏差,其具有严格的数学证明,在达到隐私保护目的的同时,也保持了一定的数据效用。
定义4 拉普拉斯分布[38]
它的逆累计分布函数为
从上述内容可知,本文对任务感知数据进行了结构化表示和数值化、隐私偏好的度量和时效性的加入,且得到了动态隐私阈值的概念和求解。接下来,本文将对该模型构建评估机制,从数据效用以及隐私保护程度等评估指标,考虑模型的隐私度量效果与有效性。
定义5 矩阵-范数
定义6 数据效用
实验在Intel®Core(TM) i7-1050U CPU@ 1.80 GHz,12 GB DDR4,1 TB hard disk的Windows 10硬件平台上进行,软件配置主要有Python3.6、IDE PyCharm以及MATLAB R2018a。数据集采用的是共享单车用户的移动行为数据,包括使用者性别、年龄、每次骑行的起点和目的地、开始和结束时间、起点经纬度、目的地点经纬度等属性。该数据集所包含的用户是具有高度移动特性的,且所产生的数据主要依赖自身携带设备装载的传感器,适用于MECS范式。
图1 的隐私量随时间的变化情况
图2 隐私保护程度与数据效用随噪声增加的变化情况
Figure 2 Changes in the degree of privacy protection and data utility as noise increases
图3 不同用户的动态隐私阈值和隐私保护程度关系
Figure 3 The relationship between the dynamic privacy threshold of different users and the degree of privacy protection
为了克服MECS范式中用户对自身感知任务隐私的认知不足,突破现有相关工作对隐私度量因素考虑较为单一性的问题,本文提出了一种面向感知任务数据的动态隐私度量模型。考虑多隐私属性、用户隐私属性偏好和时效性等因素,给出了用户个性化隐私阈值计算定义式。随后,对所提模型设计了一种有隐私量、数据效用及隐私保护程度等多指标的评估机制。通过大量的实验结果和数据分析,验证了所提动态度量模型能够有效进行敏感数据的隐私量度量,且客观反映出数据隐私保护效果和数据效用的变化,解释了个性化隐私阈值计算式的合理性,为用户感知数据的隐私动态度量和隐私阈值个性化计算提供了方案和思路。
[1] XIONG J B, ZHAO M F, BHUIYAN M Z A, et al. An AI-enabled three-party game framework for guaranteed data privacy in mobile edge crowdsensing of IoT[J]. IEEE Transactions on Industrial Informatics, 2019: 1.
[2]XIONG J, CHEN L, BHUIYAN M Z A, et al. A secure data deletion scheme for IoT devices through key derivation encryption and data analysis[J]. Future Generation Computer Systems, 2020, 111: 741-753.
[3]YU S, WANG G, LIU X, et al. Security and privacy in the age of the smart internet of things: an overview from a networking perspective[J]. IEEE Communications Magazine, 2018, 56(9): 14-18.
[4]QI L, HU C, ZHANG X, et al. Privacy-aware data fusion and prediction with spatial-temporal context for smart city industrial environment[J]. IEEE Transactions on Industrial Informatics, 2020: 1.
[5]胡宇翔, 伊鹏, 孙鹏浩, 等. 全维可定义的多模态智慧网络体系研究[J]. 通信学报, 2019, 40(8): 1-12.
HU Y X, YI P, SUN P H, e al. Research on the full-dimensional defined polymorphic smart network[J]. Journal on Communications, 2019, 40(8): 1-12.
[6]LUO C, JI J, WANG Q, et al. Channel state information prediction for 5G wireless communications: a deep learning approach[J]. IEEE Transactions on Network Science and Engineering, 2020, 7(1): 227-236.
[7]乔康, 游伟, 王领伟, 等. 基于区块链的5G 物联网数据共享方案[J]. 网络与信息安全学报, 2020, 6(4): 45-55.
QIAO K, YOU W, WANG L W, et al. Data sharing scheme for 5G IoT based on blockchain[J]. Chinese Journal of Network and Information Security, 2020, 6(4): 45-55.
[8]AL-GARADI M A, MOHAMED A, AL-ALI A, et al. A survey of machine and deep learning methodsfor internet of things (IoT) security[J]. IEEE Communications Surveys & Tutorials, 2020, 22(3): 1646-1685.
[9]熊金波, 马蓉, 牛犇, 等. 移动群智感知中基于用户联盟匹配的隐私保护激励机制[J]. 计算机研究与发展, 2018, 55(7): 1359.
XIONG J B, MA R, NIU B, et al. Privacy protection incentive mechanism based on user-Union matching in mobile crowdsensing[J]. Journal of Computer Research and Development, 2018, 55(7): 1359-1370.
[10]ZHANG Y, WANG P, HUANG H, et al. Privacy-assured FogCS: chaotic compressive sensing for secure industrial big image data processing in fog computing[J]. IEEE Transactions on Industrial Informatics, 2020.
[11]LIU C, TIAN Y, XIONG J, et al. Towards attack and defense views to-Anonymous using information theory approach[J]. IEEE Access, 2019, 7: 156025-156032.
[12]AL-ASMARI H A, SALEH M S. A conceptual framework for measuring personal privacy risks in facebook online social network[C]//International Conference on Computer and Information Sciences (ICCIS). 2019: 1-6.
[13]ZHAO Y, WAGNER I. On the strength of privacy metrics for vehicular communication[J]. IEEE Transactions on Mobile Computing, 2018, 18(2): 390-403.
[14]WAGNER I, ECKHOFF D. Technical privacy metrics: a systematic survey[J]. ACM Computing Surveys (CSUR), 2018, 51(3): 1-38.
[15]熊金波, 王敏燊, 田有亮, 等. 面向云数据的隐私度量研究进展[J].软件学报, 2018, 29(7): 1963-1980.
XIONG J B, WANG M S, TIAN Y L, et al. Research progress on privacy measurement for cloud data[J]. Journal of Software, 2018, 29(7): 1963-1980.
[16]HUANG Z, YANG L, JIANG W. Uncertainty measurement with belief entropy on the interference effect in the quantum-like Bayesian networks[J]. Applied Mathematics and Computation, 2019, 347: 417-428.
[17]SONG H, LUO T, LI J. Common criterion of privacy metrics and parameters analysis based on error probability for randomized response[J]. IEEE Access, 2019, 7: 16964-16978.
[18]YAN F, XU K. A set pair analysis based layer of protection analysis and its application in quantitative risk assessment[J]. Journal of Loss Prevention in the Process Industries, 2018, 55: 313-319.
[19]SHI W, HU J, YAN J, et al. A privacy measurement method using network structure entropy[C]//Proceedings of the International Conference on Networking and Network Applications (NaNA). 2017: 147-151.
[20]SHAHAM S, DING M, LIU B, et al. Transition-entropy: a novel metric for privacy preservation in location-based services[C]//IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS). 2019: 1-6.
[21]GAO F, HE J, PENG S, et al. A quantifying metric for privacy protection based on Information theory[C]//Proceedings of the 2010 Third International Symposium on Intelligent Information Technology and Security Informatics. 2010: 216-220.
[22]张宏磊, 史玉良, 张世栋, 等. 一种基于分块混淆的动态数据隐私保护机制[J]. 计算机研究与发展, 2016, 53(11): 2454-2464.
ZHANG H L, SHI Y L, ZHANG S D, et al. A privacy protection mechanism for dynamic data based on partition-confusion[J]. Journal of Computer Research and Development, 2016, 53(11): 2454-2464.
[23]彭长根, 丁红发, 朱义杰, 等. 隐私保护的信息熵模型及其度量方法[J]. 软件学报, 2016, 27(8): 1891-1903.
PENG C G, DING H F, ZHU Y J, et al. Information entropy models and privacy metrics methods for privacy protection[J]. Journal of software, 2016, 27(8): 1891-1903.
[24]ZHANG T, ZHAO K, YANG M, et al. Research on privacy security risk assessment method of mobile commerce based on information entropy and markov[J]. Wireless Communications and Mobile Computing, 2020, 2: 1-11.
[25]马蓉, 陈秀华, 刘慧, 等. 移动群智感知中用户隐私度量与隐私保护研究[J]. 信息网络安全, 2018,18(8): 64-72.
MA R, CHEN X H, LIU H, et al. Research on user privacy measurement and privacy protection in mobile crowdsensing[J]. Netinfo Security, 2018,18(8): 64-72.
[26]WANG Y, LIU J. An attribtue-based statistic model for privacy impact assessment[C]// Proceedings of the 2016 International Conference on Collaboration Technologies and Systems (CTS). 2016: 619-621.
[27]LIU R, CAO J, VANSYCKEL S, et al. PriMe: human-centric privacy measurement based on user preferences towards data sharing in mobile participatory sensing systems[C]//Proceedings of the 2016 IEEE International Conference on Pervasive Computing and Communications (PerCom). 2016: 1-8.
[28]YAMAOKA Y, ITOH K. K-presence-secrecy: practical privacy model as extension of-anonymity[J]. IEICE Transactions on Information and Systems, 2017, 100(4): 730-740.
[29]GKOUNTOUNA O, TERROVITIS M. Anonymizing collections of tree-structured data[J]. IEEE Transactions on Knowledge and Data Engineering, 2015, 27(8): 2034-2048.
[30]LI X Y, ZHANG C, JUNG T, et al. Graph-based privacy-preserving data publication[C]// Proceedings of the 35th Annual IEEE International Conference on Computer Communications. 2016: 1-9.
[31]ZHANG X, GUI X, TIAN F, et al. Privacy quantification model based on the Bayes conditional risk in location-based services[J]. Tsinghua Science and Technology, 2014, 19(5): 452-462.
[32]HAN X, TIAN D, DUAN X, et al. Optimized anonymity updating in VANET based on information and privacy joint metrics[C]//Proceedings of the 8th ACM Symposium on Design and Analysis of Intelligent Vehicular Networks and Applications. 2018: 63-69.
[33]TESFAY W B, SERNA-OLVERA J. Towards user-centered privacy risk detection and quantification framework[C]//Proceedings of the International Conference on New Technologies, Mobility and Security (NTMS). 2016: 1-5.
[34]晏燕, 郝晓弘, 王万军. 一种隐私保护度量的集对分析方法[J]. 武汉大学学报(工学版), 2015, 48(6): 883-890.
YAO Y, HAO X H, WANG W J. A set pair analysis method for privacy metric[J]. Engineering Journal of Wuhan University, 2015, 48(6): 883-890.
[35]HUANG W Q, XIA J F, YU M, et al. Personal privacy metric based on public social network data[J]. JPhCS, 2018, 1087(3): 032007.
[36]HE W, ZENG Y, LI G. A novel structural reliability analysis method via improved maximum entropy method based on nonlinear mapping and sparse grid numerical integration[J]. Mechanical Systems and Signal Processing, 2019, 133: 106247.
[37] HASSAN M U, REHMANI M H, CHEN J. Differential privacy techniques for cyber physical systems: a survey[J]. IEEE Communications Surveys & Tutorials, 2019, 22(1): 746-789.
[38]HE J, CAI L, GUAN X. Differential private noise adding mechanism and its application on consensus algorithm[J]. IEEE Transa- ctions on Signal Processing, 2020, 68: 4069-4082.
Dynamic privacy measurement model and evaluation system for mobile edge crowdsensing
ZHAO Mingfeng1,LEI Chen2,ZHONG Yang1,XIONG Jinbo1,3
1. College of Mathematics and Informatics, Fujian Normal University, Fuzhou 350117, China 2. College of Engineering and Computing, Georgia Southern University, GA 30458, USA 3. Fujian Provincial Key Laboratory of Network Security and Cryptology, Fuzhou 350117, China
To tackle the problems of users not having intuitive cognition of the dynamic privacy changes contained in their sensing data in mobile edge crowdsensing (MECS) and lack of personalized privacy risk warning values in the data uploading stage, a dynamic privacy measurement (DPM) model was proposed. A structured representation of data obtained by a user participating in a sensing task was introduced and was transformed it into a numerical matrix. Then privacy attribute preference and timeliness were presented to quantify the dynamic privacy changes of data. With this, personalized privacy thresholds of users based on the numerical matrix were reasonably calculated. Finally, differential privacy processing was performed on the numerical matrix, and a model evaluation system was designed for the proposed model. The simulation results show that the DPM model was effective and practical. According to the given example, a data utility of approximately 0.7 can be achieved, and the degree of privacy protection can be significantly improved as the noise level increases, adapting to the MECS of IoT.
dynamic privacy measurement, personalized privacy threshold, differential privacy, model evaluation, mobile edge crowdsensing
TP309.2
A
10.11959/j.issn.2096−109x.2021016
2020−09−16;
2020−12−14
熊金波,jbxiong@fjnu.edu.cn
国家自然科学基金(61872088, U1905211, 61872090);福建省自然科学基金(2019J01276);贵州省公共大数据重点实验室开放课题(2019BDKFJJ004)
The National Natural Science Foundation of China (61872088, U1905211, 61872090), The Natural Science Foundation of Fujian Province, China (2019J01276), The Guizhou Provincial Key Laboratory of Public Big Data Research Fund (2019BDKFJJ004)
赵明烽,Lei Chen,钟洋, 等. 移动边缘群智感知动态隐私度量模型与评价机制[J]. 网络与信息安全学报, 2021, 7(1): 157-166.
ZHAO M F, LEI C, ZHONG Y, et al. Dynamic privacy measurement model and evaluation system for mobile edge crowdsensing [J]. Chinese Journal of Network and Information Security, 2021, 7(1): 157-166.
赵明烽(1996−),男,江苏张家港人,福建师范大学硕士生,主要研究方向为移动数据安全和隐私保护。
Lei Chen(1978− ),男,陕西西安人,美国佐治亚州南方大学副教授,主要研究方向为网络安全、信息安全、云计算与大数据安全等。
钟洋(1995−),男,湖南湘西人,福建师范大学硕士生,主要研究方向为安全深度学习。
熊金波(1981− ),男,湖南益阳人,福建师范大学教授、博士生导师,主要研究方向为网联自动驾驶车辆的安全与隐私、物联网安全、大数据安全、隐私保护。