社交网络中用户签到行为位置泄露风险预警

2023-10-29 01:48王晓丹王子乔金山海
计算机仿真 2023年9期
关键词:攻击者预警社交

王晓丹,王子乔,金山海*

(1. 延边大学工学院,吉林 延吉 133002;2. 延边大学,吉林 延吉 133002)

1 引言

社交网络已经成为人们生活中不可或缺的部分,其信息繁杂多样、共享性强,用户的各种操作都极易造成数据信息的泄露,尤其是位置信息的泄露,威胁着用户的人身安全和财产安全,是电子安全领域研究的重点问题,现阶段因用户签到而造成位置泄露风险预警的方法仍存在预警效果不佳、准确率低等问题,为了实现位置泄露风险预警的准确预测,需要研究社交网络用户签到行为位置泄露风险预警方法,该方法的研究有望为公众隐私保护带来新的有效措施,具有重要现实意义[1-2]。

王竹等人[3]提出Android设备中基于流量特征的隐私泄露评估方案,计算用户行为特征和业务相关性,通过凝聚层次聚类方法优化业务相关性行为特征;基于流量特征模型,完成社交网络用户的位置信息泄露风险预警。该方法存在检测准确率低的问题。朱唯一等人[4]提出基于EDLATrust算法的社交网络信息泄露节点概率预测方法,采用信息种群传播和线性传播两种模型;通过XGBoost算法预测关键信息节点;通过预测模型完成社交网络用户的位置信息泄露风险预警。该方法存在预警错误率高的问题。范敏等人[5]提出基于字符级扩张卷积网络的Web攻击检测方法,对网络数据预处理并实行人工校验,构建扩张卷积网络层,通过模型完成社交网络用户的位置信息泄露风险预警。该方法存在风险预警时间长、预警效果不佳的问题。

为了解决上述方法中存在的问题,提出社交网络用户签到行为位置泄露风险预警方法。通过构建攻击者模型,采用K-means聚类算法获取数据信息,采用敏感性、数据可见性、属性公开性完成社交网络用户签到行为位置泄露风险预警。

2 攻击者模型

建立社交网络用户的位置攻击者模型,分析其攻击情况[6-7]。

攻击者分为系统内恶意位置服务提供商和系统外恶意攻击者两种情况。根据实际经验列出攻击者背景知识可能性如下:

1)攻击者拥有全体用户所处区域标识。

2)用户情况可被攻击者获取观察。

3)攻击者了解中间服务器的用户隐私保护机制。

4)用户历史信息可被攻击者获取。

5)隐私保护机制的概率分布密度函数可被攻击者获取。

攻击者可获取社交网络用户个人资料信息和用户历史位置服务信息两部分用户背景知识。

针对位置信息的获取,攻击者可根据先验知识和用户位置权限构建用户移动信息。在R区域内,用户u移动轨迹序列可用Q×Q矩阵表示,其移动概率值可用Pr(tk|to)表达,tk、to表示用户不同位置信息。受知识权限限制,攻击者不能完成估算出用户移动轨迹序列中的全部位置情况,攻击者通过马尔科夫链建模用户在R区域内移动轨迹从而获取用户转移概率矩阵[8-9],其矩阵内元素信息公式表达如下:

(1)

其中,t(y)、t(y-1)表示用户移动时刻信息。

攻击者通过历史信息进一步推断出用户在y-1时刻的位置概率分布公式表达如下:

Pr(t(y-1))=Pr(to|u)

(2)

故攻击者的位置攻击受时刻概率分布和位置概率分布约束。

攻击者可由观察事件逆向推测用户的真实事件,即用户与位置区域关联范围,最终推导出用户u在y时刻的位置公式表达如下:

(3)

其由用户下一刻的转移概率决定。

以此完成攻击者位置攻击行为分析。

3 用户社交网络数据获取

构建位置攻击者模型后,通过数据挖掘的K-means聚类算法获取用户社交网络数据信息[10-11]。

数据挖掘通过数据清洗、集成、选择、变换、模式发现、评估与知识库七个阶段获取用户数据信息。

K-means算法被广泛应用于社交网络用户的数据挖掘中,通过聚类分析获取用户的数据信息[12]。

用F{x1,x2,…,xn}表示数据点集合,维度实数空间向量可用xo=(xo1,xo2,…,xot)表示,共n个数据点个数。

1)在数据集F中划分l个数据点作为初始簇中心qk,其公式表达如下:

(4)

其中,Vk表示第k个簇,Co表示数据点中心,|Vk|表示簇的个数。

计算数据点到簇中心距离dist(xo,qk),其公式表达如下:

(5)

划分数据到簇中心,并重新计算每个簇中心,重复此过程,直至满足以下条件中任意一个,即终止迭代:

1)所有数据点被分配完成。

2)簇中心固定化。

3)误差平方和(SSE)局部最小。

误差平方和公式表达如下:

(6)

基于此,完成社交网络签到用户数据信息的获取。

4 位置泄露风险预警

获取到用户信息数据后,通过属性敏感性、数据可见性、属性公开性三个指标完成社交网络用户签到行为位置泄露风险预警。

位置泄露包含隐私参数、攻击者推测、真实隐私信息和先验知识四种因素,根据此四种因素设置属性敏感性、数据可见性和属性公开性三个指标以量化位置泄露信息风险程度。

属性敏感性通过用户隐私喜好设置量化位置泄露程度;数据可见性依据先验知识从用户数据中获取先验概率分布;属性公开性依据攻击者意图推测量化推测属性识别模式,其流程如图1所示。

图1 位置泄露风险预警流程

4.1 属性敏感性

通过用户隐私偏好矩阵的构建,获得社交网络用户属性敏感性程度。

(7)

其中,tol表示用户主观属性敏感性,d表示属性数目,l表示第l个属性。

使用皮尔逊相似度计算用户主观敏感性sbj-senol,其公式表达如下:

(8)

其中,r表示皮尔逊系数。

计算皮尔逊客观敏感性obj-senl,其公式表达如下:

(9)

其中,m表示客观属性敏感性数目。

以此归一化处理用户属性敏感性,排除主观因素的影响,完成用户属性敏感性的量化处理。

4.2 数据可见性

可通过先验概率量化用户隐私程度,从而获得用户数据曝光的程度,用户位置泄露风险程度与数据可见性成正比。

分析获取的用户数据信息以评估用户数据信息的可见性大小。计算用户数据可见性数据Bodo,其公式表达如下:

(10)

其中,Pok表示获取用户信息概率,m表示用户信息量。

由此推算出用户数据可见性量化其位置信息泄露程度,攻击者的攻击成功可能性直接受此影响。

4.3 属性公开性

攻击者通过用户数据推测用户属性的确定程度称为属性公开性,用户威胁泄露风险程度与属性公开性成正比。攻击者获取签到社交网络用户数据来推断用户属性信息,从而造成位置泄露风险[14]。例如用户的签到信息经常活动在某范围内,攻击者则可推测出该用户地址。

属性公开性即攻击者通过属性识别模型获取签到用户概率分布,可用信息熵来度量签到用户信息属性公开性,信息熵越大则用户属性公开性越大。

设置用户数据用随机变量X表示,假设其随机变量Y满足均匀分布,其定义域用η表示,其待计算属性attrl,属性个数为|η|,极端属性值的先验概率P(u)公式表达如下:

(11)

根据信息熵计算用户属性公开性cerol,其公式表达如下:

(12)

其中,J(U|C)表示属性识别,P(u|c)表示确定条件概率,J(U)表示属性值。

属性公开性可量化攻击者的位置信息攻击情况,从而评估签到行为引起的位置泄露风险情况。

4.4 风险预警评估

根据用户签到行为存在的属性敏感性、数据可见性和属性公开性,从动态、静态两个角度评估用户位置泄露风险情况[15]。

用户签到引起的位置泄露可分为正常状态和异常状态两种情况,判定位置泄露步骤如下:

计算主观隐私评分,其公式表达如下:

(13)

计算客观隐私评分,其公式表达如下:

(14)

从静态角度,计算用户隐私指数,其公式表达如下:

(15)

其中,IU表示用户合集。

从动态角度,计算用户隐私评分序列,其公式表达如下:

PSS=(sbj-Psyo,sbj-Psy2,…,sbj-Psyf)

(16)

其中,f表示时间窗口大小。

当客观隐私评分大于用户隐私指数或主观隐私评分时,表示异常状态,否则为正常状态。

设置阈值β和χ量化用户位置泄露程度,其公式表达如下:

(17)

其中,PI表示隐私指数。

基于此,完成社交网络用户签到行为的位置泄露风险预警。

5 实验与分析

为了验证社交网络用户签到行为位置泄露风险预警方法(所提方法)的整体有效性,对其完成如下测试。

寻找在一个月前就正常使用社交网络的实验用户10名,实验用户实验当天在延边大学工学院各个位置完成用户签到,并佩戴电子手表以记录真实运动位置,同时采用多种攻击方法攻击实验用户的应用程序。

1)预警精度、查全率、F值

引入预警精度、查全率及预警精度和查全率调和均值F值来对位置泄露风险预警效果评估。

预警精度公式表达如下:

(18)

查全率公式表达如下:

(19)

F值公式表达如下:

(20)

其中,TP表示实际有泄露风险,FP表示实际无泄露风险,FN表示实际有泄露风险。

采用所提方法、基于流量特征的隐私泄露评估方案(参考文献[3]方法)和基于EDLATrust算法的社交网络信息泄露节点概率预测方法(参考文献[4]方法)对其位置泄露风险预警测试,其结果如表1所示:

表1 三种方法的位置泄露风险预警评估指标

分析表1可知,所提方法的预警精度为98.6%、查全率为97.6%以及F值为85.6%,均大于参考文献[3]方法和参考文献[4]方法,表明所提方法的行为位置泄露风险预警效果更好。

2)预警幅度频率对比

在存在外界影响的情况下,采用不同方法对其实行位置泄露风险预警测试,观测三种方法预警幅度波动率是否平稳,三种方法的预警振动频率如图2所示。

图2 三种方法的预警振动频率

分析图2可知,所提方法的预警振动频率波动率保持在-50Hz~50Hz区间内,而参考文献[3]方法、参考文献[4]方法的预警振动频率波动率均超过-50Hz~50Hz,表明所提方法的预警判定在存在外界干扰的情况下仍可获得较为平稳准确的预警结果。

通过上述实验可知,所提方法通过攻击者模型分析了攻击者的位置攻击方法情况,提高了位置泄露风险预警的精度;通过属性敏感性、数据可见性、属性公开性三个指标的量化处理,提高了位置泄露风险预警的正确率,获取了社交网络用户签到行为的位置泄露风险预警效果。

6 结束语

社交网络成为全民生活的必需品,在应用过程中存在签到行为,是泄露社交网络用户位置的主要行为。为了保证社交网络用户的信息安全,因此提出社交网络用户签到行为位置泄露风险预警方法。通过构建攻击者模型;获取签到社交网络用户数据信息;通过对三个指标的量化处理,完成社交网络用户签到行为位置泄露风险预警。所提方法为社交网络用户的信息安全提供了保障,具有重要现实应用意义。

猜你喜欢
攻击者预警社交
社交之城
社交牛人症该怎么治
基于微分博弈的追逃问题最优策略设计
社交距离
法国发布高温预警 严阵以待备战“史上最热周”
你回避社交,真不是因为内向
正面迎接批判
园林有害生物预警与可持续控制
机载预警雷达对IFF 的干扰分析
有限次重复博弈下的网络攻击行为研究