张维作
摘 要:文章针对目前大数据隐私保护机制具有的局限性,提出了基于模糊评估的现代社会网络隐私风险,使大数据隐私能够主动保护。在相关专家及文献的研究基础上,分析了大数据环境下社会网络存在的隐私风险。本研究证明基于模糊评价的社交网络风险具有良好的实用性,能够提高大数据环境下社会网络的服务水平。
关键词:模糊评估;大数据时代;社交网络;隐私风险
在我国社会不断进步的过程中,科技也在不断的发展,现代社会产生的数据极速增长,统计数据量以PB(1024TB)级趋势不断增加,人们已经进入到大数据时代。现代社交网络备受人们喜爱,越来越多的人们喜欢通过社交网络分享自己的所见所闻、交友、聊天,人们在网络中的每一步操作都被服务器所记录。在开发社交网络个人信息潜在价值的基础上,如何保证其个人信息的安全性,保证个人信息不被利用及收集,是目前大数据时代要解决的问题。
1 创建隐私风险评估指标体系
1.1 社交网络的隐私风险因素
现在我们处于大数据时代中,社交网络也不断深入对用户数据的收集、处理及分享,也增加了用户隐私被侵害及威胁的可能性。社交网络隐私风险主要分为:
其一,社交网络较为脆弱。其主要包括软件缺陷、硬件缺陷、网络通信协议、用户隐私安全设置不严谨等,这种风险会导致用户在网络传输过程中的数据被伪造、窃听及篡改,并且还会使用户遭到物理破坏。
其二,用户行为极为脆弱。其主要包括用户的信息行为疏忽、隐私设置关联、用户密码简单等。由于用户能够通过自己的账号登录不同的论坛,用户在社交网络中发布的内容会被无意同步到其他网络,以此泄露隱私,并且还会忽视社交网络中朋友的身份验证,导致自己的信息暴漏,被他人所利用。
其三,外部威胁。其主要包括服务崩溃、第三方因素、信息隐私交易及黑客攻击等。由于用户的疏忽或者技术的漏洞,能够使黑客或者其他人盗窃用户的隐私,将用户的隐私作为第三方不法使用的对象。
1.2 构建指标体系
通过上述分析,本文中构建指标体系的方法为Delphi,以相关专家的研究及知识对指标进行筛选,主要包括两轮删选,从而统一专家意见,以此形成隐私风险评估体系,分为三个以及指标及十三个二级指标。图1为隐私风险评估指标体系。
1.3 指标的量化处理
由于社交网络中的隐私风险评估体系并没有测量数据,都是定性指标,所以社交网络隐私风险评估体系具有一定的模糊性。那么为了能够对其进行定量评估和分析,就要通过本文的专家打分的定量化指标。专家打分的方法指的是将定性指标分为多个级别,并且对其赋予量值,以区分精度为基础,将打分的区间分为五、七及九三个分值,本文中使用五分值,隐私风险可以定义为低、较低、一般、较高、高五种级别,其对应的量值为1,3,5,7,9。隐私评估指标为负向,也就是说指标值越小,评价就越好。通过下式处理初始指标值:
1.4 指标权重的计算
指标权重指的是指标对评估对象的影响程度,其反映了指标之间的差异。在社交网络隐私风险评估的过程中,不同的风险指标的发生概率和损失也都各不相同,所以要根据其重要性对权重进行设置。为了保证评价指标的科学性及合理性,本文将Shannon信息熵融入到AHP方法中,计算评价指标熵值,通过信息量得出指标权重。[1]步骤为:
首先,处理决策矩阵X=(xij)m*n,得到标准化矩阵Y=(yij)m*n,之后归一化处理:
其次,将j指标的熵值进行计算,公式为:
另外,计算j指标的差异系数,表示为:
最后,计算j指标的权重,表示为:
评估指标权重向量为:
W=(w1,w2,...wn)
2 基于模糊评价的社会网络隐私风险
评估社交网络隐私风险的过程中,要考虑多种内在和外在因素的影响。因为社交网络自身就较为复杂,尤其是相亲交友网站中,涉及了多种隐私风险因素及模糊不确定的因素,所以不能够使用统计概率量化风险。那么就要基于模糊评价,根据其中的模糊关系合成理论,评估社交网络隐私风险。
2.1 定义评价语集
评价语集是要根据实际情况制定的,一般将其分为五个等级,以本文中低、较低、一般、较高、高五种级别为例,其等级度量可以表示为:
低:发生风险时对用户的隐私损害极小;较低:发生风险时对用户的隐私损害较小;中等:发生风险时对用户的隐私损害一般;较高:发生风险时对用户的损害严重;高:发横风险时对用户的隐私损害非常严重。
2.2 评估矩阵的创建
首先对单隐私风险因素进行评估ui(i=1,2,3,...,n),得出其模糊评价语集Ri(ri1,ri2,ri3,...,rim)。
假如某个因素因素ui有qij个vj评语,其隶属度rij表示为:
2.3 综合模糊评价
隐私风险因素的权重集W=(w1,w2,...wn)和评估矩阵R两者相互融合得到综合模糊评价,结果为:
通过模糊评估向量C判别评估结果,一般标准为最大隶属度。为了保证评估结果的客观性,使用加权评估计算,公式为:
通过隐私风险隶属度等级标准判定社交网络隐私风险等级。隐私风险隶属等级标准为:0-0.2分为低风险;0.2-0.4分为较低风险;0.4-0.6分为一般风险;0.6-0.8分为较高风险;0.8-1高风险。[2]
3 结束语
本文分析了大数据背景下社交网络隐私风险因素,并且创建了评估指标,计算了指标权重,以此模糊模糊评估了社会网络隐私风险。此方法能够客观地描述大数据环境下的社交网络隐私风险,从而主动规避隐私风险。
参考文献
[1]张艳欣,康旭冉.大数据时代社交网络个人信息安全问题研究[J].兰台世界,2014(5):24-25.
[2]程燕.大数据时代社交网络隐私保护问题研究[J].计算机科学,2014(B10):74-78.