李一航
摘要:随着当今移动通信技术的飞速发展,移动用户行为的活跃及地理位置的改变,使基于位置的服务应运而生。在分析通信基站记录群体登记信息的同时,个人开户信息与基站记录数据的关联,导致用户受到各种因素潜在风险的威胁。有可能造成个人信息数据的泄密、造成直接经济损失。本篇论文是解决个人信息保护与位置服务权衡的问题,探讨如何使位置服务与个人信息保护达到平衡并相互促进的目的。
关键词:个人隐私 位置服务 k匿名
中图分类号:TN918.91 文献标识码:A 文章编号:1007-9416(2016)07-0113-02
1 概述
随着移动通信技术和互联网技术的迅速发展,传统微型计算机与通信手机结合而诞生的智能手机终端已经广泛普及。社会的各个领域(医疗、金融、交通、电子商务等)都在利用成熟顺畅的移动通信网络访问智能手机第三方应用程序(APP)[1]。移动智能终端手机使通信沟通、信息处理合二为一。用户在享受移动互联网环境下信息沟通的畅快淋漓的同时产生的信息泄露不容小觑。每一个移动通信智能手机用户从开机连接互联网开始,无时无刻不的数据被通信基站记录并更新交替位置数据、社交软件数据电子商务数据电子地图导航等数据。详细的用户数据在未经过差分隐私保护等手段处理的情况下被分析者做上下文检索并得到更多的用户位置隐私信息。过度无良的商家为赚取广告费用不择手段的获取用户个人隐私。无论是移动通信运营商、互联网电商还是社交软件、电子金融,都在极力的提供用户位置服务,为用户推送出的相关推荐性服务产品,达到争抢用户资源和市场的目的。随着数据挖掘的纵深方向的发展和用户隐私权意识的觉醒,为了解决两者的矛盾:一方面满足数据分析者需要更多数据做位置服务的商业科研等目的,另一方面又要维护数据载体用户的个人信息隐私的非公开性,使用户对个人信息公开的心理接受程度不陷入恐慌。
2 相关概念
2.1 个人隐私
国外著名的隐私解决方案提供商TRUSTe的调查报告显示,隐私问题主要分为如下几类:地理位置;唯一归属个人信息(例如社保号码、身份证号);社交关系网络信息。
综合以上调研情况,结合移动网络业务的特性,本文将隐私数据分为如下几类:
(1)数字化数据:唯一关联终端用户数字,包括身份证号码和电话号码等;
(2)地理位置数据: 手机登陆基站标识、GPS经纬度数据;
(3)应用链接数据:具体手机APP应用相关的数据,包括用户名、密码、联系人等。
2.2 k匿名
k匿名由samarati和sweeney提出,实际上已经成为了最为常见也是最为基础的一种匿名化原则。几乎所有的匿名化准则都是在k匿名基础上再加上其他限制。如果表T中任何一个元组都和至少另外k-1个元组在准标识符上是不可区分的,那么即使攻击者知道表T中某个人的身份及其准标识符信息,因为T中至少有无个元组可以与之连接(他们构成一个等价类,攻击者就无法确定这个等价类里的哪条元组与这个人对应),这样的性质使得满足k匿名的数据具有良好的隐私保护能力[2]。
2.3 应用领域
用户行为轨迹LBS服务基于地理位置定位一般有三种方式。1.基于GPS;2.基于运营商基站;3.WIFI另外蓝牙还有传感器也可以定位。传统的定位方式会使用户有被“监视”的感觉,约束的个人地理位置的自由和位置隐私。
本文研究讨论隐私数据的合理保护和基于用户行为数据的模式抽取两者兼得,正是隐私保护数据挖掘方法的出发点和最终目标。是数据挖掘方基于非精确的原始数据而抽取出精确的模式与规则,对推动交叉学科互融互通和城市规划统计决策有着重要的意义。对国民经济生产,优化产业结构,重组社会资源的决策有着重要的研究显示意义。
3 问题研究及方法
3.1 存在的问题
在移动通信网中,能记录用户地理位置信息的经纬度致使用户隐私行为暴露。因为在核心网HLR中,可以使用关联分析的方法利用用户登记记录的身份标识(身份证号码)记录关联用户地理位置的经纬度;根据智能手机用户点击社交、位置等服务类手机软件时,软件后台可以记录用户的相关活动的描述性信息。例如在微信、陌陌、探探等基于位置的虚拟社会软件中还提供了一些好友信息等隐私性的描述文档,包括用户喜好、习惯、评价等等。因此,无良商家为了广告目的利用这些描述性文档,采用直接点对点的个人准确推荐方法,来提高推荐务的准确性,从而引起用户恐慌。
在移动通信网络提供给用户便捷的畅通服务中,使用方的隐私保护问题一直都是“鱼和熊掌”的问题。一方面用户需要享受运营商,APP服务商等带来的舒适便捷的项目服务,另一方面用户同时惧怕陌生人对己方信息了如指掌后的安全性担忧。如果使用加密技术对个人用户信息通篇加密,又会使计算开销和用户自己存取使用带来不必要的麻烦。再一方面,数据使用者分析方(商家,科研机构)希望获得原始资料,在经过信息层层加密,隐私化之后的数据可利用度另人怀疑。
3.2 解决办法
居民身份证号码是每一个公民与生俱来的唯一身份识别号码。根据〖中华人民共和国国家标准GB 11643-1999〗中有关公民身份号码的规定,公民身份号码是特征组合码,由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。 居民身份证是国家法定的证明公民个人身份的有效证件。银行,公安,教育,交通,通信等机构掌握有大量的公民身份证号码。公民身份证号码一旦泄露,对个人造成直接财产损失。因此本文提出基于K匿名的个人身份证号码隐私保护方法其基本思想是:对公民身份证号码的有效分割数字地址码、数字出生日期码、数字顺序码,打乱三者一对一关系来保护个人用户的隐私。简单的程序操作就可以将六位数字地址码和后三位数字顺序码一位数字校验码去隐私保护,使用户出生年月日成为用户标识,在基于位置的服务中,属于使用者既可以通过基站小区记录登记的用户出生年月将用户归类进行用户行为分析、推荐挖掘,又不能获取用户完整身份证号码而侵害用户权益。将用户数据利用最大化与用户隐私达到博弈平衡点的效果
4 结语
在有效的保护好用户隐私的基础上实现群体用户行为轨迹服务推荐,使得原始数据经过隐私化后筛选分类得到的子集既能充分反映用户行为轨迹路线的兴趣偏好,尽可能多的覆盖具体个人推荐服务项目;又能满足用户隐私的保护不被泄露的安全感。通过对移动通信用户数据行为轨迹LBS服务的研究,为智能城市,智能交通理念的推广与探索,为城市区域内用户行为轨迹做规划,推荐选择资源最优化出行交通工具与便捷服务。
参考文献
[1]汤琳,何丰.隐私保护的数据挖掘方法的研究[J].计算机技术与发展,2011,21(4).
[2]何贤芒.隐私保护中k_匿名算法和匿名技术研究_何贤芒[D].复旦大学,2011.