Chenxi
大数据时代的到来使人的身份被数据化,每个人生活的方方面面都以数据的形式存在于互联网上。
我們身处一个怎样的时代?今天你在聊天软件上聊过天的好友,很可能出现在你的Facebook推荐好友列表里,今天你在自媒体发表的一条消息里有和健身相关的器材,很可能就出现在了流媒体推送广告里。如果你觉得,这样的推荐还没有冒犯到你,看看最近几年都发生了什么。2016年,Amazon推出了“未下单先调货计划”,通过挖掘大数据预测用户的下单,提前调货发送至转运中心,缩短配送时间。2017年,美国征信机构Equifax数据泄露,导致几乎全美一半人口的个人信息掌握在黑客手中。2018年,剑桥分析公司非法收集Facebook用户信息。并基于分析结果干预美国大选。
大数据时代的到来使人的身份被数据化,每个人生活的方方面面都以数据的形式存在于互联网上,社会经济生活的方方面面正在以更细粒度的数据形式呈现,进而整个社会的“像素”得到显著的提升,并促进了数字“成像”的发展。在社会活动中,每个人以自组织或者组织的形式参与其中,组织的有机结合形成了可以通过“科学”层面的可能性、程式化和可重复要素的数据算法表达,以及我们越来越倾向于去尝试“量化”的情感、心理和认知等“艺术”层面要素的表达,这些因素都推动着大数据驱动的管理范式走进我们的视野。尽管大数据所涉及的隐私保护边界以及支撑大数据的隐私保护技术的发展中所出现的问题已经在风口浪尖,但对其中至关重要的问题的法律表述和技术支撑仍然要经过漫长的演化和推进。
什么是隐私?在具体的界定中,不同文化或个体可能有不同理解。但对个人或组织来说特殊或敏感的不愿意暴露的数据就是隐私,无疑是可以达成共识的隐私概念。从隐私的类型来看,隐私可划分为:与银行、金融机构相关的财务隐私,与患者患病和治疗相关的医疗隐私,公民在行使投票权利时涉及的政治隐私,使某用户在互联网上暴露该用户自己的信息以及谁能访问这些信息的互联网隐私,以及其他数据和信息的保护。我国的个人信息保护法尚在制定中,个人信息权的划定和保护并没有可实操的法规来保护。而我们很少了解到我们只有QQ号码的使用权,我们更无法想象我们的个人信息数据在“黑市”上如何被批发。这些问题可能涉及大数据资源的重新分配。而这并不是相关法律法规制定推进过程中所面临的唯一问题。
从数据保护技术的角度出发,基于大数据生命周期和大数据架构体系的不同的分类视角,匿名化技术、存储加密技术、访问控制权限设定等技术的发展和应用丰富了大数据信息保护的手段。比如,我们并不希望医院在向疾控中心等研究机构提供疾病预防和决策相关的数据支撑时,泄露病人的隐私,上市公司也并不希望自己发布的财务年报和新产品信息在成为开源信息的时候,因为未经处理而给竞对公司可乘之机。这就要求,在数据挖掘的过程中使用数据失真和数据加密技术来挖掘有价值的模式和规律而避免敏感数据的泄露。而在文章一开始描述的我们正面临的大数据隐私问题,已经暴露了目前的大数据安全防护水平,而对大数据平台的安全监管也对企业和社会提出了更多机制方面的挑战。
我们的时代从来不缺乏新的技术,区块链技术将对去中心化大数据交易过程中产生怎样的影响还没有完全的探索清楚,但区块链技术在解决价值激励、安全信任等方面是个有效方法正在得到证实,为改进数据市场相关问题提供了新的思路。然而不能忽略的是区块链技术中数据拥有者对数据流通权限的确认和数据确权,以及共识机制和智能合约等关键自身技术中存在的问题,使区块链的应用所可能产生的安全问题仍需要进一步探讨。