对数据的新思考势在必行

2019-04-11 02:00
第一财经 2019年1期
关键词:算法

一個常听到的说法是,“数据是新时代的石油。”与那些来自地下的黑色黏稠物质一样,所有这些1和0在被加工成某种更有价值的东西之前无甚用处。而那个有价值的东西便是你。

全球市值最高的10家公司中有7家是技术公司。苹果靠销售昂贵的小设备赚钱,微软就软件和服务向企业收费,其余5家的立身之本都是将数据和人关联在一起。Google和Facebook希望尽可能多地掌握用户的兴趣、活动、朋友和家人方面的数据。亚马逊对用户过往的消费行为一清二楚。腾讯和阿里巴巴充当了数亿中国人的数字钱包,两者都足够了解用户,并据此提供被广泛使用的信用评分系统。技术公司开疆拓土,其他各方也紧随其后。各行各业的消费品牌都在收集客户数据,用以改进设计、宣传产品及服务。政府仔细观察了这些企业的变化后,也建立起自己的系统来收集公民信息。印度总理莫迪称自己是受Facebook的启发,印度居民身份系统Aadhaar的覆盖范围不断扩大就是明证。13亿印度人若要使用你能想到的任何政府服务,几乎都要依靠这个系统。

个人也越来越清楚数据的价值,尤其是因为个人信息如此频繁地遭到黑客攻击、被泄露或窃取。事实证明印度的数据库容易受到骗子的攻击和政府的滥用。2018年,Facebook大部分时间都在应付多起泄密带来的声誉损失,最出名的一起就是咨询公司剑桥分析事件。仅在2018年就有以下这些家喻户晓的公司发生了一定程度的数据泄露:Google、万豪、达美航空、英国航空、国泰航空、百思买、西尔斯、萨克斯第五大道,甚至还有美国最大的面包连锁店Panera Bread。这些事件已经颠覆了公众之前对数据收集的理解。人们开始注意到自己正在拱手送出所有数据。

然而却很少有人改变自己的网上行为、抵制窥探个人隐私的技术公司,或行使自己微乎其微的数字权利。这在一定程度上是因为自我管理数据既耗时又复杂,即使对内行人也不例外。但同时也是因为人们对其中的利害存在误解。“数据”是个既专业又无形的抽象概念。而身份的概念则要实实在在得多。只有当“数据”被理解为代表着“人”时,个人才会要求那些企图掌握他们信息的公司承担责任。

这种责任远远不止保证个人信用卡信息安全那么简单。在信息时代,数据被用来决定人们可以获得什么层级的服务。Uber的评分决定谁能打到出租车;Airbnb的评论决定了你可以租到什么样的房屋;婚介App的算法为你选择潜在的生活伴侣。公司利用位置数据和支付记录向你销售产品。你的在线搜索记录可能会决定你购买商品的价格。那些芝麻信用分(由阿里巴巴的子公司管理)较高的人可以享受折扣和押金减免,反之则鲜有享受优惠。

如果这些技术为国家所用,构成的威胁则更大。能够识别数据模式的算法可以准确挑出异见人士,甚至是持非传统观点的人。2012年,Facebook开展了利用数据操纵情绪的试验。2016年,俄罗斯利用数据来影响美国总统大选。因此,问题并不是有没有人在做坏事,而是会不会让这些人有机可乘。

历史行为就像化石燃料,为未来的经济和社会结果添柴加火。隐私规则、数据保护法规以及有关算法使用的新法律在保护个人权利方面至关重要。但要确保新信息时代的公平,首先要明白,有价值的不是数据,而是你自己。

此文原标题为《吾即数据》(Les stats, cest moi)选自《经济学人·商论》2019年1月刊,版权属经济学人集团所有,未经授权不得转载。如需转载,请联系globalbusinessreview@ economist.com

猜你喜欢
算法
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
基于CC2530的改进TPSN算法
基于BCH和HOG的Mean Shift跟踪算法
基于增强随机搜索的OECI-ELM算法
一种改进的整周模糊度去相关算法
一种抗CPS控制层欺骗攻击的算法
Wiener核的快速提取算法
带跳的非线性随机延迟微分方程的Split-step算法