匡文波:大数据热的冷思考

2015-01-07 06:38匡文波
中国传媒科技 2015年7期
关键词:文波信息

文|匡文波

匡文波:大数据热的冷思考

文|匡文波

编者按:大数据时代新闻表达形式会发生哪些改变?新闻学教育体系会做出哪些相应改变?数据新闻的兴起会给传统媒体的新闻采编人员带来哪些挑战和机遇?6月27日至28日,“大数据与全球传播变革”国际学术研讨会在河北大学召开,来自中国人民大学新闻学院博士生导师匡文波、河北大学新闻传播学院教授陶丹等专家各抒己见,共商数据新闻引发的数据思考。

匡文波:中国人民大学新闻学院教授、博士生导师。

大数据本是一个技术词汇,但是却成为了社会热点名词。在这个大数据爆炸的时代,数据分析似乎无所不能,从商业、体育、医疗到军事领域,大数据分析都在大显身手。但是,大数据不是万能的;而且大数据是把“双刃剑”,国家和企业因大数据获益的同时,个人隐私的保护却从此变得更加艰难。

1 大数据非万能的上帝

大数据技术给作战指挥带来新的机遇,但若认为“有数据就够了,数据会说话”则是片面的。大数据的价值应该被认同,但不应被夸大,看到优势一面的同时也要看到劣势一面。一句话,大数据不是万能的,如果我们盲从大数据,就容易产生“大错误”,出现大问题。

首先是结果不确定。数据量的大幅增加会造成结果的不准确,来源不同的各种信息混杂在一起会加大数据的混乱程度,导致出现错误发现的风险增加。

其次是逻辑无规律。大数据能够提高指挥效率、加快获取情报、加速信息处理,然而数据量的增大会带来规律的丧失和严重失真。据运行过程中不同的数据会相互融合,发生变异得到新的数据,以至于很难发现事件背后的规律。

第三,大数据是对过去已发生的事件进行经验总结,本身不具备创新性。数据偏爱潮流,忽视杰作。当大量个体对某种文化产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。

第四,数据不懂社交。人的大脑懂得社会认知。计算机数据分析擅长的是测量社会交往的“量”而非“质”。大数据不可能捕捉到你心底对于那些一年才见2次的儿时玩伴的感情,更不必说但丁对于仅有两面之缘的贝阿特丽斯的感情了。因此,在社交关系的决策中,不要愚蠢到放弃头脑中那台充满魔力的机器,而去相信你办工作上的那台机器。

第五,数据不懂背景。人类的决策不是离散的事件,而是镶嵌在时间序列和背景之中的。经过数百万年的演化,人脑已经变得善于处理这样的现实。数据分析则不懂得如何叙事,也不懂得思维的浮现过程。人们的决定并不是仅仅基于离散的事件的,它往往是基于前后关联的情景的。而大数据分析则很难分析清楚就算最简单的小说里的线索和各种前后关系。

第六,大数据产生过多的发现,并产生虚假的关联,会引导我们作出错误的结论。

2 大数据时代给个人隐私保护带来了前所未有的挑战

数据时代给个人隐私保护带来的挑战主要表现在:

2.1 窥视与监视

洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生;谷歌流感趋势利用搜索关键词预测禽流感的散布。而商家利用这些数据,可以对消费者的喜好进行判断,预估用户的需求,从而提供一些比较独特的个性化服务。这一块的应用,还包括百度利用搜索记录进行推荐,包括逐渐完善的Google Now。

但是在这些人性化的背后,是令人战栗的隐私安全。你在互联网上分享出来的各种信息,很有可能会在明天成为黑客攻击你的最后一根稻草。如果这些数据都是某个人产生的,而不法分子的目的也是针对这个人的,那这个人的过去以及未来,近乎是“全裸”在别人面前,这样的结果你想要吗?而会有什么样的结果你能预料到吗?是的,我相信上段时间好莱坞女明星私密照泄露事件,不仅仅是苹果的问题,也还有那些女明星自己对互联网隐私保护不力的原因。

2.2 隐私信息披露与未经许可的商业利用

大数据带来的不仅是各种便利及机会,同样也会让我们时刻都暴露在“第三只眼”之下。

在荷兰,许多使用“TomTom”牌导航仪的司机发现,生产商将导航仪记录下来的数据信息打包卖给了荷兰政府,警察根据数据显示的司机驾驶习惯,在那些最可能“创收”的地方设置了限速“陷阱”,不少司机都因此“中招”。此事被曝光后,TomTom公司的CEO公开道歉。

淘宝、京东、亚马逊网站监视我们的购物习惯,百度、谷歌监视着我们的网页浏览习惯,而微博窃取着我们的社交关系网。在各种机构搜集数据的同时,普通人的各种私人信息也会成为被收集的数据。在哪里使用了购物卡、租用汽车等等,这些信息都会被收集起来。

这些私人信息被收集起来后会供给谁使用?会继续保持匿名,还是在使用后被删除?曾经有公司宣布要通过“脸谱”、推特和其他社交网站收集的信息分析个人的贷款信誉,结果引发了民众的抗议,这个计划最终被取消。

当大数据应用软件细化和明确到每个人的数据时,企业就可以针对每个人的喜好来进行非常具体的营销。例如,如果某人在社交网站上表示自己喜欢某个品牌某个款式的牛仔裤,那么百货商店就可以在此人下一次进入该品牌专柜时向他的手机发送该款式的优惠券。也许零售商和部分消费者会喜欢这种促销模式,但是其中涉及的隐私泄露也是非常可怕的。

许多公司都会标明收集的信息是“匿名”的,但信息越多,被对号入座的可能性就越大。

2.3 歧视

个人健康信息等隐私的泄露,会导致歧视的发生。

大数据是好的时代,也是坏的时代:如果免费检测基因的公司拿到了个人的健康隐私数据,就能精准地推销医药产品,建立点对点的商业模式,这对公司是一个黄金时代。但如果大数据被污染了,也就是说,数据被人为操纵或注入虚假信息,据此作出的判断就会误导人们。

2.4 隐私信息的恶意使用

隐私信息的泄露,会导致诈骗频发。个人隐私泄露的频繁发生威胁到个人的生活安全,成为影响社会治安的主要因素,如:电信诈骗、个人或交友圈信息泄露后的身份冒充、购物信息泄露后冒充卖家诈骗。隐私信息的泄露,最典型的案例就是人肉搜索。

3 从隐私保护的角度看:手机是最危险的智能终端

今日的手机,绝非移动电话,而是手机是具有通信功能的迷你型电脑。由于手机24小时不离身,已经成为了隐私泄露最危险的智能终端。

2014年夏天,小米智能手机被曝搜集并向其服务器传输用户个人信息事件被炒得沸沸扬扬。此事一出,立即在博客圈引发热烈讨论。几番升级之后,此事似乎淡出了人们的视线。现在,台湾“国家通讯传播委员会”又把此事带回公众视野。该委员会8日称,小米智能手机或仍在不知不觉中向其服务器传送用户数据。

今日的手机,不仅成为了偷拍利器,而且手机暴露用户的位置信息。科技日报2015年5月7日报道,美国科研人员日前开发出一种具备厘米级精度的定位系统。该系统基于GPS信号,用较低的成本就能将手机等移动设备的定位精度提高上百倍,将误差的尺寸从汽车一般大缩小到硬币一样小。这一技术为人们日常生活带来更多便利,如厘米级精度的GPS可能会导致更好的车联网技术,让车与车交流发生革命性的变化。如果你的车能够知道盲点处来车的精确位置和速度,就能提前反应,避免碰撞。但是,手机精确定位技术也是个人位置信息等隐私信息保护的噩梦。

苹果今年发布了可穿戴设备Apple Watch,它的发布很有可能将各种大大小小的可穿戴设备普及开来。这种普及是好事,因为它能够给用户带来各种便利,但它健康状况记录、运动追踪(GPS)等功能则给互联网隐私带来了更大、更多的挑战。可穿戴设备由于体积小,所以语音就成了这些设备最主要的交互方式,这也就使得一些设备会记录用户的声纹数据。但如果声纹隐私无法得到保护,现在的声音合成软件又到处都是,那么肯定会有不法分子利用你的声音去诈骗。试想下,如果有亲友在QQ上向你借钱,你的第一反应肯定是通话验证下是否真假,如果不法分子用声纹信息合成的声音,这时你还能辨别得了?

这还不是最致命的,最致命的是你的喜怒哀也尽被人掌控。除了家人、医生和竞争对手,还有谁会关心我们的心率是否正常?但请别忽视这个问题。一旦将心跳数据与其它数据相结合,所能泄露的秘密远远超出我们的想象。试想,攻击者可以实时听到我们的语音,并能实时了解我们的心跳,那么我们就会像在《尼基塔》中被阿曼达用专业仪器测谎的艾丽克斯一样。区别在于,攻击者躲在暗处,而我们对这种“测谎”毫无戒备。结合智能手环的心跳数据和智能眼镜的实时影像,攻击者可能比我们自己更了解我们的真实情感——喜怒哀乐等。我们这个时代,强调云、强调大数据,我们的这些健康数据虽然是记录在自己的设备上,但最终多多少少会被上传到云中。如果有权限查看你数据的人别有用心,那么他只要记下与你谈话的时间再结合这些数据,你在生活中就有时刻被监视的可能性。

除了这些外,可穿戴设备上的GPS传感器也是种威胁,它泄露了用户个体的行踪,让你无处可藏。

笔者并不是要批评大数据不是一种伟大的工具。只是,和任何一种工具一样,大数据有拿手强项,也有不擅长的领域。

猜你喜欢
文波信息
一群“蟑螂”
武术研究是什么
GROUND STATES FOR FRACTIONAL SCHR¨ODINGER EQUATIONS WITH ELECTROMAGNETIC FIELDS AND CRITICAL GROWTH∗
基于组合特征的航母目标识别方法
订阅信息
展会信息
欢欢的游乐场
迷路的稻草人
信息
健康信息