胡泳+郝亚洲
大数据新闻意味着一种新闻理念的进步。除了获取谈资之外,我们需要更多的干预或者参与的力量。
2013年,我们在创作有关大数据的纪录片时采访了斯坦福大学的多媒体和信息设计专家Geoff McGhee。他曾经是《纽约时报》的记者,后来专注于数据新闻领域的研究。在谈到数据新闻业的时候,McGhee认为,数据新闻相对于传统新闻业来说更能让人主动、精确地去还原故事的现场。McGhee说,“现在普通的媒体要找一个故事,就需要派记者出去打听线索。将来很可能有一组很大的数据挖掘,就从这个里面去找故事。《纽约时报》过去就是很善于记录数据的,比如船只到达的时间、货物量等等。一百多年以后,在你笔下的故事、角色,就是当初被记录的数据。包括《华尔街日报》,也就是把股票数据记下来,通过这些数据就能转化出当时的人物——总统,还有州长。数据新闻要做的事情,就是把数据还原成故事和人物。这个还原过程,就是数据可视化的过程。”
当数据被解读成一个又一个故事,这个还原过程是非常有趣的。以最近央视曝光东莞色情业为例,新闻播出后,一部分网民想到通过“百度迁徙”查询东莞当天的人口迁徙状态,结果显示,从东莞去往香港的人占比最多,于是有人将其视为香港人逃离东莞的佐证。虽然事后有媒体指出这种解读并不靠谱,东莞的人口流动与色情业的关联度并没有那么高,但这并不影响网友在微博、微信上转发和评论的积极性。
公众解读的激情
“百度迁徙”是基于数亿部智能手机的LBS定位服务数据实现的,根据用户地理位置的变化,判断出用户发生的“迁徙行为”,并最终进行直观、动态的可视化展现。究其本质,这是一种数据流。
McGhee认为,数据新闻就是在放大新闻的信息属性,而这个属性的展现形式是数据流。以往,记者使用的摄像机、话筒、笔,都是信息采集和记录工具,但是将这些信息传递出去的过程,是一个封闭的过程。传统新闻制作流程是不允许公众干预或者说参与进来的。也就是说,数据编码和解码的过程,与阅读者无关。
数据新闻的着力点恰恰在此。移动互联终端取代了传统摄像机之类的信息采集终端,每一个人成为数据化单位,个性化的数据记录则由App来完成。个体无意之间变成了新闻的参与者。(注意,这里说的是“无意间”。如果是“有意”的,更会对传统新闻业造成天翻地覆的变革。)
可以展开合理的想象,来对比传统新闻报道和数据新闻的区别。如果央视的记者走传统路数的话,就会是一个出镜女记者站在东莞高速路口做模板式的报道,“我台记者现在XXX做现场报道。昨夜,东莞市政府出动大量警力清查了多处涉黄场所。今天,我们看到在高速路口,出城的车辆明显多于进城的车辆。”然后,女记者举着话筒跑到一个在收费口排队的私家车旁边问,“先生,您什么时候来东莞的,现在要去哪儿?”
央视在这个新的时代自身也在努力寻求突破,比如马年春运和春节期间联合百度推出的“据说春运”、“据说春节”,调用百度的大数据(包括迁徙数据和搜索数据),将其融入新闻内容的策划与创作过程中。作为中国影响最大、受众最广的媒体,央视迈步探索数据新闻,无疑会给其他媒体带来示范效应。不过,探索之路上,旧的思维依然存在。比如当主持人介绍完百度迁徙地图的热点城市之后,马上又回到了老路上。显然,数据新闻目前还只是作为为传统新闻模式服务的新工具,距全新的制作新闻理念仍有距离。
当百度用可视化工具将东莞的人口流量呈现出来时,公众获得的第一个权利就是解读的权利。从微博和各种自媒体账号的讨论来看,公众的解读热情显然被一下子释放了出来。这种数据新闻对于当下中国来说,也许我们还不能将其上升到颠覆了什么、改变了什么的高度,但可以说带来了一种崭新的气象——“新闻谈资化”。
在国内,黄章晋做的“大象公会”被认为是在尝试“新闻谈资化”。所谓新闻谈资,就是充分利用了公众的好奇心,捕捉事实之外的留白。比如“大象公会”做过的为什么主席头会流行、为什么朝鲜阅兵礼最震撼等等。而数据新闻背后的谈资会更多,比如围绕着为何“逃离”东莞的主路线会是香港,还有哪几条清晰可见的线段,就能衍生出大量相关话题。而话题,无疑就是谈资。
数据新闻的灵魂
2013年,一则人事变动的小小新闻并没有引起互联网界很大的反响,但是对于数据新闻业来说,它关乎这个行业的两个巨头。也许,我们在若干年回过头来看这则新闻的时候,会感觉到有权杖交接味道。
2013年4月18日,为《卫报》效力15年之久的老牌记者Simon Rogers在其个人博客上宣布,他跳槽前往Twitter效命。这个人之所以关键,是因为他是《卫报》“Datablog”的发起人,可以说《卫报》在数据新闻领域能在全球走得如此超前,和Rogers的努力分不开。
他的告别博文值得每一位研究新闻业转型的人去拜读。《再见,卫报。你好,Twitter》,简单直白的题目,直接让我们看到了在这位资深编辑眼中,谁才是新闻的未来。
2009年,Rogers在编辑Alan Rusbridger的鼓动下开设了Guardian Datablog。他说,《卫报》在很早就意识到了新闻需要新的形态,也就是“开放新闻”。这些数据应该来源于大众,同样也应该属于大众。
在前文中,我们曾提到“无意”和“有意”的话题。百度迁徙地图,是让公众无意成为了新闻的参与者。而真正的数据新闻,则应该是以开源的理念制作,让公众有意参与。就好像Rogers在接受采访时谈到,“众包”是他们制作数据新闻的主要手段。比如,《卫报》做的对国会议员开销的调查,奥运会门票销售情况的调查等。
事实上,我们在做大数据专题研究的时候也发现,寻求开放才是大数据时代的动力。大数据更像是一场运动的高潮。这场运动发轫于上世纪80年代,以理查德·斯托尔曼、林纳斯·托瓦兹和埃里克·雷蒙德为代表的开源三杰认为知识应该以共同创造和共同享有的姿态出现,而不是被垄断在寡头手中。随后,在著名出版商、Web 2.0之父蒂姆·奥莱理的倡导下,开源运动进入了第二个阶段,即数据开放。
也许今天,我们认为开源是大势所趋,但在互联网还没有出现、甚至是刚刚步入第一个青春期的时候,封闭与开放两大流派曾进行过长时间的激辩。这甚至影响到了美国政府的信息开放政策。
从布什政府以反恐为名,连续出台了两个争议颇多的法案——《爱国者法案》和《2002国土安全法》,到奥巴马提出“人民知道得越多,政府官员才可能更加负责任”;从布什政府时代政府和公众的交流受限,到奥巴马签署《透明和开放的政府》备忘录,美国一直在开放的路上走走停停。
就在奥巴马实践其开放政府理念的同时,一位互联网的传奇人物在英国也实践着他的数据网梦想。他就是万维网的发明者蒂姆·伯纳斯-李。在他的力推之下,英国政府开始了数据开放运动。英国的 data.gov.uk上线后,公众可以在该网站上查到3000多项民生数据。保守党领袖卡梅伦担任英国首相之后,更是提出了“数据权”的概念,即获取数据是每一个英国公民的基本权利。
从IT领域的开源到政府的转型,这是一场长达30多年的以“开放”为灵魂的历史运动,而移动互联网的兴起无疑把这场运动推到了前所未有的高峰,这个高峰被命名为“大数据时代”。
新闻同大多数行业一样,无法摆脱时代思潮对它的影响。在大数据时代的背景下,新闻不仅应该注重对数据的整理和解读,更应该懂得数据源于公众,属于公众。
海地的数据地图被公认为是世界上最完美的数据地图。因为在海地地震期间,大量的公众参与了数据地图的建设,一直到现在还有人在继续完善。作为数据新闻从业者的行动指南,《数据新闻手册》也使用众包的方式完成的。
由于Twitter等新媒体工具的兴起,我们开始变得不再关注新闻本身是什么,而是更加沉浸在作为个体参与其中的乐趣之中。正如Rogers所说,“报纸传统的与读者的单向关系正在被人手一部移动设备、随时产生新闻的新形式所取代。只要我们做新闻工作,Twitter便是一个重要的元素。它在每个涉及政治、体育与娱乐的重大事件中都不可忽视,而且越来越重要”。
与Twitter的数据所发挥的新闻效应一样,百度的大数据新闻意味着一种新闻理念的进步,但仅仅是一个开端。除了获取谈资之外,我们需要更多的干预或者参与的力量。