大数据时代新闻人才培养的若干思考

2014-08-15 00:49潘亚楠
湖北开放大学学报 2014年1期
关键词:可视化信息

潘亚楠

(商丘师范学院 新闻传播学院,河南 商丘 476000)

一、大数据时代已全面到来

从商业到新闻业,从政商领袖到学术精英,大数据的话题正在迅速发酵和传播。究竟什么是大数据(Big Data)?《大数据时代》作者维克托迈尔·舍恩伯格在书中指出,“大数据”并非一个确切的概念。最初,这个概念指需要处理的信息量过大,已经超出了一般电脑在处理数据时所能使用的内存量。因此工程师们必须改进处理数据的工具。而在互联网对数据处理技术发展到今天,“大数据”是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,其主要特点是海量、非结构化和半结构化、实时处理。大数据的本质在于“以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。”[1]而业界通常将大数据归纳为4个“V”:Volume(数据量大),Variety(数据类型多样),Velocity(处理速度快),Value(价值密度低)。

随着互联网的重心逐步向着移动互联转移,各种新型智能移动设备的迅速普及带来海量数据的猛烈爆发。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。2010年,全球数据量达到1.2ZB,2011年中国互联网行业持有数据量达到1.9EB,2011年全球被创建和复制的数据总量为1.8ZB(1.8万亿GB)。每天,微博twitter平均产生1.9亿条微博,社交网站facebook有40亿的信息扩散,视频网站Youtube上传的影片时长为5万小时。[2]

大数据时代的到来给新闻业带来现实而深刻的影响。除了政府、机构、企业等组织发布的数据,媒体、网站所拥有的用户数据、互联网用户自己生产的内容(UGC),都成为记者重要的数据资源。记者需要从这些庞大而碎片化的信息中发现有价值的新闻线索,并进行合理化地阐释和解读。曾长期担任《纽约时报》记者的斯坦福大学教授Geoff于2009—2010年间开始研究数据新闻(Data Journalism)。他指出,现在的新闻越来越多的和数据有关,媒体的责任是如何向公众解释复杂难懂的数据。数据的爆炸式增长使我们需要工具来进行分析,数据可视化专家正在开发工具帮助我们更好地理解和使用数据,记者的工作是运用数据使新闻报道更加有说服力。

二、新闻挖掘与叙事方式的变化

大数据时代的数据显然具有更为广泛而深刻的意义,特别是非结构化数据挖掘的后台与数据可视化的前台呈现,使得数据新闻在互联时代已经成为一种至关重要的新闻挖掘和叙事方式。

(一)深度挖掘新闻。数据不再仅仅是作为新闻语言来呈现事实,而更需要记者对包括非结构化数据在内的海量数据上进行挖掘和深度分析,从而发现隐藏在数据背后的事实与真相。今天的社交媒体已经深深渗透并影响我们的生活。除了传统的采访手段,社交媒体上大量非结构化的数据信息,已经成为挖掘新闻事实不可忽视的工具和阵地。2011年12月英国伦敦爆发的大规模骚乱震惊了世界,媒体需要找出背后的真正动因。英国首相卡梅伦否认贫困因素,而将之归咎于社交媒体的煽动作用。而《卫报》通过对骚乱参与者居住地与英国地区经济状况结合制作动态地图,清晰地展示出暴乱参与者多居住在较为贫穷的街区。此外,研究者对推特信息进行了内容分析,分类编码为:重复、驳斥、质疑、评论,并对数据进行可视化处理,指出了推特在纠正谣言方面发挥了积极作用,而非之前普遍认为的煽动作用。

正如彭兰教授指出的,无论多么优秀的记者,他对于事物的观察都只能是受制于个人的视野与立场,即使是相对深入的,也未必是全面的、充分的。而与记者在某一个视野有限的观察点上对事物进行的观察与分析不同的是,有效加工的大规模数据可以揭示更大范围内的或更接近事实的情状,从而也为报道的深入提供了基础。[3]

(二)数据可视化:更加注重新闻的视觉体验。广义上的“数据可视化”包括数据可视化、信息可视化以及科学可视化等等多个领域的统称。狭义上的数字可视化指的是讲数据用统计图表方式呈现,它涉足制图学、图形绘制设计、计算机视觉、数据采集、统计学、图解技术、数形结合以及动画、立体渲染、用户交互等。精确新闻中常见的饼图、直方图、散点图、柱状图等,是最原始的统计图表,它们也是数据可视化的最基础和常见应用。

作为网络时代至为重要的一种设计表达,数据可视化(Data Viz,data visualization),也称之为“信息图表”(Info graphics),其最大的特点就是融合数据信息与视觉美学元素,将冷冰冰的数据及信息通过丰富的设计语言表达,在信息能够清晰传达的同时注重受众的视觉体验。当然,信息图表本身在互联网时代以前就广泛存在,很多杂志及报刊在传达数据及信息时就曾经有过类似的设计。而在很多编辑软件中,我们也可以轻易产生一些柱状及图饼形的数据展示。但以前的图表着重于数据的可读性,而今天在保证数据的可读性前提下,也着重于数据的可观性。

数据可视化,更加强调呈现方式的美观和易接受度。除了数据,图表本身就是吸引受众阅读的工具。例如,《纽约时报》在总统大选后而制作的动态信息图,根据“摇摆州”投票数描绘出的线条在图片上“摇摆”,颇为直观地表达这些“摇摆州”在历史上是怎么“摇摆”的。网易数读频道在《中国电影票价占人均收入1/57为美国8.5倍》 这篇报道中,编辑在数据可视化的展示中,首先用观影食品爆米花作为视觉焦点,直接点题,然后国旗指代国家,用电影票指代观影次数,对比鲜明,生动清晰地说明了中国电影票价格昂贵的情况。

正如美国北卡罗来纳大学计算机系副教授、著名信息可视化博客EagerEye的作者Robert Kosara所说,饼图之外的东西并不是没有用的。这是一种通过视觉有效传递信息的手段。在可视化中如何配色,如何把信息用最自然最符合人们思维的方式传递给读者是非常重要的一块研究领域。[4]

(三)众包(Crowd sourcing)与分享。分享是互联世界的核心理念,网民不但提供新闻线索,而参与到新闻的制作中来。英国《卫报》数据新闻总编Simon Rogers在介绍《卫报》的数据新闻操作理念时就特别提到,“数据新闻是80%的努力,10%好的创意,10%的产出。”[5]事实上,所有致力于做好数据新闻的媒体,都要花费大量的人力物力和时间来筹建数据库资源。Rogers表示,“我们花费大量的时间建立数据库,做成PDF文件,并重组数据。在向读者呈现数据之前我们做了大量工作。我们搭建起来数据和试图理解这个世界人们之间的桥梁。”[6]而在数据库的筹建过程中,从政府、商业机构到普通的网民都参与进来。越来越多的国家开始建立自己的数据门户,以促进公众和商业机构对政府信息的重新利用,诸如美国政府的 data.gov和英国政府的data.gov.uk、datacatalogs.org提供了此类数据的全球最新索引。英国《卫报》的全球政府数据是一个元搜索引擎,包含许多国家的政府数据分类目录。此外,大量免费数据可视化工具如scraperwiki、Datacouch等,使得普通网民就可以利用元数据制作自己的新闻图表。

三、数据新闻人才匮乏及培养缺失

大数据时代的到来已经正在深刻地影响着传媒生态。面对新媒体的冲击,传统媒体需要在深度新闻的挖掘和可视化呈现两个方向同时发力。彭兰教授指出,“未来越来越多的深度报道将是数据驱动的,是基于大型数据的挖掘与分析实现的对新闻事实的深度揭示与解析。这无论是对于只习惯文字、图像等思维的传统新闻人,还是只习惯于数据思维的技术人,这都会是新的挑战。进行跨学科的人才培养,是未来的必然。”[7]

华中科技大学新闻与信息传播学院教授、院长吴廷俊曾在谈到新闻“复合人才”的能力培养时特别强调,“既有深厚的人文功底、扎实的传播理论基础,又具有现代传播技能”。美国学者大卫·卡拉特尔也认为,“高校新闻教育必须让学生掌握专门技术和关键语言技巧”。[8]对于当下的“现代传播技能”和“技术语言技巧”来说,无疑就是大数据带来的新闻挖掘和叙事方式的变革。培养能够利用大数据深度挖掘新闻、并利用可视化制作工具呈现新闻的跨学科人才已经变得十分急迫。但对于大多数新闻院校来说,普遍缺乏相关课程的设置,甚至在新闻采写课程中数据新闻的教授也没有被给予重新的定义和重视。而缺乏能够胜任此类课程的教师,也是数据新闻教育迟滞的重要原因。借鉴目前国外的一些做法和经验,笔者认为目前可以从以下几个方面着手:

首先,提高学生用“数据”讲故事的能力。在传统的新闻采访与写作课程中,应大幅提高过去作为“边角料”的数据新闻授课内容。通过丰富的案例教学,帮助学生深刻认识到数据在网络传播时代至关重要的地位,并鼓励学生利用利用互联网上如政府公开的大量元数据主动练习制作数据新闻,通过社交媒体发布和传播,提高其学习成就感。

其次,促进新闻专业与计算机专业教师的紧密合作。目前国内很多学校已经开设了包括网页制作、数据可视化、Photoshop等课程,但这些课程往往由完全不懂新闻的计算机专业教师讲授,使得技术和新闻实践脱节。学生掌握了技术,却仍然不懂如何为新闻写作所用。在美国,许多新闻院校早在上个世纪末就开设了数据新闻(Data Journalism)、计算机辅助新闻(CAJ,computer assistant journalism)等融合计算机技术与新闻写作的课程,往往由具备此类工作经验的教师教授。建议我们在开设诸如数据新闻写作、数据可视化这样的课程时,应由新闻专业教师和计算机教师共同完成,使得学生在掌握技术“武器”的基础上,真正知道如何利用数据工具去挖掘和呈现新闻。此外,这类课程不应仅仅针对网络传播专业的学生,应成为新闻传播学专业学生的基础课程,在大一或大二时开设。

同时,培养储备熟练掌握大数据新闻制作和表达的青年教师。快速变化的新闻实践经常走在理论之前,目前在国外如火如荼的数据新闻实践也是业界自发形成的。媒体的记者和编辑自发地形成各类学习小组,学习和交流最新的新闻挖掘和制作工具。国内不少网络媒体如网易的《数读》、腾讯的《大数据》以及传统媒体都已经开始积极探索数据新闻的实践方式,应鼓励高校教师参与到这种探索和学习中去。

[1]维克托迈尔-施恩伯格,肯尼思·库克耶. 大数据时代[M]. 杭州:浙江人民出版社,2013.

[2]百度百科“大数据”[EB/OL]. http://baike.baidu.com/view/6954 399.htm

[3][7]彭兰. 大数据时代:新闻业面临的新震荡[J]. 编辑之友,2013,(1).

[4]视物致知. 统计图和信息可视化之争[EB/OL].http://www.civn.cn/p/3859.html.

[5][6]Data Journalism Handbook[EB/OL]. http://www.datajournalism handbook.org/1.0/en/.

[8]田华,李志. 高校新闻教育如何培养特色人才[J]. 青年记者,2006,(4).

猜你喜欢
可视化信息
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
思维可视化
自然资源可视化决策系统
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
订阅信息
展会信息
信息
健康信息