□ 文/贺俊浩 林 沛
在今年两会报道中,媒体在数据挖掘、数据分析以及数据呈现方面进行了一系列探索和创新,取得了良好的传播效果。本文尝试对媒体在两会报道中运用大数据技术做法的类型进行盘点,并尝试对其运用趋势和方向进行总结。
“关于两会,网友们最想知道什么?哪些两会话题最受网友关注?如何从浩如烟海的数据中读出中国民众对改革的期待?”,针对2014年召开的全国两会,人民网·中国共产党新闻网联合百度知道,共同推出系列大数据解析——数读时代,“据”说两会。报道主要特点是密切追踪网民对两会热点的关注轨迹,并辅以多种示意图,信息呈现多元且一目了然。
报道大致分为三部分:分别是每日热搜,实时呈现网友关切问题;分地区呈现地方网友最关心的热点话题,展示地域差异;具体问题的解剖和细化,这一部分共有六期内容,分别是全国、改革、民生、政府、反腐和两高,每一部分内容都有“网友关注度最高的问题”“哪些地方最关心这个问题”等分类,例如在改革这一部分中,共下分四部分内容,分别是“经济体制、社会体制改革关注度超50%”“网友最关注高考、公务员、公积金改革”“广东网友最关注改革 专家称居民心态更实际”“还有19岁至30岁这一年龄段的人更关注改革”,这四块内容都配上了相应的图表,显得可信性更强。
新华社在两会报道中也广泛运用了大数据技术,并在对网民关注热点追踪呈现的基础上,拓展报道深度和广度,主要手段是引入背景介绍和对代表委员的采访,恰如其分地将社会热点与两会议题连接起来。例如一篇名为《大数据揭示网友军费关切 代表委员解读军费增长》的报道中,其主要方式就是“针对大数据方法从社交媒体中提取的关键词,军队人大代表、政协委员就中国军费增长进行解读。”其中这些关键词是来自2013年7月1日至2014年1月31日期间腾讯、新浪提及“军费”或“国防费”的51964条微博。
整篇报道按照关键词来进行分类,共有三个部分,分别是:微博关键词一:重要、安全——“不适当增加国防投入,怎能有效维护国家主权、安全和领土完整”;微博关键词二:美国、日本、中国——“中国国防费刚进入协调发展时期,与世界主要大国相比仍低”;微博关键词三:颐和园、北洋水师——“牢记甲午战争历史教训,切实把每一分钱用到战斗力建设的刀刃上”。每一部分又包括三小部分,分别是大数据、背景以及代表委员的解读,在第一部分对重要、安全关键词的分析中,“大数据”部分主要是呈现数字并做简单介绍,“网友讨论‘军费’或‘国防费’时用到的形容词里,名列前两位的“重要”和“安全”两个词出现频率分别为1352和1116,总数占全部微博的4.75%”,然后在背景部分中,引入十八大报告中有关军费和国防费的文件内容,让报道权威充分,继而采访了相关委员,分别对军费用在哪和为什么增长进行解释。
此次两会,央视扩展大数据的运用范围,在“两会直播报道”“两会解码”中,引用百度指数数据,并根据每一期主题,在虚拟演播室中让主持人和屏幕上的数据图谱互动,摒弃了原本播音员单纯播报的方式,看起来更加生动活泼。3月3日“新闻联播”两会报道开篇即言“我们首次运用大数据的分析方式,从不同视角看两会”,对全球关注两会的情况进行分析报道。随后场景转向欧阳夏丹所在的虚拟演播室,在主持人旁边有个地图,随着主持人播报内容的推进,地图上的数字不停变动,随后还会更新不同类型图表,主持人通过生动活泼的语言风格、轻松自如的互动方式,让受众通过数字更清晰地看到而不仅仅是听到丰富的信息内容,从而有更完善的视听觉体验。再如3月8日《两会解码》中,对全球关注政府工作报告的情况进行了分析,从哪些国家关注到关注的具体内容是什么,再到全球关注者怎样评价新一届中国政府的施政纲领,内容层次分明、体系完善,对于全球关注中国等相关问题的呈现也足够全面,利于观众理解。
网络媒体在今年利用大数据方面,所体现出来的贴近性、客观性、全面性也值得一提。其中百度知道策划的“从百度知道看两会热点”的系列报道被广泛转发,其中不乏主流媒体网站。
策划报道关注点大多是民生问题,例如“2014中国‘房’事”“2014史上更难就业年”“工资这点事儿”“中国人生育面面观”“舌尖上的食品安全”等,它利用百度知道丰富的数据,将网友对具体问题的看法意见呈现出来,以此来做深入分析的引子,使报道系统全面。如“中国人生育面面观”报道就是对“单独二孩”政策出台以后,中国人生育观点的盘点和梳理,整个报道分为三部分,分别是“有些人怀上了不想要——在不想要孩子问题上的纠结,男女各不同”“有些人想要却怀不上——生育压力催生代孕等灰色产业”“有些人还想要第二个——最为关注人群为发达地区、30-39岁的人群”,每个问题的分析都是图表+文字的模式,把网友们对生育问题的观点进行呈现,从而让更多人全面了解这个问题在中国的现状。在此基础上,百度知道还试图还原这一人群深层次的动因,如“有些人怀上了不想要”这部分中,报道首先呈现了网友不想要的原因之一:“和男朋友交往6年了,怀孕了,本来应该是件高兴的事,可是男朋友却不要孩子,我让家里人给他做工作,可是他还是坚决说不要。不知道怎么会是这样,每天在一起上班,却不会说话,很难受。我已经拿掉过2次了,现在年龄也合适了,为什么就不要啦!”然后在此基础上提供原因分析,包括“实在负担不起”“条件还不成熟”“没钱就不要小孩”等,然后以直观的图表来进行呈现,一目了然。
背景资料
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,其主要特点是四个“V”:Volume(数据量大),Variety(数据类型多样),Velocity(处理速度快)、Value(价值密度低)。随着技术的发展,大数据逐渐广泛运用于新闻报道。
传统主流媒体和网络媒体在对两会的报道中,主动和数据公司合作,在数据挖掘、分析和呈现方面进行了探索与创新。大数据意味着多样化的数据来源、巨大的数据量、快速的处理,这对传统报道的形式和深度都有拓展。通过上面对各种运用类型的盘点梳理,可以看到两会中利用大数据创新报道有以下若干方向:
其一,媒体间数据的共享力度加大,并重视数据挖掘与整合的合作。舍恩伯格和库克耶在《大数据时代》一书中,将大数据带来的思维变革总结为三点:一是总体样本取代随机样本,二是对不精确的容忍度增加,三是相关关系取代因果关系。其中第一条可以看出大数据对样本数据量的要求是巨大的,并且在先进技术的基础上提高了总体样本的分析能力,脱离之前随机样本的有限性,而加大对数据量挖掘的扩展。央视与亿赞普公司、百度公司合作,新华社与武汉大学互联网科学研究中心等合作,人民网和百度、360搜索进行合作,百度知道也对自身丰富的数据进行了分析,拓展了网络媒体报道的深度。可以看出,主流媒体与数据公司、网络媒体等的联姻已成趋势,不仅形成互补促进了资源的利用效率,更加大了对创新可能性的探索。
其二,不仅限于对搜索数据的呈现,还通过采访解读增强报道的可信性和权威性。通过对网络搜索痕迹的挖掘来获得数据,然后以不同的标准对数据进行分析整合,例如以年龄、地域、性别等,再通过示意图将结论呈现,这是大数据与新闻报道结合的第一个层次,解决了“网友在看什么”的问题。但一篇完整的新闻报道不仅包括呈现既定的事实,还有通过背景介绍、采访专家学者等来对事实进行分析与解读,新华社在《大数据揭示网友军费关切 代表委员解读军费增长》这篇报道中就以此来解答了“网友为什么看”以及“权威专家怎么看”的问题,从而使报道厚重充实,权威可信,另外在“从百度知道看两会热点”这一报道中,也引入了编辑对相关现象原因的分析。
未来的新闻媒体将共同博弈,利用大数据进行形式和内容的探索与创新,对于增强报道的全面性和深入性都有裨益。但须知“大数据时代不仅意味着机会与挑战,也会意味着更多的风险与新的外部制约力量”,所以如何进一步提高大数据运用的有效性,应是未来媒体重点探索的问题。