【摘要】数据新闻生产新实践日新月异,数据新闻领域出现了不断加速的生产实践和生产理念之间的裂痕,由此引发了伦理道德乃至社会法律等层面的诸多问题。本文从社会建构论的视角,首次提出了数据现实的基本概念,并从数据现实层、实践操作层和新闻功能层三个层面建构数据新闻生产的基本现实。
【关键词】社会建构;数据新闻;大数据
大数据概念在新闻传播领域日渐盛行,国内外的新闻媒体争先恐后设立数据新闻生产部门或者数据新闻研究的实验室;追本溯源,数据新闻的理念与20世纪70年代的精确新闻存在异曲同工之处。国外数据分析在新闻业的实践要追溯到1967年,美国(底特律自由报》使用计算机技术对居民进行调查,研究分析底特律黑人暴乱事件。
数据新闻并非进入21世纪之后才进入新闻生产的视野,至少从理念到实践都能在新闻史的发展中找到雏形或者先验的实践行为,不过当前计算机技术的发展以及大数据概念的兴起的确极大地推动了这一轮数据新闻的盛行,特别是计算机编程技术比如python等深度进入新闻编辑室,在很大程度上已经打破了学科发展的边界。当前数据新闻的特点之一就是跨学科、跨技术和跨行业,从这个意义上来看对于传统新闻行业的确是具有“破坏性创新”的意义。但是问题也随之产生。首要问题就是包括社会学科、计算机学科等在内的多学科对于数据新闻产生越来越重要的影响,扎根于诸多学科的研究方法根植于数据新闻生产方式之中。因此,数据新闻既要接受跨学科的新理念以打破传统新闻的局限,同时又要坚守新闻生产本身的规范。目前国内对于数据新闻的研究普遍倾向于进行个案研究或者实务操作层面的讨论,欠缺对数据新闻理念的建构。数据新闻包含数据挖掘和数据呈现两个重要阶段,本身就是一种建立在知识经验基础上的建构行为。本文将追溯社会建构主义以及新闻建构论的理论基点,建立了数据现实的基本概念,从社会建构主义的角度对于数据现实、数据新闻生产和功能性三个层次进行建构。
对新闻建构论影响最深的是社会建构论的理念,因此关注新闻建构论首先要将社会建构论作为基础。“社会建构”的名称被认为来源于伯格和卢克曼的著作《现实的社会建构》。媒介社会学中的建构论认为,媒介传播对社会实在并不是被动地反映,而是主动参与建构的过程;从媒介传播的角度来看,建构论关注的是媒介如何反映了社会实在,以及社会实在为何要被如此反映。早期的媒介社会学认为,新闻是对客观实在的反映,这种理念反映在方法论层面就是客观、定量地研究新闻是如何反映的客观实在,而“社会建构论”潮流的兴起改变了这一传承的范式。
一、数据新闻领域的主体间性与“手头库存知识”
现象学社会学不仅仅是一个学术流派,也是一套完整的世界观。舒茨的现象学社会学正是社会建构的本源,在舒茨的基础上,伯格和卢克曼才提出了“社会建构”的概念。在舒茨的思想体系中,“日常生活世界”这个概念起到了至关重要的作用,他用来指称具有主体间性的社会,这正是社会学范畴的基础和发生场所。川在这个世界中,最典型的特征是具有主体间性,日常生活是一个文化事件,是一种意义结构。‘旧常生活世界”是一个由他者经验与解释的世界,只有在他者在场的情况下才是可能的。舒茨认为社会世界是一个多元主体的世界,是一个多元主体基于语言为主的符号系统而进行相互理解的世界;在这个世界中,历史、现在、未来这样的时间维度都转化为众多主体的经验沉积,经验沉积以零碎的方式组织、呈现,从而将世界连接为一个整体。[2]
既然‘旧常生活世界”是建立在沉积经验基础之上的主体间性世界,那么主体之间如何才能够实现相互理解呢,舒茨扩展了超验现象学中“经验”的内涵,他认为被感知到的感性材料的相互叠加,以及他们与符号等意义系统相互作用以及结果,都属于经验。舒茨将这种“无内在意义”的经验沉积和存储称为“手头库存知识”。现象学社会学认为,“手头库存知识”是一种基于自身的直接经验与所获得的间接经验所形成的、影响当下认知内容的复杂观念体系(the stock of knowledge)。他认为人类之间的相互理解必须要依赖符号和语言,并在此基础上形成模糊的、不断变动的、多维度的共识。
基于以上分析,围绕舒茨的‘旧常生活世界”所进行的社会建构是需要众多社会行动者共同参与的,这些参与者可能处于共时或者历时的时空范围之中;广泛的系统知识为其提供了见识的“库存知识”基础,脱离了日常生活世界、广泛的知识基础和主体间性这三点都无法实现随意的社会建构。这样也预示着具备了上述条件的大数据在社会建构中可能会发挥着极大的作用。
数据新闻的建构也无法脱离日常世界、手头库存知识和主体间性这三点社会建构的基础。数据新闻生产实际上是数据新闻建构的过程,生产所需要的结构化数据或者非,结构化数据是存在于日常生活世界的具体对象,而基于计算机学科和社会学科的技术手段和科学研究理念贯穿数据新闻始终,作为数据新闻消息源的数据包括结构化数据和非结构化数据,数据本身也是数据生产者对于日常生活世界的建构,充分依赖数据生产者的知识基础作为支撑,从这个角度来看,數据新闻生产是仍然离不开舒茨提出的社会建构理念,而且是对建构的建构。
数据新闻生产是主体间性在日常生活世界发挥作用的过程。新闻追求客观性,恰恰说明新闻生产层面仍然无法摆脱主观性的影响,数据新闻从学科分类上属于新闻学,自然而然也继承了新闻对于客观性的追求,并将其作为重要的准则和规范。从社会建构的角度分析,主体间性的存在是日常生活世界的常态,数据新闻建构的正是意义的世界,而且数据新闻最终在日常生活世界所接受和消费,建构的意义被日常生活世界所接受的过程也是主体间性发挥作用的过程。
二、数据现实层:大规模数据与非结构化数据
在大数据时代,认识数据现实的首要问题是区分数据和大数据,这既是数据现实的客观存在,也是数据新闻操作层面的现实需要。无论是业界还是学界,当前都存在数据新闻大数据化的误区。所谓数据现实,指的是数据新闻所关注的社会存在,是由多元主体基于语言符号而相互理解的主体间性世界。数据现实是数据新闻的基础,基于数据的新闻和基于大数据的新闻在实际操作层面存在着方法论上的巨大差异。建构大数据时代的数据新闻,有必要首先明确所面对的数据现实。
进入大数据时代,数据现实的质和量两方面都实现了巨大的发展。2006年,个人用户的数据量刚刚进入TB时代,到了2010年底,全球数据量已经达到了1.14ZB,预计到2020年全球电子设备存储的数据量会达到35ZB。正是在这个基础上,谈数据新闻似乎无形之中离不开大数据的影响,特别是计算机学科的介入、分布式数据挖掘技术的普及,让大数据的挖掘也能够进入新闻编辑室。
根据对2013年到2018年全球数据新闻奖获奖作品的分析,可以发现30个样本中,数据行数能够达到百万级以上的只有3个,22个样本的数据行数在千级和万级,[3]这样的数据样本量只能够归类于数据体量比较大;如果以大数据称之,显然不符合当前业界对于大数据定义所达成的共识。
数据现实基本面包括常规的大规模数据样本和大数据样本。大规模数据样本和大数据样本是两个相对而言的概念,目前的共识是数据量在TB字节以上的方可称为大数据。以数据挖掘为例,尽管分布式挖掘能够有效地处理大数据,但是时间长效率并不高;大多数新闻编辑室又对于新闻的时效性具有比较高的要求,因此更多的记者倾向于技术难度较小但是效率明显更高的小数据样本。另外,即便能够借助于计算机技术实现大数据的分布式挖掘,目前的社会学知识更多的是局限于小数据样本的分析;也就是说尽管样本量巨大,可是很有可能是在有限的类目之内无限地增加样本行数,这样的结果是大数据的准确性因为类目的局限性并没有比小样本数据具有明显的优势。
数据现实的第二个层面包含着结构化数据和非结构化数据,具体而言包括数据再结构化和数据结构化两个不同的生产过程。结构化数据的典型代表是行业部门发布的统计数据,结构化数据往往具有完善的类目和详细的统计数字。非结构化数据则与之形成鲜明的对比,非结构化数据往往需要新闻生产者从大数据样本中挖掘和编码,从而将非结构化数据结构化,结构化之后的非结构化数据才能够被生产者直接使用。以社交媒体上的用户数据为例,一部分数据是包含在设计媒体后台的数据库中,但是最终前端呈现出来的是非结构化数据,生产者需要将挖掘到的数据建立在新的数据库中,经历了结构化数据到非结构化数据再到结构化数据的过程,本文将这种过程称之为数据再结构化。除此之外的大部分数据都属于非结构化数据,不存在结构化到非结构化的第一个过程,因此可以成为数据结构化。
综上所述,数据现实改变的是新闻生产中的消息来源和生产模式等核心环节。从社会建构的角度来看,目前数据新闻中大规模数据和大数据之争,实际上反映出来的是数据新闻生产过程中为了实现主体间性而不得不因为库存知识不足而以大规模数据为主角的客观现实;数据结构化和数据再结构化反映出来的是数据新闻生产与传统新闻生产的革命性变化,两者共同建构了数据新闻生产的基本数据现实。
三、实践操作层:数据新闻学科的建构
基于数据现实的客观情况,数据新闻生产环节综合了计算机学科、数学学科、社会学科和新闻学科等不同学科的知识,但是在数据新闻教育方面,国内外大多数课程都是由新闻学院提供的,教育和生产环节的不一致反映出来的实际上是数据新闻的学科之争;因为计算机学科和数学学科天然的学科属性问题,目前参与学科之争最激烈的恐怕是计算机学科、社会学科和新闻学科。
基于数据现实的基本面,数据新闻生产过程充满了计算机学科和新闻学科的融合。既然数据新闻是关于数据的新闻,那么不可避免的需要使用数据,并且对数据进行分析和呈现。目前数据新闻中常用的数据分析方法包括描述性数据分析、探索性数据分析、机器学习和信息检索等。大量运用数据分析方法的其中一个结果就是让数据新闻看起来更象是社会调查报告。尽管目前仍然比较流行的让数据讲故事等表述方式,但是不可否认的是数据讲故事的可行性和有效性一直困扰着数据新闻从业者和研究者。2014年,全球编辑网络年度峰会的数据新闻奖项设置取消了原来的“讲述故事”和“数据故事讲述”这两个奖项,原因是“实际上未有用数据成功讲述故事的数据新闻”。
从社会建构的理念考察计算机学科、新闻学科和社会学科的争议,反映出来的是库存知识的累积,而库存知识的累积在社会建构过程中发挥着十分重要的作用。因此对于数据新闻生产而言,实际上并不是哪几个学科之争的问题,而是日常生活世界库存知识累积的问题,只不过在相对较短的历史时期之内这种库存知识的累积表现出来的是学科之间的差异化和冲突性而已。这也就要求无论是数据新闻的教育者还是从业者,都需要从破坏性创新的角度出发,跳出学科的局限,站在一个更高的社会建构的立场上,为实现主体间性而进行社会知识的累积和融合;从媒介发展的角度来看,这与目前所强调的媒介融合息息相关。
四、新闻功能层:数据新闻功能性的建构
从传统的新闻选择的角度来分析,新闻功能性的首要考虑因素是新闻价值;而从社会建构论的角度来看,数据新闻是建立在数据挖掘和数据分析基础之上的数据呈现,而数据新闻的目的之一是实现主体间}生;二者并不矛盾,主体间性的建立有助于新闻价值的传播和实现。数据新闻与传统新闻相比,由于计算机学科、社会学科和数学学科等跨学科知识的介入,使得数据新闻的功能性在传统新闻的基础上得到极大地扩展。
综合国内外数据新闻的案例可以发现,当前的数据新闻大致可以分为四种类型:整体一呈现性、问题一分析型、已然一预测型和模型一定制型。[4]其中这四种类型的功能分别对应了国内学者所提出的“大数据新闻具有描述、判断、预测、信息定制思想功能”的研究观点。[5]结合当前数据现实和数据新闻生产的实际,数据新闻更多地实现了描述的功能。
结语
围绕着舒茨的.旧常生活世界”哲学体系,本文建立了基于数据现实的建构基础,数据新闻的社会建构是众多学科、众多参与者基于自身知识共同塑造成实在的社会现象;广义的知识是数据新闻建构数据现实的基础,不论是存在于语言符号系统中的知识,还是存在于行动者跨學科认知图中的知识;建构数据现实的功能是一种可以经验的实践结果,是在参与者基于各自的意志在极为复杂的交互过程中实现的。
参考文献:
[1]张彤.从先验的生活世界走向文化的日常生活——许茨与胡塞尔生活世界理论比较研究[M].哈尔滨:黑龙江大学出版社,2011年第196-202页.
[2]舒茨.社会世界的意义构成[M].游涂祺,译.北京:商务印书馆,2012年第185-186页.
[3]张超,闪雪萌,刘娟.从去专业化到再专业化:数据新闻对数据科学的应用与趋势[J].中国出版,2019(09):25-28.
[4]曾庆香,陆佳怡,吴晓虹一数据新闻:一种社会科学研究的新闻论证[J].新闻与传播研究,2017,24(12):79-91+128.
[5]陈力丹,李熠祺,娜佳.大数据与新闻报道[J].新闻记者,2015(02):49-55.
【作者简介】张志成,西安外国语大学新闻与传播学院讲师。
【基金项目】本文系陕西省教育厅2019专项科研计划资助项目《大数据时代西部高校自媒体舆情引导策略研究》(项目编号:19JK0711);西安外国语大学校级科研项目成果《智媒时代,西部高校自媒体大数据舆情引导策略研究》(项目编号:19XWB09)。