人工智能时代新闻真实性概念的量化转向

2019-03-29 12:05姚庚君
新媒体研究 2019年2期
关键词:数据新闻人工智能

姚庚君

摘  要  随着大数据和机器学习算法等人工智能相关技术的发展,数据新闻、机器新闻写作等新闻生产领域的新样式对“质化”理解的传统新闻真实概念提出挑战。文章试图通过对传统新闻真实性概念在现实技术环境下的挑战的分析,指出对新闻真实性概念的理解由“质化”向“量化”转型的必要性,并且借助对中外新闻学研究史中新闻真实性概念发展的梳理,以及国内外对新闻真实概念的测量案例的分析,指出这种量化转向的可行性。

关键词  新闻真实性;可测量化;人工智能;数据新闻

中图分类号  G210      文献标识码  A      文章编号  2096-0360(2019)02-0018-02

2017年12月15日,假新闻(Fake News)当选“柯林斯词典年度热词”。柯林斯词典对“假新闻”的定义如下:伪装成新闻报道的、虚假的、耸人听闻的信息。根据其旗下相关机构统计,这个词自2016年以来使用量增加了365%。“假新闻成为年度热词”这一事件虽然不能让本文得出有关于当前新闻媒体报道真实性状况的准确结论,但是这至少说明一个事实,那就是:作为新闻专业主义的核心概念与规范,新闻媒体的真实性现在正在面临质疑。

与此同时,数据新闻,机器新闻写作以及自动化验证等人工智能相关技术的发展也给从19世纪中期以来依靠行业自觉与行业规范[1]而形成的新闻真实性定义提出了挑战。所以,本文将通过对国内外的相关研究进行梳理也再研究,从以下方面分析这种挑战。并提出相关解决方案。

1  形式化挑战

马特·卡尔森的“算法三部曲”作为现阶段对于算法在新闻生产中的应用的突破性研究。他的研究表明:算法新闻对传统新闻专业主义的模糊性提出了挑战,他指出:“在数字新闻时代,新闻业的边界仍然具有一定的可渗透性,同时也更容易受到外界的影响。因此,要单单依靠专业主义为新闻业提供一定的边界保护越来越不可能。”[2]

马特·卡尔森还认为,算法在某些情境内获得了自己的“主体性”[2]。清华大学新闻与传播学院彭兰教授更是表明,在未来“万物皆媒”的时代,“新闻信息存储、分析、加工系统可能脱离专业媒体独立存在”[3]。事实上,不论是机器新闻写作还是自动化验证技术,实际的行业应用都证明中外两位学者的判断是正确的,比如大数据专家Julia Goldstein和Mike Ghoul就通过文本挖掘等技术设计出来一种能够识别假新闻的算法。在这些特点中,机器算法与人最大的不同在于其判断方式的规则性与机械性,原因在于算法的本质是一系列形式语言的符号,它与人类基于意识与行为经验的判断方式具有明显的差异。这个问题反映到对新闻真实性的判断上,可以被表达为:对于算法而言,想要让它遵从新闻真实性的规范和要求,一方面,我们需要精确而严格地定义新闻真实,另一方面这个定义需要被用精确而严格的形式语言表达出来。

形式化表达更加深刻的意义在于:一方面它可以促进人机之间的沟通与协作,另一方面它能够将人类的价值观,并且引导算法向着良性的方向发展。

2  量化挑战

这种量化挑战可以从信息结构层面的方面来理解。信息结構主要是针对数据新闻的。因为对于数据新闻,使用数据并使得报道更加的精确和严格是它非常重要的功能。吴小坤教授在其论文中对数据新闻的维度进行了如下定义:新闻性、统计性、工具性、生产流程标准化、新闻行业创新性[4]。其中“统计性维度”说明数据新闻的数据处理需要服从统计学对于“真”的定义的某些规则,但是这就使得传统新闻真实性即将面对一个重要的挑战那就是可量化挑战,正如方洁老师指出“传统的新闻采编的记者往往是一种‘非规范的定性思维,擅长简单的归纳、数据的总结,容易在采访中主观先行。数据新闻则是以一种‘比较偏向量化的研究思路做新闻,新闻事实的产生是基于数据挖掘和分析。”[5]

比如,在传统新闻真实性观念中,“对于新闻真实的量度,仍然主要是一个定性范围的概念,不是一个纯粹的可以计算的数量概念。”[6]李良荣教授就表明:“要做到整体真实是相当有难度,尤其是难以准确地评估。”[7]我们虽然不能仅仅用数据新闻的整体真实涵盖整个传统新闻真实性理论中有关于整体真实的全部内涵,但是在数据新闻的现实要求下,对于新闻真实性的量化定义可以在一定程度上帮助数据新闻确定某些统计意义上的真实,而这种量化定义下,“真实性”这种性质判断用语将被“真实度”,“确证度”以及“置信程度”等具有统计意义的量化用语取代。

3  中外新闻学研究中有关“真实性”的测量问题

事实上,有关“新闻真实”的自动化测量一直是全世界学者所关注的问题。

20世纪60年代,基于统计理论以及社会科学实证方法的精确新闻学是这方面的开创性研究之一,菲利普·梅耶就明确表示要通过严格的统计学方法,精确地估测一些无法直接测量但是却很有新闻价值的事件。

到了数据新闻时代,随着计算机的广泛使用,伯明翰大学的Paul Bradshaw认为,“计算机式思维”将是引领下一波数据新闻浪潮的重要思维工具,在他的设想当中,“计算机式思维”应该包括如下特征:问题分解、模式识别、抽象化及算法。其中抽象化与本文提到的形式化的内涵有相通之处,只不过本文中提到的形式化不仅仅是一种新闻工作者的思维方式,更是一种新闻学的发展方向。

经历了如上学术积淀,新闻真实性的可测量化最终在最近得到了突破。圣克拉拉大学马库拉应用伦理中心的真实性核实量化标准体系就是其中的代表。该项目发布了一份信托指标,一套标准化的公开性原则,旨在为出版物的标准、工作流程和记者的背景提供清晰的信息,帮助受众轻松评估新闻的质量和可信度。信任指标是标准化的披露,提供清晰的新闻机构的道德标准和其他公平性和准确性的标准[8]。该项目发布了一份信托指标,一套标准化的公开性原则,旨在为出版物的标准、工作流程和记者的背景提供清晰的信息,帮助受众轻松评估新闻的质量和可信度。信任指标是标准化的披露,提供清晰的新闻机构的道德标准和其他公平性和准确性的标准。世界各地主要媒体公司,以及Google、Facebook、Bing和Twitter,都开始使用这些指标,来给人们提供更多关于他们所读故事的信息,帮助他们识别高质量的新闻。

在国内方面,青年学者胡华涛运用非形式逻辑与概率系统,通过信念修正的方法来部分形式化与量化地定义真,使得对“真”的判断变成了基于逻辑的概率判断[9],进而实现对新闻真实性的量化。

所以,通过以上分析,我们可以得出以下结论:将新闻真实性由相对“质化”的理解转为“量化”的理解既是新闻学发展的可能方向,又是应对现实技术挑战的必要措施。而可行的方法应该是将新闻表达的语言逻辑与统计经验相结合,并不断通过与受众的相互协调,完成学理概念,实践操作与沟通互动三方面的结构性统一。而且随着媒体技术的发展,我们或许可以展望在不久的将来,新闻的客观性、时效性等更加复杂的新闻价值概念也可以通过一种严格而精密的量化规则来进行定义。从这个意义上来讲,新闻真实性概念的量化转向很有可能仅仅是这一系列新闻学基本概念量化转向的开始。

参考文献

[1]黄旦.新闻专业主义的建构与消解:对西方大众传播者研究历史的解读[J].新闻与传播研究,2002(2):2-9.

[2]马特·卡尔森.自动化判断?算法判断、新闻知识与新闻专业主义[J].张建中,译.新闻记者,2018(3):83-96.

[3]彭兰.智媒化:未来媒体浪潮——新媒体发展趋势报告(2016)[J].国际新闻界,2016(11):6-24.

[4]吴小坤.数据新闻:理论承递、概念适用与界定维度[J].新聞与传播研究,2017(10):120-126.

[5]黄志敏,王敏,李薇.数据新闻教育调查报告[J].新闻与写作,2017(9):17-24.

[6]杨保军.新闻真实论[M].北京:中国人民大学出版社,2006:45.

[7]李良荣.新闻学导论[M].北京:高等教育出版社,1999:128.

[8]Markkula Center for Applied Ethics,Leading news outlets establish transparency standards to help readers identify trustworthy news sources,Santa Clara University official website[EB/OL]:https://www.scu.edu/ethics/focus-areas/journalism-ethics/programs/the-trust-project/trust-project-launches-indicators/.

[9]胡华涛.当代新闻逻辑学导论——新媒体时代新闻推理与论证的现代性研究[M].武汉:武汉大学出版社,2015:75.

猜你喜欢
数据新闻人工智能
人工智能之父
2019:人工智能
人工智能与就业
数读人工智能
国内网络数据新闻发展中存在的不足
我国数据新闻的传统因素及创新策略
中外数据新闻编辑流程比较研究
大数据时代新闻的新变化探究
媒介融合时代数据新闻可视化教学探索
从“数据新闻”看当前互联网新闻信息传播生态