“大数据时代”的自动化新闻写作的历史、实践与未来

2017-05-13 23:03沈浩元方
新闻爱好者 2017年4期
关键词:大数据时代

沈浩+元方

【摘要】大数据时代已经到来,而大数据的一个显著特点,就是分析的对象正在从结构化数据向半结构化数据、非结构化数据转变。这正和新闻文本的特点相契合,因此,大数据中文本挖掘、情感分析的相关方法必将在新闻业中发挥重要作用。

【关键词】自动化生成新闻;机器人新闻写作;计算新闻

每天股市收盘时,许多投资者的手机上都会收到一条行情软件的推送消息“今日股市开盘XXXX点,收盘XXXX点,最高XXXX点,最低XXXX点……”。写这样一条消息不难,然而,每天下午3点收盘,最迟3:01这条信息就需要完成推送,如果靠人力写作,显然是一项非常枯燥乏味的工作,但如果依靠机器自动化写作,这就是一条最简单的自动化生成新闻。除了收盘时的简报,也有软件可以提供更加详细的市场资讯,来自于自动化写作的这样一条新闻,可以涉及很多名词:数据(驱动)新闻、计算新闻、程序新闻、算法新闻、机器人报告、自动化新闻,而这些术语都与数据和计算机的使用直接相关,更确切地说,与当下这样的大数据时代直接相关。

大数据时代已经到来,而大数据的一个显著特点,就是分析的对象正在从结构化数据向半结构化数据、非结构化数据转变。这正和新闻文本的特点相契合,因此,大数据中文本挖掘、情感分析的相关方法必将在新闻业中发挥重要作用。

文本挖掘分析的是包含在自然语言文本中的数据,它可以帮助一个组织从基于文本的内容中获得有价值的潜在业务洞察力。例如文档、邮件和社交媒体中发布的帖子。在某种意义上,它被定义为从无处不在的文本中发现知识的方式,而且通常这些文本可以在网络上直接获取。而文本挖掘中的情感分析更是为新闻自动化写作打下了很好的基础。情感分析是指使用自然语言处理、文本分析和计算语言学确定一段文本的作者对某一特定主体的态度,它可以帮助确定文本表达的态度是积极的、消极的还是中立的,情感分析现在经常用于发现消费者对特定主题、产品或想法的感受。在未来,它们可能帮助新闻从业人员发现社交媒体上流行的热点事件,收集事件的情报;可能发现受众的情绪所在,从而抓住他们的兴趣;还可能帮助机器自动生成的新闻变得更加平易近人,而不仅仅是冷冰冰的客观陈述。大数据的方法越来越多地渗入各个领域和各个行业中,潜移默化地改变它们。

新闻业确实正在发生改变,从计算机辅助报道到数据新闻,再到自动化新闻写作,这种术语的变化体现了一个事实,计算机和数据正在逐渐成为关系中的主体。这种变化不仅是由新技术驱动,而且结合了更广泛的背景。“大数据”仍然是一个相对较新的概念,人类正身处数据洪流之中,产生了两种深刻的发展。[1]第一是由于人类(和自然)活动产生的关于人类(和自然)活动的数字化信息的种类和数量都非常多,通过移动设备、跟踪工具、传感器以及便宜的计算存储等来记录这些信息也日益普及。“在一个数字化的世界里,消费者每天的活动——沟通、浏览、购买、分享、搜索——创造了他们自己巨大的数据流量”[2]。第二个主要发展涉及计算过程、机器学习、算法和数据科学的快速进步和扩散。这些發展使得公司、政府和研究人员更容易地分析公共生活中的数据。无论是称为大数据还是别的什么,这一时刻都是数据中的一部分,它的收集分析和展现,以及相关数据驱动技术的应用,都对理解媒体、技术和社会的交叉点产生了极大的共鸣。

这种深刻的发展让我们认识到,日常生活的数据化有助于我们理解世界上发生了什么,从而做出更好的决定。重要的是,这种理解不是来自人类社会创造的理论或者假设检验,而是计算机处理大数据所揭示的相关性。

这种深刻的发展也使得新闻生产和分发中的重要方面发生着变化。可以看到的是,在新闻业大规模数据集及它们的收集、分析和解释对于从数字化信息中获取价值和意义变得越来越重要,也成为一种趋势。大数据和数据新闻越来越多地被作为一种思维方式来理解,它体现了我们如何思考人类主题以及探索作为对象的世界的能力。

一、数据导向的新闻业发展

在新闻中使用计算机和数据是一个沿革的过程,精确新闻、计算机辅助报道、数据新闻、数据库新闻、数据驱动新闻和计算新闻,乃至自动化新闻写作,它们的共同点都是计算机导向的方法,并且对从业人员来说,需要更多高级的计算机技能。但是本质上,精确新闻强调使用科学方法,计算机辅助报道强调数字化工具的使用,数据库新闻强调信息存储和检索的结构,数据和数据驱动的新闻强调在数据集中找到故事,而计算新闻强调在工具和方法应用中融合计算和新闻价值。(数据导向的新闻生产模式见表1)

[表1 数据导向的新闻生产模式[3]][\&精确新闻\&计算机辅助报道\&数据新闻\&数据驱动新闻\&计算新闻\&焦点\&新闻的科学性\&利用计算机技术报道新闻\&在新闻中发现、分析和展示数据\&跟随“数据线索”追踪未知或推测的故事\&创造、适应或使用计算工具和方法,在新闻中或作为新闻本身\&技能\&社会科学方法\&高级计算机使用\&数据处理,数据叙事\&分析性和探索性的研究\&计算思维,编程\&]

(一)计算机辅助报道和精确新闻

计算机辅助报道于19世纪50-60年代出现在美国,1952年CBS使用计算机预测美国总统选举的结果,1967年Philip Meyer使用计算机报道底特律暴乱,并且他在1973年出版了《精确新闻学》一书,几乎可以作为数据分析正式成为新闻重要组成部分的一个里程碑。Meyer在书中提倡新闻的“科学”方法:“新的精确新闻是科学新闻……采用科学方法、科学的客观性和科学理想。”[4]他认为,计算机辅助报道就是采用计算机获得信息和分析信息的报道,上述两个方向正是计算机辅助的方向。精确新闻是通过应用社会科学中的方法使新闻更负责任和更科学,而计算机使这种方法的实现更实用。

在19世纪70—80年代,新闻业开始引入数据库作为工具,有几个普利策奖获奖作品的关键方法是引入两个数据集(例如驾驶学校班车的人与被判定有交通违规的人),找到两个数据集中交叉的行,或者缩小大型数据集的范围,从而用于假设检验。

计算机辅助报道的基本工具被描述为电子表格、数据库管理器和在线资源,还包括Web访问和电子邮件等作为重要技术进步[5]。

(二)数据(驱动)新闻

虽然数据新闻的一些特点与计算机辅助报道非常相似,但是两者其实存在非常明显的区别。“数据”在这里表示数字的结构化或非结构化的原始资料,记者用它们调查和解释事实。典型的数据一般包括税收记录、政府预算、普查数据等公开数据,推特和微博等社交媒体数据以及交易日志等私有数据。并且数据新闻是通过可视化和讲故事向公众解释复杂的数据。(McGhee 2010;Segel and Heer 2010;Weber and Rall 2013)

“数据新闻”这个名字可能更倾向于专门收集和分析数据的“分析师”或“数据科学家”角色,处理数据是新闻生产中最核心的部分,解释数据是技术之外的挑战。另一个用计算机制作新闻的名词是“数据驱动新闻”。它通过追踪数据中的线索完成故事本身,在分析完成前没有人知道这个故事是什么样的,强调分析数据是比管理数据更重要的东西。

(三)计算新闻

但是,并不是上述所有的数据新闻都与大数据有关,大部分数据新闻还只停留在“使用数据写作新闻”这个层面上。与大数据最直接相关的则是计算新闻,它还被称为:自动化新闻、算法新闻或者机器人新闻写作的部分。

我们可以将计算新闻定义为算法、数据和知识的组合,从某些方面而言,计算新闻建立在前述所有术语的基础之上,“机器做的更好的事情之一是从大量数据中快读创造价值。自动化过程和内容是降低新闻成本和提高编辑输出的最缺乏探索的领域”[6]。这就是计算新闻的意义所在,它通过对计算方法的应用创造新闻价值,很少或根本不需要记者的参与。计算新闻的目的是让新闻生产过程中能够探索越来越多的结构化和非结构化信息。

Diakopoulos在他的《计算新闻中的创新功能路线图》一文中提到了一个更加面向过程的定义。“把计算方法和计算思维应用于新闻活动,包含信息收集、组织和意义建构,传播和展现,以及散发和新信息的公众反馈”[7]。这种新闻生产的最新发展伴随着自然语言生成技术的进步,作为自然语言处理的子领域,自然语言生成被定义为从信息的计算中自动生产人类(自然)语言的软件和计算机系统[8]。

计算机和其他相关技术的进步持续改变着新闻业。这些技术变革成为新的工具,可以帮助记者提高报道质量和效率,还成为讲故事的人本身。尤其是在当下大数据时代的背景下,大数据、算法和代码的兴起导致越来越多的新闻媒体开始热衷于雇用数据科学家帮助甚至领导他们的数据分析。这种转变表明了记者所需技能的变化,传统意义上的记者技能通常包含采访能力和写作能力,而现在,编写代码、参与社交媒体和多媒体交互叙事这些数字化的技能越来越重要。计算新闻的优势主要体现在以下几个方面[9]:

(1)提高对纷繁复杂来源的事件的感知速度,识别通向原始新闻的数据模式;

(2)更有效地利用公开数据,调查记者可以对大规模数据进行分析,结合专门知识形成新闻内容;

(3)为数字新闻增加价值,为受众提供可以检查事实的工具,使用多媒體和互动元素吸引受众;

(4)能最大限度地减少花在繁琐的背景研究和事实检查上的时间,创建代码和挖掘数据,然后可以在其他项目上重复使用。

当然,也有人认为这些变化可能引起法律与伦理问题,威胁到隐私,或者带来黑客风险,新闻业将会被算法驱动的数字记者取代。但从另外一个方面看,算法、AI(人工智能)和大数据为新闻记者提供了一个机会,利用这些新兴技术增强人类记者的工作,重塑新闻的性质和实践。这不仅可以带来更高的效率,还可以提高人类记者的质量和生产力。

二、自动化新闻的基本流程

从内容和形式上考虑,我们可以把自动化新闻分为五个层次。第一个层次是简单描述事件。例如当某地发生地震后,软件通过接口或其他方式从外部数据获取到该地震的具体时间、震源经纬度、深度、烈度等级等信息,然后将数据填入编写好的模板中,模板的形式可能是这样:“今天下午XX时XX分XX秒某地发生X.X级地震,震源位于北纬XX.XX度,东经XXX.XX度,深度XX千米。”该条填写完毕的新闻自动被发布到媒体的新闻网站或社交媒体上。这是最简单的简讯形式,如果从数据库的角度考虑,事实上它相当于在地震数据库中插入一条记录。第二个层次是结合外部数据进行分析。在这一层次,媒体通常会维护一个包含历史数据和其他相关数据的数据库,当地震发生时,模板可能变成这样:“今天下午XX时XX分XX秒某地发生X.X级地震,震源位于北纬XX.XX度,东经XXX.XX度,深度XX千米。这次地震仅低于XXXX年在该地发生的X.X级地震,烈度排名第二……。”虽然形式上仍然是填入模板,但由于结合了历史数据的分析,可能会出现一些重要的结论作为新的新闻线索。进入到第三个层次,除了填模板,会有一些与大数据真正相关的智能算法加入进来,例如利用文本分析构造新的句子,利用情感分析改变句子语气等。这时候生成的新闻,就不像前面两个层次那样千篇一律,而会加入与情感相关的因素,这样可以在一定程度上提高新闻的可读性。

前三个层次是集中在文章的写作方面的,虽然我们经常将这套程序称之为自动化新闻写作或者机器人新闻写作,但是事实上,完整的新闻生产流程除了写作,还包括发布。在第四个层次中,应该可以做到发布新闻的分群体推送,类似数据挖掘中的精准营销。自动化生成的新闻除了发布在新闻网站和社交媒体上以外,还应该可以通过APP推送、私信推送等方式,针对不同群体推送不同的新闻。这就涉及要对受众做受众细分,要收集归纳每一类受众的特征,为受众细分群体打标签,通过标签决定推送内容。而到了第五个层次,这种推送应该得到进一步细化,做到真正的“个性化推荐”,根据每个受众不同的特性个性化推送新闻。标签会从受众群体细化到受众个体身上,协同过滤等个性化推荐算法也可能在这里发挥作用。更为关键的是,在第四和第五层次,生成程序的算法也会随着标签不同而采用不同的参数甚至不同的算法,生成尽可能个性化的内容。总而言之,当自动化新闻达到第五个层次时,它已经成为一个完全的智能化系统,会根据每个受众特征的不同,选择不同的新闻事件、不同的生成算法或者算法参数生成不同的文章,并推送到每个人的媒体终端上。这才是真正的大数据时代的新闻。

结合上述五个层次,我们来梳理一下自动化新闻的基本流程。简单的方法是指从数据库中提取数字,然后将这些数字用于填充预先编写的模板故事中的空白,从而完成新闻的写作。还有更复杂的方法,需要分析数据,获得更多信息,并创建更有说服力的叙述,这主要依赖于大数据分析和自然语言生成技术,此种方法的成果最初经常出现在体育报道中,Graefe总结了自动化新闻的流程[10](见图1),这里我们结合一场篮球比赛的报道详细解释一条新闻是如何生成的。

首先,软件收集可用的数据,例如比赛中的得分、篮板、助攻和历史记录,运动员的背景资料等,既可以收集到当前篮球比赛的实时数据,还可以从数据库中读取历史比赛数据,得到趋势性的数据。第二步,算法采用统计方法识别数据中重要和有趣的事件,比如可以定义如下规则作为事件的判定依据:某球员连续20場得分在25+;某球队本场投进20个三分球创赛季最佳;某球队在第三节比赛的最后5分钟时间内打出了个10:0,从而反超了比分等。第三步,软件按照重要性对所识别和洞察到的信息进行分类排序,如比赛情况可以分为球队表现和球员表现,球员表现中又包括明星球员的表现,由此新闻自动写作程序将比赛表现与受众的关注程度等结合,从而可以实现第四步,遵循定义的规则安排新闻价值元素,以生成陈述。最后,故事上传到发布者的内容管理平台,并可以自动发布。

在此过程中,软件依赖于一组特定的预先定义规则,这些规则需要工程师、记者和计算机语言学家的协作。工程师实现分析程序,记者定义新闻价值的标准,根据该标准、算法寻找重要事件并排列它们,计算机语言学家通过新闻语料识别潜在的逻辑,并将它们转换为能够构造句子的基于规则的系统。

图1 算法如何生成新闻

三、自动化新闻写作的实践

体育和金融新闻已经使用算法自动生成并发布了数以千计的新闻故事,它们不需要人工干预,成本很低或没有成本[11],还有一种说法,即自动生成的新闻将在五年内赢得普利策奖[12]。不管未来自动化新闻写作能不能赢得人类世界的奖项,它在近两年的发展中已经被越来越多成功的实践所证明。

从2014年起,美联社使用自动化洞察(Automated Insights)公司的Wordsmith软件撰写每个季度的公司财报,算法挖掘财务报告,总结每份报告中的关键要素并生成叙述。Wordsmith平台每秒最多可以产出2000篇此类新闻,而且出错率极低,美联社采用机器人自动写稿是之前人工报道发稿量的1.4倍[13]。

2014年3月17日,洛杉矶发生了4.7级地震。3分钟内,洛杉矶时报的网站就发布了关于此事的第一条新闻。虽然该新闻很短,但是它的作者是一个叫做Quakebot的机器人。此外,洛杉矶时报还使用另一个程序报道杀人事件,依靠数据分析和人工智能建立起了一个数据库,用于追踪事件并撰写新闻。此外,自动化写作的应用案例还包括美国纽约公共广播电台“美国全国大学体育协会”赛事报道的NailbiterBot,等等。

新闻写作系统中甚至可以使用更高级的人工智能技术,这样的AI系统可以对人类记者的行为方式建模。想象一个系统,该系统基于机器学习和人工智能的相关技术,它监测微博或者推特这样的社交媒体,学习人类记者的监测方式,选择有新闻价值的事件,并根据该事件在社交媒体上讨论的发展趋势自动写成故事。这套系统很容易让人们联想起英国《卫报》2014年推出的“#Open001”,这是一份纸质报纸,但是其中几乎所有内容都由算法生成。预先编写好的机器人程序分析社交媒体上的热门分享,并对其进行筛选、编辑和排版,生成一份报纸。这虽然只是一个尝试,但是表现出了无限的可能。在未来,对应于不同来源的大数据,例如传感器和移动设备,可以形成不同的写作系统。

虽然自动化新闻写作最早出现于国外,国内的相关研究与应用起步较晚,但已有成功案例。在中国,2015年9月,腾讯财经发表了一篇《8月CPI同比上涨2.0% 创12个月新高》的文章,署名为自动化新闻协作机器人Dreamwriter,可以视为自动化新闻写作第一次在国内得到应用。随后腾讯又在10月份发布了三篇不同类型的CPI数据报道,分别为“精要版”“研判版”和“民生版”,这四篇新闻报道均采取官方数据加专家分析的结构,读起来段落间衔接略有不连贯[14]。2015年11月,新华社也推出了自己的写作机器人——“快笔小新”,它输入股票代码,3秒钟就能完成一篇财报分析,稿件中大小标题一应俱全,还配有图表等信息[15]。然而,“快笔小新”也只是基于人工录入的知识库和模板,写出的稿件结构单一,内容乏味。2016年里约奥运会期间,今日头条推出了新闻机器人“张小明”,“小明”作为第二代新闻机器人,除了生成赛事新闻报道外,还能智能检索并选择图片,根据比赛结果模仿人类语气等[16]。虽然比起单纯套用模板进步了不少,但是从“小明”发布的报道中,还是能见到一些由于对语义理解不够而造成的错误。总体来说,比起《洛杉矶时报》、美联社等已经在日常的新闻发布中采用成熟的写作机器人产品,国内的自动化新闻写作发展还处在相对初级的阶段。

随着自动化新闻写作的兴起,计算新闻领域也在深度和广度上得到长足的发展。一方面,新技术的进一步革新,深化了其应用功能,如机器人视觉的持续发展也为新闻摄影的未来带来了其他可能;有多种智能技术可以捕获高质量的音频、视频,这种技术同样可以获取新闻事件照片,因此自动化新闻不仅限于文字写作,有可能实现多种媒介展现方式的融合,也弥补了其在新闻价值方面的部分缺失。另一方面,计算新闻的发展拓展了其应用范围,如2016年年底,基于人工智能的新闻真实性核查再次掀起了一股热潮。人工智能和自然语言处理的技术可以用来检测见闻背后的语义,也可以通过查看其他网站尤其是权威媒体来源佐证消息的真实性。全球数亿网站会形成超级巨大的数据集,在这个数据集上利用人工智能检测假新闻非常具有优势。

四、自动化新闻写作和新闻的未来

自动化新闻已经成为一个需要认真对待的趋势。首先,新闻职业越来越商业化,基于商业逻辑运转,新闻任务的自动化生成可以提高利润率和降低生产成本。其次,尽管计算机生成的新闻可能无法与主要新闻媒体提供的高质量新闻相竞争,这些媒体上的文章注重细节、分析并且语言更活泼,但是对于在互联网上可以自由获取的信息,自动化生成的新闻可以击败它们。

如前所述,体育报道通常被认为是自动化生成内容的理想选择,因为比赛中的统计数据非常丰富,并且很容易创建用于比赛的报道模板和短语。除此之外,该技术的应用范围还包括房地产、财务金融、天气预报和自然灾害,甚至在更长的时间内,一些关于政治的新闻也可以自动化。

自动化新闻被看作是对传统新闻业的威胁。它吸引了众多记者的注意力,這主要集中在技术将如何改变记者这个角色,以及随着技术的发展,记者所需的技能如何变化这样两个问题上。自动化技术与传统记者的关系事实上是取决于记者的任务和技能的,在常规的重复性任务中,通常只需要把原始数据转换为符合某种标准的文章,这时候人类记者很难与自动化生成程序的速度和规模相竞争,最典型的例子就是在体育赛事和财报分析领域,这两个领域也是自动化新闻写作应用得最广泛的领域。

在乐观人士的视角下,自动化新闻写作程序可以提高常规新闻质量,从繁琐的重复性劳动中解放人类,使他们可以有更多的时间花费在深入分析、评论和调查工作上,写出更具有深度的新闻文章。而在悲观人士的视角下,自动化新闻与人类记者是竞争关系,自动化本身是为了减少成本,而原本完成这类任务的常规记者如果不能写出更好的文章,或者专注于人类胜过算法的技能,他们就将被取代。其实从这种角度看,乐观人士和悲观人士的看法在某些方面是具有共同性的。

Reginald Chua提出了一种“人机联姻”的说法。他认为在未来,人类和自动化新闻将会紧密结合,算法分析数据,找到有趣的故事并形成初稿,之后记者进行深度调查,通过加入对关键人物的访谈及背景资料丰富报道。

随着自动化新闻写作的发展,记者也会逐渐找到新的定位。自动化新闻的一大挑战是定义算法从数据创建故事时所遵循的规则与标准,一名体育记者会了解哪些时刻对比赛结果是至关重要的,他可以将这种知识转化为基于规则的系统,该任务需要分析思维、创造力和一定的统计能力。

从普遍意义来看,自动化新闻写作技术是可以使新闻消费者受益的。机器人程序快速批量写作能力可以覆盖新闻的长尾需求,使更多的细分受众得到满足。但是如果把视角切换到整体的角度,受众可能会关注的两个问题是自动化新闻的质量和算法透明度。

Clerwall(2014)使用可信度和可读性两个指标分析了记者和计算机写作新闻在感知质量上的差异,受众在阅读文章时并不知道作者的身份,他们被要求对新闻进行打分。总体来说,这两种新闻的差异很小,但是计算机写的文章倾向于收到更高的可信度评价,而记者写的文章则在可读性方面得分较高[17]。不过他使用的样本较小,这使得结果的可靠性容易被质疑。

Andreas等人设计了一个线上实验研究受众对计算机写作的新闻的看法。他们使用222的设计,改变文章主题以及文章的实际和声明来源。研究发现,改变声明来源具有较小但一致的效果,表明人类写作的文章总是被评价为更亲切,无论其实际来源如何。改变实际来源则具有更大的影响,计算机写作的文章被被试者评价为更可信、更具有新闻专业性,但是可读性较差[18]。

这并不奇怪,常规的新闻写作经常处于简单叙述事实的层面,使用程序自动化生成内容严格遵循这样的标准,因此人们自然倾向于在可信度上打分更高,但是这些结果并不能推广到描述事实之外的主题。记者能够为新闻故事提供价值的部分,也就是深度报道,仍然没有自动化程序出现。而当对新技术的兴奋退去时,我们可能会发现,新鲜和具有创造力的人类写作风格依然具有吸引力。

算法透明度则是基于新闻写作程序中算法的黑箱问题而存在的。写作程序可能是跨层次的,涉及输入数据、模型、推理规则和外部接口。数据的质量(包括准确性、误差范围、及时性和完整性等),抽样方法,变量定义,权威性;模型输入变量和特征,目标变量,特征权重,建模工具,源代码或伪代码,参数及可能的人工调整;推理规则的持续性,准确度基准值,误差分析和置信度等不确定性信息;还有外部接口的开关,输入和权重的可调整性等多个因素都会影响到写作文章的质量[19]。这些内容的披露机制在非常大的程度上能决定透明度。然而,可以想到的是,许多专业人士之外的受众可能难以理解这些内容或对之不感兴趣,因此确定关于算法透明度的真实受众需求,以及如何解决这些需求就成了重要的问题。

对新闻机构来说,正如前文所述,更多的机器人新闻写作无疑有助于降低机构成本和减少编辑的工作量。但他们同样有需要考虑的问题,他们的问题集中在源数据、数据处理和输出新闻质量三个方面。新闻机构需要对源数据的版权和准确性负责,他们需要保证该数据确实可用,因此需要数据管理和验证的程序。同样,如果算法的数据处理过程存在错误,也会造成大量虚假新闻,这可能对新闻机构的声誉带来灾难性的影响。自动化新闻写作程序在首次发布前需要彻底的测试。而对最后输出的新闻,可能需要匹配新闻机构的官方样式与风格,此外机构也要意识到可能出现的法律和道德问题。

如果把目光投向整个社会,对自动化新闻的应用事实上是在一个更大的话语体系内部的,那就是,考虑到新闻媒体的舆论监督功能,更大范围地应用更复杂的由机器人写作的新闻,是否意味着把这种监督的主体由人让渡到算法?我们是否可以信任算法作为检查、识别重要社会问题的机制?算法已经参与到社会管理中的很多方面,它决定了你多长时间能够打到一辆车,银行是否应该批准你的信用卡,甚至警察应该监控谁和监控哪里。而接下来,它们还可能会影响你的公共生活,你会在新闻媒体上看到什么,甚至你会处于一个什么样的社会。

参考文献:

[1]S.C.Lewis,Journalism in an Era of Big Data:Cases,concepts,and critiques.Taylor & Francis,2015.

[2]J.Manyika et al.,“Big data:The next frontier for innovation,competition,and productivity,”May 2011.

[3] E.Stavelin,Computational Journalism.When journalism meets programming.The University of Bergen,2014.

[4]P.Meyer,Precision journalism:A reporters introduction to social science methods.Rowman & Littlefield,2002.

[5]Cox M.The development of computer-assisted reporting.Informe presentado en Association for Education in Jornalism end Mass Comunication).Chapel Hill,EEUU:Universidad de Carolina del Norte,2000.

[6] M.Carlson,“The robotic reporter:Automated journalism and the redefinition of labor, compositional forms, and journalistic authority,”Digital Journalism,vol.3,no.3,pp.416–431,2015.

[7]N.Diakopoulos,A functional roadmap for innovation in computational journalism.http://www.nickdiakopoulos.com/2011/04/22/a-functional-roadmap-for-innovation-in-computational-journalism/, 2011.

[8]K.N.D?rr,“Mapping the field of Algorithmic Journalism,”Digital Journalism,vol.4,no.6,pp.700–722,Aug.2016.

[9] T.Flew,C.Spurgeon,A.Daniel,and A.Swift,“The promise of computational journalism,”Journalism Practice,vol.6,no.2,pp.157–171,2012.

[10]A.Graefe,Guide to automated journalism.2016.

[11]A.Van Dalen,“The algorithms behind the headlines:How machine-written news redefines the core skills of human journalists,”Journalism Practice,vol.6,no.5–6,pp.648–658,2012.

[12]M.L.Young and A.Hermida,“From Mr.and Mrs.outlier to central tendencies:Computational journalism and crime reporting at the Los Angeles Times,”Digital Journalism,vol.3,no.3,pp.381–397,2015.

[13]徐曼. 國外机器人新闻写手的发展与思考[J]. 中国报业,2015,(23):32-34.

[14]王江涛. 机器人新闻写作的局限与不足——基于腾讯财经写作机器人Dream writer作品的分析[J].传媒观察,2016,(7):12-14.

[15]王悦,支庭荣. 机器人写作对未来新闻生产的深远影响——兼评新华社的“快笔小新”[J].新闻与写作,2016,(2):12-14.

[16]赵禹桥. 新闻写作机器人的应用及前景展望——以今日头条新闻机器人张小明(xiaomingbot)为例[EB/OL].http://media.people.com.cn/GB/n1/2017/0111/c409691-29014245.html,2017.1.

[17]C. Clerwall,“Enter the Robot Journalist,” Journalism Practice, vol. 8, no. 5, pp. 519–531, Sep.2014.

[18]A. Graefe, M. Haim, B. Haarmann, and H.-B. Brosius, “Readers perception of computer-generated news: Credibility, expertise, and readability,” Journalism, p.1464884916641269, Apr. 2016.

[19]N. Diakopoulos and M. Koliska, “Algorithmic transparency in the news media,” Digital Journalism, pp. 1–20, 2016.

(沈浩为中国传媒大学新闻学院教授、博士生导师;元方为中国传媒大学互联网信息研究院互联网信息专业媒体大数据与社会计算方向博士生)

编校:郑 艳

猜你喜欢
大数据时代
大数据时代互联网金融冲击下商业银行发展的SWOT分析
大数据时代档案管理模式的转换与创新
大数据时代宏观经济分析的相关探讨
智慧城市与大数据时代的政府治理
大数据时代互联网金融对传统商业银行的影响研究
大数据时代下计算机信息处理技术的应用
大数据时代背景下高职院校宣传思想工作的思考与实践
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态