文|刘挺
机器人来了,记者去哪儿
文|刘挺
美联社、纽约时报用机器人写新闻的消息一度充斥媒体,最近腾讯财经也用机器人写新闻了,“狼”不但来了,而且在中国登陆了。古往今来,写作是人类的专利,关乎人类的尊严,无生命的机器真的能够替代人吗?本文是一个工科背景的人对这位“狼先生”的看法,尝试探讨机器人技术将对新闻领域产生的变革。
机器人将给新闻领域带来的冲击包括四个方面:编辑、写作、传播、辅助设备。
注:在新闻领域谈机器人,并非特指有胳膊有腿儿的人形实体机器人,而是泛指能够模拟人的某种能力的智能信息处理系统,可能有硬件载体,更可能是纯软件。
互联网对新闻界的冲击首先是试图替代编辑,以Google News为代表的互联网公司推出的新闻服务,可以快速地采集各大传统媒体的新闻报道,并自动地将其分类汇总,筛选出当天广大读者可能会共同关心的话题置于头版。这一度引发了版权之争,但互联网公司有强大的入口优势,能够为传统媒体带来流量,双方很快达成了合作的默契,而且每天的热点新闻也就那么几条、几十条,机器并没有发挥出其大规模计算的能力,选出来的新闻也未必有人类编辑的眼光那么敏锐独到,所以不足以构成对传统媒体的威胁。
此后,以“今日头条”为代表的个性化新闻火了,要每天为每一位读者编辑一份符合其阅读兴趣的独特的电子报刊,这个计算量是巨大的,人类编辑完全无法承受。“今日头条”是对传统媒体的有力补充,但它同样只是编辑筛选新闻,而不是生成新闻,同样不会危及传统媒体人的生计。
现在,机器人写手登场了,机器原创的新闻出现了,革命的旗帜在地平线上时隐时现,恐慌随之而来。然而,理性地将机器当前能够达到的智能水平,以及与人类记者相比所具备的优势分析一番,就可以看出:机器在可预见的未来可能吞噬的人类记者的生存空间是有限的。
机器写手目前能够写的新闻都必须是“规范化”的新闻,比如财报,体育比赛的报道,对地震的报道等,而完全无法写出具有“自由风格”的新闻。要写规范化的新闻,可以从大数据中自动抽取出一些关键的数字,比如篮球比赛中的进球数、篮板数等,把这些数字自动地填充到人事先编辑好的模板(套话儿)里,一条新闻就诞生了。
人们可以对同一类事件写出花样繁多的模板,以免读者很快察觉到机器新闻刻板生硬的缺陷,也可以利用人工智能技术,具体地说是自然语言处理技术自动地从人类撰写的大量同类新闻中自动抽取模板再经人过滤修订,以便提高模板库的构建速度,以及模板的多样性,但机器一旦闯入缺少严格规范的新闻话题中,或者那个话题也有一些规范可循,但除了规定的骨架要素外,还需要更多的鲜活灵动的内容,需要一些个性化的细节,需要栩栩如生的描写和或多或少的煽情,需要独立的见解以及提出一些开放的问题引起读者的深思,需要分析事件背后的原因揭示出问题的实质所在,此时,机器,失灵了!这就是机器新闻写手当前的局限,也是未来机器智能写作要重点研究的课题,即从“规范化新闻”到“自由风格的新闻”,但这有很长的路要走。
虽然,由于机器能力的局限,在可预见的未来还无法替代人类记者写出自由风格的新闻,但与人类写手相比,机器的优势也是不容小觑的,这包括:
(1)机器的速度快,比人更善于应对突发事件,比如一旦地震,机器可以从地震局的大数据中第一时间采集到异常波动,抢先发出灾难来临的新闻;
(2)机器人比新闻人更不知疲倦,人可以熬夜到清晨,而机器永不停歇;
(3)机器新闻具有客观性,除非事前或事后进行了人工干预,否则机器写出的新闻就是结构化数据的一种文本形式的可视化表现,基本上不会歪曲数据;
(4)最后,也是最为重要的:机器有可能从大数据中挖掘出人类写手受视野限制,受时间和精力的限制,而无法发现的颇有价值的新闻话题。一个非常有挑战性的研究课题是:如何从大数据的异常变化中自动发现能够引起公众普遍讨论的新闻话题,即新闻价值的自动预测。事情已经发生,事实就在那里,但不能够被挖掘出来推送到新闻头条就等于不存在,因此,自动挖掘具有传播潜力的新闻话题,将极大地拓展人类对这个世界的观察视野。
机器人写手的出现一方面让从事规范化新闻写作的人下岗,一方面又给人类写手解放出更多的时间去做更有价值的深度新闻的撰写,技术对行业的变革总是在残酷的“破”与热切的“立”的矛盾中呼啸前行。
在新闻传播方面,人工智能技术的发展除了可以帮助度量一条新闻的价值,预测这条新闻能不能“火”以外,还可以做很多事儿,包括:
(1) 预测一下,用什么样的文风(口气)写一条新闻,这条新闻可能传播得更远;
(2) 自动发现哪些人,尤其是哪些大V可能会对这条新闻感兴趣,甚至帮助传播,如何激活这些人的阅读和转发的能量,让新闻实现最大范围的覆盖;
(3) 传播不但要广泛,而且希望得到读者正面的评论。目前做文本情感分析的研究者已经开始做情感预测,即预测某个人或某个群体读到某条消息后可能产生什么样的情绪反应。
(4) 传播效果的事后自动分析,包括量和质两个方面,量指的是覆盖了多大范围的人群,质指的是覆盖的人群都是什么样的人,以及这些人对该条新闻产生了什么样的反馈,如果该新闻的目标是褒扬某个人或某个企业,那么通过从海量评论文本的自动褒贬倾向分析可以准确地判断是否达到了预期的新闻效果。
在新闻采集和传播的各个环节,智能辅助设备的介入都可以提高新闻的生产与传播效率,甚至获得传统新闻媒体所无法获取到的新闻数据,以及无法想象的传播效果。
(1)无人机航拍从视听觉的角度极大地拓展了新闻采集的视野。
(2)基于语音识别的新闻采访自动转写技术,能够把访谈录音自动转换为文本,并对文本进行自动的润色编辑,大幅度提高记者的成稿速度,科大讯飞公司正在紧锣密鼓地研发这方面的产品,而哈工大也利用其在自然语言处理方面的优势参与其中。人在对着手机讲话时(称为“语音听写”),知道听者是机器,所以他会调整自己发音的清晰度、讲话的速度,以便配合机器,但要记录人与人之间的自由对话(称为“语音转写”),因为人处于自然状态,而且可能发表长篇大论,所以语音识别的难度要高很多,而这样的技术突破将产生的商业价值也要大得多。
(3)听新闻:让语音合成的自然度达到让读者愿意听新闻而且感到很舒服的效果,这对于有视觉障碍的残疾人(盲人)或视觉通道暂时被占用的正常人(比如开车时)都是重要的福音。
总体而言,机器将凭借其不断发展的智能,在新闻的编辑、写作、传播、辅助设备等各个环节上发挥越来越重要的作用,为人类新闻工作者提供更多的支持、补充,当然也包括替代越来越多的人类程式化的脑力劳动。在新闻领域,未来将是人机共生、人机协同的局面,对机器的恐惧是多余的,对人工智能将带来的变革的理性认知和高度关注是非常必要的。而在推进机器采集、编辑、撰写、传播“中文”新闻的过程中,国内中文信息处理研究者经过几十年的奋斗积累起来的国际领先的中文技术,将发挥重要作用,媒体人与技术专家的充分沟通与协作迫在眉睫。
(作者:哈尔滨工业大学教授,社会计算与信息检索研究中心主任)