方曦 江苏省广播电视总台新闻广播部
人工智能时代传统媒体发展趋势展望及思考
方曦 江苏省广播电视总台新闻广播部
本文对人工智能在传媒业的应用现状进行了综述介绍,对人工智能时代,传统媒体发展趋势进行展望及思考,提出在人工智能时代要积极应对,稳步构建人机协作的互补共生体系,储备力量,打造“全媒体记者”+“算法工程师”的人才高地。
人工智能 趋势展望 应对思考
北京时间2017年8月8号21点19分,四川阿坝州九寨沟县发生里氏7.0级地震。10多分钟后,21点37分15秒,一条全文585字的地震速报消息经由中国地震台网官方微信率先在全球发布,内容涵盖速报参数、震中地形、热力人口、周边村镇、历史地震、震中天气等八方面权威数据,同时配有五幅图片。这条消息的作者,是中国地震台网人工智能系统,写作耗时25秒。往前追溯,2017年1月17号,《南方都市报》写稿机器人“小南”上岗,首篇300多字的春运报道生成用时不到一秒。
机器人也来写稿了,媒体记者、编辑的饭碗还端得稳吗?一时间,各种讨论、担忧甚嚣尘上。事实上,不止写稿,人工智能在传媒领域的实践早已从最初的数据搜集,延展到内容生产、渠道分发等各环节。今年三月的全国两会上,人工智能首次被写进政府工作报告,列为需要加快研发和转化的五大技术领域之一。七月,国务院印发《新一代人工智能发展规划》,提出到2030年,我国的人工智能理论、技术与应用总体要达到世界领先水平,成为全球主要的人工智能创新中心。这意味着发展人工智能已经上升到国家战略层面。未来,在传媒业,人工智能可能取代人力吗?它又会给这个行业带来哪些改变和影响呢?
人工智能试水传媒业后,以人为主导的媒介形态逐渐被打破。在生产端,媒体巨头加紧布局,争先恐后地迈进自动化门槛;在分发端,智能客户端遍地开花,人机互动愈发个性化。线索搜集、处理,内容生成、分发,产品推广、反馈......不夸张的说,在上述流程的各个环节,我们或多或少都能直观感受到人与机器的应用连接。
2.1 写稿机器人:试水内容生产,依托大数据出稿件
机器人写稿,被认为是人工智能在传媒业的颠覆式创新。环顾四周,美联社有“WordSmith”、《华盛顿邮报》有“Heliograf”、新华社有“快笔小新”、腾讯有“Dreamwriter”、今日头条有“张小明”......似乎是一夜之间,全球媒体纷纷推出自家的写稿机器人。机器人是如何写稿的?稿件质量怎么样?我们来做个梳理盘点。
(1)格式化的财经、赛事消息
这是目前机器人写稿最常应用的领域。以美联社为例。2014年7月,美联社与一家科技公司达成协议,使用对方的Wordsmith平台自动编发企业财报。三个月后,这套人工智能系统通过算法学习,掌握了新闻写作的基本规范。彼时,它每个季度平均能出4000篇财报。到了2015年,美联社将Wordsmith的应用范围扩大到体育板块,并透露,下一步还将开发算法,争取将文字消息自动转换成广播音频。
在国内,这类机器人的代表有新华社的“快笔小新”和今日头条的“张小明”。“快笔小新”现供职于新华社经济信息部、体育部以及《中国证券报》。机如其名,无论是一句话报盘,还是长篇大论的公司财报,人类记者花几十分钟甚至几个小时才能写就的稿子,“快笔小新”分分钟能生成若干条。
今日头条的“张小明”更加专注体育圈。里约奥运会开赛一周,“张小明”六天生成两百多篇稿件,平均每天出稿三四十篇。有业内人士评价,高产还不是它的最大优点,“张小明”上岗的更大意义在于,它能一场不落地关注奥运赛场上每一场需要它关注的比赛。这些比赛有些是常人眼中的冷门项目,但从反馈来看,用户关注度并不低。换句话说,“张小明”的出现,不仅弥补了媒体人手有限的短板,所触发的长尾效应更是出乎意料地显著。
(2)大数据解读稿
擅长撰写这类稿件的机器人代表是微软中国研发的“小冰”。近一两年,“小冰”频繁亮相各大媒体平台,先后担任过东方卫视早间新闻主播、中国教育电视台选角导演、优酷自频道人工智能主播等。如今,它的新身份是《钱江晚报》特约记者,在报社APP“浙江24小时”设有专栏。
“小冰”的数据处理、分析能力很强,加上有微
软必应搜索大数据支撑,它能轻松捕捉用户兴趣点。常态工作中,它会以“一个标题、一幅图片、一段概要、两种观点”的形式,自动抓取热点事件,罗列交锋观点,邀请网友互动点评。与此同时,它还会不定期地推出数据解读稿。比如今年春节后推出的作品《全国烹鸡地图来了,哪种“鸡”征服了你的味蕾》。这是一篇基于大数据,盘点国人吃鸡喜好的策划报道。由编辑确定选题,工程师定制模板、研发算法,“小冰”自动分析生成。文章梳理了八道最受大家欢迎,以鸡为食材的过节菜肴,又根据南北差异,绘制了一幅栩栩如生的全国“鸡菜”地图,选择在春节刚过完上线,应景又生动。
和其他机器人一样,“小冰”也会写一些文体赛事类消息。所不同的是,它的预测能力惊人,成功预测过的赛事包括:格莱美奖、奥斯卡奖,还有多场NBA比赛。准确度之所以如此之高,源于“小冰”具备了将学习模型用于全网数据的分析能力,说到底,还是依赖大数据。
2.2 聊天机器人:优化产品分发渠道、提升人机交互体验
要说和机器人聊天,估计大家最先想到的是苹果Siri。其实,不止苹果这类科技公司,很多新闻机构也在抢占聊天机器人的新风口。聊天机器人,普遍具备更强的关键词识别能力,在人机互动的过程中,它们会将用户使用过的关键词,搜集反馈至数据库,经由勾勒、复刻用户画像,精准定位、定向推送,由此实现产品分发渠道的优化。
今年四月,Facebook在F8开发者大会上宣布,聊天机器人Chatbot上线。Facebook Messenger向开发者开放,它将助力媒体实现人机对话。很快,包括美国有线电视新闻网CNN、英国《卫报》在内的传媒巨头纷纷试水。
CNN的聊天机器人每天会向用户定点推送头条新闻。每条推送下方都有三个选项:阅读全文、获知梗概、向CNN提问。只要提问,机器人就会自动捕捉问题关键词,分析比对后,为用户推送匹配的资讯。英国《卫报》的美食机器人“Sous-Chef”则有教人做菜的本事。但凡有想吃却不会烧的菜,咨询“Sous-Chef”,它就会根据食材、做法等关键词,为用户定制菜谱推送。
2.3 虚拟编辑:智能化辅助生产,解放媒体人力
全天自采新闻很多,哪一些更适合在社交平台呈现?美国《纽时时报》虚拟编辑Blossomblot解决这个问题很拿手。Blossomblot每天都会过滤社交平台上的海量文章,并根据大数据预判、抓取最具价值的内容推荐推广。来自报社内部的统计数据显示,经由Blossomblot筛选后自动推荐的文章,点击量是普通文章的38倍。
英国机构Full Fact去年研发出一款新闻自动核查校对程序。它能从几十家英国新闻网站搜寻信息,一旦发现网络谣言,就会澄清、粉碎它们。项目负责人自信,事实核查所经的各个环节再不久的将来都将实现智能化。
机器人出稿有多快?腾讯机器人“Dream Writer”一天能写超过2000篇财经科技类稿件、500篇体育类稿件。第一财经的“DT稿王”,一秒能写28个字,一分钟就是1680个字。美联社机器人“Wordsmith”一个季度能出4000篇公司财报。如此高产高效,的确非人力所能及。
人工智能在传媒领域的实践有多火?以国内媒体为例,据不完全统计,仅仅今年全国两会期间,从中央到地方,就有12家媒体推出了15款智能机器人。从终端形式看,推出实体机器人的媒体有5家,推出虚拟机器人的有5家,两者兼有的2家。
如此蓬勃的发展势头,不由让人疑惑:会有那么一天,人类记者、编辑被机器人取代吗?事实上,类似的担忧在人工智能付诸实践的若干领域都在不断被讨论。这些担心并非空穴来风。高盛去年的一篇调查报告就提到:当下,人工智能带来的自动化及效率提升在各领域都缩减了约 0.5%到1.5%的劳动工时。这意味着,今后,越是低附加值的领域,人类越容易被人工智能所取代。只是,在传媒领域,这种担心的结论为时尚早。
3.1 人工智能实践暂时离不开人为干预
一个显而易见的事实是:至少目前,机器人参与的所有媒体实践都离不开人为干预,因为它所依赖的算法、模板、大数据,短期内都离不开人。
(1)自动成稿需要人为干预
现阶段,机器人成稿“快”是优点,但行文格式单一、可读性差,也是回避不了的硬伤。对照出稿流程,按需定制的新闻模板决定了成稿框架;用户的参与热度左右了大数据维度;技术人员开发算法的水平,影响到出稿的准确度。有鉴于此,机器人写稿的应用范围才会更多集中在需要数字说话的财报、赛事领域。其他需要深入采访,或者强调个性化表达的调查报道、评论、访谈类体裁,至少目前,机器人还无法胜任。
(2)深度学习依赖人为干预
人机互动,不仅仅是人与机器聊天,优化分发渠道、定制推送产品的过程,也是机器人充实大数据、深度学习的过程。通常,研究人员需要花几年时间来确定目标对象的属性、特征,搭建重点模型,再通过算法、代码,帮助机器人理解模型特征。之后,在人机互动的过程中,机器人会自动搜集、比对、标记接收到的数据,并根据优先级,做出针对性的吸纳、学习。经过这个过程,机器人的图像识别能力和语音辨别能力会呈几何级的提升,并且理论上,它接触到的数据越多,就越聪明。一个影响很广的例子,是谷歌公司的围棋智能程序“阿尔法狗”,它与人类棋手交锋越多,就越熟悉人类的出棋套路,针对性的见招拆招。
了解了原理,不难发现,机器人深度学习,起码有两方面依赖于人为干预。一是研发人员的前端准备,后端跟进、监控,不断完善模型和算法;另一个就是用户反馈。反馈数据决定着数据库的体量和质量,数据有效性越高,机器人的智能化水平也就越高。反之,则会导致机器人黑化,通俗的说法,就是机器人学坏了。
典型的例子是微软聊天机器人Tay。初次亮相时,Tay表现得彬彬有礼。然而上线仅仅24小时,它在和人互动时就爆了粗口,甚至屡屡发出涉及种族主义的不当言论。在做出紧急下线Tay决定的同时,微软方面也曾无奈地表示,Tay学习能力很强,它拥有将搜集到的信息内化的能力,但却无法辨别信息好坏。由于使用者的不确定性,这种照单全收模式,直接导致了Tay的黑化。如此看来,机器人智能化的水平高低,不仅有赖于技术的研发、完善,与使用者的素质也休戚相关。打个形象的比方,现阶段,离开了人机互动,机器的初始智能就像一张白纸,白纸上能画出什么样的画,则取决于人为干预。
3.2 人工智能尚在试水,未涉及核心采编业务
客观的说,相比科技企业,媒体还不具备人工智能的开发实力。尽管争先恐后地试水态度值得肯定,但细看之下,目前,除少部分媒体引入人工智能时,有从战略到执行的系统方案外,更多媒体还是在体系内的某个环节做针对性的有限尝试,且人工智能依赖的大数据,多由科技公司开放平台提供。比如Facebook开发的Facebook Messenger chat平台,目前这个平台上有11000多个聊天机器人,专长覆盖了新闻、财务、娱乐、生活等各大门类,CNN、英国《卫报》等西方媒体试水的聊天机器人就是基于这个平台。
必须看到,尽管系统战略、技术平台尚不具备,但行业内盲目跟风,快速上马人工智能项目的现象依然存在,一些媒体推出的所谓黑科技,短暂亮相后,很快销声匿迹。这种应景式的被动应承,自然不会涉及媒体核心采编业务。机器人取代记者、编辑,也就成了无稽之谈。然而这种行动过当,带来的是资源浪费,机会成本损失。
4.1 积极应对,稳步构建人机协作的互补共生体系
我们正处在由技术革新推动的行业转型期,媒体智能化时代已然迫近。在可预见的未来,人工智能技术将对媒体生产、传播的方方面面产生深远影响。新技术更新迭代速度快马加鞭,传统媒体无法视若无睹,更不可能置身事外。要想守住阵地,不能一味沉溺于内容为王的路径依赖,而要顺应发展,采取“升维”思路,变“传统互联网思维”为“人工智能思维”,将“Think Mobile”转换为“Think AI”,站在战略高度,探索尝试“内容+技术+市场”的全产业链运营。
当前,行业内对发展人工智能还存在两种非理性的状态:一种是一拥而上地炒作,另一种则是过分保守、谨慎观望。必须承认,机器在数据处理、分析、核查等辅助生产方面的能力确实比人强,将这些优势善加利用,能够极大提升媒体效率,节约成本、解放人力,让编辑、记者有更多时间、精力去创作有温度的作品。因此,理性看待人工智能,不回避、不盲从、不惊慌,积极构建人机协作的互补共生体系,最大限度将两者优势放大,形成合力,将是未来一段时期,媒体转型升级的主要趋势。
另一方面,媒体兼具政治、经济双重属性。任何时刻,无论技术如何发展,不分性质、类型、领域,坚持把握正确舆论导向,始终是对媒体统一、共性的要求。这种坚持只有依靠采编人员多年积累的专业素养才能把握准确。因此,无论人工智能如何创新,媒体人始终要谨记,机器只会是辅助人力的高效工具,而人才是新闻生产和传播的主体。
4.2 储备力量,打造“全媒体记者”+“算法工程师”的人才高地
大数据,是发展人工智能的基础和前提。未来,谁拥有的数据量越大、质量越高,谁就越能占据制高点,获取发展的主动权。当前,行业内正处在向媒体融合纵深发展的关键期,行业转型升级箭在弦上,对从业人员的要求,也从最初的熟练掌握采编业务,提升到兼具图片、音视频处理能力,能够灵活对接全媒体平台发稿等。
媒体需要复合型人才,更需要复合型的人才队伍。如果说全媒体记者和互联网用户为大数据采集提供了取样支撑,那么“算法工程师”则是赋予机器深度学习能力的灵魂工程师。他们运用数学和计算机知识,为实现人工智能目标,搭建模型、设计算法,训练机器人按需搜集、处理、加工数据,并通过后期追踪完善,不断提升机器人的业务水平。在可预见的将来,传统媒体若想占据人工智能实践的更多先机,应当发挥技术对创新的引领作用,针对内容生产、用户平台等关键环节,加大技术力量的储备。去年,“今日头条”远赴美国硅谷招兵买马,开出百万年薪招募资深算法构架师,一度引发轰动,未来,这种对技术人才的重视和培养或将成为常态。