“Xiaomingbot”背后,写稿机器人的技术探寻——专访北京大学计算机科学技术研究所万小军博士
万小军博士
《中国传媒科技》:头条写稿机器人的主要技术特色是什么?
万小军:写稿机器人的主要技术特色在于对包括自然语言生成、文档自动摘要、机器学习等在内的多种技术的综合利用,并且针对不同类型的稿件采用不同的技术途径去生成,因此能够为体育赛事同时生成短短几句话的简讯与长达上千字的详细报道。
《中国传媒科技》:网易等媒体报道头条写稿机器人主要有速度快、发稿样式多、语言情感自适应、自动配图等业务特色,哪些关键技术实现了突破,对应哪些关键技术创新?
万小军:该写稿机器人在基于文字直播的新闻自动生成以及语言情感自适应等技术上实现了突破。“Xiaomingbot”是业界首个基于文字直播数据进行新闻生成的系统。基于先进的机器学习算法,该系统能够实时地从文字直播数据中进行语句筛选与融合,从而在体育比赛的任一时刻生成高质量赛事报道。
在语言情感自适应方面,我们设计了比赛逻辑判断单元,使得“Xiaomingbot”在判断出比赛的激烈程度后,可以使用不同的词语形容赛事中运动员获胜的难易程度,如“力克”“艰难晋级”“完胜”等词语。另外,“Xiaomingbot”会不断学习网络直播员使用的语言,应用在长篇资讯报道中。
《中国传媒科技》:有媒体报道头条机器人的推出标志写稿机器人进入第二代,您怎么看待这个评价,您认为人工智能技术合理的断代依据是什么?
万小军:按照专业人士观点,人工智能发展顺序是从弱人工智能开始,到与人类智能相当的 “强人工智能”,再到全面超过人类智能的“超人工智能”。目前人工智能在少数领域确实进入了2.0时代,也即“强人工智能”,例如语音识别、棋类对弈等,但在很多领域还处于弱人工智能,这其中就包括自然语言生成。再回过来说写稿机器人,我个人的看法是这个第二代写稿机器人的说法并不能和人工智能2.0对应,而只是与第一代基于模板填充的写稿机器人进行区分。由于写作是极富创造力的事情,因此写稿机器人具有“强人工智能”,仍有很长的路要走。
《中国传媒科技》:头条机器人对“基于会话分析的摘要生成技术”的应用效果不俗,需要多大规模的语料库和持续训练时间?
万小军: 由于时间和精力的原因,目前我们只人工整理了一百多项比赛对应的文字直播数据与人工撰写的赛事新闻作为训练语料,采用的机器学习算法能够在数小时内训练完毕。 如果有更多的训练语料,效果肯定会进一步得到提升。
《中国传媒科技》:写稿机器人研发过程中,在今年的ACL会议上发表了哪些论文,取得了多大范围的影响?
万小军:我们针对“基于文字直播数据的新闻自动生成技术”已发表ACL2016长文一篇(Jianmin Zhang, Jin-ge Yao and Xiaojun Wan. Toward Constructing Sports News from Live Text Commentary. In ACL 2016.),该论文在ACL会议期间受到众多国内外同行关注。此外,我们还在ACL2016上发表了3篇论文,此前,我们依据研发的成果已经在国际顶级会议与期刊上发表数十篇学术论文。
《中国传媒科技》:头条写稿机器人的图文自动关联发稿是如何实现的,今后是否有可能做到基于视频信息摘要生成技术的自动发稿?
万小军:图文自动关联实现方法主要是基于图片和文本做语义匹配,这是多媒体信息处理领域的热门课题。基于大量的图文数据库,采用先进的机器学习算法能够学习图文语义匹配模型,基于该模型可以为文本挑选合适图片。
基于视频信息进行自动发稿是一个远期目标,需要视频理解技术达到一定的高度才可行。然而对于带有音频解说的体育视频,我们可以先采用语音识别技术将音频解说转换为文字直播数据,然后采用基于文字直播的新闻生成方法自动写稿。
《中国传媒科技》:这次奥运赛事报道期间,如何实现研究机构和产业机构联合运维的?
万小军:在这次合作中, 北大方面主要负责提供算法模块。由于该系统的模块划分较容易,接口定义也很清晰,因此双方责任很明确,同时双方技术人员保持密切沟通,所以整个系统的上线和优化效率较高。
《中国传媒科技》:写稿机器人是否能写深度报道,需要哪些关键技术支持,未来是否会代替记者和编辑?
万小军:机器人写深度报道是一个长期目标,如果机器人能够实现这个目标,那么在该领域就真正实现人工智能2.0了。这个需要语义理解、观点分析等多种技术支撑,需要计算机掌握归纳和推理能力。
即使写稿机器人获得大规模应用,也不会让记者丢饭碗,而是分工合作、各司其职:写稿机器人负责生产陈述基本事实的稿件,记者负责生成对事件的深度分析报道。研发写稿机器人的目的是要解放记者和编辑,让他们做更有创造性的事。
《中国传媒科技》:有人质疑学校科研成果落地的效果,这次成功的产学研合作是如何实现的?
万小军:我们双方负责人(我和李磊)都是一线从事技术工作的,能够比较准确地判断一项技术的应用价值和成熟度,而且我们双方的判断一致,沟通顺利,这为合作打下了基础。我们从开始谈合作到系统上线只用了不到两周,这得益于前期的基本模块开发和原型系统。
学术研究目标主要不是为了产学研合作,毕竟大部分科研成果并不具备实用价值,但是我们需要准确地判断哪些成果具有实用价值,并据此研发相关原型系统。
《中国传媒科技》:人工智能不仅是传媒的热点,而且是未来的转型升级方向,您认为传媒领域下一个人工智能热点是什么技术或产品?
万小军:我不太擅长预测,预测变化日新月异的人工智能领域尤其感到力不从心。我个人比较看好人机交互技术,通过人机对话与各种智能设备进行多通道交互,获取多媒体信息。例如,用户可以基于语音对话实现新闻的个性化阅读,能够回溯、暂停或快进一篇新闻播报,同时系统能够主动对用户提问,询问用户对新闻事件的看法等,可能成为未来的新闻形态。