周璐
摘要:社会需求的增长,推动了云计算、物联网、大数据和人工智能等新技术的发展,促成了如今媒体技术融合的时代。越来越多的互联网新产品应运而生,成为我们生活中不可或缺的一部分。新闻媒体行业也在新趋势的带动下,不断与前沿科技相融合,提高媒体产能和推广范围,准确把控靶定对象。本文主要以舆情分析系统为例,对当下新闻行业进行分析,以及对未来新闻媒体行业的发展做出的思考。
关键词:人工智能;新闻报道;舆情分析;机器书写;MGC
中图分类号:G201.7
文献识别码:A
文章编号:1001-828X(2019)010-0420-02
一、引言
随着我们每天的数据以PB规模不断增长,以及人工智能研究的快速发展,中国传媒行业已经在人可控范围内迅猛成长。自2017年12月由新华社在成都发布的中国第一个媒体人工智能平台
“媒体大脑”成功上线,到如今的媒体大脑“3.0”在进博会上的成功表演。这也就说明,我国目前在信息技术革命领域新闻报道方面已经有了质的飞跃。
在新闻报道方面,不管是新媒体,还是传统媒体,对于机器写作助手的认可已经是毋庸置疑的了。例如今日头条的“张小明”、
“Giiso”写作机器人、《时代财经》等上千家出版社的“御用”写手,都已经逐步渗透到了人们的生活中,这些机器人依靠后台强大的智能语义系统和数十亿个数据库中数千个节点的素材库、知识地图和语法功能让它们躲过了大脑语言系统的审查。随着数据库的不断更新、机器人系统的创新升级和营销扩大化,新闻报道行业的自动生成系统已经初见规模。
二、舆情分析系统简报自动生成
舆情分析系统的简报自动生成,通过前端设定监测时间、关键词等一系列范围性要点,在系统后台筛选出有价值的情报信息,并将它汇总到一篇文章中,简明扼要的对舆论信息及事态进行恰当分析。对于简报的输出形式,根据不同的舆论输入类型,文本生成可以大致划分为三大类:文本到文本的生成,数据到文本的生成以及图像到文本的生成[2]。
简报自动生成系统,主要来自于大量文义的解读,在文本中抽取出相同含义的句子,将这些句子整合成语义不变的新句子。但是哪些句子是可以抽取出的呢?这个答案来自于句子抽取领域的第一篇论文,由IBM公司的科学家Luhn在1985年撰写的《TheAutomaticCreationofLiteratureAbstracts》,他表示如果句子当中包含的关键词较多,那么就认为这个句子就越重要,系统后台就是要根据一定的算法找到这样的句子,将他们汇总到一起,调整语序和表达词汇,综合成一篇简报。看起来这样的工作量很大,但对于计算机来说,强大的软硬件的支持让需求者可以在眨眼的功夫便拿到这样一篇简报。文档的完整解释和总结摘要对于人类来说通常是困难的,而对于现有的文本自动摘要技术,也同样是困难的[1]。这只是最初级最快速的办法,如果想要深入,简报完全不能满足人们对大量内容分析结果的需要。
虽然简报自动生成系统是初级的,但对于需要每天面对大量数据分析的现代人,简报又是不可或缺的。
例如,对“全球硬科技创新大会”进行舆情分析,检测周期为十五天,运用主题聚焦,定向站点采集,元搜索采集及第三方数据引入等手段对国内外新闻网站、纸媒、广播电视、海外主流媒体等多个渠道多语言进行全面监测,检测到信息4000余条,新闻报道3600余篇,纸媒报道370余篇等其他信息条。这样庞大的一项数据监测若是运用人力怕是一件极其艰难的事情,但是通过舆情分析系统可以准确把控到各大媒体的媒体走向、媒体流量、关注度等。将舆论后庞大的数据根据特定的算法和文本深度语义算法自动分析,得到所需基本内容概述。
三、文字自动生成的特点
目前,学术界对“机器人写作”的更一致的看法是,它是基于计算机的程序算法,在此基础上捕获和分析信息内容。然后运用一种新的新闻制作方法,使用自动生成内置模板的手稿完成新闻报道。目前用于财务,体育和灾难性报道,特别是对于大量数据的新闻报道,它具有固有的优势[3]。
1.新闻报道生产速度之快,数量之大是人类望尘莫及的。生产之快源于它基于计算机强大的大脑,它可以在收集巨量数据后进行整合,这包括静态数据,也包括动态数据,即每时每刻所发生的信息,都要在同一时间录入到智能语义库进行读取,并在下一瞬间进行筛选、分割和重组,直到事件完成。同时,由于强大的数据储备支持,电脑也会在同一时刻调取到以往相关数据进行分析,确定相关性以及匹配性,这一系列的动作都是在大数据中来回的快速穿梭,以求在最短时间内,完成高质量的新闻报道。如今,一篇文章的完成我们已经可以用毫秒或是秒来计算了。
由于生产速度的提高,机器又优于人类不知疲劳,所以机器的新闻报道生产数量是巨大的。在上百家媒体中的新闻报道一年可达10亿个,平均每秒2000篇的速度。智能化生产,在提高生产率的同时,节省了成本,增加了收益。
2.新闻报道是个性化的。基于现有庞大的数据库和智能分析软件,我们可以轻易的找到每个人,每个领域,每个年龄阶段等不同类的语言使用习惯;另外,还可以根据需要、偏好和读者群去人为设定新闻生成的种类与个性。腾讯公司的Dreamwriter推出个性化的實时多版本功能,其写作逻辑是在达到一定的触发条件后,系统通过对若干计算模型进行定量和定性的分析,自动根据数据选取合适的表达模板,将数据与模板相结合。[4]这样的文章就不会是机器式死板的,而是灵活可变的。
四、媒体大脑生成“MGC”
在新闻生产的这100多年的历史上,从最初的专业化生产到业余化生产再到如今的智能化生产,从个人非营利性生产到成为专业职业,从靠人力资源到如今的多维融合。随着智能化新闻生产逐步走向潮流,UGC、PGC已经成为了我们新闻发展道路上的主要形式。而MGC(Machine Generated Content)也悄然到来。MGC一个通过摄像头、无人机获取视频及数据,然后经由识别技术让机器进行价值判断,最后依托于媒体大脑将理解到的内容进行关联,检索语义,编版,最终智能生产新闻的新兴技术。
第一条MGC新闻,时长2分08秒,由“媒体大脑”中的2410(智能媒体生产平台)生产,耗时10.3秒。2018年全国两会上发布了全球首条关于两会实时内容的MGC视频新闻——《2018两会MGC舆情热点》,这是在5亿条舆情热点信息中综合筛选汇总后生成的。可见,智能新闻生产已经开始摆脱单一的呈现形态、单一的表现方式和单一的题材领域的局限,人类的新闻生产活动被真正带入到全媒体、多形态、多领域的新闻生产过程中,利用新的媒介技术创新新闻生产方式。[5]
利用MGC进行新闻生产,最终形成富媒体新闻,这是一个需要多学科杂合融汇的过程,是一个技术深度交叉融合的结果,摄像头、传感器、AI技术+大数据,每一项都是真实可靠的。机器是不会说谎的,它记录到什么,收集到什么,就会反馈出什么,系统同样会辨别出新闻的真实度,让未来新闻越来越客观真实。另外,MGC的生产效率之快是人类所不能企及的,人类生产一条新闻视频的时间,媒体大脑可以生产180条,并且它还可以保证在快速出产的同时依靠全球最大新闻资讯库使信息达到精准无误。
MGC新闻是将算法+数据+遥感相结合的产物,它提高了危险新闻报道的安全性,使得在某些特定地点,特定时间,不再需要人类去做一些繁复简单或是充斥危险的一线工作。随着科技的不断进步,“MAGIC”的提出,各媒体平台相互交融,以扩展传播途径和广度,实现新闻报道新方向的新发展。五、新闻报道未来的发展
1.人机协同。写作机器人、媒体大脑等新型的媒体手段,是新闻领域科技时代的前沿技术。时代在发展,但无论人工智能发展到什么样的阶段,人工智能都不会凌驾于人类之上,当然,这需要人类对这一领域做出一定的行业标准,在人类可控范围内,最大化的突出人工智能区别于人的优势。人类要与它们协同合作,强强联手,优势互补。运用人类的思维和机器的速度,实现传媒行业人机一体化的转变与进步。
2.思想是先锋。從目前的机器人写作情况来看,诗歌、对联、专项新闻等占主要部分,而散文随笔小说等带入感情的纯文学的作品,机器人还是达不到的。现代机器人无思想,无趣味性,无人情味,缺乏现场应变能力等等与情感有关的方面永远都是他们的短板。在人类世界中,那些有温度的话题,有微妙情绪的语句,也只有人类自己可以理解,这些无形的情感,是很难用程序化的代码可以代替的。另外,传媒人也应不断思考新鲜事物,将多样化的信息以新颖的方式展现在人们面前,在永远保持一颗对主流事态和社会的责任心和社会认同感的同时,提升眼界和思维。
六、结语
在新闻报道领域发展的舞台上,人与机器,并不应该是同台竞赛,对于新闻业的未来,也应保持一颗平常心。在这个逐步发展,转变的过程中,本着从用户的角度来看待科技创新带来的发展,坚守住新闻人心中的底线。我们有理由相信,在未来,“人工智能+大数据”必将带来可以期待的精彩。
参考文献:
[1]Mani I .Automatic Summarization[M].John Benjamins Publishing,2001.
[2]Paper_weekly.EMNLP 2018 | 从对话生成和文本风格转化看文本生成技术[OL].https://blog.csdn.net/c9yv2cf9i06k2a9e/article/details/83388740,2018,10.
[3]徐婷婷.新闻业的“人工智能”时代[J].科技传播,2016,8(15):82-83.
[4]杨名宜,吴海荣.探讨“机器新闻写作”的发展趋势[J].视听,2016(11):131-132.
[5]蔡筱牧.新华社媒体大脑:技术驱动新闻生产方式变革[J].传媒,2018(20):54-56.