□ 文/田舒斌 郭奔胜 王宇航 刘 冬
内容提要 近年来,在内容建设转型中,新华网依托“超级编辑部”建设不断探索编辑部转型发展的方向路径,持续推进采编业务流程再造、扎实推动技术平台系统性升级、不断强化融媒体产品生产能力,为推动实现从“超级编辑部”向“智能化编辑部”的跃迁奠定了坚实的基础。
在新华社2018年工作会议上,新华社党组提出“建设以智能技术为基础、以人机协作为特征、以大幅提高生产传播效率为重点的智能化编辑部。”这是新华社党组针对“移动传播渐成主流,社交平台迅猛发展,智能媒体方兴未艾,媒体融合向纵深推进”的传播新形势作出的重要部署,对于新华社在智能化领域抢占先机、掌握媒体变革的主动权具有重要意 义。
新华网作为新华社打造“网上通讯社”的重要方面军,如何应对席卷而来的人工智能浪潮,在互联网新闻信息传播中保持引领,抢占融合发展制高点,是必须面对和认真思考的问 题。
随着人工智能、大数据、云计算等技术在社会各行各业的广泛运用,技术“嗅觉”灵敏的新闻媒体也正在开启一场前所未有的技术革命。2017年,被称为“AI应用元年”,人工智能开始穿透产业。对于媒体而言,智能化进程早已悄然开启,人工智能正在全方位融入内容生产,为媒体和受众打开无限想象空间。
从西方主流媒体来看,BBC的新闻实验室(News Lab)自2013年起开发了“结构化新闻”(Structured Journalism)系列项目。推出“榨汁机”(The Juicer)系统,利用人工智能机器学习技术分析新闻素材,将其按主题归类,接管了繁琐而又低级的信息整理分类筛选工作;随后该项目又提供了“编辑部之窗”(Window on the newsroom)操作界面,帮助编辑从分类资料中选取内容,进行深度创作;此外该项目还提供了一套自动化新闻产品生产系统“雾化新闻工作流”(Atomised News Workstream),能够从数据库中自动选取内容,组合出定制化的新闻作品。美联社在2014年与世界上唯一的公共自然语言平台Wordsmith创始人合作,将季度财报出版机械化,使报告产量增长了12倍。在2016年的美国大选中,BuzzFeed的开放实验室开发了一款机器人,可以搜集共和党大会上各种信源的新闻,并可以实时综合选举结果与投票报道,让记者从这些枯燥的工作中解脱出来。
国内主流媒体也在智能化领域进行积极探索。在内容采写方面,继新华社两年前率先推出写稿机器人“快笔小新”后,机器人写稿已成部分媒体标配,且正快速向机器人采访、直播领域延伸拓展。在人机对话方面,在2017年全国两会报道中,光明日报客户端推出“小明AI两会”,以40多万篇历年两会报道数据为基础,融合运用人脸识别、图片识别、语言识别等技术,让人工智能应答机器人“小明”回答用户提出的有关两会的问题。2017年12月26日,新华社在成都发布中国第一个媒体人工智能平台——“媒体大脑”,提供基于云计算、物联网、大数据、人工智能(AI)等技术的八大功能,覆盖报道线索、策划、采访、生产、分发、反馈等全新闻链条,探索大数据时代媒介形态和传播方式的未来。
应该说,人工智能技术在传媒领域的应用已远远突破内容分发层面,媒体的人工智能时代已经开启。建设“智能化编辑部”已成为媒体推进内容建设深度转型的重要抓手。
那么,究竟什么是智能化编辑部?从媒体最近几年的探索实践来看,智能化编辑部的核心就是利用大数据、云计算、人工智能技术实现人机交互和人机协作,从而释放媒体生产力,带来传播形式和手段的变革、传播力和影响力的提升,使媒体连接万物、融于网络、直抵受众。
近年来,新华网紧跟行业发展前沿,从策划、采集、加工、发布以及互动、反馈等采编全流程入手,以大数据、云计算、人工智能等技术为引领,不断夯实技术基础、加快技术平台建设,推动研发成果转化,力求通过技术引领实现编辑部的智能化跃迁。
移动互联网时代,舆论热点的形成往往与媒体的议程设置无关,在社交平台和自媒体的双重驱动下,传播爆点一触即发,令众多媒体措手不及,只能仓促应战。在这种传播新形势下,谁能利用智能化手段,通过大数据深度学习技术,快速自动化摸排或最早发现舆情热点线索,谁就能赢得舆论引导的主动权、主导权。因此,智能化编辑部首先应该具备的就是“智能感知”全网能力,要能够运用大数据技术对网站、客户端、社交媒体、社区平台等全终端、全平台发布传播的新闻信息、网民互动信息等数据进行全天候采集和智能化解析,并向采编团队进行智能化推荐,为策划组织报道提供准确、高价值的新闻线索,有效提高媒体的热点预判能力、跟踪能力,解决人工筛选及判断效率较低的问题。
目前,在数据采集上,新华网已经形成了对新华社通稿线路、多媒体供稿线路、互联网抓取数据、全网实时采购数据、电视节目收录、记者现场采访等六大类每天近亿条新闻数据的采集能力。
在数据处理上,初步建立了线索模型库。目前能实现的主要功能包 括:
1.传播效果分析。对已经形成一定热点的新闻事件,除给出新闻线索推荐外,还相应提供了传播效果分析功能,辅助编辑人员进行决策;
2.事件脉络分析。对一些交叉热点事件,提供事件脉络分析,帮助编辑人员更加清晰明了地了解事件背后的发展脉络。
到2018年下半年,还将实现以下几项功能:
1.海量数据存储管理。对每天海量的数据采用非结构化存储技术进行存储管理,实行数据一体化统筹管理,为后续数据利用提供快速响应能 力;
2.新闻事件自动识别。对实时进入系统的稿件进行快速识别,有效提取最新的新闻事件;
3.新闻价值智能判断。根据提取的新闻事件,将原本需要人工判断的内容形成可量化的数值,采用大数据深度学习技术对新闻价值进行智能化判断;
4.新闻角度智能选取。根据主管部门对报道的要求,智能化选取新闻报道角度,并给出相关推荐。
面对互联网上每时每刻传播的海量新闻信息,智能化编辑部的内容采集系统应该是大数据、全媒体、智能化的采集系统。目前,基于内容策划环节的大数据资源,新华网正在着手建立基于全网大数据采集、侧重多元内容整合、集图文音视频全媒体形态于一体、具备智能搜索功能的全媒体大数据稿源素材中心,并研发素材中心的智能化应用功能。
稿源素材中心目前能实现的主要功能包括:
1.智能分类。对图文、音视频内容自动进行分类;
2.自动关键词。对文本内容自动提取其关键词;
3.自动摘要。对文本内容自动提取其文本摘要;
4.文章情感分析。精确分析文本数据,深入挖掘语义特征,对文章所表达情感进行分析;
5.智能搜索。对进入稿源素材中心的数据进行智能识别,提供以文本关键词、图片(拍照搜图,以图搜图)、语音(类似百度的语音搜索能力)等多种方式进行搜索的手段;
6.智能推荐。除提供基本的搜索功能外,还结合线索发现的底层功能,为编辑人员编辑稿件、制作专题提供智能推荐功能。
到2018年下半年,还将实现以下五项功能:
1.智能技审。对稿源素材中心接入的视频素材进行黑场、彩场、彩条、静音等技术检测,防止无效内容进入后续编辑环节;
2.智能提取视频字幕。对接入的视频内容自动提取字幕内容并形成文本,供后续编辑使用;
3.智能提取视频语音。对接入的视频内容自动提取语音内容,并利用智能化手段自动将其转换文本内容,供后续使用;
4.图片场景智能识别。对图片中的室内、室外、自然风景和其他等若干场景进行识别,为编辑选取素材提供便利;
5.图片景物智能识别。对图片中含有的包括汽车、动物等日常生活常见的物体进行识别,为编辑选取素材提供便利。
目前新华网的内容管理系统主要提供了基于新华社CNML标准化稿件结构的XML编辑器,其更侧重于图文细览网页的版面编排。随着传播技术的发展,原有的内容管理系统已经很难满足全媒体内容制作、多终端分发的要求。因此,建设具备多终端发布能力和融媒体产品加工能力的“超级编辑器”是提升智能化编辑部生产力水平的关键。
目前新华网正在建设中的“超级编辑器”将满足电脑桌面终端编辑和手机移动终端采编的需求,为编辑人员提供全时空、全媒体编辑工具。
1.手机移动终端编辑器已经实现了基本的图文编辑、现场图片拍照、视频拍摄、短视频即时制作等功能,到今年年底还将实现现场直播拍摄等功能,同时集成“媒体大脑”的“采蜜”功能,提供语音转文字功能,让编辑人员可以将口述内容即时转换为文本内容,供后续编辑创作使用。
2.电脑桌面终端编辑器将在现有文图编辑、H5产品制作的基础上,在2018年9月底实现视频编辑制作、“两微一端”编辑、社交平台编辑等功能,同时支持多屏协同工作环境。
3“超级编辑器”还可以借助“新华云”服务实现智能编辑功能与多点协作加工两大功能。智能编辑功能主要包括:视频稿件智能化处理、图片稿件智能化识别推荐、多媒体稿件智能化搜索、智库数据融媒体加工、文本及语音智能互动问答等。多点协作加工功能是指:将云服务与本地终端充分整合,让图文、视频等多名编辑人员同步参与到同一个融媒体产品的制作中来,各司其职、发挥各自专业特长,共同完成融媒体产品生产,形成真正的“超级编辑队”。此外,“超级编辑器”还能满足多终端视频直播、导播,移动端互动直播等需求。
“超级编辑器”的建成及投入使用将真正释放人机协作的最大效能,为采编人员日常编辑操作提供一把“利器”。
智能化编辑部在生产过程中,除需要强大的多终端“超级编辑器”之外,还需具备较强的智能化安全管理系统,通过系统提供的安全管控手段,做到采编审发全流程可管可控可 查。
目前正在建设的系统将主要具备以下功能:
智能化内容审核功能。到2018年9月,系统将依托集成了“媒体大脑”的新华云服务,实现对敏感文字、图片、视频画面、音频等进行识别、提示、拦截、加签、加审等功能,让不合法、不合规、不正确、不健康的内容无处遁形,真正实现“人防”与“技防”相结合。
谣言和虚假信息核查功能。提供智能化新闻核查手段,通过集成网络辟谣平台,对网上传播的谣言、虚假信息等进行核查溯源,帮助编辑人员快速理清新闻事件真相。
发稿流程安全管控功能。到今年9月,系统将提供审签流程可视化自定义功能,使不同分类、不同时期、不同作者的稿件都可以根据预设的逻辑进入不同的审签流程。系统还采用稿件版本监控技术,对所有人员、所有稿件操作做到全流程、全记录。在稿件全流程版本记录的基础上提供类似Word办公软件修订的修改痕迹可视化功能,使稿件的每个版本修改都以不同颜色进行可视化呈现,方便版本的检查与后续问题追溯。
在依靠算法推荐分发的智能化传播时代,精准传播能力应该成为智能化编辑部的“标配”。智能化编辑部将在原有静态网站页面数据发布之外,提供基于标签体系的用户画像系统,从7个维度28个行业,细分10万+个标签描述用户的属性和兴趣。精准智能化推荐系统将根据用户元数据、物料元数据、用户行为数据,以机器学习技术作为推荐引擎,实现为多终端新闻阅读用户提供高质量的推荐服 务。
在实现路径方面,目前新华网将以数据运营思维驱动用户拓展,通过打造(电脑桌面)视频直播客户端,重建用户关系、扩大用户规模,实现从访客到忠实用户、从忠实用户到注册用户、从注册用户到付费用户的转化。同时,在符合《网络安全法》情况下,采集积累用户浏览行为、个人身份特征等大数据资源,为智能化、个性化内容推荐奠定基础。此外,还将与电商平台合作,整合运用用户日常生活消费等大数据信息资源,实现用户特征的精准刻画。
目前新华网正在以思客“智享”平台建设为抓手,重点面向党政人群、专业人群和年轻群体,构建全网统一的用户体系,以积分机制建立用户激励机制,并逐步打造用户成长体系。到2018年9月,还将初步实现多终端、多租户支持的评论云服务、投票调查云服务、知识问答云服务等功能。同时,针对付费阅读、付费观看、付费收听日益普遍,网民付费习惯已经养成,媒体付费内容生产不断发力的情况,着手建立新华网支付中心,与支付宝、微信支付等快捷支付平台进行合作,为移动端直播打赏、PC端独家内容付费阅读、思客内容付费阅读、专家智库问答、线下活动付费参与等打通线上支付通道。
智能化编辑部还要有一个传播效果监测反馈系统,通过大数据分析和定向分析相结合,对发出的每一条稿件在网站、两微一端、社区平台的传播情况、网民互动情况进行实时监控,并及时以可视化的方式反馈至采编、运营团队,便于团队有针对性地调整传播策略、传播内容及运营策略。
目前,在数据源采集方面,新华网已经采集了涵盖网站流量数据、微信公众号粉丝数据、微博阅读数据、活动转发与评论数据等在内的全方位传播效果数据。在数据应用方面,正在加紧推进炫知传播力分析系统和新华睿思平台与采编和运营团队应用的无缝衔接,通过可视化的方式为采编、运营人员提供传播路径分析、传播趋势分析、传播时长分析、传播媒体分析等服务,力求有效帮助各相关团队及时了解内容质量、传播效果,预测运营方向、控制运营成本,评估营销方案等。
建设智能化编辑部是一项庞大的系统性工程,它不仅仅是某一采编环节的智能化,也不能完全依靠“超级编辑器”,更不能简单等同于“超级编辑队”。建设智能化编辑部需要技术、人才、机制等全要素的有力支撑和有机融合才能真正释放出“超级效能”。
如何实现技术与采编的有机融合面临挑战。从目前情况看,尽管大数据、云计算、人工智能等先进技术在媒体领域正在被广泛采用,但应用水平仍处于初级探索阶段,人工智能真正发挥效能需要大数据的支撑和算法的不断完善优化。此外,虽然搭建智能化采编平台是建设智能化编辑部的重要抓手,但如何实现技术平台升级与内容建设需求的“耦合”,做好技术研发成果转化“落地”,做到“技术引领但契合采编需求”,仍然需要采编、运营、技术团队“供”“需”双方深度磨合。只有“供需平衡”才能真正发挥技术对内容的引领作用,达到解放人力、释放生产力的目的,实现编辑部整体创新能力、生产能力质的提升。
如何实现人机协作的高度契合面临挑战。“超级编辑器”需要“超级编辑”来驾驭。技术平台的系统性革新对采编人员的业务能力也提出了新的更高的要求。加快培养大量复合型全媒体人才是确保智能化编辑部高效运转的基础。要通过专题培训、实战演练、业务研讨、观摩交流等方式,加快推动现有人员向全媒记者、全媒编辑转型,使采编全员成为既会全媒采集,又会文图、音视频、H5产品等全媒生产的跨终端、跨平台报道的“特种兵”。此外,还要着力完善人才激励机制,研究设计更加科学合理的考核评价体系、职级晋升制度、薪酬分配办法等,充分调动 “人”的积极性、创造性,为“人机协作”“人机合一”创造有利条 件。
如何建立新型的采编体制机制面临挑战。智能化编辑部能否高效运转,体制机制保障是关键。智能化编辑部需要人机密切协作、团队紧密协同,其内容生产不能是“村村点火、户户冒烟”的无序生产,也不能是毫无目标的盲目生产,必须是精准策划、精准生产、精准传播。这就需要匹配建立高效顺畅的组织指挥机制、创意策划机制、协同生产机制、多终端传播机制、信息反馈机制。只有将机制建设与人才和技术建设融为一体,才能发挥出智能化编辑部的最大效能。
2018年,新华网将加快推进智能化编辑部技术平台建设,实现相关功能分期分批测试上线应用;加大人才培养力度、推动采编全员全媒化转型;着力创新体制机制,为智能化编辑部高效运转提高有力保障。未来,还将积极推动智能化编辑部与新华社“媒体大脑”深度融合,探索平台接轨、技术共享、资源共享、人才共享,全面提升新闻报道全链条智能化水平,真正实现人、物与信息的全面连接,实现内容与技术的深度融合,有力抢占媒体融合发展制高点。