文_夏康健
现今从全球范围看,媒体智能化进入快速发展阶段,可以预期,内容生产与人工智能深度融合将是未来新闻传媒重要的发展趋向。近年来,人民网积极聚焦前沿技术应用,将人工智能等核心技术不断运用于新闻生产,以主流价值导向驾驭“算法”。其中,最典型、最有成效的应用当是创新建设国内一流的“AI编辑部”,这一新技术的应用改变了传统新闻生产模式,有效推进新闻产品的生产,大大扩展了新闻传播的深度与广度,进而提升了新闻专业生产能力与水准。
“AI编辑部”的设置建设是近年来人民日报技术创新和人民网技术应用的典型成果,它从内容生产层面为人民网事业发展增添了强力引擎。尤其在2020-2022年全国两会期间,先后推出3个版本的“AI编辑部”,广泛并迅速应用于人民网采编一线。在2020年两会期间,“AI编辑部”首次亮相。此时的“AI编辑部”技术融合了人工智能的“看”“听”“悟”“审”“查”等方面的能力,不仅为一线记者第一时间提供相关资料,也审查稿件写作中有无错误,深度嵌入新闻采集和生产环节。在2021年两会期间,“AI编辑部”迭代更新,形成了“2.0版本”,增加了云上精编、智能审核、智能海报、多模搜索、一键特写五个创新功能,充分运用5G技术和边缘计算技术,保证了音像、影像等大容量数据传送,进一步强化了“AI编辑部”在全媒体生产上的应用深度与广度。在2022年两会期间,紧扣移动化、视频化、智能化的媒体技术发展趋势,“AI编辑部”提升为“3.0版本”,新增编辑移动端、5G全媒体生产、事实核查辅助、视频加密暗水印、智能会议纪要、一键生成视频、Cloud ME等辅助性技术,用5G技术连接采访前后方、用AI技术直抵新闻报道一线。
“AI编辑部”的技术应用,不止于此。人民网处在人民日报媒体融合发展的前沿阵地,在“AI编辑部”的影响推动下,涌现出不少衍生技术和产品。比如,人民网将“AI编辑部”与传统数据库技术融合,形成了新的产品发展与演变,“时习之”专栏就是其中的典型。该专栏从“习近平系列重要讲话数据库”思路出发,收录习近平总书记系列讲话重要内容,并将其接入互联网。该专栏运用“AI编辑部”的深度学习语义分析技术,将“数据库”升级为“大脑”,在可感知、可运用的前提下为受众提供学习平台。同时,人民网又充分运用既有的媒体融合成果,将“时习之”内容延伸到“学习大国”微信公众号,大大缩短了与受众的传播距离,实现了更“近一步”的传播。作为“时习之”的延伸触角和内容二次传播阵地,“学习大国”推出了大量成体系、多层次的学习资料包,如领导人讲话原文、重点书目导读、权威专家解读等,借助移动化、社交化传播模式实现与受众的深入交流,强化生产者与受众的传播连接。
与此同时,“AI编辑部”又衍生出许多实用新技术,其中事实核查辅助技术备受一线编辑记者青睐。事实核查技术主要融合了人脸识别、语音识别、自然语言理解、字幕识别、机器视觉等多项人工智能技术,能够实现对文字、图片、音频、视频等多种形态信息的审核。比如图片核查技术,可以对新闻稿件中的图片进行按照传播链路源头核查,借助图像向量引擎技术,甄别出旧图新说、版权侵权、图文脱节等问题;或者利用智能算法,多角度比对相关度较高的文章,以核查事实不符之处。事实核查比对重点网站,并以中纪委、中央气象台、国家地震台等官方权威数据库为审核基准,从信源上确保了数据的权威性。同时,事实核查辅助技术集纳了教育部、国家语言文字工作委员会的相关行业标准,增强了对敏感关键词和用语规范性的监测、提升了对常识性错误和发音不准错误的纠正能力,确保新闻内容表述妥当、精准无误。
一直以来,人民日报社高度重视技术支撑制度建设,从顶层设计上确保人民网技术发展守正创新。首先,人民日报社设有专门的内设机构即技术部来统筹全报社的技术发展。其次,人民日报社规划了“1+2+3+4+X+N”全媒体技术支撑体系。其中,“1”指的是“人民日报社媒体技术联席会”机制,统筹报社技术发展规划、重大项目、网络安全和协调报社技术资源;“2”指的是传统媒体和新兴媒体两条业务主线,推动媒体融合向纵深发展,真正做到“融为一体、合而为一”;“3”指的是数据中心机房、同城灾备机房和异地灾备机房3个技术支撑平台,“4”指的是全媒体采编、涉密内参、内网办公、网络安全,面向技术服务对象;“X”指的是AI中台、数据中台、5G中台、视频中台等公共基础技术,这些技术推动采编、办公、管理一体化,为全媒体内容创作赋能。“N”是报、刊、网、端、微、屏等全媒体业务矩阵的融通和联动。这一发展规划明确了人民日报与人民网在技术发展上的管理关系,有序促进人民网技术创新。比如上文提到的“时习之”专栏就是由人民日报社主管,依托人民网建设的传播内容认知国家重点实验室协作共建。
第三点和第四点是相关政府招标采购制度与规划版图设计。一方面,人民日报社借助招标采购制度保证技术发展“守正”。人工智能市场鱼龙混杂,要想选择出真正具有实用价值的技术并非易事。人民日报社规定大额标的资产采购必须经过技术部和计划财务部的共同招标,而负责招标的工作人员均具有较为优秀的专业素养,这从根源上确保了人民网的技术水准。另一方面,从规划版图上看,人民网独有上市公司身份,这保证其能够不断引入资本力量对技术展开探索。2019年,人民网就和中科院自动化所共同建立人工智能技术引擎和人才创新平台,即“人民中科”,借助上市公司带来的资本力量吸引国内顶尖AI专家,实现智能理解团队和技术人才储备。这些都是孕育人工智能技术发展的重要前提。
从媒体融合发展现状来看,提高新闻内容生产力将是未来技术发展趋势。目前,新闻传播的一个突出矛盾是专题新闻策划多、受众新闻需求多,但是内容生产不足。如何将人力资源最大限度地从重要但机械的内容生产步骤中解放出来,又最大限度地投入到创意创新生产上,将是一项重要工作。这方面的探索和实践也是近年来人民网媒体技术发展的着重点。结合人民网的采编播实践,笔者认为,以下三个方向或是新闻传媒技术融合与创新发展的着力点:
一是数据库建设技术。数据库就是写作素材的积累库。数据库越强大,内容生产的潜能就越强。目前,多家媒体已经开始围绕习近平总书记重要论述展开数据库建设,不仅囊括总书记的重要论述,也包括相关重要报道。但是,当下数据库建设的难题在于如何最大限度接入各类素材,尤其是在确保准确无误前提下将习近平总书记的重要论述尽可能地纳入到数据库中。目前很多媒体借助抓取技术从海量的互联网信息中将内容直接抓取出来,但这一技术无法保证内容的准确性与真实性;倘若将信息抓取只局限在几家权威网站,又会导致数据缺乏全面性,可以说这是一项“卡脖子”技术。另一方面,如何在数据库中准确搜索到写作者所需要的信息,也是难题。很多数据库建设过于依赖传统的搜寻模式,过于机械化且缺乏精准度。目前,很多互联网公司将人工智能运用到数据抓取和数据查询中,将这一技术应用于媒体数据库建设也是未来重要方向。
二是智能化写作技术。机器人写稿发展到今天已日显雏形。在5年前,机器人写稿略显稚嫩,写出的稿件表达机械且缺乏感情,难以广泛应用于现实。但在今天,随着人工智能技术的应用,机器人写稿出现了新情况,即“生成型人工智能”的广泛应用。人工智能包括两种,即“分析型人工智能”和“生成型人工智能”。前者是传统意义上的人工智能,顾名思义,重在数据分析,它兴起于2016年并迅速蓬勃发展,市场规模从2016年的600亿美元上涨到2021年的近3000亿美元,广泛应用于亚马逊、字节跳动、特斯拉等公司。生成型人工智能则是重在创造新事物,如创造文本。这种人工智能尚未完全发展成熟,但在未来有着广阔前景。在不远的将来,生成型人工智能将广泛应用于机器人写稿中。
三是防差错技术。对于新闻工作而言,事实错误带来的伤害是不可逆的,直接损害新闻媒体在受众心中的权威性,因此如何更好地提升事实核查效率、降低事实错误率,是重中之重。从实际来看,对于每家媒体,尤其是报社而言,核校是极为耗时但产出不明显的工作,拴住了大量人力物力,也不能保证内容完全无差错。目前,人民网等媒体将人工智能应用到防差错技术中,不仅有效削减了人力资源投入,更降低了内容差错率。在未来,这将是新闻生产力进一步解放的重要突破点。