郝冠南 刘星宏 李璨 孙云龙
(人民日报社 北京 100733)
习近平总书记强调,“要探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,全面提高舆论引导能力。”[1]近年来,人民日报社持续将AI、5G 为代表的创新应用作为融合转型的重要驱动力,从全媒体新闻报道实际出发,深挖一线采编需求,以智赋能,借智增效,移动创新,以构建全媒体新闻生产新生态为目标,主导研发了人民日报社AI 编辑部,并于2020 年两会前夕上线投入使用,经持续迭代升级,AI 编辑部现已进入 4.0 时代。AI 编辑部针对性解决报社新媒体视频业务和纸媒业务面临的痛点、难点,驱动全媒体高质量内容生产,助力报社全媒体报道提质增效,具有自主可控、灵活搭建、业务融合、智慧先进等特点,并凭借其突出技术能力和“好用、实用、管用”的特性获得编辑、记者青睐,成为报社重要的公共技术支撑能力之一。其5G 云上精编、智能视频模板、智能报头校对等九大功能在国内媒体领域中具有突出创新性和较强借鉴意义。
人民日报社AI 编辑部(如图1)结合云计算、人工智能、大数据、5G、VR 等新兴技术,持续建设面向全社全媒体智能生产工具集,从体制机制确立、基础能力搭建、业务主线梳理等方面着手助推媒体深度融合发展。其建设内容主要包括5G 云上精编、直播拆条、智能审核、5G 云导播、数字新闻、智能媒体海报、一键视频特写、全息互动连线、智能文生图、智能助理等四十余项功能模块(如图2),涵盖新闻生产“策、采、编、核、审、评、播、印、发”全链路全流程,建成全媒体时代“一次采集、多次编辑、多渠道发布”的一站式生产制作发布平台。其中智能文生图和智能助理功能是借力AIGC 技术赋能采访策划、配图生成、素材搜集、精准查询、内容溯源、智能摘要、智能辅助创作等新闻生产场景的重要探索尝试。
图1 AI 编辑部PC 及移动端界面
图2 AI 编辑部建设内容示意图
人民日报社响应中共中央办公厅 国务院办公厅2020 年印发《关于加快推进媒体深度融合发展的意见》中提出“要深化主流媒体体制机制改革,建立适应全媒体生产传播的一体化组织架构,构建新型采编流程,形成集约高效的内容生产体系和传播链条”[2]的要求,致力于实现媒体内容制作流程再造和全链路上云,在充分调研人民日报社各新闻生产部门的业务场景和需求痛点后,结合海量全媒体新闻素材管理、搜索、快速节目制作、内容安全把控和移动化生产等业务需求,扎实构建具备技术先进、纸媒适用、流程完整、敏捷灵活等多重特色与风格的AI 智能编辑部。
人民日报社结合新兴技术,构建面向全社全媒体生产的智能化底座(如图3),助力报社各类新闻作品创作。智能化底座提供音、视、图、文的全媒体感知、认知和决策能力,包括业内领先的语音智能(语音识别、多语种判断、语音合成)、视觉智能(文字识别、人脸识别、人脸美化、肢体识别、新闻场景识别、建筑物识别、物体检测、画质修复)、自然语言处理(文本分类、中心词抽取、实体抽取、情感分析),融合多模态AI 能力(智能标签、多模态搜索、智能审核)以及基于先进大模型的开放对话、AI 作画、AI 视频生成等AIGC 能力,这些能力处理速度快、应用效果好,且以原子能力形式下沉至中台,为上层各功能模块提供灵活、强大的底层技术支撑。
图3 AI 编辑部智能化底座架构图
除为融媒体宣传报道提供智能审核能力外,AI 编辑部还聚焦传统纸媒在稿件、版面审核校对方面的难点痛点,针对性打造五个特色智能审校能力,有效提高编辑记者审核效率和准确性,降低内容违规风险。
2.2.1 人民日报智能核校
该功能可自动将稿件拆句,再逐句与人民日报历史版面数据库进行比对,并根据比对结果标注出处,让核校人员秒级获取相关文字历史出处信息,解决过去只能依靠核校人员大脑记忆并人工翻阅核实的痛点,助力提升核校效率和准确率。
2.2.2 人民日报智能报头校对
该系统对人民日报历史报头图片进行AI 训练,构造报头识别模型,可精确审查出图标被消除、被替换或隐藏不良信息等情况,还可基于神经网络技术对见报日期、字体信息、位置信息等进行合规审核,对报纸安全出版起到重要智能辅助作用。
2.2.3 人民日报智能语音唱校
在版面制作的文字唱校环节,语音唱校功能可借助AI 语音合成能力取代传统人工读稿,通过AI 标准化发音避免了人工读稿可能带来的发音干扰,提高校对效率并降低人力负担,尤其在重点长篇稿件唱校场景下优势更为凸显。
2.2.4 人民日报透版检视核查
该功能可按照版次与纸张的对应关系,将纸张背面的版面内容做横向镜像,与纸张正面的版面内容进行透视叠加,形成透印后的预览效果,确保版面、照片印刷出版质量,防止可能出现的透印不利影响。
2.2.5 人民日报折印预判
该功能模块可通过技术手段标画出人民日报电子版上的折痕预估线,根据所有样本的像素线高计算折痕预估线的算术平均值,将其作为折痕高,并据此在透版模拟系统上画出折痕模拟线,方便编辑对重要版面进行折印预判,有效防止重要照片的重要部位出现在折痕上。
人民日报社积极构建“一次采集、多次编辑、多渠道发布”的全媒体AI 编辑制作平台,实现人工智能“感知+认知+决策”的全技术能力建设、全链路智能辅助、全流程数据驱动,助力报社宣传报道提质增效,顺应互联网传播移动化、社交化、视频化趋势,积极运用大数据、云计算等新技术,创新采编流程,实现内容快速采集、智能化标引、AI快捷编辑生产、一站式审核、多渠道分发等功能,并着力构建移动终端智能生产能力,全面支持移动协同,提升融媒体记者在重要报道中的到达率、自采率和首发率。
同时,全媒体AI 编辑制作平台支持分众化互动化设计。基于用户不同需求针对性生产特色信息产品,点对点推送到用户手中,做到量身定做、精准传播,提高新闻宣传的私域流量传播效果。平台提供互联网舆情热点分析、传播力分析等工具,各业务平台能实现网络热点快速反应,及时传播;AI 编辑部支持跨场景全息会面/直播、超高清云桌面(5G云上精编、5G 全媒体生产)、会议语音转写、智能会议纪要、事实核查等能力,从一横(内容深度)一纵(内容广度)两个方向对新闻内容生产模式进行优化。
此外,全媒体AI 编辑制作平台还实现了“资源通融、内容兼容”。为丰富内容表达形式、提升传播力,报社有着较高的图文、音视频等全模态新闻素材生产、管理需求,业务部门还需支持跨类型内容制作以呈现多样化、新颖、有冲击力的优质新闻作品,AI 编辑部据此打造了数据新闻、视频转GIF、一键转视频等跨模态生产工具,实现内容产品从可读到可视、从静态到动态、从一维到多维的升级融合,使新闻报道动起来、活起来,满足多终端、多模态传播和体验需求。在疫情期间,全媒体AI 编辑制作平台采用的精细化全息连线、异地分身、降噪、窄带高清等核心技术,构建跨地域、跨场景的全息会面能力,在两会重大报道中实现记者与被采访人隔空面对面互动,为观众带来身临其境的现场采访体验。
原有新兴技术落地赋能新闻采编生产的集成方式存在敏捷性不足、定制研发工作复杂、交付周期长等明显不足。为提升业务流程的敏捷性,加快新兴AI 技术在业务应用场景中的落地应用,AI 编辑部引入了低代码可视化搭建平台,通过使用简单的逻辑模型和拖拽工具即可快速将AI 能力集成至业务流程中,实现融媒体业务敏捷创新。
在国家5G 战略背景下,基于移动互联网性能提升的大前提,人民日报社与阿里云联合创新建设AI 编辑部移动端。移动端提供采集回传、直播录制、作品管理、智能剪辑、内容审核等功能,从发现线索、获取素材,到拍摄制作、审核签发,从发起直播、实景播报到连麦访谈、现场采访,真正做到“一部手机完成现场报道”。
移动版AI 编辑部适配各型号主流移动终端,并与网页端用户、内容、数据、功能互通,便于前方记者随时随地进行新闻素材采集、剪辑、上传、发布,较好保证了短视频作品的时效性。同时,移动版AI编辑部适配阿里视频云自研s264 编码器算法,使视频转码效率提升至原来的6 倍,并可更加智能和精准地控制码率,实现带宽、时延、存储和画质保真四个方面的动态调整,带给用户极致体验。未来,AI 编辑部还将适配针对倚天CPU 进行s264、s265 编码器深度优化的ARM 视频编码器,进一步提升国产化适配能力。
AI 编辑部4.0 版本集成先进大模型算法,深度结合报社数十年历史版面数据和各权威资料库,打造智能助理、智能绘图两大创新应用,为编辑记者提供秒级历史数据溯源、版面定位、素材搜集、智能创作、以文生图等实用AIGC 能力。在2023 年两会重大报道期间,上述功能得到编辑、记者广泛使用,智能助理服务被调用超500 次,生成智能绘图作品372 幅,大幅提升了素材供给能力。
人民日报社AI 编辑部一直走在科技创新的路上,不断吸纳优质先进的新兴技术能力,探索尝试全媒体采编报道量质齐升的新契机、新可能,成功助力报社全媒体矩阵在生产效率、内容革新、出版安全等多方面获得显著提升,具有突出创新性和实效性。
经浙江省科技信息研究院科技查新中心科技查新认证,以下9 项创新应用均为人民日报社AI 编辑部项目首创提出和应用:(1)5G 云上精编。该功能旨在解决个人笔记本终端算力瓶颈问题,充分发挥云端资源计算和存储的优势,集成Premiere、大洋非编、新奥特非编等主流非编工具,编辑人员只需一键连接云桌面,即可将云直播的视频流拉流并存储在云桌面上,并实现与后方团队的协同办公。(2)媒体智能海报。提供海量不同风格及主题的海报模板集,编辑可根据生产需求检索相应主题模板,通过快速替换其中的核心元素快速生成和发布海报。(3)一键视频特写。该功能将16:9 的多人视频素材快速裁剪形成多个单人竖屏视频,便于聚焦关键人物特写,突出视频核心内容。(4)全息互动连线。该功能集成Cloud ME 全息通信技术,可将两地采集的直播画面以全息影像方式呈现在“全息舱”中,实现访谈从“两地”到“同框”、视频从“平面”到“全息”的蜕变。(5)基于神经网络的智能报头校对系统。该功能可对报头图标、见报日期、字体信息、位置信息等进行合规性审核,确保报头不出差错。(6)智能核校系统。提供内容溯源核实和固定语序、引用、表述纠错能力。(7)智能语音唱校系统。通过AI 语音合成能力取代传统人工读稿,提升唱校环节效率与准确率。(8)
智能绘画(智能文生图)。编辑、记者通过简单输入关键词或上传参考图即可生成符合需求的图片。(9)智能助理(对话式智能知识库及报纸版面查询服务)。该功能支持以对话方式及时查询相关主题见报稿件内容,查看历史报纸版面及相关视频,并具备辅助创作功能。
人民日报社AI 编辑部自上线以来得到报社各部门、单位编辑记者高度认可和广泛应用,在党的二十大、全国两会、建党百年、冬奥会、进博会等重大报道期间发挥了重要支撑作用,生成了“王毅的这些话,很刚!”“珠峰登顶成功!”“听!两会声音微纪录”等大量传播力、影响力较高的爆款新闻作品。仅2023年两会期间,经由该平台制作的作品全网累计阅读量就超过2 亿,微博话题阅读量超23 亿。该平台有效提升了报社全媒体新闻采编生产力,已成为报社重要公共技术支撑平台之一。
AI 编辑部系统是人民日报社全媒体生产、传播的一次重大创新,它显著提高了新闻信息利用率,革新了传统的新闻生产方式,提升了新闻生产的自动化、智能化水平,不仅助力人民日报社全媒体宣传报道提质增效,助推人民日报融合转型升级更进一步,也为媒体同行提供了5G、AI 等新兴技术赋能新闻采编生产可供参考的新范式。
虽然人民日报社AI 编辑部系统取得了“王选新闻科学技术奖”一等奖的喜人成绩,但技术发展和创新永不止步。下一步,我们将实现AI 编辑部与人民日报社专属协同办公平台“人民e 家”的深度融合以及与其他各业务系统的融通联动,并以在建全媒体资源、中央数据库等各类权威数据库为语料库,不断优化打造更具党媒意识形态和主流价值观属性、更加智慧好用的人民日报社垂直领域大模型。AI 编辑部还将接入正在建设的“人民审校”智能勘误平台能力,使其校检功能更加完善、高效、可靠。同时,我们将开发建设数字人功能,使每位编辑记者都能轻松拥有自己的数字分身。人民日报社将与广大媒体同行一道,充分借力以人工智能为代表的新兴技术,为媒体融合转型升级谋良策、为全媒体宣传报道提效率、为国际传播力的扩大和提升开新局。