成 鹏 王 熠 苏 宇
(新华社技术局,北京 100803)
媒体融合时代的初期,新华社完成了国内分社宽带网、海外国际网以及卫星广播网等技术基础设施的建设,为业务发展奠定基础。但是,整体的技术体系还是传统典型的IOE 架构,通过IBM 小型机、Oracle 数据库和EMC 存储设备实现信息化功能,这套技术架构曾经在信息化建设时期发挥了重要作用。而面对新兴的移动互联网、社交媒体,面对一日千里的新技术应用,面对媒体融合发展这一跨时代的课题,迭代缓慢、框架封闭的传统技术架构,逐渐后继乏力。
2015年,新华社技术局展开云计算、开源框架等互联网技术调研,分析技术面临困境,与阿里、百度等互联网公司展开合作,探索一次采集、多元生成、多渠道传播的新闻生产新模式。
2016年,新华社技术体系开始向互联网转型,启动具有里程碑意义的“新华全媒工程”,完成技术体系的顶层设计和重构再造,实现新闻生产全流程数字化的转型,为新华社新闻生产进入全媒体时代提供了技术支持。
通过“新华全媒工程”,新华社建成了全媒内容管理平台、全媒新闻服务平台、办公协同平台、全媒业务管理平台、移动业务平台、现代化分社技术平台等六大应用平台,以及数据服务平台、云计算平台、基础设施平台等3 大基础平台,奠定了媒体融合时代融合创新的互联网化技术体系。
随着人工智能技术的发展,新闻生产进入智能时代。2017年年底,新华社启动“新华智媒工程”,以AI 中台驱动模式,将一系列智能服务嵌入新闻生产全流程,技术体系全面实现智能化转型。截至2022年9月,新华社技术局应用自然语言处理、语音识别、计算机视觉等人工智能技术,累计研发了180 余项先进技术赋能工具,覆盖了选题策划、调度采集、编辑加工、分发供稿、传播分析、业务管理等6 大采编环节,同时,与业务部门合作推出智媒新闻、智媒视频、数据新闻、游戏新闻、报道专题库等5 大类70 余款融媒体创新产品,以技术创新业务、驱动业务、赋能业务。在这个过程中,新华社打造了一支自主掌控、自主研发、自主运维的技术团队,为新华社媒体融合发展提供了有力保障。
2020年,中共中央办公厅、国务院办公厅印发《关于加快推进媒体深度融合发展的意见》[1],明确了媒体深度融合发展的总体要求,提出“要以先进技术引领驱动融合发展,用好5G、大数据、云计算、物联网、区块链、人工智能等信息技术革命成果,加强新技术在新闻传播领域的前瞻性研究和应用,推动关键核心技术自主创新”,为以技术创新推动媒体融合发展提供了根本遵循。媒体技术人主动求变,紧追先进、适用技术,为新闻报道不断注入技术活力,以变“化”无穷力量推进媒体融合发展。
“技术的落后不可怕,可怕是观念的落后”。迈入媒体融合时代之初,新华社技术应用延续了传统竖井式的技术架构,各个系统都有自己独立的一套服务器、存储、数据库,应用系统在一个封闭环境内运行。同时,由于当时系统化测试能力不足、自主开发能力缺乏等问题,均对技术发展形成阻碍。
“过不了互联网这一关,就过不了长期执政这一关。”解决媒体融合发展的技术瓶颈同样需要过互联网这一关。随着全媒体不断发展,只有解放思想,转变观念,积极主动适应新的传播环境、新的竞争规则,才能有效赋能新闻生产,真正扛起党赋予的时代重任。在新华社技术局(以下简称技术局)局务会带领下,技术局上下观念发生巨大转变,倡导互联网思维、拥抱互联网开源技术,积极应用5G、大数据、云计算、区块链、人工智能等信息技术,取得一系列媒体融合建设突破性进展。以云计算技术应用为例,贯通北京自建云平台和海外3 个公有云节点,打造新华社全媒混合云平台,为新华社业务和全球用户提供支持。基于云平台,利用Kubernetes 容器编排技术将多种操作服务集成到线上平台,动态调配算力资源、存储资源,支撑全社采编发供业务和智能化应用,极大解放了新闻生产力,为新华社全媒体业务发展提供了基础保障。
面对媒体融合发展的挑战,新华社传统技术体系转型迫在眉睫。依托“新华全媒工程”和“新华智媒工程”技术工程,新华社完成技术系统向数字化、智能化的转变[2],也是向互联网化媒体融合技术体系的转变。新技术体系有两个显著特征,一是微服务架构,二是人工智能。
基于开源框架,技术局构建全媒体微服务架构,对各项媒体业务功能进行服务划分,实现服务的高内聚松耦合,服务自治性、服务可组合性显著提升。技术局研制微服务引擎脚手架,在服务发现、服务配置、服务路由、服务容错熔断、服务限流降级、全链路追踪等功能上满足各项业务需求,解决了传统架构效率低、代码重用率低、扩展性不足、故障排查难等问题。微服务架构推动了社内多个内容生产管理平台(也称编辑系统)的整合,同时,实现更加灵活的代码共享,极大缩短了交付周期。
新华社高度重视人工智能技术。在2020年,技术局推出全媒体智慧中台,集成语音识别与合成、计算机视觉、自然语言处理、智能翻译、智能校对等百余项智能化服务。2021年,建成集数据标注、数据预处理、模型管理、自动化测试、服务发布为一体的算法训练平台,为智能算法持续优化提供支撑。同时,不断提高智能化应用水平,积极地将人工智能技术嵌入新闻采编全流程,推动了新闻生产提质增效。其中,在线视频快编工具AIVideo 实现了自动化剪辑聚合生成视频,降低视频编辑加工难度,被视频编辑认为是“打瞌睡时送来的枕头”。图片选片工具快速剔除不合规照片,具备敏感图识别、视频转动图、照片风格迁移等众多功能。音讯盒子工具实现各类语音快速转换为文本,大幅提升采访记录整理效率,被编辑部称为“采访神器”。“图图”可视化工具可将新闻稿件转化成为词云等30 多种图表进行展示,为新闻深度报道提供有力支撑。
随着大规模预训练模型技术的出现,人工智能应用进入新阶段。2020年,基于GPT-2 预训练模型,技术局人工智能算法团队推出了“诗词模型”,快速生成藏头诗、续写诗。2021年,新华社技术局与北京智源人工智能研究院联合发布全球首个中文新闻人工智能模型,推出“可命题诗词模型”。2022年,基于开源模型,围绕新闻领域应用场景,技术局研发推出Large 级媒体行业中文大模型,并在解决“稿件主要新闻人物提取”等多项业务任务中发挥重要作用。技术局还将“多模态大模型”技术应用于文、图、视频稿件的多模态检索业务上,实现了对新闻内容、人物、场景、视觉信息等关键元素的语义搜索,有效提升稿件二次利用价值,为最大程度利用新华社内容资源进行融媒体产品创新提供支撑。
智能化已经成为媒体融合技术体系中的核心要素。发挥好人工智能技术作用,将成为占领媒体融合发展技术制高点的关键。
图1 新华社全媒体智能化技术体系
随着媒体融合向纵深发展,技术和内容的关系更加紧密,技术服务模式从“满足需求”转变为“分工合作、相互融合”。2021年,新华社技术局成立“闻新数智工作室”,利用大数据等技术为编辑部提供海外互联网舆情数据分析支持。工作室研发“北美雷达”大数据分析系统,及时、准确地汇聚境外新闻热点、新闻线索,大大提升海外信息获取的广度、速度和深度。围绕编辑部业务需求,定制化研发“关注度态势感知模型”“对华友好程度分析模型” “涉华议案预测模型”等十余种算法模型,据此形成的数据图表与分析结果已经成为新闻稿件和智库报告的组成部分。在这里,编辑部的业务经验转化为技术实现,编辑部提供“论点”,技术支持“论据”;编辑提出“选题”,技术提供发现“方向”。技术与内容互相引导、互相启发,为新闻产品带来新形态、新文风。随着技术能力的不断提升,美学、创意等元素通过技术融入新闻报道和融媒体产品中,技术激发灵感、融合美学,实现了“内容+技术+灵感+美学”有机的统一。
媒体发展历程中,技术发挥了重要的支撑和推动作用。在媒体融合时代,技术的定位从“支撑”到“引领”,发生了新的变化。
区块链被视为新闻行业未来发展的重要技术之一。2019年,新华社将区块链技术应用于数字版权保护。针对新闻的无序传播、违法转载等行为,利用区块链技术实现新闻稿件的存证、上链,维护新闻传播秩序,为保护新华社稿件版权,维护新华社利益提供支撑。
随着元宇宙的兴起,基于区块链的非同质化通证(Non-Fungible Token)出现。当NFT 与照片、视频等内容相结合,又被称其为数字藏品。2021年,新华社自主建设了NFT数字藏品发行平台,实现数字藏品声明、铸造、发行、秒杀等各环节,并将当年优质新闻照片铸造成藏品,打造了国内第一款新闻类的数字藏品“2021 我们独一无二的记忆链”,成为新闻爆款。区块链应用于数字版权保护,是技术对传播环节的支撑,基于区块链的NFT,形成数字藏品媒体新形态,让新闻有了新的打开方式,引领媒体发展新方向。
近年来,机器人新闻写作、AIGC(AI 生成内容)开始进入国内外新闻传播领域。2015年,新华社写稿机器人“快笔小新”上线,实现了体育、金融相关快讯的快速生产和发布,解放了记者生产力。随着人工智能技术不断升级,更多的“AI 人”进入内容生产和发布流程,引领媒体跨越到AIGC 时代。2022年,基于扩散模型技术,技术局构建了AI 漫画创作平台,模型通过语义推理,自动对漫画中的物体场景、构图配色等方面进行智能绘制。漫画编辑凭借一句话就能获取“AI 漫画家”绘制的漫画。AI 漫画作品在海外社交媒体平台发布后获得了海外网友的广泛好评。
当前,基于技术局最新搭建创意生成模型,就可以将一句古诗生成一幅绚丽的油画甚至是一段有创意的视频。再综合超分辨率、补帧等技术,让视频达到高清的效果。媒体融合时代,技术不仅仅是辅助内容的工具,而且已经成为引领媒体融合发展不可缺少的重要“一翼”。
图2 AIGC 以诗作画效果
面对媒体融合发展的新形势、新任务,技术能力、技术体系、技术服务模式、技术定位都在不断发展变化,这是媒体技术人服务大局、应对变局、开创新局的必由之路。以技术创新推进媒体融合发展,是手段;将新华社建成国际一流新型全媒体机构,是目的。其中技术建设要服务于新闻业务是丝毫不能改变的。新技术日新月异、层出不穷,好技术不一定是合适的技术,“不能为了技术而技术”,必须紧扣新时代新华社核心业务推动技术创新和应用。决定一项新技术应用于新闻业务前,要做到“三想”:一想这项技术是否有安全风险,二想这项技术是否偏离新闻业务中心工作,三想这项技术是否能被用户接受。想清楚这3 个问题,才能在融合之路上更好发挥技术服务业务的作用。
技术建设的实践经验证明,以“技术外包”为主的技术建设思路将带来创新能力减弱、系统建设周期过长、核心技术“卡脖子”等一系列问题。新华社技术局始终坚持不断提升自主研发能力,培养研发队伍,贴近应用场景,掌握核心技术,创新主流算法,走出了一条满足业务快速发展要求、发挥引领性保障作用的技术发展之路,这使得技术局掌握技术赋能新闻业务的主动权。当然,“自主研发”并不意味着全盘“自己研发”,新华社在不断提升自主研发能力的同时,积极加强对外交流合作,腾讯、阿里、百度、科大讯飞、清华大学、北京大学、中国科学院等单位成为紧密的合作伙伴,充分运用集成创新、合作研发、技术转化等手段,积极抢占技术制高点,快速将先进适用技术为我所用。
密切跟踪应用新技术成为媒体发展的不变原则。新华社傅华社长明确提出,强化技术赋能,始终保持对媒体融合技术路线的前瞻性,紧扣新时代新华社核心业务推动技术创新和应用,不断提升技术预见、技术储备能力,推动先进适用技术在新闻报道中的有效转化,积极抢占全媒体时代媒体技术高地。[3]
以移动通信技术为例,4G 技术带来了移动互联网的繁荣,5G 技术在新闻传播采集方式、生产流程、传播形态等方面催生出更多深刻变化,新的新闻业态不断涌现。2019年北京世界园艺博览会报道,新华社首次实现5G+VR 全景直播,提供了全景沉浸式体验;2020年12月,新华社发出中央媒体机构第一条5G 消息;2021年,技术局建成“5G 消息智能采编发平台”实现新闻生产全流程5G 消息化;2021年中国共产党成立100 周年庆祝大会报道,技术局成功应用5G 网络切片技术保障海量图片快捷稳定传输。可以看出,媒体行业技术能力将伴随着新技术的发展而不断成长。
安全是一切工作的底线。媒体融合时代引入全新的传播方式,带来了更多的不可预测性和风险性,确保网络安全、发稿安全、数据安全等安全工作的重要性不仅毫不动摇,且带来更多课题。
围绕发稿安全,新华社技术局推出了自主研发的“新华较真”人工智能内容安全引擎[4],立足新闻稿件采写校对的强需求,以主流导向为约束,结合权威时政数据,增强学习模型,打造“内容检校+内容风控”的内容安全产品,对政治术语、固定搭配、形近字、音近字等语法错误进行识别,对涉政敏感、违纪敏感、事件敏感进行判别,利用多模态内容检校技术,集成语音审核、OCR 审核、旗帜审核、技术审核等不同维度的算法模型,打造全场景覆盖、全要素审核的内容检校平台,为确保安全运行提供智能化手段。
习近平总书记在阐述媒体融合时曾强调,管得住是硬道理,用得好是真本事。媒体技术人要在“管得住”上下功夫,首先要提升自身的政治能力和政治水平,要防止技术应用引发的算法歧视、内容伪造、“信息茧房”等问题,努力研发应用“管得住”“用得好”的技术,推动媒体融合发展。
十年来,媒体技术人积极践行技术创新,推动媒体融合发展,变的是技术体系、技术能力和创新意识,但忠实履职的精神始终不变。加快媒体融合发展,时代呼唤我们不断前进,围绕“内容+技术+灵感+美学”的有机统一[3],持续解放思想、夯实能力、稳扎稳打,在媒体融合的道路上不懈探索。