人工智能大模型赋能全媒体传播基础设施升级与应用生态创新

2024-03-10 11:25徐琦
出版广角 2024年3期
关键词:内容模型

【摘要】尽管当下全球大模型投建如火如荼,但如何利用大模型賦能媒体融合,路径尚不明晰。从“涌现”和“同质化”入手,深刻理解大模型的技术特性、技术局限与潜在风险是必不可少的前置思考。对主流媒体而言,对大模型采取“拿来主义”并不可行,通过价值观对齐、行业知识增强等措施建设安全可控的媒体大模型是媒体融合新的技术落地方向,能够驱动基于智能体的人机协同的“策采编审发评馈管”全流程智能升级,加速人工智能生成内容新范式的普及化,促进智媒应用生态的持续繁荣发展。人工智能大模型赋能全媒体传播的切实进路应以媒体大模型为新技术底座,以大模型核心能力为支点,以内容生产、内容消费、内容安全、媒资管理、协同办公等典型行业场景为切入点,以智能媒体应用创新为落脚点,通过模型赋能、场景赋能与生态赋能多层次完善主流媒体布局,从而推进媒体深度融合。

【关  键  词】人工智能大模型;全媒体传播体系;媒体融合;智能媒体;智能传播

【作者单位】徐琦,中国传媒大学媒体融合与传播国家重点实验室新媒体研究院。

【基金项目】国家社会科学基金项目“基于AIGC的主流媒体智能传播机理研究”(23BXW035)研究成果。

【中图分类号】G206【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.03.002

从党的十八大到党的二十大,从建设现代传播体系、全媒体传播格局、全媒体传播工程到全媒体传播体系,以习近平同志为核心的党中央不断从党和国家全面推进中华民族伟大复兴的战略规划高度来强调加强全媒体传播体系建设的重要性,将其作为指导中国媒体融合发展的行动指南,引领我国媒体融合持续纵深推进。近10年来,各级主流媒体在媒体融合深水区奋楫争先,强化技术引领,重塑内容生产流程,拓展传播渠道,打造平台矩阵,创新运营模式,现已取得丰硕成果[1]。

随着媒体融合进程从全媒体、融媒体加速迈向智媒体时代,AI作为新一轮科技革命和产业变革的重要驱动力量为传播格局带来历史性变革与颠覆性挑战。2023年ChatGPT全球爆火,成为有史来最快达到1亿名月活用户规模的消费级应用,让社会大众切实感受到AI和第四次工业革命的惊人潜力。ChatGPT实际上是一种预训练大语言模型应用,从2018年的初代版本发展到2023年3月的GPT-4版本,其模型性能在短短5年间产生了质的飞跃。2024年2月,谷歌发布Gemini 1.5,该模型在长语境理解方面取得重大突破。与此同时,OpenAI发布文生视频大模型Sora,其基本视频生成能力(时长、长宽比)、视频连续性、真实世界模拟等都具备显著优势。更重要的是,Sora 作为理解和模拟现实世界模型的基础,它的出现更被视为实现通用人工智能的关键里程碑。当下,科技巨头纷纷加码大模型研发,国内“百模大战”正酣,大模型正在诸多社会生产领域全面崛起。尽管当下全球大模型投建如火如荼,但其发展依旧处于通用智能的初级阶段,传媒学界对该领域的研究基本集中在ChatGPT引发的人机关系和交往以及知识生产新机制方面[2],传媒业界对大模型的关注与日俱增,但尚未大面积展开实际的产业落地。如何利用大模型技术创新赋能我国媒体融合、推进全媒体传播体系建设,路径并不清晰。为此,本文试图透过当下生成式AI浪潮的喧嚣现象,集中探究大模型赋能全媒体传播体系构建的切实进路与创新潜力。

一、前置思考:理解大模型的涌现与同质化

人工智能大模型是指在大量数据参数上训练的模型,其可通过适应来执行广泛的下游任务[3]。在参数规模方面,大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,每年参数规模至少提升10倍,目前千亿级参数大模型已成为主流。在技术架构方面,变换器架构已成为大模型领域的核心技术,其在大语言模型方向催生了GPT和BERT两大技术流派。其中,BERT的代表性应用是谷歌AlphaGo。随着GPT-3.0模型的问世,GPT系列渐成行业主流。如今,几乎所有千亿级参数规模的大型语言模型都采用了GPT架构。在模态支持方面,大模型已从单一模态(如文本、图像、语音)的单一任务处理发展到能支持多模态和多任务的复杂场景。OpenAI的GPT、CLIP、Sora,谷歌的BERT、Gemini与开源模型Gemma,百度文心、阿里通义、腾讯混元、华为盘古等都是大模型的具体实例。

1.涌现与同质化:大模型的技术特性及其基石意义

大模型通常具备大容量、海量参数、大算力等特点。究其技术原理,大模型主要基于深度学习和变换器架构,同时结合多种先进的机器学习技术。变换器架构是一种基于自注意力机制的神经网络模型,可有效处理长距离依赖关系,适用于自然语言处理任务。在预训练阶段,大模型通过自监督学习任务从大量无标注的数据中学习语言和视觉模式。大模型训练依赖于大规模数据集,这些数据集包含丰富的语言、图像、声音、视频等多种模态信息,模型可通过训练学习广泛的知识和模式。为处理大规模模型,大模型训练通常采用模型并行和数据并行技术,前者将模型的不同部分分配到不同的计算设备上,后者则将数据集分割成多个部分,每个部分由单个计算设备处理。在预训练完成后,大模型可通过微调来适应特定的下游任务。微调通常在有标注的数据集上进行,使得模型能够学到特定任务所需的知识。对多模态大模型而言,其通常还涉及能捕捉跨模态关联的网络结构和训练策略的设计,从而具备有效整合和处理不同模态信息的能力。此外,大模型可通过融入外部知识库(如知识图谱)以增强其知识表示和推理能力。简而言之,大模型的技术原理和特性是多方面的,其不仅在理论上具有创新性,而且已在多行业的复杂任务场景中展现超出预期的性能和应用潜力。

大模型可被视为现代AI领域的基石模型,其强大的学习和泛化能力为解决各类复杂问题提供了基础。事实上,本轮生成式AI最大的突破来自底层大模型。理解大模型的基石意义可以从“涌现”和“同质化”两大关键词入手。“涌现”是指系统行为或特性是隐式诱导而非显式构建的,它是人们为科学进步深感振奋的源头,也是人们对广泛未知后果心怀隐忧的源头。大模型的“涌现”表现为模型在没有明确编程的情况下展现新的能力或行为。例如,GPT-3通过上下文学习实现了通过任务提示语来适应下游任务,这实际上是系统“涌现”的结果,而非专门训练的结果。“同质化”是指在机器学习系统中构建方法的整合,它为许多任务提供了强大的杠杆作用,但也构成了单一的故障点。大模型的“同质化”意味着几乎所有先进的自然语言处理模型都是基于少数几个基石模型进行适应的。这种“同质化”虽然提供了极高的杠杆效应,但也意味着所有的AI系统都可能会继承少数基石模型中相同的隐藏偏见问题。

值得注意的是,大模型“涌现”和“同质化”的相互作用可能令人喜忧参半。“同质化”意味着多领域均有机会因智能化水平提升而受益,尤其是在特定数据有限的情况下。但任何基石模型的缺陷都会被适应模型和下游任务所继承,这就使得基于这些模型进行的激进“同质化”风险重重。加之,目前获得重要突破的语言大模型和多模态大模型主要基于深度神经网络,其透明性和可解释性仍显不足。这种“黑盒”特性限制了人们对其内部工作机制、模型决策过程的理解和信任,凸显了风险隐忧。

2.达摩克利斯之剑:大模型技术局限与潜在风险

虽然传媒业对大模型的关注与日俱增,但大模型在主流媒体中的落地应用还处于早期阶段。与此同时,大模型的技术风险、伦理问题和安全挑战始终是悬在头顶上的“达摩克利斯之剑”,清醒研判其技术局限性与潜在风险是必不可少的前置思考。DeepMind团队曾对语言模型可能带来的伦理问题和社会风险进行系统分类,他们将已观察到的风险和预期风险归为六大领域:歧视、仇恨言论和排斥;真实信息危害;错误信息危害;恶意使用;人机交互危害;环境和社会经济危害[4]。具体到传媒业,大模型的技术局限、误用或恶意使用可能会危及新闻的真实性、及时性与公共性,引发一系列偏见歧视、意识形态危机、侵蚀社会信任等社会问题,值得高度警惕。

第一,大模型具有多重伴生技术风险。一是大模型中所隐藏的偏见与歧视问题,如果训练数据存在偏见或有害歧视,大模型可能会学习并放大这些问题,而其他适应模型与下游任务都将继承这种偏见与歧视,并导致在实际应用中产生歧视性结果,影响社会公平和正义,这与传媒的公共性相悖。二是大模型能快速生成逼真的文本、图像和视频内容,这可能会加剧深度伪造和假新闻等虚假信息的传播,侵蚀新闻的真实性,进而对媒体信任、社会信任、政治安全、信息安全构成威胁。三是大模型的滥用和操纵问题,恶意用户可利用大模型生成具有误导性或煽动性的内容,服务于操控公众舆论、进行网络欺诈或社会工程攻击等恶意目的。尤其是在全球选举大年发布的Sora,其逼真的视频生成与世界模拟能力更加模糊了真实与虚拟的界限,这将加剧深度伪造风险,因此当前各界人士都在呼吁全面防范其潜在风险。此外,大模型仍存在安全漏洞,这些安全漏洞可能被攻擊者利用,导致与大模型关联的媒体业务面临整体失效的风险,并可能威胁到以其为基础构建的智能媒体应用生态。

第二,大模型的可靠性尚未得到有效保障,这对强调真实性、及时性的新闻业而言是难以接受的。其中,最典型的就是尚未得到有效解决的“机器幻觉”问题,即AI模型在没有足量数据或缺乏相关数据支持的情况下生成或预测不存在的信息或内容,这在图像生成、文本生成和音频生成等领域的生成模型中尤为常见。上述问题可能导致模型输出与现实世界的事实不符,甚至产生误导性信息或有害信息,而目前业界尚无方法对所合成内容做出可靠评估。

第三,大模型的内容生成能力在很大程度上依赖于输入的提问或提示语,这种对提问方式的敏感性导致其生成内容具有高度不确定性,极易诱发意识形态风险及其他安全隐患。具体来看,大模型通常缺乏对现实世界常识和道德规范的深入理解,这使得它们在处理涉及道德、法律和安全敏感问题时容易产生不当回答。大模型通常利用海量互联网数据进行训练,其中的个人、企业甚至国家的敏感数据可能被编码进大模型参数中,而通过提示信息可能会诱发大模型隐私数据泄露的问题。此外,大模型对提问方式的敏感性使其内容安全风险更加隐蔽,常规内容风控手段可能无法对其进行有效监管。

第四,大模型尚未具备判断和推理能力,只有形式躯壳,缺乏意志内核,其生成内容并不具备稳定的价值观。有学者将语言模型比作“随机鹦鹉”,即语言模型通过大规模文本数据训练学会了模仿语言的表面结构,但并未深入理解语言背后的深层含义。这类问题在大型预训练语言模型中尤为突出,基于海量数据训练的语言大模型生成的内容可能符合语言规则并通顺流畅,但缺乏实际意义或与上下文无关,甚至在逻辑上是荒谬的。这种内容生产模式无疑会影响人类的自主性和创造力。

第五,大模型应用部署代价高,这对主流媒体机构而言是无法回避的现实考量。由于大模型参数规模和数据规模巨大,其存在训练和推理计算量大、功耗高、应用成本高、端侧推理存在延迟等问题[5],这些现实问题势必制约其大规模应用落地。此外,大模型在小数据情景下的迁移能力不足,如何应对传媒业复杂的业务需求,增强其对媒体各细分场景的适用性、鲁棒性和泛化性仍极具挑战。

二、模型赋能:基于安全可控的媒体大模型升级技术底座

大模型因数据规模量变产生智能“涌现”质变的同时,带来了因同质化导致的风险问题。这决定了对首要服务党的新闻舆论工作的全媒体传播体系构建而言,主流媒体对大模型奉行全盘“拿来主义”并不可行,打造安全可控的媒体大模型技术底座才是破局之道。

1.赋能底座:从通用大模型迈向安全可控的媒体大模型

随着大模型的持续迭代,其发展重点正逐渐从通用大模型转向针对特定行业或领域的垂直大模型,从通用到行业垂直,向下扎根,以实现更深入的行业应用和更高效的服务。行业大模型相对通用大模型而言,其大模型划分依据的是应用领域的维度。通用大模型具有强大的泛化能力,如ChatGPT、百度文心、阿里通义、腾讯混元、华为盘古等,其可在不用微调或少量微调的情况下完成多场景任务,这相当于让AI完成了通识教育。而行业大模型需要利用行业知识对大模型进行微调,相当于让AI完成专业教育,如金融领域的BloombergGPT、航天-百度·文心等。

通用大模型虽然泛化能力强,但仍存在以下局限性:一是行业深度不足,通用大模型由于缺乏特定行业的深度数据积累,因此在专业领域和更加细分的垂直领域中往往难以提供高价值的服务;二是数据安全问题,通用大模型通常不是本地部署,也没有用户权限管控,企业需要将私有化数据上传到大模型方的服务器,其过程可能存在数据泄露的风险,这对数据安全敏感的行业来说是极大的挑战;三是运营成本高昂,通用大模型需要处理海量数据,对算力和算法的要求高,多数企业难以承担其高昂的运营成本。

在通用大模型的基础上,建设媒体大模型需要完成价值观对齐、行业知识增强等重要工作。具体而言,在大模型领域,对齐是一个关键概念,指确保模型的行为、输出和决策与人类的价值观、偏好和预期保持一致。特别是对能生成各类内容的大模型而言,价值观对齐尤为重要。通过设计与实施伦理框架、提高模型可解释性、确保训练数据质量、引入人类反馈以强化模型对正面价值观的学习、定期审查与更新等措施,主流媒体方可确保媒体大模型安全可控,有效防止有害内容生成,发挥媒体社会功能。行业知识增强即结合传媒业知识对大模型进行微调与知识增强。由于媒体业覆盖面广、应用场景繁多、用户需求复杂,为使大模型更懂媒体,主流媒体需通过引入更多高质量数据、领域知识融合、微调训练等方式来提升其在特定应用场景中的性能,从而满足个性化的业务需求。

从业界实践来看,媒体业大模型建设正在成为主流媒体转型的新方向。媒体大模型以基础通用大模型为底座,深度结合媒体技术和行业专属数据,可广泛服务于辅助创作、内容风控、智能应答与检索、多模态服务等应用场景,以赋能内容生产传播,推进媒体融合发展。百度与人民网联合发布的专门为传媒业设计的人民网-百度·文心大模型基于百度的文心大模型ERNIE 3.0构建,結合人民网在传媒业的丰富经验和行业知识,以及双方在预训练大模型技术和传媒领域业务与算法的经验,在新闻摘编报告生成、新闻内容审核分类、舆情分析等场景中得以应用。中央广播电视总台和上海人工智能实验室联合推出的央视听媒体大模型(CMG Media GPT)专注于视听媒体内容生产,提供节目创作、短视频生成、节目编辑/剪辑、超写实AI数字人、AIGC动画和AI换脸等功能,现已在部分节目中实际应用。山东省新型智慧媒体重点实验室推出的专注于传媒行业的内容生成和理解的传媒行业大语言大模型壹点天玑,使主流媒体能更好地与AI行业头部企业或科研院所展开大模型合作,从而加速AI新技术在媒体行业的落地,推动传媒业智能化升级。

2.赋能机理:为智能媒体产业生态提供新基础设施支撑

从结构上看,中国智能媒体产业生态在整体上可划分为基础层、技术层和应用层。其中,基础层和技术层为智媒发展提供算据、算法、算力等基础支撑,是AI发展的通用基础。应用层面向传媒业需求和应用场景,提供智能软硬件产品及解决方案,提升媒体的智能化程度,集中体现了AI对传媒业的赋能影响[6]。具体到大模型新技术背景下:基础层涵盖云计算平台、数据存储和处理服务、算法优化等,主要提供基础设施支撑;技术层集成各种预训练模型和开发工具,为构建和部署各类智能媒体应用提供技术基础;应用层主要包括智能媒体产品服务及行业应用,产品服务主要包括文本生成、图像和视频处理、语音合成、数据分析等各类工具和服务,其行业应用主要涉及大模型和AIGC在垂直行业中的具体应用[7]。概言之,大模型的发展体现了智能媒体技术层的显著进步,当前生成式AI最大的技术突破实际上就来自于底层大模型。

当前阶段的数智化融合是技术逻辑、制度逻辑和关系逻辑三重逻辑叠加的产物。数智化赋能下,媒体融合进入深度融合发展阶段,呈现以数据驱动为新引擎,以AI技术全面嵌入媒体内容生产为新流程,以产业链、供应链、价值链、创新链协同为新生态的内涵特征[8]。作为媒体融合新的技术落地方向,安全可控的媒体大模型将成为主流媒体智能化技术平台新技术底座的重要构成,其将驱动基于智能体的人机协同、人智交互的“策采编审发评馈管”全流程智能升级,加速人工智能生成内容新范式的普及化,促进智媒应用生态的持续繁荣发展。对内,大模型新技术底座可推动媒体融合生产方式创新和业务流程再造,全面提升内容生产力和传播效率,支撑智媒产品更新迭代,创新人智交互体验,实现提效降本,助推主流媒体数智化转型。对外,主流媒体可通过智能化技术平台将大模型技术服务能力输出,赋能区域联盟成员单位、政务服务商务合作伙伴、内容创作者等生态成员,不断放大技术外溢价值,全面提升智媒体时代主流媒体的综合实力与竞争力。但由于大模型处于智能媒体产业生态基础设施层面,其赋能进路并不直接可见,大模型的技术优势和赋能效果实际上是通过智能产品服务创新、行业场景落地与应用创新全面体现的。

三、场景赋能:服务全媒体传播目标,推动智媒应用创新

模型赋能考验的是技术积累和基础设施能力,而场景赋能更加考验主流媒体对于媒体行业需求及痛点的洞察与破题。对主流媒体而言,大模型技术首要服务于全媒体传播体系建设目标,核心在于对内促进“策采编审发评馈管”核心工作流程智能化升级,目前可重点切入媒体内容生产、内容消费、内容安全、媒资管理、协同办公等典型应用场景。

1.大模型智能生成重塑内容生产流程

内容生产是媒体机构的核心业务流程,基于大模型的内容生成是当前被寄予厚望的传媒业落地场景。事实上,新闻写作是AI最早介入的传媒场景之一,但不同于早期仅限定于体育、财经等特定领域的模版式写作,目前大模型已能完成语言自然流畅、风格多变甚至充满创意元素的写作任务。早期基于数据表单与写作模板的程式化自动写作模式正在加速转变为基于大模型、人与智能体协作的交互式生成范式,媒体机构内部内容生产流程将跟随生产范式的转变进行迭代升级。

面向内容生产场景,大模型技术及其应用通过提升内容生产的“策采编发”流程智能化水平,持续推动媒体内容供给侧的降本增效与流程再造。在选题策划与内容采集方面,大模型利用文本自然语言理解能力,结合大数据分析能力,辅助新闻策划人员获取灵感,完成选题挖掘分析和选题推荐,提高新闻策划人员的选题决策效率和准确性。在辅助创作方面,大模型可帮助采编人员高效使用内容摘要获取、大纲提取、专题生成、标题优化、风格仿写、改写、润色、续写、扩写、缩写等功能,以提高内容创作质量和效率。在多模态内容生产方面,大模型通过多模态生成能力可提供AI搜图、配图、文生图、文生视频、数字人、知识问答、智能稿签、文章裂变、多语种翻译等生产辅助功能,从而实现内容产品创新,提高生产效率。在内容传播环节,大模型数据分析能力有助于精细化分析传播渠道、传播链路,辅助运营人员分析并提升传播效果。

2.大模型人智交互创新内容消费体验

内容消费是媒体机构市场竞争力和社会影响力的基础,也是其商业价值、品牌价值的基础。随着数字媒体的快速发展,内容消费形态和方式不断更新,主流媒体机构需要持续创新以洞察并适应用户的需求变化,以保持自身的市场竞争力。

面向内容消费场景,大模型技术及其应用有望创造全新的内容消费方式,优化现有的内容发现与获取体验,提升内容反馈效果并促进内容再消费。在内容消费方式方面,不同于传统的单向式内容消费,基于大模型智能体的内容消费是人智交互式的,是可通过自然语言来实现多模态实时内容交互的,用户侧可以定制个性化新闻小助手、新闻主播、数字分身等智能助理,媒体侧可以研发各类基于大模型的数字人应用,通过人智交互的新消费方式来拓宽内容增量空间。在优化内容发现与获取方面,大模型可与搜索引擎、推荐系统、社交媒体等系统整合,以提高内容的可见度,帮助媒体机构赢得用户注意力竞争。在提升内容反馈效果方面,大模型可助力内容侧与用户侧的精细化运营,以激励用户完成观看、收听、评论、点赞、分享、再创作等内容消费与互动行为,以此提升媒体机构的内容价值。

3.大模型内容安全提升風控审核效率

内容安全是媒体机构的生命线,内容审核风控是确保媒体内容符合法律法规、社会价值观、社会道德标准和平台政策的关键环节,其对防止有害信息传播,营造清朗社会环境,维护社会秩序与保护用户权益至关重要。内容审核通常涉及文字、图片、视频、音频等媒体形式的审查,以识别和过滤不当内容。传统内容审核主要依赖人工,普遍存在效率低下、主观性强、成本高昂、审核员疲劳从而影响判断力和准确性等局限性。

面向内容安全场景,大模型技术及其应用可极大提升媒体机构的内容审核风控效率和准确度,使媒体机构能有效应对多模态、多语种、情感识别、深度伪造等全新挑战。在提高审核效率方面,大模型能快速处理和分析大量多模态内容,提高审核流程的自动化程度,降低人力依赖,显著提高审核速度,满足实时或近实时审核需求。在准确性方面,大模型能通过深度学习和自然语言处理综合考虑内容的上下文信息及其关联性,能够更准确地理解内容的微妙语意,包括双关语、文化差异等,从而减少误判和漏判。在跨语言能力与适应性方面,大模型支持多语言处理,能够理解和审核不同语言的内容,以及不同国家和地区的法律法规和道德标准,确保内容在不同文化和语言环境中的合规性。在情感和情绪分析方面,大模型能分析内容中的情感和情绪倾向,这不仅可以提高审核的准确度,还能帮助媒体机构更好地理解用户反馈,及时调整内容策略。在深度伪造检测方面,大模型本就和深度伪造技术同源,可通过持续学习和优化来识别和分析经过高级图像和视频处理技术生成的伪造内容,实现深度伪造反制。

4.大模型媒资管理促进内容资产增值

媒资系统是媒体机构的核心竞争力,它不仅提高了内容生产的效率和质量,还为媒体业数字化转型和创新发展提供了坚实基础。媒资系统是一种用于存储、检索、管理和分发各种媒体资产(如视频、音频、图片、文档等)的软件系统,通常包括内容创建、版本控制、版权管理、工作流程自动化、元数据管理等功能,以在确保内容的安全性、可访问性和合规性的同时,实现内容资产的高效管理和利用。传统媒资系统虽然在一定程度上解决了媒体资产的管理问题,但也存在手动操作烦琐、搜索效率低下、扩展性不足、智能化处理能力不强等局限性以及安全性和合规性挑战。

面向内容资产管理场景,大模型技术及其应用可极大提升媒体机构的内容管理效率与资产数字化增值空间。在自动化内容分析方面,大模型技术可高效提取关键帧、场景、情感等信息,生成丰富的元数据和内容标签,提高搜索效率和内容推荐的准确性。在智能检索与推荐方面,大模型技术可以更精准地理解用户的查询意图,并通过自然语言来完成流畅的检索推荐交互过程。在辅助生产方面,大模型技术可以辅助用户更好地进行创意工作,同时自动化处理重复性任务,优化工作流程,提高工作效率。在安全与合规方面,大模型技术可以辅助监测和识别潜在的版权问题,以确保内容的合法合规使用。在拓展性方面,大模型技术使得媒资管理系统更加灵活,能够快速适应新技术和新格式,如支持高清视频、虚拟现实内容等。

5.大模型协同办公优化媒体管理流程

协同办公平台是媒体机构维持日常运转的重要支撑,也是主流媒体创新管理的具体体现之一。媒体机构通常采用办公自动化系统,即OA系统来使用电子邮件、文档管理、工作流程自动化、会议管理、任务分配、考勤管理等功能。目前,OA系统基本支持媒体机构日常的办公业务功能,但仍面临个性化办公需求难以满足、跨部门数据孤岛、用户界面和交互设计不友好以及数据安全等痛点。

面向协同办公场景,大模型技术及其应用有助于优化媒体机构的内部管理流程,提高机构效率与现代化管理水平。协同办公实际上也是当前大模型能快速落地的通用场景之一,通过集成大模型,OA系统可以实现更智能的工作流程自动化,减少人工干预,提效降本。在用户体验方面,大模型的自然语言处理能力可以提升OA系统中的文本分析、自动回复等功能,优化用户体验,提高系统的易用性。在跨平台协作方面,大模型可以打破数据孤岛,实现不同系统和平台之间的数据整合,促进信息共享。在个性化办公需求方面,媒体员工可以根据自身的工作习惯和偏好来定制服务不同目标的智能体,通过智能助理的形式实现办公场景的“千人千面”。基于大模型智能体的人智协同办公有望重塑办公流程,成为未来主流的办公方式。

四、生态赋能:盘活全媒体传播生态,放大技术外溢价值

通过近10年的媒体融合探索,主流媒体已实行区域融媒联盟共建共享、政务服务商务运营模式创新、创作者内容共建等生态建设举措。随着主流媒体对大模型的渐次采用,对外技术赋能将广泛助力全媒体传播生态成员,不断放大技术外溢价值。

1.盘活融媒联盟生态,促进省市县技术资源共享

我国媒体融合发展遵循资源集约、结构合理、差异发展、协同高效的原则,对中央媒体、省级媒体、市级媒体和县级融媒体中心四级融合发展布局进行纵向优化。统筹建立跨区域、跨层级的媒体资源共享平台,形成四级媒体的协同发展机制,是健全完善四级媒体融合发展布局,形成“上下贯通、左右联动”的全媒体传播体系的题中应有之义。

目前,各级主流媒体已在实践中探索出省带区县融合、全省融合等做法,重点是依托省级媒体平台技术支持区域融媒联盟生态,将区县融媒体发展为新型主流媒体平台的用户入口和综合服务端口,以实现渠道下沉、资源整合和数据积累,合力扩大主流价值影响力版图。随着省级媒体平台对大模型技术能力的整合,各区域融媒联盟单位都将广泛受益于新一轮数智化升级。例如,传播大脑科技(浙江)股份有限公司发布的“天目蓝云”,其作为浙江全省统一的新型智能化融媒体技术平台,现已推出“融媒通”“智岛”“洪泽”等产品,可对省内11家市级党报、90家县媒、1700余家机构等浙江融媒共享联盟成员形成广泛赋能,通过体制机制创新与业务流程重塑,构建“用户共享、内容共享”的一体化传播体系。持续深耕“媒体+科技+服务”区域媒体融合生态建设的湖北长江云新媒体集团,于2023年2月与百度集团达成战略合作,将湖北省移动政务融媒体平台和县级融媒体中心省级技术支撑平台“长江云”正式接入百度文心一言,入驻长江云平台的全省100多家各级政务部门以及市县级融媒体中心可优先获取领先AI支持。

2.共建政务服务商务生态,增强“新闻+”连接力

2020年9月,中共中央办公厅、国务院办公厅印发《关于加快推进媒体深度融合发展的意见》,其中提出“新闻+政务服务商务”的运营新模式,为主流媒体深度融合提供了具体可循的路线图。经过数年探索,“新闻+政务服务商务”已成为当前融媒体的主要运营模式,新闻内容是其基底,服务功能是其工具,二者共同发挥主流媒体的社会作用。截至目前,各级各类主流媒体已广泛探索政务服务、政府智库、智慧城市、医疗服务、就业服务、交通服务、社会服务、MCN、直播带货、文旅产业等跨界合作。

实际上,“新闻+”是一种生态思维,即通过“新闻+”汇聚外部资源,实现跨界连接,促进跨界资源反哺新闻业务,通过生态位互补形成多元传播连接新模式,以此推动主流媒体从单一的传播模式转向“传播+连接”模式,实现媒体深度融合。未来,主流媒体可通过大模型技术及其应用赋能政务服务商务生态合作,进一步提升自身在信息传播、政府治理、公共服务、商业服务等方面的综合服务水平。例如,360公司与北京时间有限公司合作,将北京市政府相关政策数据灌入大模型,通过数字人“春妮”为学生提供申请助学金等问题的答疑服务,打造出有温度的“新闻+政务”体验。又如,界面财联社启动AI金融大模型项目,旨在基于自身优势打造符合金融行业发展需求的金融垂直领域专业大模型。

3.赋能创作者生态,繁荣主流媒体内容创作平台

全媒体传播体系构建强调“走好全媒体时代群众路线”,重点是把党的优良传统和新技术新手段结合起来,强化媒体与受众的连接,以开放平台吸引广大用户参与信息生产传播。在实践中,主流媒体已从早期聚合平台先后转向内容开放平台建设。领先的主流媒体持续探索利用AI技术夯实内容生态基础设施,广泛吸纳不同的内容创作主体,持续开放内容生产边界,充分激发内容创新活力。

主流媒体机构投入研发大模型技术及其应用创新,不仅可助力自身优化流程、提高效率,还可通过内容开放平台对外技术赋能,为各类内容创作者提供大模型通用创作工具,促进内容智能化生产及协作,繁荣主流媒体内容创作生态,更大程度推动AI赋能媒体融合发展。2017年新华社发布的“媒体大脑”持续迭代,通过AI不断赋能智能媒体生态,2022年其作为牵头单位起草《机器生产内容自动化分级》团体标准,从标准高度健康引导智能内容生产。由人民日报社新媒体中心联合多家企业开发的开放式媒体技术创新平台“人民日报创作大脑”于2020年上线,2023年10月发布的“人民日报创作大脑AI+”就集纳了大模型、自然语言处理、计算机视觉、音频语义理解、图像识别等先进的AI技术,通过集智能化、场景化、自动化于一体的全新工作模式平台广泛赋能内容创作者。

五、结语

OpenAI首席执行官山姆·阿尔特曼曾预测人工智能大模型技术将成為继移动互联网之后未来最大的技术平台,而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展模式将催生世界级大型企业。对全媒体传播体系构建而言,大模型浪潮不仅仅是前沿技术挑战,更是历史性发展机遇。主流媒体唯有加快数智化布局,善用技术赋能,合力推进媒体大模型应用生态建设,方可在智能媒体发展赛道上夺得先机。

|参考文献|

[1]朱瑞,李良荣. 加强全媒体传播体系建设的逻辑、内涵和支撑[J]. 新闻战线,2022(23):86-89.

[2]涌现的问题域:智能时代的新话题与旧议题的新意涵:2023年新媒体研究述评[EB/OL]. (2024-02-01)[2024-01-15]. https://baijiahao.baidu.com/s?id=1789686049746405618&wfr=spider&for=pc.

[3] On the Opportunities and Risks of Foundation Models[EB/OL]. [2024-01-15]. https://download.csdn.net/download/xiaoxiyang1990/21168934?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-download-2%7Edefault%7EBlogCommendFromBaidu%7EPaid-1-21168934-blog-129937212.235%5Ev43%5Epc_blog_bottom_relevance_base5&depth_1-utm_source=distribute.pc_relevant_t0.none-task-download-2%7Edefault%7EBlogCommendFromBaidu%7EPaid-1-21168934-blog-129937212.235%5Ev43%5Epc_blog_bottom_relevance_base5&utm_relevant_index=1.

[4]Taxonomy of risks posed by language models[EB/OL]. [2024-01-15]. https://dl.acm.org/doi/10.1145/3531146.3533088.

[5]2023中国人工智能系列白皮书[EB/OL]. (2023-12-17)[2024-01-15]. https://www.sohu.com/a/744750336_121851714.

[6]徐琦,赵子忠. 中国智能媒体生态结构、应用创新与关键趋势[J]. 新闻与写作,2020(8):51-58.

[7]中国信通院发布《2023大模型和AIGC产业图谱》[EB/OL]. (2023-07-07)[2024-01-15]. https://www.sh.chinanews.com.cn/kjjy/2023-07-10/113935.shtml.

[8]田园. 数智时代新型主流媒体的内容传播生态省思[J]. 青年记者,2023(19):13-17.

猜你喜欢
内容模型
适用于BDS-3 PPP的随机模型
内容回顾温故知新
内容回顾 温故知新
内容回顾温故知新
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
3D打印中的模型分割与打包
主要内容
FLUKA几何模型到CAD几何模型转换方法初步研究