ChatGPT爆火,人工智能颠覆内容生产模式

2023-03-23 02:40杨仁文
新财富 2023年3期
关键词:赛道领域人工智能

杨仁文

全球用户增长速度最快的消费级应用程序,已经从字节跳动旗下的抖音海外版TikTok,变成美国人工智能公司OpenAI推出的聊天机器人ChatGPT。这一人工智能对话系统在2022 年11 月30 日上线之后,仅用两个月时间,月活用户就突破1亿,并引爆全球对其所在的人工智能(AI)赛道应用场景的热烈讨论。

如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能(AI)正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷抢滩布局相关创新生态,各细分赛道在持续创新下变革在即,其中,ChatGPT所在的人工智能生成内容(AIGC)领域尤其值得重点关注。

商业场景:内容生成领域是未来重点,相关行业或被颠覆

AIGC,英文全称为AI-GeneratedContent,指基于生成对抗网络(GAN)、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。

AIGC的突破进展意味着,内容生产已经从专业生成内容(PGC)、用户生成内容(UGC)时代,进入人工智能生成内容时代。AIGC有望在应用领域,成为数字内容创新发展的新引擎,为数字经济发展注入新能量。因此,其被认为是Web3.0的重要基础设施。

从技术场景看,内容生成领域为未来AIGC的发展重点。基于不同内容模态,我们将AIGC分为文本生成、音频生成、图像生成、视频生成及跨模态生成等主要细分场景。其中,底层基础基本明确的商业场景,预计在未来1-2 年实现规模化应用,为具有快速增长潜力的细分赛道。

結合细分赛道,可将AIGC划分为内容领域及延展领域。其中,内容领域目前虽然具备商业化潜力,但并未有效实现商业化,其中存量价值来自于批量处理同质内容的降本增效,而增量价值则来源于跨模态内容生成,以及AI本身带来的科技感。在该领域,由于发行商、内容最终消费渠道具有较强的产业链话语权,我们建议关注企业对内容渠道的把控力。延展领域则对AIGC的自由度和稳定性有更高的技术要求,本质为依托人工智能进行定制化及个性化数字内容的自动化创作。

我们认为,以下四类场景有明显增长潜力:个性化内容营销、合成数据生成、虚拟陪伴及交互性内容(适用于游戏等实时变化较大、要求内容多样性的领域)。可以在该领域下重点关注企业数据、算法及商业变现能力。

应用场景中,在数字化程度高且内容需求丰富的行业上,AIGC将带来颠覆性变革,包括传媒、电商、影视及娱乐行业等。

在传媒领域,AIGC可以通过人机协同生产,推动媒体融合,例如在采编环节,实现采访录音语音转写,提升传媒工作者的工作体验。在电商领域,AIGC可推进虚实交融,营造沉浸体验,例如生成商品3D模型,用于商品展示和虚拟试用,或打造虚拟主播等,提升线上购物体验。在影视领域,AIGC可拓展创作空间,提升作品质量,例如赋能影视剪辑,为剧本创作提供思路等。而在娱乐领域,AIGC可扩展辐射边界,获得发展动能,例如在视频社交平台实现趣味性图像或音视频生成,盘活用户活跃度。另外,在教育、金融、医疗及工业领域等,AIGC可推进数实融合,加快产业升级。

典型应用:聊天机器人是核心,ChatGPT火爆全球

在文本生成领域,聊天机器人(Chatbot)是AIGC核心的应用方向,技术的不断突破正催化对话式AI产品持续落地。

1970 年诞生的“Elizzs”,是人类建造的第一个对话机器人。2000 年前后开发出来的Alice系统,则开始使用人工智能标记语言,允许用户定制聊天内容,对话机器人能按照预先设定好的脚本来回答问题。2011年,由IBM基于深度问答(Deep QA)技术开发的Watson,能够利用深度自然语言处理技术,产生候选答案,并交叉验证评估。

2014年,微软推出“小冰”,此时,对话机器人产品已可以较为熟练地使用深度学习技术。目前,用于客服、外呼、营销等环节的对话机器人产品相继推出,国内已有多家AI技术相关客服公司成立或实现较大的规模产品方案。

据市场研究机构Acumen统计,2021 年全球Chatbot市场规模约为5.21 亿美元,预计未来9 年年均复合增长率(CAGR)将为23.7%,2030 年达到34.11亿美元。

截至2022 年8 月,仅FacebookMessenger上已有超过30 万聊天机器人。据艾瑞咨询数据,在中国市场,2021年对话式AI核心产品规模约为45亿元,其中软件产值及服务产值分别为32 亿元及13 亿元。预计2026 年中国对话式AI核心产品规模约为108亿元。

2022年11月,美国人工智能公司OpenAI上线的聊天机器人ChatGPT引爆全球。它能够理解自然的人类语言,并生成类似人类作答的书面文本,不仅可以帮助开发者解决编码问题,也能充当诗人。起初,任何拥有OpenAI账号的客户可以免费使用ChatGPT。2023 年2 月,OpenAI推出付费版ChatGPT Plus,每月收费20美元。OpenAI还计划发布每月收费42美元的ChatGPT专业计划(ProfessionalPlan),并在需求低迷时提供免费计划。截至2022年12月7日,ChatGPT已拥有超过100万用户,这帮助其获取了大量数据。到2023年1月底,ChatGPT的用户已超过1亿,成为迄今为止增长最快的消费级应用程序。

决定AIGC产出质量的三大核心要素,分别是数据、算法和算力。数据是算法的“饲料”,海量优质的应用场景数据是训练算法精确性的关键基础,算法需要通过海量数据训练不断完善。算法是AIGC的“推手”,神经网络、深度学习等算法是挖掘数据智能的有效方法。算力是“基础设施”,计算机、芯片等载体为AIGC提供基本的计算能力。

ChatGPT作为AIGC发展的里程碑,离不开超级基础设施(大算力)下的大模型及大数据支撑。GPT-3是OpenAI开发的一个大型语言预测和生成模型,能够生成长序列的原始文本。在GPT-2的150亿参数基础上,GPT-3将参数量扩大至1750亿。在学界,模型规模和模型效果呈正相关关系为基本共识,但模型规模扩大后,对于CPU的内存、计算能力亦有更高要求。

2020 年,微软宣布与OpenAI合作,在Azure云中运行微软“AI超级计算机”。这个新型超級计算机包括超过28.5 万个CPU内核、1 万个GPU和每个GPU服务器每秒400GB的网络连接。在后续研究中,OpenAI发现,训练175B的SFT模型需要算力为4.9pflops/s-days,训练175B的PPOptx模型需要60pflops/s-days,训练GPT-3算力消耗约3640pflops/s-days。虽然GPT-3算力成本高昂,但在语言模型RLHF中非常有效,比模型大小增加100倍更加有效。

因此,ChatGPT基于庞大数据量进行训练的同时,引入了“手动标注数据+强化学习”(RLHF,从人的反馈进行强化学习)来不断调整预训练语言模型。该技术路径大幅提升了ChatGPT对人类意图的理解,从而提升回答信息的准确性。

ChatGPT具体的训练过程可分为三个阶段:一是收集演示数据并训练;二是通过人工标注训练数据来训练回报模型;三是使用PPO强化学习法优化回报模型,根据回报模型评分结果更新预训练模型的参数。

虽然ChatGPT“类人化交流”引发热议,但由于训练数据的缺乏及偏差,ChatGPT仍有缺点与不足,包括出现看似合理但错误或荒谬的回答,及无法完全拒绝不合理及不道德的请求等,颇有改进空间。

发展历程:从降本增效,走向额外价值创造

AIGC的兴起,源自深度学习技术的快速突破和日益增长的数字内容供给需求,当前,其市场潜力逐渐显现。

结合人工智能的成长历程,AIGC赛道的发展大致可分为三个阶段。

早期萌芽阶段,为20 世纪50 年代至90年代中期,受限于科技水平,AIGC仅限于小范围实验。

1950 年,艾伦·图灵发表了一篇文章《机器能思考吗?》,提出著名的“图灵测试”,并给出了判定机器是否具有“智能”的试验方法。1957年,美国作曲家莱杰伦·希勒(LejarenHiller)和莱纳德·艾萨克森(LeonardIsaacson)将计算机程序中的控制变量转换成音符,第一支由计算机创作的弦乐四重奏《依利亚克组曲》完成。1966年,世界第一款可人机对话的机器人“Eliza”在麻省理工学院问世,其根据人工设计的脚本与人类交流,没有语义理解,而是通过模式匹配和智能短语搜索合适的回复。上世纪80年代中期,IBM基于隐形马尔科夫链模型(Hidden Markov Model,HMM)创造了语音控制打字机“Tangora”。此后,由于高昂的系统研发成本无法带来相应的商业变现,各国政府纷纷减少了在人工智能领域的投入。

中期沉淀积累阶段,为20 世纪90 年代中期至21 世纪10 年代中期,算力设备性能提升及海量数据基础下,AIGC从实验性向实用性转变,但受限于算法瓶颈,无法直接进行内容生成。

2006年,深度学习算法取得重大突破,同时期,图形处理器及张量处理器等算力硬性设备的性能不断提升。得益于互联网发展,数据规模快速膨胀并为人工智能提供了高质、海量训练数据,推动人工智能发展。2007年,世界第一部完全由人工智能创作的小说《1 The Road》问世。2012年,微软展示全自动同声传译系统,可将英文演讲者的内容自动翻译成中文语音。

2010年至今,AIGC步入快速发展阶段。

2014 年,伊恩· 古德费洛(lan J.Goodfellow)提出生成式对抗网络,推动深度学习算法的迭代更新。随后,AIGC百花齐放,产出效果逐渐逼真至接近人类作品。2017 年,微软“小冰”推出世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》。2018年,英伟达发布StyleGAN模型,可以自动生成高质量图片。同年,人工智能生成的画作在佳士得拍卖行以43.25 万美元成交,成为首个出售的人工智能艺术品。2019年,谷歌旗下的DeepMind发布DVD-GAN模型,用以生成连续视频。2021 年,OpenAI推出了DALL-E,主要应用于文本与图像交互生成内容。2022年,ChatGPT上线,引发全球关注。

相比全球领先企业的进展,中国AIGC产业仍处萌芽期。据量子位预测,AIGC在中国的发展可分为三个阶段。2021-2026 年为助手阶段(摸索磨合期),AIGC会辅助人类进行生产,优先变现的关键在于编辑优化功能,行业创新关键能力为素材模块分拆与个性化推荐。2026-2028年为协作阶段(推广应用期),可实现人机共创,主要价值为降本增效及提供创意,预计互联网大厂将普遍布局,竞争热度提升。2028年之后为原创阶段(价值增长期),AIGC将独立完成内容创作,产生附加价值。

目前,中国AIGC企业均在初创阶段,机会也许藏在垂直应用领域中,对赛道的选择十分关键。

国内现状:企业底层技术发展不足,变现聚焦产出内容及软件服务

量子位智库的研究表明,AIGC在中国大多被作为公司的部分业务乃至相对边缘化的功能进行研发,独立运行的初创公司数量明显少于国外,大部分细分赛道的初创玩家在5家以下。语音合成(TTS)等较为成熟的AIGC能力,大多被综合性的AI公司打包提供,在应用场景上缺乏明确的指向性。另外,底层技术及产业应用侧的差距,导致中国企业仍停留在内容领域开发,如AI写作和语音合成领域,虚拟人赛道则刚刚兴起。

相比之下,国外企业则在延展领域进行了更为充分的挖掘,例如个性化文本生成、合成数据等赛道,均为其重点布局领域。

中外企业在应用进展上的差异,除了技术之外,更大的原因在于此类业务拓展的综合性要求较高,需要需求方有较高的数字化程度以及供给方对行业的充分了解,预计国内外差距短期难以大幅缩小。

从产业链看,我国AIGC产业还缺失众多环节,比如上游的数据供给、分拆及标注环节。产业链中游,我国相关企业仍处初创期,垂直赛道值得关注,优秀代表企业包括文字生成领域的聆心智能、澜舟科技、彩云科技、秘塔科技及香侬科技等,图像、音频及视频领域的感知阶跃、影谱科技、帝视科技及标贝科技等,游戏及虚拟人领域的知觉之门、倒映有声等,综合领域的红棉小冰等。產业链下游主要为各类内容创作及分发平台、第三方分发渠道及消费品厂商等(附图)。

整体看,国内AIGC行业尚未建立明确的变现方式。以写作机器人、自动配音等场景为例,大部分产品仍处在“流量吸引+平台改良”的免费试用阶段,变现空间相对较小。此外,据量子位智库的研究,由于服务B端客户时话语权较弱,部分企业会考虑直接向C端领域延展。但企业能否在互联网流量相对稳定的前提下有效接触C端用户,并设计好产品转化路径,依旧是一项挑战。

参考海外企业的商业化路径,我们发现AIGC相关企业的变现方式,主要集中在模型训练、作为底层平台、产出内容、提供软件服务等方面。根据艾瑞咨询披露的中国对话式AI业务占比来看,软件产值中的私有化部署,包括许可号授权以及公有云产品(按调用量/流量收费及按订阅制收费),均可成为AIGC企业核心变现路径。

总结来看,中国AIGC产业发展的核心困境来自三个层面:其一,关键技术不够完全成熟,大规模推广落地尚存痛点、难点;其二,企业核心能力参差不齐,威胁网络内容生态健康安全发展;其三,相关规范指引尚需完善,发展与治理之间存在匹配问题。

未来,要把握这一新兴赛道的机遇,可以重点关注三大关键点,包括技术及产品迭代成熟度、核心场景的确定,以及开源模式的产业接纳态度。行业需要关注的风险包括政策监管风险、行业市场增长的不确定性、竞争环境不确定性、AIGC企业商业化路径不确定性,以及技术创新不及预期等。

猜你喜欢
赛道领域人工智能
自制冰墩墩不能滑出“法律赛道”
科创引领,抢跑新赛道
征服蒙特卡洛赛道
领域·对峙
2019:人工智能
人工智能与就业
无人驾驶,先上赛道如何?
数读人工智能
下一幕,人工智能!
新常态下推动多层次多领域依法治理初探