上善若水
沉寂许久的AI在2022年年底来了个华丽的返场——“AIGC”作为AI领域新的宠儿,以令人注目的速度发展,将创新和技术再度拉回到世界舞台的焦点。
2022年8月的美国科罗拉多州博览会艺术比赛上,一幅 “数字艺术/数字修饰照片”获奖作品在互联网上掀起热议并持续至今。观察这部作品,典型的歌剧人物,巴洛克式建筑大厅,大幅的圆窗外阳光明媚,隐隐出现建筑轮廓,富有美感。但这幅《太空歌剧院》(Théatre DOpéra Spatial),是由AI绘画软件Midjourney完成的,这也是其争议的来源。其创作者,一位桌游公司的CEO杰森·艾伦(Jason Allen)获奖后表示,没有犯规,不会道歉。
以AI生成文字、图像、音频等内容,是已经存在已久的深度学习方向。早在2017年,一幅由AI学习大量画作,最后“模仿”生成的作品,就已经在佳士得拍卖出超过40万美元的价格。
但从今年开始,各种各样的AI绘画应用,如同雨后春笋一般冒出。无论是大厂小厂,都像约好了一样发布AI绘画产品:2月,Disco Diffusion推出AI图像生成平台;7月,微软旗下的Open AI推出新模型WALL-E2,并进行公测;8月,Stability AI推出Stable Diffusion,并开放注册……AIGC赛道开始浮出水面。
AIGC全称为AI-Generated Content,指基于人工智能技术,通过数据寻找规律和适当的泛化能力从而生成内容的技术,内容通常为AI生成的文字、图像、音频等。通俗来讲,AIGC其实就是通过AI的智能生成技术将其赋能于各大内容相关行业,从而创造出更多的可能性和创新性作品。
从文字到图片,从图片到视频,从视频到游戏,互联网内容形态变化的背后,更是内容生产方式从PGC到UGC、从UGC到AIGC的变化。
根据Questmobile数据显示,2022 年上半年以 UGC 为主要生产方式的短视频时长进一步增长 2.3 个百分点达 28.0%,以 PGC 为主要生产方式的在线视频时长下降0.2 个百分点达 6.6%。相比于 PGC,UGC 具有供给量充足、快速试错、优胜劣汰等优势,成为当前内容生产的主要形态。
而AIGC是UGC发展到一定阶段的必然产物。一方面,内容生产的升级依赖于工具的迭代,而工具的迭代依赖于对优质内容的总结。以抖音为例,美颜、配音和特效简化内容制作,而创作者对于热门和优质内容的模仿又推动优质内容的集中产出。事实上,推荐算法的结果将加剧局部的中心化,一个爆款内容往往带动的是一类爆款内容。
可以说 UGC 是基于 PGC 内容的,从影视内容的二次创作到爆款内容的扩散。同理,大量的 UGC 内容也是 AIGC 的温床,AI 通过对数据的深度学习和归纳,不断提高内容的质量。将 UGC 供给量充足、快速试错、优胜劣汰的优势进一步深化。
CNBC的一项针对美国千禧一代与Z世代年轻人的研究显示,梦想成为内容创作者的年轻人数量,已经达到了将宇航员作为选项的人群的3倍。而哔哩哔哩发布的《B站创作者生态报告》显示,从2011年到2021年,该平台创作者数量增长了1512%。
创作者数量扩大,背后是正在崛起的创作者经济。根据Influencers.Club最 新报告,2021年全球创作者经济规模达到1042亿美元,2021年创作者经济初创企业(Start-ups)估值总规模就高达50亿美元。
AIGC在元宇宙创作者经济领域内的广阔想象空间,成功吸引科技巨头们的关注。
2022年上半年各平台UGC内容比例,来源:Questmobi
红杉资本发表了一篇名为《生成式AI:一个充满创造力的新世界》(Generative AI: A Creative New World)的文章。红杉在文中表示,生成式AI,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,未来预计能够产生数万亿美元的经济价值。
市场潜力如此巨大的领域,让谷歌、Meta、微软纷纷布局,从Meta宣布由文本到视频的系统Make-A-Video,到谷歌宣布的可以从简单的文本提示中生成高清视频的Imagen Video和Phenaki,AIGC在海外迅速发展。而Stability AI、Jasper、OpenAI等AIGC的新晋独角兽也开始强势崛起,2022年10月19日,主打文字生成的AIGC公司Jasper.ai宣布完成1.25亿美元的A轮融资,估值达到15亿美元。前一日Stability AI宣布获得1.01亿美元,公司宣布会继續研发用于生成图片、语言、音频、视频和3D的AI生成模型,投后估值达10亿美元。
与此同时,国内大厂百度、腾讯优图、阿里巴巴、快手、字节跳动、网易、商汤、美图等都在AIGC领域有所投入。11月9日,百度创始人兼首席执行官李彦宏表示,过去一年无论是在技术层面还是商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。其中人工智能技术方向性改变的体现就是AIGC。李彦宏判断AIGC将迎来三个发展阶段:“助手阶段”,AIGC辅助人类进行内容生产;“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;“原创阶段”,AIGC将独立完成内容创作。
其他国内公司中,腾讯打造出写稿机器人“梦幻写手”;阿里巴巴旗下的AI在线设计平台Lubanner,帮助营销人员生产Banner;字节跳动旗下的剪映以及快手云剪都能提供AI生成视频;网易推出一站式AI音乐创作平台“网易天音”等等。
对于大众而言,AIGC并非遥不可及的存在,其已被广泛应用在文字、图像、音频、游戏和代码的生成当中,一些较早创立的企业已经实现了较好的商业化。尤其在一些具备高重复性的任务、对于精度要求并不那么高的领域应用较为成熟。随着 AIGC 技术的发展,其适用面将会逐渐扩大,这类 AIGC 服务的提供商大多数时候会以提供 SaaS 服务的形式变现。
在文字创作领域,AIGC生成文字目前主要被应用于新闻的撰写、给定格式的撰写以及风格改写。该领域独角兽Jasper允许个人和团队利用 AI 来创作内容,多用于商业。用户可以借助 Jasper 生成具有丰富关键词、搜索引擎优化的原创博客,可以通过文字描述让Jasper帮助完成文章的创作、创建广告话术。通过Jasper 用户可以寻找创作思路、高效完成文案、突破语言壁垒,而不会存在抄袭的嫌疑。
图像创作则因AI绘画已经广为大众熟悉了,其背后的逻辑在于计算机通过NLP识别语义并翻译成计算机语言,结合后台的数据集(这些数据集主要通过自有素材或机器人爬取公开版权的内容获得),创作出一幅全新的作品。除了绘画以外,AIGC当下也能够被运用在视频创作中。Google推出了AI视频生成模型Phenaki能够根据文本内容生成可变时长视频的技术,在公布的 DEMO 中,Phenaki,它是一项基于几百个单词组成一段前后逻辑连贯的视频只需两分钟。相比原有的Imagen基础上衍生的Imagen Video瞄准短视频,Phenaki 瞄准的是长视频。AIGC 在视频中的运用,让我们看到了未来虚拟人也能够作为演员在影视剧中扮演不同的角色以提高内容产出的效率和多样性。
除此之外,游戏也是当下AIGC落地的主要领域,一方面是用于场景和故事的搭建。开放世界游戏越来越受欢迎,通过 AIGC 来创建场景和 NPC 都将会大幅度提升效率和降低成本。另一方面,玩家可以通过 AIGC 的平台工具来创建自己的虚拟人,可以用于游戏中的打金等活动。有一家叫作 Delysium 的游戏公司已经开始引入这一功能。或许在未来的开放世界游戏中,不同的玩家将对应不同的游戏剧情和副本,这无疑将是令人兴奋的应用。
从Web 1.0的单向信息传递的“只读”模式到Web 2.0的人与人通过网络双向沟通交流的“交互”模式,内容的需求在不断增加。为满足这一需求,内容的生成从单一的PGC演变到了现在的UGC并占据了主要市场。Youtube、Instagram、抖音、快手、B站上有大量的内容来自UGC创作者。
而当我们迈入Web3.0时代,人工智能、关联数据和语义网络构建,形成人與网络的全新链接,内容消费需求飞速增长,UGC\PGC这样的内容生成方式将难以匹配扩张的需求。
在这样的趋势下,AIGC将是新的元宇宙内容生成解决方案,AIGC利用人工智能学习知识图谱、自动生成,在内容的创作上为人类提供协助或是完全由AI产生内容,不仅能帮助提高内容生成的效率,还能提高内容的多样性。