近期,美国宾夕法尼亚州立大学博士生吕尧和合作者,开展了一项关于生成式人工智能(GenerativeAI)的研究。
其表示,这项研究的缘起可以追溯到近年来生成式人工智能技术的突飞猛进。
作为人工智能(AI)发展的一个全新赛道,生成式AI展现出令人惊艳的创造能力,能够根据简单的提示或指令,生成逼真的图像、视频、文本、音频等丰富多媒体内容。
其中,大型语言模型(如GPT-3)和文本到图像、视频的生成模型(如DALL-E、StableDiffusion)无疑是最耀眼的“明星”。
它们突破了人类认知的极限,让AI系统也能拥有“想象力”,催生出超乎想象的创意作品。
与此同时,内容创作者群体正在极力拥抱并驾驭这些生成式AI工具,将其融入到自身的创作实践中。
借助AI的协助,人们可以极大提升创作效率,甚至超越自身的能力边界,生成出高质量且与众不同的内容作品。
详细来说,本次研究始于2023年的一次同行交流。
当时,吕尧和本次论文的第二作者张和(音)、第三作者蔡杰(音)以及美国克拉克大学的牛硕博士参加了人机交互与普适计算大会(CSCW)。交流之中,牛硕提到了一个新兴现象:内容创作者们正在越来越多地尝试将生成式AI工具融入创作实践之中。
但是,具体是怎样的尝试?效果如何?存在什么机遇和挑战?在这次交谈中,他们都认为这是一个潜力很大的课题,并且表达了对这个课题的兴趣。
基于这样的疑问,他们开始查阅大量文献,搜集各方观点和一手素材。
通过几个月的持续关注,他们逐步确立了本次研究的核心主题——对内容创作中的生成式AI应用进行系统性探索。
为全面了解内容创作者运用生成式AI的实践,他们设计了搜索策略,从视频平台YouTube上下载了大量相关视频素材。
这其中也遇到了一些技术挑战,比如如何过滤无关视频、如何获取更多元化的示例等,通过多次调整策略之后他们才逐步攻克这些难题。
经过初步筛选,他们最终锁定68个高质量分析样本,覆盖了多个不同创作领域。
这些视频展示了创作者与生成式AI工具的实际互动过程,对于接下来的数据分析至关重要。
针对这批宝贵的一手素材,他们采用开放式编码以及亲和图分组等经典的定性研究方法,对视频数据进行了细致分析。
其间,他们反复观看理解每一个视频,识别并标注出与研究问题相关的所有要素。
过程中最大的挑战是如何准确理解和命名新名词、新事物,因为生成式AI应用是一个前沿领域,缺乏成熟理论框架和术语体系。
由于生成式AI的应用实在太过新颖和前沿,他们在对视频素材进行分类归纳时,常常会遇到概念界定的分歧和争议。
有些AI工具比如Synthesia既可以生成图像又可以生成视频,那它到底应该被归为“图像处理工具”还是“视频处理工具”?
针对这一问题,小组成员在会议室里展开过激烈的辩论。
有人认为应该根据工具的最终输出形态来定义分类,但也有人提出这样过于片面,忽视了工具在创作流程中所扮演的角色和贡献。
最终,通过多轮讨论碰撞,他们决定从工具在创作过程中的实际“行为”出发,对每个视频素材中呈现的AI用途进行编码,再据此进行分类和命名。
这一看似简单的方法论争议,实则体现了他们对AI创作实践本质的深入思考。
另一个令吕尧印象深刻的讨论焦点,则是关于“AI生成内容”在当下是否真正属于“创作”范畴的哲学命题。
由于AI只是根据提示和规则运算产生结果,那么是否可以用“创造”来形容?
这种质疑不仅引发了他们对智人与智能界限的反思,也体现了生成式AI给传统“创作”概念带来的全新思考维度。
虽然未能给出一个终极定论,但他们每个人对于这一哲学命题都有了自己独到的见解。
而在完成初步编码之后,他们通过集中讨论、归纳总结,最终从海量原始数据中提炼出一系列有价值的发现,并将它们逐一对应到所设置的研究问题之中。
比如在“内容创作者使用了哪些AI工具”这一问题上,他们总结出了语言模型、图像处理器、视频处理器等六大工具类型,并详细列举出每类型下的具体工具实例。
而在“AI工具在创作中扮演了何种角色”的问题上,他们则从视频中总结归纳出了诸如“生成”“升级”“建议”等八种主要的AI贡献行为。
最终,相关论文以《对YouTube用户在内容创作中使用生成式AI的初步探讨》为题发在人机交互顶会上。
如果本次成果能够得到业界的关注和认可,它可以为相关领域带来一些积极的价值。
预计有望推动以下几个方面的进展:
首先,优化内容创作工具。
根据课题组对创作实践的细致分析,生成式AI工具的开发者可以更精准地把握用户需求,开发出符合创作者习惯的一体化解决方案。例如,将视觉生成、音频生成、视频编辑等多种AI能力无缝集成到同一个创作平台,从而简化创作流程,提升工作效率。
此外,通过本次研究该团队对生成式AI在创作中的具体角色和贡献也有了更深入的认知。这可以为优化工具的人机交互界面提供依据,进一步提升人与AI的协作效能。
比如,可以在工具界面上增加更多反馈和修正的自由度,以及增加更智能的提示机制,帮助创作者高效地调整和控制AI输出结果。
其次,推进人工智能教育。
生成式AI正在悄然改变内容创作的游戏规则。相较于传统的人力创作,AI辅助的创作模式无疑效率更高、门槛更低。
未来,如何高效利用这些新兴工具,保证自身在激烈的人机竞争中不被边缘化,将是内容创作者亟待解决的现实课题。
而本次研究可以为设计AI教育培训课程提供参考,帮助创作者获得必要的AI素养。
包括高效调用和编排各种AI能力的技巧、评判AI输出质量的标准、创作中的人机分工模式等,从而顺利融入人机协作的新常态。
再次,完善内容审核和法律政策。
随着生成式AI快速渗透内容创作的各个环节,审核AI生成内容质量的需求也将日益迫切。
本次针对当前内容创作中生成式AI的具体使用场景和产出形态的研究,可以为制定相关审核标准、识别AI生成内容的方法论提供依据。
从本次研究的结论来看,在视频创作领域YouTube创作者普遍利用AI工具生成虚拟人物形象,进而用于录制“人物”视频。
那么在审核过程中,就可以基于人物动作、语音等细节特征,来鉴别视频中的人物是否为真人。
另一方面,大规模AI生成内容的涌入,也对现有的知识产权法律制度提出了新的挑战。
谁拥有AI生成作品的版权?创作者的贡献是否足够获得版权?算法本身能否享有某种权利?
诸如此类的法律争议将暴露出越来越多的空白点,亟待通过司法判例和法律法规的补充来规范和明确。
而本次研究或可为厘清版权纷争、探讨相关法律责任提供一些实证支撑,为制定科学合理的AI内容治理政策贡献一份力量。
最后,催生新型商业模式。
生成式AI无疑是一种生产力,它在赋能内容创作者的同时,也必将催生出新的商业模式。依托AI的力量,大批新生创作者将能更加便利地加入内容创作的大潮,从而加剧这一领域的“去中心化”趋势。
在这种趋势下,创新的盈利模式或将涌现出来。可以预见,为了满足AI辅d8c464ac35259f8f301844374e2800010e723c759c2bba64c98066c1956be5bc助创作过程的需求,将可能衍生出创作素材的交易市场、辅助创作服务的供应链、为生成内容“加成”并售卖的中间产品等新兴商业形态。
例如,有一位YouTuber就曾展示如何基于AI素材模板,二次编辑生成出新颖有趣的视频内容,并通过售卖这些内容产生收益。
而本次研究或许可以为这种“去中介”的新型创业累积理论基础,为寻找新的盈利模式指明方向。
此外,吕尧补充称:“我想再次强调生成式AI对内容创作领域带来的深远影响。这种影响不仅体现在创作工具和流程的变革之上,也将逐步渗透到内容生态、商业模式、法律政策等多个层面。”
生成式AI为内容创作者提供了全新的“智能助理”,有望解放创作者的生产力,催生出更多富有创意的作品。
与此同时,AI生成内容的泛滥也可能对平台的内容质量和知识产权造成一定冲击。
如何在创新与管控之间寻求平衡,妥善利用AI优势,规避其潜在风险,是一个亟待解决的命题。
因此,吕尧希望本次研究能够引发同行对这一话题的更多思考和讨论。
与此同时,生成式AI及其在内容创作领域的应用正在日新月异地发展和演进,吕尧认为本次成果仅仅是勾勒出了一个万里长征的起点。
未来,他们仍将紧密跟踪这个前沿热点,努力在以下方向取得新突破:
其一,扩展研究范围。
目前,他们仅仅分析了YouTube视频,但生成式AI的使用远不止如此。
因此,其计划将研究范围扩展到其他主流内容平台,如TikTok、Instagram、X等,以便更全面地了解内容创作者的实践动向。
其二,追踪技术发展。
第二代大型语言模型、视觉问答模型等AI创新层出不穷,必将进一步改变内容创作的游戏规则。
所以,需要及时跟进这些发展动态,分析其对创作实践和内容生态的影响。
其三,挖掘创作者体验。
目前,他们主要关注的是创作产出的层面,但对内容创作者的实际体验和感受还缺乏深入了解。
未来,吕尧等人计划开展定性研究,通过访谈等方式采集第一手数据,全方位把握用户在使用生成式AI时的切身感受。
其四,制定设计原则。
在理解创作实践的基础上,他们希望能总结出一些设计原则和最佳实践,为工具开发者和内容平台提供指引,让AI辅助创作工具更好地契合使用场景需求。
其五,探讨伦理与政策。
生成式AI在推动内容创新的同时,也可能带来诸如版权纠纷、知识产权争议等伦理法律问题。其也期望能够就此开展相关研究,为应对这些挑战献计献策。(综合整理报道)(策划/克珂)