徐乃帅
美国纽约时报大厦
OpenAI被《纽约时报》起诉,涉及金额达到了数十亿美元!
刚刚过去的2023年,以ChatGPT为代表的AIGC(生成式人工智能),成为了最受关注的话题之一。
而在2023年12月28日,又一枚重磅消息传来:《纽约时报》指控OpenAI和微软未经许可,使用了其数百万篇文章来训练GPT等大语言模型,提出赔偿损失的同时,要求OpenAI销毁所有包含《纽约时报》作品的AI模型和训练集。
其中,给世界带来诸多惊喜的ChatGPT语言大模型,首当其冲。
作为西方最有影响力的传统媒体之一,《纽约时报》打响的这一炮,必然会成为里程碑式的案例,深刻影响AIGC的后续发展走向。
实际上,这并不是OpenAI第一次因为版权问题,遭到起诉。
自从ChatGPT4.0问世以来,就不断有作家声称,自己的作品未经允许就被用于大模型训练。2023年7月,来自美国马萨诸塞州的两位作家将OpenAI告上了法庭,成为了ChatGPT第一起涉及版权的诉讼。
9月,美国作家协会组织了17位作家向OpenAI提起诉讼,称ChatGPT“大规模地系统性盗窃”他们的版权作品。17位作家中,包括大名鼎鼎的乔治·R.R.马丁—他是《权力的游戏》的原著作者。
作家喬治·R .R.马丁
用于训练ChatGPT的数据集中,《纽约时报》的内容是最大来源之一。
至于《纽约时报》,早在2023年4月份,就有消息传出,正在和OpenAI就版权相关问题进行协商;6月,《纽约时报》在发给内部工作人员的邮件中,要求“禁止《纽约时报》任何独家文章用于训练生成式人工智能”;8月初,《纽约时报》公布更新后的服务条款,表示未经书面许可,所有在《纽约时报》刊登或提供的照片、影像、设计、音频或视频,以及其他资料及数据等,都不得用于训练生成式AI大模型。
很显然,谈判了半年多时间,《纽约时报》最终还是和OpenAI谈崩了。此次提起诉讼指控OpenAI侵权,《纽约时报》的确是酝酿良久“有备而来”,洋洋洒洒写了69页诉状,陈列了204条指控。
在《纽约时报》甩出的证据中,ChatGPT的输出文本和《纽约时报》的文章极为雷同,有些甚至达到了逐字照抄的程度。
另一个《纽约时报》提供的关键事实是,用于训练ChatGPT的数据集中,《纽约时报》的内容是最大来源之一,至少包括了1600万条来自其旗下新闻网站的文章,以及超过6600万条内容记录。
《纽约时报》强调,被告“无偿使用了《纽约时报》的内容来创造它的替代品”—比如那篇被指控逐字照抄的文章,是《纽约时报》展开了为期18个月的调查,进行600次采访,申请了100多次信息公开,花费了大量人力物力才写成的,却被ChatGPT轻松地“偷走”了。
在整个2023年,AI都像一股不可阻挡的潮流,冲击着各行各业。而《纽约时报》这次打算对抗这股潮流,它在发给内部员工的邮件中写道:“AI于我们只是一种补充人类专业知识的数字工具。我们为技术的发展感到欣慰,但也需要在热情与事实中保持清醒的平衡。当AI威胁到我们时,我们将诉诸法律武器。”
这似乎代表着,《纽约时报》这一次提起的诉讼,并非许多人所认为的“敲诈”一笔那么简单,而是在利益持续被侵害的情况下协商无果的“无奈之举”,被迫诉诸法律武器,摆出了“硬刚到底”的姿态。
毕竟,伴随着AIGC技术的迅猛发展,传统媒体确实到了危机存亡的时刻。
这起诉讼案,到底会走向何方,目前还众说纷纭。
舆论场上,有人认为,虽然OpenAI将《纽约时报》的付费文章用于大模型训练是不可辩驳的事实,但那是属于对版权内容的“变革性”使用,符合美国《版权法》所界定的合理使用范畴。实际上,ChatGPT大模型只是对《纽约时报》的内容进行了“学习”,就像人类学习知识一样,其自身根本就不会去存储《纽约时报》的文章,自然也就不存在侵权一说。
另一方则认为,ChatGPT的存在的确会造成《纽约时报》网站的访问、订阅量下降,输出内容一定程度上取代了《纽约时报》的文章,并不符合《版权法》中的合理使用范畴;更重要的是,不能把AI和人类的“学习”混为一谈,毕竟从《纽约时报》提供的证据来看,ChatGPT确实是对一百多篇文章进行了“抄袭”。
从《版权法》到对于AIGC输出内容性质的界定,再到对AI大模型“学习”的认定,和其深层次运行逻辑的分析,这场诉讼案中涉及的诸多争论点都是前所未有、极具有挑战性的。
诉讼案的结果,也将会对相关行业的未来造成巨大影响。
倘若《纽约时报》完全胜诉,也就意味着AIGC领域的发展将迎来巨大的阻碍:任何认为自己版权受到侵害的个人或者团体,都可以来要求“分一杯羹”,哪怕是财大气粗的OpenAI背后的微软,都可能需要好好考虑一下投入产出的比率。
倘若OpenAI完全胜诉,那么不仅仅是以《纽约时报》为代表的传统媒体行业抵达了至暗时刻,更令人悲观的是,从此往后各种大模型可以更加有恃无恐地“学习”并且“剽窃”版权作品,且不用支付任何成本,这将极大损害各种创作领域从业人员的利益,严重破坏行业生态。
那么,双方最终会走向和解吗?
2023年12月14日,欧洲最大的媒体集团Axel Springer和OpenAI建立了合作伙伴关系,允许ChatGPT获取、总结旗下媒体的新闻报道,并从中获得OpenAI支付的报酬。
但在这背后,Axel Springer在2023年3月份就对大规模裁员进行了准备,放出风声“AI将可以取代记者”,到6月份的时候,该集团已经裁撤了“三位数”的员工。
歐洲媒体集团Axel Springer
集团的一位高管认为,AI技术将有效“解放记者”,让他们把更多的精力放在核心业务的钻研上面。
既然OpenAI一方确实有和传统媒体“和解”的意愿,那么显然就是《纽约时报》不满意OpenAI给出的报价。
最有可能的情况是,作为媒体行业中的“顽固派”,《纽约时报》依旧坚持传统观念,不愿意放弃5800名全职员工,和在世界各地部署的大量记者团队,不愿意进行裁员、削减成本来抵消AI时代的冲击—海量投入的人力,可谓是《纽约时报》能够持续产出“高质量”内容的基石。
不肯用AI来取代人类的工作,从这个角度上来说,《纽约时报》的坚持其实也无可厚非。
这样两难的抉择背后,值得我们思考的是,注重客观事实的新闻媒体行业完全被AI取代,真的能使人接受吗?
从更广泛的角度来讲,AI真的会取代人类的工作吗?放在数年前,这可能还只是一个看似杞人忧天的问题,现在,它早已成为了不少人必须面临的现实。
2022年底,生成式AI绘画软件Midjourney问世没过久,就遭到了广大画师的集体抵制。在圈内著名的综合CG视觉艺术网站“A站”(ArtStation)上面,将近两千位画师上传了“禁止AI”标识的图片,以此来表达对AI绘画软件大范围侵害画师权益的抗议。
在整个2023年,国内外的画师群体,经历的是悄无声息的一场寒冬。
AI绘画软件可以模仿特定的画师风格,轻易生成海量艺术风格相近的作品,而绝大多数人都无法分辨两者的区别。对于画师来说,这也意味着创作的“独创性”被AI大幅度消解,其职业的社会价值受到了严重威胁,被AI绘画软件所替代,成为了极有可能发生的情况。
虽说擅自将画师作品“喂投”给AI作画软件,生成商用作品已被广泛认定为侵权,但由于取证极其困难的缘故,几乎不可能有成功的案例。在整个2023年,国内外的画师群体,经历的是悄无声息的一场寒冬。
2023年7月,代表16万演艺人员的美国演员工会和广播电视艺人工会宣布罢工,抵制“AI的入侵”。此前,由于制片方开始使用ChatGPT来撰写剧本,已经遭到了部分编剧的罢工抗议。而此次罢工的直接导火索则是,资方提出可以对演员进行全身扫描,数据录入系统,这样以后制片方就可以直接用AI技术合成影像,不需要演员真实出镜了。
尽管这项技术是否成熟还有待商榷,但这个“设想”无疑是引爆了广大演艺人员的恐慌,导致了好莱坞63年来首次全行业抗议罢工。
2023年7月28日,美国洛杉矶,演员简·方达在Net f lix工作室外进行罢工演讲
虽说演艺人员所害怕的事情尚未发生,但AI技术显然犹如一把悬在头上的“达摩克利斯之剑”,不知何时将会轰然坠下。
在动画领域、音乐领域、建筑和室内设计领域……所有此类行业中,也都有着类似的景象。AI的进入,无疑是极大提升了工作效率,体现了人类生产力的进步革新,但为何它又是如此令人担忧,乃至于带来恐惧?
就AI本身的发展来说,人类的担忧正是技术进步的一大阻碍。
目前所有生成式AI大模型,都被普遍认为没有产生“自主创作”的能力,还完全依赖于人类作品的“喂投”,输出的内容,无非是对已有元素的不断拆分重组而已。而在这种“借鉴”还是“抄袭”都尚且难以界定的模式下,许多从业人员已经面临着权益受到严重侵害,甚至丢掉饭碗的困境。
假如AI真的颠覆了某个行业的生态,其行业大多数作品都将由AI产出,那么失去了人类持续向AI供给“养料”,该行业发展就将停滞,或者陷入“AI学习AI”的尴尬境地。并且,诸如美术、音乐、文学这些文艺领域,终究是需要人类的承认才能获得价值,人类在其中的主体性始终是不可动摇的。
AI大模型从人类已有的成果中诞生,本应成为造福人类的工具。而目前来看,被滥用的AI,反而更有可能成为压榨人类的工具—更深层次的矛盾并不在于AI本身。
起诉OpenAI的作家,“A站”上抗议的画师、他们所反对的显然并非AI,而是不合理的分配制度:由于资方利用AI技术肆无忌惮侵害他们的利益,剽窃他们的努力成果,而他们却无法从中获得任何补偿。
在这种状况下,去指责他们阻碍了AI技术这一“先进生产力”的发展,未免显得太过冷血了些。
究其根本,真正阻碍AI发展的,并不是那些利益受到侵害的群体,而是人类即将踏入AI时代之际,那已然显得落后的“生产关系”。
责任编辑吴阳煜 wyy@nfcmag.com