生成式人工智能Sora 赋能智慧图书馆的探索与法律规制

2024-12-20 00:00:00李涛
图书馆建设 2024年5期
关键词:生成式人工智能智慧图书馆著作权

[ 摘 要] 生成式人工智能技术的革新将带来生产力的重大飞跃,Sora 的出现势必对现代图书馆发展产生重大影响。作为智慧图书馆建设的驱动力量,Sora 所赋能的生成式人工智能可以在图书馆可视化知识服务体系、智慧虚拟空间、优化算法技术以及智慧化信息建设与管理等方面发挥积极作用,以促进智慧图书馆的可持续发展。但与此同时,Sora 也带来知识产权、过度收集读者个人信息和数据、算法滥用等法律风险。深入分析这些法律风险背后的内在逻辑,可以发现在将Sora 与智慧图书馆融合时,应明确Sora 作品的权利归属,建立 Sora 作品的识别体系与算法监管制度,从而构建起完善的智慧图书馆法律保障体系。

[ 关键词] 生成式人工智能 智慧图书馆 Sora 个人信息与数据 著作权

[ 中图分类号] G250.76 [ 文献标志码] A [ DOI ] 10.19764 / j.cnki.tsgjs.20240465

[ 本文引用格式] 李涛. 生成式人工智能Sora 赋能智慧图书馆的探索与法律规制[J]. 图书馆建设,2024(5):128-137.

0 引 言

继ChatGPT 引发新一轮人工智能浪潮之后,2024 年初,美国人工智能研究公司OpenAI 再次发布了一款全新的人工智能视频生成大模型Sora。该大模型可以通过文字指令创建长达60 秒的视频,其逼真的视觉效果预示着一场宏大征程的开始。毫无疑问,Sora 的诞生不仅将对短视频制作、影视、数字仿真等行业产生重大影响,从长远来看,这项技术还将给图书情报、新闻出版等领域带来变革。正如360 创始人周鸿祎所说:“Sora 意味着AGI 的实现将从10 年缩短到一两年。”[1] 虽然OpenAI 暂时还未向公众提供Sora 服务,但这并不妨碍人们围绕Sora 的应用场景及其可能带来的法律风险展开讨论和研究。具体到图书馆领域,生成式人工智能契合了数字图书馆向智慧图书馆的转型,Sora 与智慧图书馆的融合将为图书馆开启一个全新的未来。

事实上,我国图书情报领域早已关注人工智能赋能智慧图书馆建设的积极作用,并在理论研究和实践探索方面取得了诸多成果。回顾人工智能与图书馆融合发展的研究文献,可以看出我国图书馆的现代化发展经历了三个阶段:一是信息化图书馆建设时期。第一代人工智能是作为 “专家系统”“模式识别”的智能计算机程序,应用于图书馆建设和图书情报管理,主要表现在文献检索、图书分类、图书馆自动化管理和信息服务等方面,完成了从传统图书馆向数字化图书馆的转型[2]。二是数字图书馆建设时期。在机器学习的弱人工智能时期,人工智能技术在图书馆的应用主要体现在智能检索、知识发现与获取、大数据处理、知识库系统本体构建、机器学习与推理、聊天咨询智能机器人等方面[3]。通过数字化和人工智能技术解决图书馆日常工作和服务中的效率低下等问题,同时为读者提供个性化的信息推荐服务。三是智慧图书馆建设期。ChatGPT 作为典型的生成式人工智能为图书馆带来馆藏资源建设、服务模式创新、读者体验升级等方面的智慧赋能,实现从数字图书馆到智慧图书馆的转型跨越[4]。Sora 和ChatGPT 一样,都属于生成式人工智能。但二者区别在于,ChatGPT 本质上是建立在自然语言处理系统基础上的聊天机器人程序,可以像人一样正常聊天和交流,并根据人的指令完成撰写文章、新闻稿,绘图等任务;而Sora 则是一款文字生成视频或图片生成视频的工具,其基本原理是通过深度学习技术和大语言模型,对人类提供的文字内容和图片进行分析,然后根据分析结果自动生成精美、高质量的视频内容,为人类带来更加丰富多彩的视听体验。有鉴于此,基于两者在功能上的差异,本文拟从生成式人工智能Sora 的基本原理入手,探讨其在智慧图书馆建设中的应用场景,并在此基础上探讨Sora 赋能智慧图书馆过程中可能面临的法律风险及应对策略,以期优化智慧图书馆服务,提升读者的体验感。

1 生成式人工智能Sora 的运行原理

生成式人工智能Sora 以“文生视频”为核心特征,它可根据用户输入的文本指令自动生成画面清晰、高度流畅、一镜到底的视频,具有深度学习、自我纠错与视频生成能力。从技术上而言,一方面Sora 具有新兴的模拟能力,它能模拟现实世界中的人、物和环境的特征,并根据其特征自动生成一系列视频帧,尽量确保视频中的人和物体随着时间和空间的变化保持一致性和连续性;另一方面它能够处理三维空间连贯性问题,通过复杂相机运动和不同视角之间的切换,视频场景中的人和物体即使在快速移动和旋转的视觉效果下,依旧能保持空间轨迹的连贯性。在视频大模型的训练中,Sora 采用了“Transformer 架构”+“时空Patches”技术+“Diffusion 扩散模式”三位一体的方法进行训练与学习。

1.1 “Transformer 架构”的功能:压缩和转换原始视频

Sora 模型训练的第一步是收集大量视频数据,然后将其压缩并存储到低维潜空间中。一般而言,我们日常生活中观看或拍摄的视频尺寸通常可达4K、8K等,如此高数值、高分辨率的视频实际上难以被只需要低维向量的人工智能所接受。因此,有必要将这些高数值的原始视频和图像压缩成与低维潜空间相匹配的图像值或形式。简而言之,就是将原始视频和图像转化为低维潜空间中的视频和图像。那么,如何实现这一过程呢?毋庸讳言,Transformer 就是实现这个转化过程的主导力量。Transformer 是一种基于自我注意机制完成序列到序列变化的深度学习模型,被广泛应用于自然语言处理、计算机视觉、语音和图像视频生成等各大领域[5]。在Sora 的模型训练中,Transformer会将原始视频数据转换并压缩到一个低维度的潜空间中,以便后续处理和图像生成。当原始视频数据被输入并存储在降维后的潜空间中时,Sora 就能在此潜空间里进行训练和自主学习,并最终生成视频。

1.2 “Patches”技术:视频和图片的分割与推理

在低维潜空间中, 转换后的视频或图像以多个“ 补丁” 的形式被记录或存储。“Patches” 与ChatGPT 大语言模型中的“Token”一样,是处理文本的最小单位或基本元素。就像我们学习语言一样,一个单词、一个短语、一个标点符号或一个字符都可以看作是最小的单位,当我们把这些最小的单位按照一定的顺序和逻辑组合在一起时,它们最终就能组成一个有意义的句子或段落。在这个比喻中,“Token”就相当于“一个单词”或者“一个词组”,通常代表最小的单元[6]。在Sora 的训练场景中,视频的每一帧画面都被分解成若干个“Patches”图像块,这些“Patches”类似于“Token”,可通过它们来控制和生成视频。但由于视频本质上是由一系列具有时间和空间变化的图像组成,通常以“帧序列”的形式呈现,而在处理视频时不仅要考虑每一帧的空间信息,还要观察这些图像随时间发生的变化,因此视频中的“Patches”实际上是一种同时包含时间和空间信息的时空图像块。而Sora 视频生成的过程实际上是通过前一个“Patches”图像块去预测、排列并生成下一个“Patches”图像块。一段完整的视频则是由多个面积大小相同的“Patches”图像块不断地推理、排列拼接而成,类似于拼图。

1.3 Diffusion 扩散模型的训练

Diffusion 扩散模型是一种先进的生成模型,通过逐渐还原数据的方式学习目标数据域的分布[7]。详言之,它先通过逐步添加噪声将数据映射到高斯分布a,然后再反向去除噪声,从而生成高质量的数据,如图像或音频。在这个过程中有两个关键阶段:一个是正向过程,即模型逐步向数据中添加噪声;另一个是逆向过程,即对模型逐步去除噪声,并将数据恢复到其原始状态。在OpenAI 披露的技术报告中,Sora 引入了一种新型扩散模型架构,用于条件引导的控制与大面积的图像编辑结果。它将原始Diffusion 模型中传统的U-net 骨干网络结构转化成了Transformer架构, 首次实现了比传统扩散模型更好的生成结果,大幅提升了模型的处理能力与效率,最终能在时空图像块上进行Diffusion 扩散模型的训练。加入Diffusion 扩散模型后,可以对图像进行连贯的动作编辑,以达到视频合成的目的[8]。在视频内容的文本描述方面,Sora 在模型训练的过程中引入了重新字幕技术。通过这项技术,Sora 在最后的训练时,可以将文字描述的内容与时空图像块的信息进行一一匹配,最终使Sora 能够理解文字描述和视频时空图像块的信息,并自动生成视频。

2 生成式人工智能Sora 在智慧图书馆建设中的应用场景

当前,生成式人工智能正渗透到人类社会的各个层面,逐渐成为科技创新、产业升级和生产力提升的内在驱动力。以ChatGPT 为代表的新技术已经开始赋能多个行业领域,发挥其应用价值。例如,在新闻传播领域,ChatGPT 有助于提高知识提取、知识生产和知识传播的效率[9],具有捕捉、引领出版热点、凸显出版多元化、推动编辑流程高效化等优势[10]。在图书馆领域,生成式人工智能可以改变图书馆的阅读服务、空间升级和基础设施建设[11]。然而,随着新型人工智能技术的发展,值得思考的是,在生成式人工智能Sora 的技术赋能下,其将为图书馆带来哪些变革?

2.1 Sora 促进图书馆建立可视化知识服务场景

数字化是当今经济与社会发展的重要趋势,党的二十大报告指出,要加快建设网络强国、数字中国。随着互联网技术更迭换代,人们对于多媒介阅读的需求越来越多元化,通过不同媒介开展知识生产、销售与服务,以满足不同场景下人们的特定需求,为人们带来不同形式的阅读体验,无疑是时代进步的要求。在人工智能时代,人工智能技术与图书馆的融合将为读者带来全新的服务体验。

通常而言,传统图书馆的服务模式以文字内容为主,文字内容的表现形式能给读者带来别样的阅读体验感和书香弥漫的氛围感,这些细节有时候使得文字阅读成为现代人的一种减压方式,能够为人们的心灵带来片刻的宁静。但是文字内容的表现形式有时候并不是那么完美,如语言歧义是一种常见的现象,尤其在汉语言文字中,同样一个字词有时候存在两种或两种以上的含义,这就可能导致文字在书面表达时出现歧义。除了文字本身具有歧义属性外,还有作者表达的问题。作者所欲表达的思想,有时并不会直白地说出来,尤其在文学创作存在多种文风的情形下,不同读者对同一本书或同一段文字内容的理解会得出不同的结论,这就难免会出现“一千个读者眼中有一千个哈姆雷特”的结果。当然,笔者所举之例,并非有意想表达以文字的形式传达内容或思想应受诟病或被摒弃,而是想表达“同样的内容或思想,可以有多种不同的呈现方式”。因为随着时代的进步和发展,人类的文明不止一种。

Sora 作为最新一代人工智能技术,具有强大的视频生成能力,可为智慧图书馆的服务建设带来新质生产力。传统图书馆的服务模式主要以文本内容为主,而Sora 可以根据既有的馆藏书籍文字、图像等,生成内容丰富、形式多元的视频,提高书本内容的可读性、增强知识的全面性与体系性。图书馆可将Sora 运用于知识服务场景中,不仅能为读者提供传统的书本借阅服务,还可提供可视化内容服务。相较于传统的文本借阅服务,可视化内容服务具有以下优势:第一,Sora 有利于使学习变得简单而高效。通过Sora 的文生视频能力,书籍中原本晦涩难懂、抽象的概念和关系等,将变得“可视”“易懂”,富有趣味性。以抽象概念为例,通过Sora 的视频讲解与分析,读者很容易就能在现实生活中找到与其相对应的具体表现;在历史学习的过程中,通过Sora 的视频展示,过去曾发生的历史事实将被全面还原、情景再现,有利于读者建立起完整的知识体系。第二,Sora 将促使图书馆发展成为视频内容创作的主要中心。目前,图书馆虽然拥有海量书籍藏品资源,但许多文献资源分散、利用率低。通过Sora,图书馆可以将这些资源充分利用并加工生成相应视频,这样不仅有利于促进知识的传播,而且可以满足社会对文化娱乐的需要,丰富人民群众的精神文化生活。第三,Sora 可提升知识库内容质量。现阶段,图书馆已建立多种中英文数据库,要想发挥这些知识库的最大化利用,则需要进一步提高和更新知识库的内容质量。而Sora 本身建立在海量数据训练基础上,具有多元化创作能力和强大的人机交互能力,可推动知识库的内容更新。

2.2 Sora 赋能图书馆创建智慧虚拟空间

近些年来,在VR、AR 等技术与图书馆融合发展的背景下,智慧图书馆沉浸式服务的实践探索已然取得了一定成效[12]。但就目前整体发展阶段而言,由于元宇宙产品研发难、设备体积重量大、运传输速率低和内容配套缺乏等问题,导致元宇宙技术正面临瓶颈。尤其是在3D 模型、场景、动作和脚本的创建过程中,耗时且成本高昂的问题一直是制约元宇宙发展的一大挑战。在现实中,大多数图书馆都借助于元宇宙技术搭建虚拟空间平台,不仅体验设备处于初级阶段,而且元宇宙虚拟图书馆中的场景内容更有待进一步更新与升级。随着以Sora 为代表的新一代人工智能视频生成技术大幅降低视频内容制作门槛,图书馆可以利用Sora 来建构虚拟智慧空间。Sora 与智慧图书馆的结合,能够持续为虚拟空间提供丰富的视觉内容,及时更新和升级虚拟空间的新场景。由于Sora 具有快速自动生成视频的能力,它不仅可将信息资源1 : 1 真实复刻到虚拟空间中,而且还能把图书馆中大量藏书的文字内容迅速转换成视频,不断提供新内容和新场域,丰富虚拟空间生成式人工智能的内容。在智慧虚拟空间中,Sora 不仅能生成3D 应用场景,还能创建出真实感更强、更具沉浸感的虚拟环境。这是因为Sora 对物理世界的模拟不仅仅是视觉上的,还包括物理规则、光影效果、材质等方面,这些都是实现身临其境体验的关键因素。

从体验的角度而言,图书馆可通过Sora 模型技术根据读者偏好和互动实时调整服务供给的内容,为读者提供一种高度定制化的沉浸式服务体验。在过去元宇宙技术下,用户在虚拟空间中的体验通常需要借助于多种穿搭设备,如VR 头盔、手柄、全身感应装置、无线网络设备等,才能实现身处虚拟空间中所带来的沉浸式体验。由于Sora 具有理解和模拟真实世界的能力,其所生成的视频是符合物理和运动学的复杂场景视频,用户仅需在移动终端设备或特定平台通过裸眼观看、佩戴特定眼镜即可感受到视频内容带给视觉上的冲击感,不仅更加便利,同时还减轻了参与者的体验负担。可以说,Sora 将颠覆我们对图书馆传统服务的认知,将其打造成一个可供深入探索、拥有无限可能性和奇妙的空间。

2.3 Sora 持续优化图书馆算法技术

随着数据挖掘技术的发展,数据在智慧图书馆的建设中具有举足轻重的作用[13]。数据挖掘是信息检索的一个重要组成部分,也称为数据库中知识的发现,是分析大型信息存储库和发现有用信息的过程。图书馆中的数据挖掘通常是从读者行为轨迹以及信息资源的使用情况中进行收集[14]。在图书馆日常管理与服务过程中,每天会产生大量的读者借阅、浏览、访问数据,从这些大数据中挖掘出可使用、有效的信息,并合理地利用这些信息对图书馆服务工作有着很大的指导作用。Sora 是基于视频大模型的算法创新而发明的新一代人工智能技术,代表着算法应用层面的最新发展。考虑到Sora 的模型训练结合了Transformer、Patches、Diffusion 等先进技术,因此图书馆可有效利用Sora 技术来提高自身的算法创新,更新原有数据和算法模型,从而促进通用模型的自主性和持续学习能力。通过算法技术优化以后,图书馆将能够为读者提供更加精准、智慧化的个性化服务。

在Sora 的技术加持下,图书馆能为读者提供更精准的个性化服务体现在三个方面:其一,Sora 可以根据读者的观看记录、行为数据、阅读爱好、阅读种类等自动生成、推送读者感兴趣的视频内容,有助于减少信息筛选成本,提升阅读体验与服务质量。其二,从教育教学的角度看,利用Sora 生成教学视频,学生能够通过图书馆平台提供的教学场景和教学内容,更加直观地接受书本中的知识,丰富课外阅读素材和资源。例如,Sora 可以根据读者年龄、兴趣爱好,将学习内容转换为视频,以数字辅导老师的形式随时为学生答疑解惑,同时还能给予学生陪同感。其三,生成式人工智能Sora 技术能够满足特殊群体多样化的阅读需求,如Sora 可以根据读者的自身能力和条件,为其量身制定、自动生成适合其观看的内容形式,搭建起无障碍阅读世界,通过人工智能科技创新带来一份善意。

2.4 Sora 促进图书馆智慧化信息建设与管理升级

Sora 赋能图书馆智慧化信息建设与管理主要表现在视频平台搭建、智慧采选、人才培养与管理、智慧评价体系等方面的优化。首先,在视频平台的建设方面,基于生成式人工智能Sora 技术,图书馆可搭建一个视频平台,将Sora 生成的视频内容汇聚在这个平台中,以方便读者学习与观看。在视频平台中,图书馆可以创建多个不同界面,如图书改编视频区、图书馆自制视频区、读者共创视频区等,并结合不同观看模式为读者提供视频内容服务。通过Sora 视频生成技术,图书馆不仅可将馆藏中的纸质书本、绝版书、古籍内容以视频孪生的形式进行复刻实现馆藏资源的永续保存与传播,而且还能满足读者获取信息的需求。其次,在智慧采选平台建设方面,图书馆可以先通过大数据技术收集、分析读者的阅读数据和观看记录,再利用生成式人工智能技术自动生成读者最喜欢阅读的书单、推荐采购书单、读者最感兴趣的视频类型等。如此一来,图书馆便可根据读者的需求和反馈作出精准采购书籍的决策。再次,推动图书馆人力资源格局发生变化。随着生成式人工智能技术的发展,人工智能将会取代很多人类岗位,这种情况在图书馆领域中将表现得尤为明显。以往图书馆中馆员的常规性工作岗位将可能被生成式人工智能机器人、虚拟数字人替代,因为后者能提高咨询服务工作的准确性与效率。在这样的变革背景下,不难预见未来人工智能工程师、大数据科学家、机器语言工程师、算法训练工程师等职业将成为智慧图书馆的新岗位。最后,优化智慧评价体系。生成式人工智能是通过深度学习的方式来完善与提高服务质量,那么读者的客观评价将成为智慧图书馆自我优化和提升服务质量的重要来源。在读者评价反馈机制下,Sora 将对评价结果作出准确分析,使图书馆及时调整、更新服务方式和质量,朝着更智能化、智慧化方向发展。

3 生成式人工智能Sora 赋能智慧图书馆的法律风险审视

2024 年政府工作报告指出,要深入推进数字经济创新发展,深化大数据、人工智能等研发应用,开展“人工智能+”行动。生成式人工智能在图书馆领域的应用,将改变读者与图书馆的传统交流模式,对图书馆的管理与服务体系产生重大影响。但与此同时,其也可能带来诸多法律风险。从Sora 在图书馆中的应用来看,其可能存在的法律风险包括生成内容的知识产权风险、数据隐私风险、算法滥用风险等。

3.1 Sora 自动生成图书视频的知识产权风险

在Sora 自动生成视频后,该视频是否具有独创性与可版权性,将成为一大争议问题。就此而言,我们不妨先参考目前国内关于ChatGPT 是否具有独创性与可版权性问题的讨论,然后再进一步探讨Sora 的独创性与可版权性问题。以ChatGPT 为例,目前主要存在两种观点:第一种观点认为我们尚处于弱人工智能时代,人工智能的生成内容都是应用算法、规则和模板的结果,不能体现创作者独特个性,不能认定为作品,宜将其视为人类创作的辅助工具[15]。第二种观点认为虽然人工智能是人类从事创造性实践活动的工具,但其生成内容具有人类的智力成果属性,因此生成式人工智能满足独创性、智力成果等作品构成要件,具有可版权性[16]。最近也有学者认为应当对生成式人工智能内容给予与人类作品相同的评价,实现二者的平等保护[17]。相较于第一种观点,第二种观点正逐渐成为法学界的多数意见。就生成式人工智能Sora而言,其在生成视频的过程中几乎已摆脱人类的控制与介入,能自动输出超越人类预期的高质量内容。从Sora 生成的视频与人类作品的表现形式来看,很难分辨出其创作主体到底是人类还是Sora。而从经济价值来看,二者能带来的经济利益并无不同,在普通用户或消费者的眼中都是作为“作品”看待。例如,在影视作品中由人工智能自动生成的特效、视频游戏中由人工智能生成的地图画面等[18],通常被视为影视作品或视频游戏的组成部分而不加区分地被一体销售。因此,由Sora 生成的视频与人类制作的视频应当受到同等对待。这样不仅有利于提高创作效率、降低创作成本,而且有利于鼓励创新,促进人工智能产业的发展。

此外,Sora 生成视频以后还将面临另一个知识产权风险,即视频作品的权利归属问题。当Sora 接入智慧图书馆后,视频内容的生成与使用、Sora 与读者交互中产生的反馈内容等产品,这些人工智能生成内容的版权应该归属读者、程序的设计者还是智慧图书馆,将极易产生版权争端。倘若Sora 生成的视频内容不当侵犯其他视频作品的著作权时,也会产生相关法律纠纷。因此,Sora 在智慧图书馆中的运用,将为图书馆知识产权保护制度带来新挑战。

3.2 Sora 过度收集处理读者个人数据隐私的风险

在大数据背景下,图书馆需要汇聚、利用读者的个人信息和数据并进行分析,才能推算出读者的文献资源需求、空间服务需求、阅读兴趣等信息,从而达到优化图书馆的智慧化管理与服务的效果。在Sora赋能的智慧图书馆中,Sora 将持续采集读者的个人信息和行为数据。Sora 在运行时所收集到的读者相关数据和信息越多,那么其为读者提供个性化服务的质量将越高。但在这个过程中,极易出现Sora 过度收集读者行为数据和个人信息的现象,甚至侵犯读者个人隐私的行为。例如,在实践中,ChatGPT 曾被曝光在未遵守“告知同意”规则下,过度收集用户个人信息且将用户信息共享给第三方平台,从而导致用户支付信息与隐私泄露。这种不当行为侵害了用户的个人信息权与隐私权。更甚者,倘若涉及商业秘密、国家机密等数据信息,过度收集的行为将导致这些机密文件外流,造成不良影响。除此之外,在人工智能技术快速发展背景下,数据操纵、篡改的行为正逐渐增多,如何保证输入数据是准确、可靠且不被篡改的,是人工智能规模化应用所面临的现实问题。虽然生成式人工智能具有高度自主系统和深度学习能力,但仍可能面临技术故障、恶意攻击、信息窃取等风险,这些风险也将导致数据泄露、个人隐私受到侵犯的概率增高。

3.3 Sora 算法滥用的风险

虽然Sora 表现出高度的智慧化特征,能够理解并分析自然语言及语境且最终输出符合人类审美的内容,但其运行程序始终离不开底层算法逻辑的设计。算法是人为的产物,即便Sora 在经过反复训练、深度学习、自我调整机制后,其所生成的内容仍可能产生算法偏见与歧视。究其原因主要有三个方面:其一,在设计与研发阶段,Sora 的底层算法在研发时就不可避免地隐含着设计者、开发者的主观判断、意识形态与价值取向。其二,在大模型训练阶段,Sora 会不断接受大量数据喂养,如果所提供的数据失真、数据样本不全面、数据存在误导性或错误信息,那么Sora所生成的内容也就会存在片面性或带有特定价值倾向,无法确保输出的内容是客观且公正的。例如,有媒体曾曝光谷歌旗下一款AI Gemini 在其生产的图像中存在种族歧视问题,随后谷歌对此回应称Gemini 展现出的问题,只是人工智能领域长期以来存在的歧视问题的另一种表现[19]。其三,Sora 在与人类交互的过程中,会无差别地学习人类的文化、思想、善恶等各种意识形态,这些意识形态会最终反映到Sora 所生成的内容中。因此,倘若不对Sora 生成的内容进行审查,而全部交于其自行处理,在缺乏人类正向价值、道德伦理引导下,将可能生成出不符合价值取向或带有偏见性的内容,从而造成不必要的争执与对立。

4 生成式人工智能Sora 赋能智慧图书馆的法律规制进路

为应对生成式人工智能Sora 给智慧图书馆带来的变革,在将Sora 技术优势融入智慧图书馆建设过程中时,需要综合研判其存在的潜在风险,建立并完善相应的风险防控机制,才能有效推动智慧图书馆的可持续发展。

4.1 明确Sora 作品的权利归属

Sora 采用的是人机交互的创作形式,它的创作流程大致表现为人类向Sora 发出创作指令与创作要求,Sora 根据自身的语言模型、数据样本等系统对指令进行分析,最终制作出符合人类审美和具体要求的视频。不难发现,在Sora 创作的整个过程中,人类与Sora 之间表现出一种“机器受托”的关系,即Sora 大幅降低了人类作者对人工智能生成内容的控制与可预见性:在Sora 的创作过程中,人类的参与仅仅是对Sora 发出指令、触发Sora 创作,而视频内容的制作过程可以说是由Sora 独立、自动完成,且超出了人类作者的预期效果[20]。由此可知,Sora 创作具有“委托创作”的特征,而其输出的视频则具备“委托作品”的法律性质。事实上,从我国的司法实践来看,现已有法院通过判决形式将生成式人工智能输出的内容视为作品。例如,2023 年11 月,北京互联网法院判决书认为原告使用开源软件Stable Diffusion,通过输入提示词的方式生成了涉案图片,该图片是以线条、色彩构成的有审美意义的平面造型艺术作品,属于美术作品,受到著作权法的保护。此案在坚守著作权主体认定的“人类中心主义”前提下,首次认可由人工智能生成的图片属于作品,这对促进我国未来人工智能产业的发展具有重要影响。同理,将Sora创作的视频视为作品亦无不可。然而值得进一步思考的是,在认定Sora生成的视频属于作品的前提下,该作品的著作权应当归谁所有?对此,有学者提出,在遵循著作权主体“人类中心主义”的原则下,可以借助法律拟制技术,将人工智能拟制为形式意义上的作者,并与人类作者建立起合作创作、委托创作等著作权法律关系[21]。笔者赞同这种观点。正所谓“有原则就有例外”,通过法律拟制技术将人工智能拟制为形式作者并不意味着全面接受人工智能的法律主体地位,而是旨在解决人工智能创作的作品具有独创性的问题,即可被评价为作品。因此,在遵循“人类中心主义”的原则下,可通过“例外”设定方式将Sora拟制为形式作者,仅具有署名权,而著作权的归属则由人类作者(Sora的使用者)和Sora的开发者或设计者预先通过合同的方式约定。例如,Sora的开发者可以通过用户协议的方式事先约定将Sora生成内容的著作权全部转让给Sora的使用者。通过这种处理方式,就能将Sora生成内容的著作权归属于人类作者——“Sora的使用者”享有。此外,根据《中华人民共和国著作权法》(以下简称《著作权法》)第 19 条之规定:“受委托创作的作品,著作权的归属由委托人和受托人通过合同约定。合同未作明确约定或者没有订立合同的,著作权属于受托人。”因此,当合同已约定著作权归属的情况下,Sora的使用者在使用Sora进行创作时,可将Sora输出的作品视为“委托作品”,由Sora的使用者享有著作权。事实上,在我国著作权法中采用“法律拟制技术”的规定并不少见。例如,《著作权法》第18条第2款规定:“有下列情形之一的职务作品,作者享有署名权,著作权的其他权利由法人或者非法人组织享有,法人或者非法人组织可以给予作者奖励。”基于相同或近似的法理,通过“法律类推”的方法将人工智能作品视为“委托作品”,将人工智能拟制为形式意义上的作者仅享有署名权,而著作权则由人类作者享有的路径,具有可行性。可以说,这种法律解释的方法或路径选择,对我国现行法律制度的安定性与内在逻辑体系的连贯性所造成的影响将会是最小的,亦符合著作权法框架体系的制度安排。

承前所述, 在Sora 赋能智慧图书馆场景下,Sora 作品的著作权归属应当遵守《著作权法》的相关规定。具体而言,关于Sora 作品的著作权归属可表现为以下几种情形:其一,当图书馆取得书籍原作者的授权时,图书馆可将书籍中的文字内容输入Sora进行视频创作,图书馆享有视频作品的著作权,Sora仅享有视频作品的署名权。其二,当图书馆利用馆藏资源独自进行文本内容创作,并将文本内容作为指令传达给Sora 生成视频时,仍然由图书馆享有视频作品的著作权,Sora 享有视频作品的署名权。其三,读者利用馆藏资源独自进行文本内容创作,并将文本内容以文字形式作为指令传达给Sora 生成视频,则由读者享有视频作品的著作权,Sora 享有视频作品的署名权。此外,如果读者未经原作者或图书馆同意、授权,不得用Sora 将原作品改编成视频作品,否则可能引发侵权纠纷。

4.2 对Sora 视频作品进行标识

目前,人工智能生成内容已达到能够与人类作品相媲美甚至超过人类的创作水平,但同时其也带来了虚假信息或虚构信息的风险。如何区分Sora 视频作品与人类作品、虚假信息与真实信息是生成式人工智能时代亟待解决的问题。在传统媒体时代,依据信息来源可将内容制作分为PUGC(Professional UserGenerated Content,专业用户生产内容)与UGC(User Generated Content,用户生成内容),这一时期的特征是由人类创作者进行创作、编辑、发布信息内容,信息内容的审核工作通常由发布机构人工审核,如期刊、杂志、报社等。然而在人工智能时代,随着生成式人工智能创作的内容逐渐增多,若完全依赖传统人工审核模式对其生成内容进行审查可能难以追赶人工智能生成的效率。因此,亟需一种高效且便捷的机制对人工智能生成内容进行审查和溯源。

对此,我国已开始尝试建立起人工智能内容治理制度。2023 年,国家网信办等七部门发布了《生成式人工智能服务管理暂行办法》,其中规定人工智能服务提供者有义务对生成内容进行标识。此外,《互联网信息服务深度合成管理规定》亦提出对内容标识管理的要求。由此可见,标识制度已成为生成式人工智能内容治理的主要方式之一。Sora 生成的内容主要以视频为主,Sora 的使用者、智慧图书馆在发布和传播Sora 生成的视频内容时应当遵守上述标识制度的相关规定,采用显著方式在视频、图片等生成内容的合理位置、区域进行标识。根据《网络安全标准实践指南——生成式人工智能服务内容标识方法》之规定,标识的方式主要有两种,即显式水印标识和隐式水印标识。显式水印标识是指在人工智能生成内容的显示区域中添加显示带有“由人工智能生成”或“由AI 生成”的提示文字;隐式水印标识是指在由人工智能生成图片、音频、视频时,应通过时空域水印或变换域水印的方式实现标识信息。其中,视频的隐式水印标识应满足任意连续5 秒以上视频内容中均包含标识信息的要求。实际上,要求对视频进行标识以作为内容审查依据的做法,在我国影视领域早已实施多年。例如,在电影作品中,“龙标”作为电影审查合格的标志,不仅意味着电影内容符合社会道德和法律规定,也代表着对版权的尊重。因此,要求Sora 的使用者、智慧图书馆在发布和传播Sora 生成的视频内容时以显著的方式对视频来源、内容质量进行标识,有利于强化主体责任,营造良好的网络信息生态环境。

4.3 对Sora 涉及个人隐私及算法风险的监管

对于Sora 运行中可能导致过度收集读者个人信息与数据泄露的风险,图书馆应当建立起相关应对措施。就智慧图书馆而言,可以通过构建以读者个人数据为核心的数据安全治理系统,实现数据风险感知、数据共享和数据质量的可靠性风险评估。要求图书馆在收集读者个人信息和数据时,应在用户协议、隐私政策中事先明确约定收集个人信息的范围且征得读者的授权同意。对读者数据进行处理时,个人信息收集者、数据处理者应遵循《民法典》第1035 条和第1036 条、《数据安全法》第22 条之规定,遵守合法、正当、必要原则,不得以捆绑、强制方式要求读者提供范围不明确、内容不具体的个人信息;不得收集与所提供的服务无关的信息和数据。

除此之外,由于Sora 的模型训练和运行阶段可能存在算法歧视或算法偏见等风险,故智慧图书馆还应加强对Sora 算法的监管力度。算法歧视的产生原因具有复杂性和技术性,虽然算法技术本身未包含歧视性元素,但算法的设计者是人,易受到人类活动因素的影响,其在设计算法时难免可能带入自身思维偏见从而左右算法的运行,最终导致算法偏离技术中立性而走向误区。因此,对算法歧视或偏见风险的监管,应从以下方面入手:第一,树立正确的算法伦理价值。算法作为一种新兴技术,应以支持与鼓励为主,对算法歧视的认识及治理思路应完成从消极防御到主动引导的转变。算法治理应当树立公平正义观念;在算法规则的设计、运行和更新中,应避免算法对人的操控;算法中立的有限性及算法的复杂性都应以促进平等为标准。算法的应用场景及表现形式应符合社会主义核心价值观,避免错误观念的引导和消除歧视,找到技术与公平的和谐共生之道[22]。第二,引入“监管沙盒”制度。2024 年欧盟议会通过《人工智能法案》,该法案第五章规定了“监管沙盒”制度。这一制度旨在为人工智能开发者、设计者等提供一个特定的监管环境, 允许其在将人工智能应用推向市场之前进行测试,从而能及时发现和规避创新型技术的风险隐患[23]。“监管沙盒”制度鼓励人工智能技术主体参与测试、评估技术风险,也为监管部门提供了灵活的监管手段。如果人工智能技术实施主体在“监管沙盒”测试过程中发现可能存在的风险并积极整改,则可豁免相关行政处罚;如果在测试结束后人工智能技术风险超过可接受的范围,监管部门可宣布暂停人工智能产品投入市场,并给予相应的处罚。第三,在分类分级治理的基础上,建立算法备案制度。算法备案制度是为了破除算法的不可解释性以及平衡算法的公平性与安全性的现实需要[24]。对生成式人工智能Sora 的算法备案机制,应针对算法内容的敏感度、算法风险等级以及算法运行机制等方面进行控制,合理把握法律与技术之间的平衡。

5 结 语

生成式人工智能在智慧图书馆中的应用已经受到学界广泛关注,而Sora 的出现又将为智慧图书馆的变革注入新的驱动力量。未来,生成式人工智能将成为智慧图书馆的重要组成部分,而由其生成的内容也将促进智慧图书馆可持续性发展。但随之而来的法律问题也不容忽视,图书馆需采取积极措施加以应对。本文旨在分析Sora 在智慧图书馆中的应用场景以及在此基础上进一步探讨其可能引发的法律风险与应对措施。从法学的角度提出明确Sora 作品的权利归属、对Sora 视频作品进行标识以及图书馆在收集处理读者个人信息与数据、算法治理等方面的完善建议,以期为智慧图书馆的建设“添砖加瓦”。

参考文献:

[1] 周鸿祎. Sora 意味着实现通用人工智能可能从 10 年缩短至 1 年[EB/OL].[2024-02-17].https://finance.eastmoney.com/a/202402162987352930.html.

[2] 郭军, 母轶. 人工智能技术在图书馆中的应用[J]. 现代情报,2002(8):80.

[3] 李宇, 鲁超, 马波. 创新驱动背景下人工智能在图书馆的应用研究与展望[J]. 图书馆理论与实践,2022(3):64-71.

[4] 王毅, 董怡婷. 类ChatGPT 人工智能在图书馆智慧服务中的应用与思考[J]. 图书馆理论与实践,2023(6):129.

[5] 罗俊仁, 张万鹏, 苏炯铭, 等. 面向智能博弈的决策Transformer 方法综述[J]. 指挥与控制学报,2023(1):10.

[6] 彭斌,白静,李文静,等.面向图像分类的视觉Transformer研究进展[J].计算机科学与探索,2024(2):322.

[7] 邓梓焌, 何相腾, 彭宇新. 文本到视频生成: 研究现状、进展和挑战[J]. 电子与信息学报,2024(5):1633.

[8] 刘雨生, 肖学中. 基于扩散模型微调的高保真图像编辑[J].计算机应用,2024(3):5.

[9] 陆小华.ChatGPT 等智能内容生成与新闻出版业面临的智能变革[J]. 中国出版,2023(5):8-15.

[10] 谢泽杭, 李武. 从赋能到融合: 生成式AI 出版的价值、困境与发展图景[J]. 编辑学刊,2023(6):13.

[11] 柯平, 王洁, 刘倩雯. 生成式AI 视域下智慧图书馆建设的关键路径[J]. 现代情报,2024(1):4-10.

[12] 郎林芳, 黄世晴, 王珏, 等. 元宇宙图书馆阅读推广服务创新发展研究[J]. 图书馆杂志,2023(10):55-63.

[13] 张文佳. 智慧图书馆建设中数据价值实现的机理及路径研究[J]. 图书与情报,2023(6):108.

[14] GUL S,BANO S.Smart libraries:an emerging and innovative technological habitat of 21st century[J].Electronic library,2019,37(5):764-783.

[15] 王迁. 论人工智能生成的内容在著作权法中的定性[J].法律科学( 西北政法大学学报),2017(5):148-155.

[16] 丁文杰. 通用人工智能视野下著作权法的逻辑回归: 从\" 工具论\" 到\" 贡献论\" [J]. 东方法学,2023(5):95.

[17] 徐小奔. 论人工智能生成内容的著作权法平等保护[J].中国法学,2024(1):166.

[18] WU Y L,YI A L,CHEN L.Artificial intelligence for video game visualization,advancements,benefits and challenges[J].Mathematical biosciences and engineering,2023,20(8):15345-15373.

[19] 澎湃新闻. 涉嫌逆向种族歧视, 谷歌暂停人工智能模型 Gemini 的图像生成功能[EB/OL].[2024-02-23].https://www.thepaper.cn/newsDetail_forward_26441830.

[20] 徐小奔. 论人工智能生成内容的著作权法平等保护[J].中国法学,2024(1):174.

[21] 徐小奔. 论算法创作物的可版权性与著作权归属[J]. 东方法学,2021(3):53.

[22] 梅傲. 积极伦理观下算法歧视治理模式的革新[J]. 政治与法律,2024(2):122-123.

[23] 张广伟. 欧盟人工智能监管沙盒制度的功能、局限及其启示: 基于欧盟《人工智能法》的解析[J]. 德国研究,2024(2):117.

[24] 韩世鹏. 生成式人工智能算法备案的法律属性与控制路径[J]. 河南政法大学学报,2024(2):119.

[ 作者简介]

李 涛 中南财经政法大学法学院博士研究生,研究方向为民商法学、知识产权法等。E-mail:569095279@qq.com。

[ 收稿日期:2024-03-25]

猜你喜欢
生成式人工智能智慧图书馆著作权
挑战·融合·变革:“ChatGPT与未来教育”会议综述
生成式人工智能重塑教育及教师应对之道
人机共生时代国际传播的理念升维与自主叙事体系构建
对外传播(2023年4期)2023-05-21 20:52:16
生成式人工智能的教育应用与展望
Beacon技术在图书馆信息服务中的应用研究
数字出版的著作权保护问题研究
企业导报(2016年20期)2016-11-05 18:57:19
信息时代图书馆数字化服务中的著作权问题探析
智慧图书馆项目建设的应用实践
美味也有“著作权”
特别文摘(2016年18期)2016-09-26 15:40:17
论智慧图书馆的三大特点
企业导报(2016年8期)2016-05-31 20:10:49