《互联网信息服务深度合成管理规定》视域下的公共图书馆深度合成技术发展探讨

2024-03-12 03:16吴梦菲陈铭
图书馆研究与工作 2024年2期
关键词:应用场景公共图书馆人工智能

吴梦菲?陈铭

摘 要:随着《互联网信息服务深度合成管理规定》的正式颁布和实施,成果应用广泛、形式丰富多样、内容良莠不齐的深度合成发展迎来明确的管理办法。文章对深度合成的概念、应用和研究现状进行了梳理,从管理规定划定的生成或编辑文本、语音、非语音等六个领域展望了图书馆的应用场景,并根据管理规定的要求,从内生型和外生型两个方向探讨在图书馆应用深度合成技术时的可能风险点,并给出了预防以及治理路径,以期助力图书馆在《互联网信息服务深度合成管理规定》的框架内更合理、合规地开展更多基于深度合成的数字应用。

关键词:深度合成技术;人工智能;公共图书馆;应用场景

中图分类号:G258.2文献标识码:A

Exploring the Development of Deep Synthesis Technology in Public Libraries within the Scope of the Regulations on the Deep Integration Management of Internet Information Services

Abstract With the official promulgation and implementation of the Regulations on the Deep Integration Management of Internet Information Services, the development of deep synthesis has gained clear management methods, with wide-ranging applications, diverse forms, and varying content quality. This article reviews the concept, application, and research status of deep synthesis, and explores the potential application scenarios in libraries across six domains defined by the management regulations: text, speech, non-speech, and others. Based on the management requirements outlined in the regulations, the article discusses potential risk points in the application of deep synthesis technology in libraries from the perspectives of endogenous and exogenous factors, and provides preventive and governance measures. The aim is to enable libraries to carry out more rational and compliant applications of deep synthesis technology within the framework of the Regulations on the Deep Integration Management of Internet Information Services to further enhance digital applications supported by deep synthesis.

Key words deep synthesis technology; artificial intelligence; public library; application scenarios

1 引言

2022年12月11日,國家互联网信息办公室、工业和信息化部、公安部三部委联合发布了《互联网信息服务深度合成管理规定》(以下简称《规定》),并自2023年1月10日起施行[1]。《规定》对互联网信息服务深度合成技术进行了明确、有效的管理和规范,对推进深度合成技术合理化发展、维护互联网健康生态起着至关重要的作用。

“元宇宙”“人工智能”近两年在图书馆行业炙手可热,在图书馆不断智慧化、信息化甚至“元宇宙”化的过程中,从理论概念研究到技术发展探索,都需要依靠深度合成技术进行实现。作为我国出台的首部对深度合成服务治理的专门性部门规章,《规定》为图书馆利用安全可靠的深度合成技术进行互联网信息服务,提供了指向性明确、整体性突出的发展方向、行为依据和法律保障。

2 深度合成的概念及其相关研究

2.1 深度合成概念

随着电子信息技术的不断发展,人工智能已经朝着产业化、泛在化方向迈进,其智慧化水平在短时间内迎来了数个代际跃升。随着数字基础设施建设趋于完善,人工智能所应用的场景愈发广泛和多元,呈现更为生动、丰富的发展景象。深度合成就是基于现阶段人工智能发展而逐渐形成的重要应用领域。

《规定》明确深度合成技术就是“利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术”[2]。“深度合成”在计算机学科中是“机器学习”的一个关键组成部分,其核心技术是机器学习模型“生成式对抗网络”(Generative Adversarial Networks, GAN)和自编码器网络(Auto Encoder, AE)[3]。模型通过“深度学习”和“合成”的综合处理,把海量的文字、图片、音频、视频等相关数据通过神经网络技术进行学习,并在源材料上产生新内容。

2017年,在美国Reddit社交网站上,一个名为“deepfakes”的用户上传视频,通过深度合成技术将知名女星的面部合成到色情视频的表演者身上[4],从而引发巨大的舆论震荡,这也被视为“深度合成”技术广泛进入公众视线的开始。2018年,受该事件影响,美国出台了《恶意伪造禁令法案》[5],将“深度合成”技术与“深入伪造”打上了“等号”。在这个“负面”的应用场景被广为熟知后,深度合成制造的真实感知力和临场感也确实引发了恶意使用和技术滥用的问题,从通过声音、面部合成进行的电信诈骗,到合成动态人脸信息进行的伪造金融注册、银行借贷,再到合成政客、亲友、明星的个人特征进行的各类谣言散布、色情欺诈等都似乎成为“深度合成”的原罪。

技术本身只是手段,无关于道德,中性、中立的技术所带来的利与弊从来不是技术本身,其益与害往往就是人性中善恶的对称。在互联网发展的大潮中,各类良性信息生成、媒介传播和互动交流都出现了深度合成的技术身影,影视制作、广告营销、电子商务、社交娱乐等都成了深度合成技术的正向应用舞台。根据国家工业信息安全发展研究中心与清华大学人工智能研究院共同发布的《深度合成十大趋势报告(2022)》显示,在内容产生上,2021年新发布的深度合成视频的数量较2017年增长10倍以上;在关注数量上,2021年新发布的深度合成视频的点赞数已超过3亿[6]。2020年韩国VR公司通过深入合成技术进行拍摄测量、虚拟实际和动作捕捉,帮助一位母亲合成还原逝去孩子;2022年,第24届冬季奥林匹克运动会在北京举办时,中央电视台的AI主播“小聪”就通过深度合成技术完成了手语模型数据库的搭建和应用,并对各类比赛项目成功进行了全程手语播报[7];2021年9月,第八批在韩中国人民志愿军烈士遗骸回国,《人民日报》通过深度合成技术为老照片进行修复、还原、上色,重现照片场景[8],等等。可见,深度合成技术带来的,除了成本更低、效率更高的内容产出,还有体验更真实更临场的感官交互,以及更欣欣向荣的数字产业经济环境和人文感受。

2.2 深度合成的相关研究

由于深度合成技术是2017年才开始出现并发展的前沿技术,所以我国相关研究相对较少。近两年,随着深度合成技术的迅猛发展以及《规定》的发布,相关研究数量呈现出一定程度的增长。国内深度合成研究主要围绕法制完善、规范治理、技术提升以及新领域赋能四个方面展开。

在法制完善方面,万志前、陈晨强调要以《中华人民共和国民法典》相关条款为基础,明确深度合成技术使用边界、使用程序以及滥用后果等[9];李伟明确了法律语境下“深度合成”和“深度伪造”的区别[10];李明鲁则认为需要对应用深度合成技术进行“深度伪造”的技术帮助犯罪行为,通过刑法采取独立罪名认定的制裁思路[11]。

在规范治理方面,王榕主要研究了深度合成技术应用普遍存在的主体责任不明确、监管不到位、算法黑箱等问题[12];眭占菱等人提出了遏制源头违规、重塑专家鉴定、加强环境经验支撑等辨识机制[13]。

在技术提升方面,蔺琛皓等人实现了对虚假数字人脸内容的检测和判定[14];魏玲应用Nuke这一数码影视后期合成软件时发现,深度合成技术可在不受光照、阴影和色度影响下直接反映图像中物体表面的三维特征[15];贺明明构建了一个基于GPU(Graphics Processing Unit, 图形处理器)的深度图像后期绘制与合成系统,成功集成了与深度图像相关的后期合成技术与绘制算法[16]。

最后在赋能新领域方面,任婧和生奇志重点探究了深度合成技术在新媒体领域智能化、虚拟化、沉浸式的应用方向[17];毕韦达等人对比了在影视渲染领域传统的合成流程与深度合成流程的异同,并对深度合成在影视产品制作、渲染、后期、特效等方面的应用进行了展望[18];刘顺堃研究发现,在影像医学方面,在深度合成技术的支持下,CT图像的精度和细节表达能力有明显提升[19]。

在国外,有关深度合成的研究的起始时间早于国内,首先是“深度合成”概念的形成,2014年,伊恩·古德费洛开创构建了生成式对抗网络技术(GAN),即通过生成模型和判别模型的对抗性博弈最终形成新内容,这是深度合成的雏形,他参与编写的《深度学习》更是深度合成研究的基础[20]。2015年,詹姆斯·马克斯等人提出要通过深度合成技术实现数据科学工作的自动化,正式肯定了深度合成的科学效用[21]。其后的国外深度合成研究就呈现出较之国内更为发散的发展方向,除了技术提升、规范治理外,还关注到了隐私、政治等多个问题。

在隐私研究方面,S.A.奥西亚等人基于深度合成建立了一种基于信息理论约束进行训练和评估的深度模型,模型能够有效防止用户的某些敏感信息与服务提供商共享[22];贾亚斯里·森古普塔等人提出了一种可扩展、隐私保护和可协作的SPRITE算法,算法采用阈值秘密共享来保证工业物联网的隐私保护[23];A·萨尔马迪等人利用共享特征提取器(Shared Specific Feature, SFE)进行特征提取,以保护协作机器学习中的隐私信息获取[24]。

在政治研究方面,罗伯特·切斯尼等人认为深度合成技术是对隐私、民主和国家安全的迫在眉睫的挑战[25];B·马修等人认为深度合成关键人物、政府首脑的相关内容可能会引发军事、政治等多方面的不安定[26];B·布莱恩通过分层视角对深度合成的應用是民主技术化还是技术民主化进行了探讨[27]。

3 深度合成在图书馆的应用场景

《规定》中明确了深度合成技术的具体应用方式,包括生成或编辑文本内容的技术,生成或者编辑语音内容的技术,生成或者编辑非语音内容的技术,生成或者编辑图像、视频内容中生物特征的技术,生成或者编辑图像、视频内容中非生物特征的技术,生成或者编辑数字人物、虚拟场景的技术”[2]六项,这也是图书馆可参考、可应用的深度合成技术场景。

3.1 生成或编辑文本内容的技术

生成或编辑文本内容的技术是通过深度合成进行的篇章生成、文本风格转换以及问答对话等,现阶段最典型也是最为大众所熟知的,能够进行较好文本生成和编辑技术的应用就是ChatGPT(Chat Generative Pretrained Transformer),一种生成型预训练聊天机器人。2022年11月,美国人工智能研究室OpenAI开发了人工智能聊天机器人应用ChatGPT[28]。作为以语言模型为基础的人工智能,ChatGPT具备对文本的识别、理解和生成能力,可以通过对话指令进行创作,能独立完成各类主体文本撰写、代码编辑等文本任务。与之前已有的Siri、微软小冰等人工智能聊天机器人不同,ChatGPT通过互联网数据和人类反馈进行深度合成和强化学习,不仅可以生成文本信息,还可以对所生成的信息进行评价和判别,并通过不断地修正和迭代合成符合人类基本常识、普遍认知和道德观的文本体系[29]。

在图书馆领域,ChatGPT类的文本内容深入合成技术带来的发展机遇无疑是巨大的。首先就是在ChatGPT类应用现阶段较为广泛的领域——智能咨询。从读者服务的角度看,日常咨询、参考咨询是图书馆对读者进行知识服务的关键。多年来,智慧图书馆的一个显性判定依据就是参考咨询工作的智能化程度。为此,清华大学图书馆、南京大学图书馆等高校图书馆都有自己的虚拟馆员咨询系统[30],上海图书馆、江西省图书馆等公共图书馆也配置了和大型商场类似的咨询机器人[31],但咨询的智能化程度和效果还远不及ChatGPT类应用。ChatGPT类应用可以进一步提升各类咨询反馈速度和质量,给读者带来新的咨询体验和更丰富、全面的知识信息。其次是图书馆运行效率的提升,ChatGPT类应用可以大量学习图书馆的新闻报道、活动预告、制度条例、汇报材料、文稿报告等文本内容,通过深度合成技术,快速、准确地生成新的相关文本,甚至进行完整的定题写作和PPT制作,虽然不能完全替代现实图书馆员,但也切实有助于提升图书馆运行效率。

3.2 生成或者编辑语音内容的技术

深度合成中的生成或者编辑语音内容技术主要指的是文本转语音、语音转换、语音属性编辑等。文本转语音技术早期是以单向文本转语声形式出现[32],办公软件中内置的朗读功能,地图软件导航、机场火车站等交通枢纽的通知、报站等都是基于此。单向文本转语声只能简单读字,不能辨析词义和语境,所以对多音字、语气不能判定。经过深度合成加强后产生的单向文本转语音技术能进行文本辨析,对内容、情感进行学习和判定,从而形成具有语音语调、能识别多音字的更为“仿生”的文本转语音系统。语音转换、语音属性编辑技术最初依靠把矢量量化(Vector Quantization, VQ)码本基于语音编码生成的方法进行语音属性编辑,实现不同人之间语音的转换,现在随着深入合成技术的发展,相继有学者提出了把GAN模型应用于语音的生成和鉴别,通过海量的训练、调整、合成,使合成语音生成效果更趋向于目标语音[33]。

在图书馆领域,语音内容的深度合成应用场景主要包括有声阅读、无障碍服务、场馆运行管理等方面。有声阅读是数字化阅读的一种表现形式,公共图书馆现阶段主要通过购买如库克数字音乐图书馆、云图数字有声图书馆、天方有声图书馆等有声阅读平台的方式获得有声阅读资源,再为读者提供相关阅读服务[34]。在深度合成相关语音技术的帮助下,图书馆可以充分发挥自身的馆藏优势,把馆藏特色文献、古籍善本、家谱方志、日记书信都通过文字转语音形式形成更具特色的馆藏语音库,使读者可以听到近代历史名人用他们自己的声音朗读信件、日记,也可以听到用上古音、中古音朗读的古籍善本中的历史记录和诗歌文学。其次,可以建立方言、口述史的语音库,通过深度合成技术,一方面将方言、口述史转换成文字,进行文字语音的双形式保存,另一方面可以利用语音转换技术建设方言和普通话的转换程序,这样既能有效完善、健全本地方言语言系统,更能帮助读者快速了解、学习、掌握本地方言,起到传承、传播本土文化的作用。在无障碍服务以及场馆运行管理方面,深度合成的语音技术可以为视觉受限人士、老人、儿童等提供更完整、准确和生动的语音辅助服务。其在浏览图书馆网站、APP以及新媒体界面时,语音技术可以通过不同类型的语音语调用于閱读界面不同内容的朗读,以及不同级菜单的导航和指引等;在图书馆的场馆利用时,语音可以实现对图书馆阅览室、各类设施的方向引导,馆藏图书的架位引导,各类展览、标识牌、阅览室说明的提示和阅读以及与图书馆灯组、门禁、各类开关设施联动的语音指令执行等。

3.3 生成或者编辑非语音内容的技术

深度合成技术在音乐领域的探索主要围绕音乐和场景声生成或编辑两大类。在前期,音乐和场景声的生成主要依靠计算机系统对已有的音乐作品进行内容拆解、关键要素提取、系统分析和规律总结,然后通过算力进行创作模型的搭建,最后将音乐要素重新填充形成音乐创作,微软公司研发的小冰、腾讯的艾灵等都可以达到音乐创作的需求[35]。在有了深度合成技术的加持后,人工智能通过广泛学习音乐中的情感的唤起、波动和影响,以乐段、乐汇、节奏、调高等为载体,模拟出更符合人脑听觉习惯、结构认知和旋律识别的共情音乐系统[36]。2021年,中国音乐学院就和中国人工智能学会联合主办了世界音乐人工智能大会,来研究、展望人工智能在音乐领域的建设发展[37]。同年,腾讯也建立了天琴实验室,重点关注深度合成技术下的音乐歌曲识别、音质优化提升、歌唱评价赋分和翻唱假唱识别等[38]。

在图书馆领域,非语音内容的深度合成技术可以在音乐推广活动和沉浸式阅读空间的打造上进行应用。在音乐推广活动方面,很多图书馆都设置有相对隔音的视听阅览室,为读者提供音乐欣赏空间,在深入合成技术应用后,图书馆可以在原有的音乐资源基础上,根据读者的喜好、年龄分布甚至职业为其提供更细分的音乐推荐和人工智能音乐作品,还可以鼓励读者在图书馆视听场馆内,以及在社交网络、数字平台上通过深度合成手段自行创作音乐,构建虚拟图书馆音乐厅,召开由读者共创共建的虚拟音乐会。在沉浸式阅读空间的打造方面,深度合成技术可以有效掌握、理解文学作品中的场景,并与场景声素材进行结合,利用图书馆现有的隔音亭、朗读亭等设备形成紧扣阅读细节的场景声打造,例如当读者在亭中阅读推理犯罪小说的特定章节段落时,隔音亭内的智能设备就能被触发并播放相关场景的场景声如由远及近的警笛声、急促的喘息声、开门声等,为读者提供身临其境的阅读体验。

3.4 生成或者编辑图像、视频内容中生物特征的技术

在深入合成技术中,较为人熟知的就是生成或者编辑图像、视频内容中生物特征技术,其中包括的人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等在某些涉嫌违法犯罪领域的应用也成为《规定》出台的主要因素之一。由于人脸面部五官结构的特殊性及其动作表情所传递情绪、情感的复杂性,传统的算法合成效果不佳,人脸替换或表情操控会具有一定的不真实性和违和感,但基于深度合成机制的层次化残差网络掩膜优化和双域生成对抗网络可以自然地学习从粗到细多级粒度的尺度特征,从而得到内容更丰富、特征更突出的面部信息输出,提升面部五官的动态排布和细节控制,保持、提升面部图像生成、调换和调整的信度和实感[39]。

在图书馆领域,文献档案研究方面,此类型技术能在老照片、老档案以及仅有少量资料的近代历史人物的有关人脸的修复和再现中起到重要的作用;阅读推广方面,文学作品中的人物可以通过描述生成面部,拥有表情,加之语音技术,读者可以与文学作品中的人物对话,童话中的动植物也可以拥有更加活泼生动的表现形式;图书馆虚拟空间建设方面,人脸生成、人物属性编辑可以为读者在虚拟图书馆空间中进行个性身份标识,让读者以自己生成的面部及整体形态体验虚拟图书馆。

3.5 生成或者编辑图像、视频内容中非生物特征的技术

生成或者编辑图像、视频内容中非生物特征的合成技术主要指的是图像生成、图像增强、图像修复,是深度合成技术在计算机视觉领域的重点发力方向。GAN可以通过无监督或者有监督的方式训练所生成的对抗网络,当真实数据中的图像和生成器合成的图像反复对抗后,就训练形成了高质量的与真实数据相似的图像。而图像的增强和修复也是利用这一机制,由帕塔克等人提出的图像修复网络Context Encoder,就是利用像素预测驱动无监督特征学习,进行缺失图像周围像素信息感知、推测修复内容,从而补全缺失像素,减少横纹、边缘锯齿等图像问题的产生[40]。

在图书馆领域中,非生物特征的深度合成技术是古籍善本、老照片、档案等馆藏资源修复的重要工具。在对古籍善本等珍贵馆藏资源进行数字化扫描建立数据库后,可以将块匹配机制嵌入图像特征空间,以特征匹配的方法进行缺损补全,通过大量数据样本生成对抗网络从而生成最优补全效果,以达到对于内容缺损的古籍文献的数字修复;其次是对于一些因年代久远或保存不当造成的字迹辨认不清,字体形状、轮廓模糊的情况,深度合成的图像增强技术可以在已有数据库的基础上,结合多个输入帧信息,通过超分辨率算法在提升像素的同时减少图像噪点和颗粒,进一步提升文字、图片的清晰度[41]。

3.6 生成或者编辑数字人物、虚拟场景的技术

生成或者编辑数字人物、虚拟场景可以说是深度合成在生成或编辑文本、语音、非语音、生物特征、非生物特征几方面的综合产物,是集几个领域为一身的数字凝合,其内容包括了三维重建、数字仿真等。数字仿真包括仿真植物、动物、数字人等。数字人[42]需要具备人类的外貌特色、人类的表达行为以及思考能力三个方面。外貌特色涉及图像领域的深度合成技术,表达行为涉及生成或编辑语音内容、生物特征等几个领域的深度合成技术,而思考则需要内容生成的过程中产生的创造性思维,所以涉及ChatGPT类生成或编辑文本内容的深度合成技术。而虚拟场景构建中,更多的是从图像合成领域中形成的虚拟场景、非语音领域形成的場景音、加之生物特征技术中形成的数字仿真生物构建起来的虚拟环境,最终的发展方向也就是“元宇宙”。

在图书馆领域,基于深度合成技术下的“元宇宙”图书馆可以在虚拟场景中进行三维重建,在数字世界打造虚拟图书馆空间。在虚拟图书馆中,读者可以以书为媒在此进入每一本图书馆馆藏图书的虚拟空间,置身于名著、童话等文学作品中,与虚拟数字主人公对话或与其共同经历人生体验新世界。读者也可以与数字图书馆员交流,获取最专业快速的知识服务、信息参考,通过具象化的沉浸式的体验进行学习提升。

4 深度合成技术在图书馆内的应用风险及其预防、管理路径

根据《规定》的划分,深入合成技术的主要参与方分为服务应用方、技术提供方[2]。服务应用方在图书馆领域指的就是通过深度合成技术进行读者服务或者图书馆业务服务的图书馆;技术提供方指的就是为图书馆提供深度合成技术的第三方。

深度合成技术的图书馆应用风险可以分为基于算法和技术本身的内生型风险以及由于应用深度合成技术而产生社会影响的外生型风险。

4.1 深度合成技术内生型风险点及其预防

内生型风险点主要指的是技术提供方在进行数据处理、编辑合成和产品服务应用三个合成技术流程上可能产生的风险。图书馆在应用技术方提供的各项深度合成技术之前,需要以内生型风险点为重点,对技术提供方的合成技术流程进行预判和审查。

首先在数据处理方面,无论是ChatGPT类的文本还是语音等的生成、编辑都需要大量的数据进行训练、对抗以达到合成目的,图书馆需要对技术提供方在数据的来源获取手段、数据存储安全、数据查用权限三个维度进行严格的判定。在数据的来源获取维度上,主要是审查获取手段是否合法、合规,数据被获取的读者、用户是否对数据获取过程、获取内容知晓,读者、用户对数据后期的用途是否知情等;在数据存储上,图书馆需要整体掌握技术提供方的全数据安全链条,审查其是否具备安全的存储介质、容灾备份、回收机制和日志审计等;在数据查用权限上,主要是审查技术提供方在数据查看、修改、上传、删除过程中权限的划分、赋予和监督是否合理。

其次,在编辑合成阶段,图书馆需要审查的是技术提供方的合成的技术性质和技术成熟度。在性质方面,需要审查深度合成算法和模型本身是否具备准确性、可信性、可靠性,进行生成、编辑的过程是否有漏洞,是否可控制,其产生的结果是否达到预期;在成熟度方面,需要审查技术提供方在数据特征提取、计算、合成、检测、学习和操作上的技术是否成熟。

最后在场景应用上面,图书馆需要审查的是技术提供方的算法应用是否合法、合规,在算法应用中是否存在算法滥用导致的信息欺诈、存储破解、信息泄露的隐患等。

4.2 深度合成技术外生型风险点及其预防与管理

外生型风险点主要指的是在技术层面之外,也就是图书馆充分肯定相关合成技术逻辑后,在准备引进或已经进行应用的过程中,技术提供方和图书馆可能产生的社会性风险[43]。

首先,图书馆需要审查技术提供方企业本身是否严格遵守国家、人工智能相关行业领域制定的相关法律法规、行业规章、规范等,企业内部是否订立了涉及安全、隐私等的严格的工作制度、工作规范和流程,是否设有相关风险控制管理部门,有没有主动的安全风险控制机制和处理手段等。图书馆还可以对技术提供方之前承接的项目进行调研,审查其在项目运行过程中是否合规,成效是否显著,后续的数据管理和利用是否符合风险信息公开性和用户数据隐私性的要求。

此外,图书馆在应用深度合成技术的时候也需要对深度合成技术的原理和算法逻辑有深入的了解,对其可能产生的风险的来源和形式有准确的预判,能够充分明确图书馆在包括方向责任、制度责任、管理责任、安全责任等方面的主体责任。

方向责任主要指的是图书馆应用深度合成技术的目的和初衷必须是向善的,是合乎法律法规、社会公德和人伦的,是在坚持正确政治方向、舆论导向、价值取向基础上,出于促进先进文化发展、建设公共文化服务体系和提升公共图书馆服务的目的。

制度责任,即图书馆有责任建立健全深度合成技术管理制度,其内容充分涵盖应用深度合成技术的所有关键环节,包括算法相关机制的审核制度、科技伦理审查制度、技术提供方的资质审查制度、合成数据及内容管理审核制度等。尤其是内容管理审核机制方面,图书馆应建立严格的内容管理审核机制,确保数据采集处理、特征库建立的过程以及深度合成结果的产生、使用过程合法合规。

管理责任包括参与对象管理、标识管理两个方面。参与对象管理主要针对技术提供方和使用或享受图书馆深度合成技术服务的读者。图书馆需要对技术提供方行业资质、算法模型、安全管理等方面进行审查,需要与使用相关服务的读者制定并公开管理规定和使用公约,对所有使用读者依法进行身份信息的验证,并对其的使用权限和行为进行明确规定,以确保在风险触发时可以进行明确的责任划分。标识管理方面,图书馆必须明确要求技术提供方在图书馆最终呈现的各类深度合成产品和服务上通过一定的技术手段在不影响读者使用体验的情况下进行标识添加。一方面,标识可以快速帮助读者和图书馆进行深度合成相关产品和服务的辨识和溯源;另一方面,标识能帮助读者有效分辨真实、虚拟的语音、画面、场景、人物,减少不必要的信息混淆和舆论影响[44]。

最后,在安全责任方面,图书馆可以联合技术提供方定期开展深度合成产品及服务的安全评估工作,预防信息安全风险。双方应共同建立违法信息、不良信息的特征库,建立行之有效的安全审核控制系统,对输入数据和合成结果中的风险因素进行及时排查、精准定位、快速处置,在不断提升技术水平的同时降低系统性安全风险。

5 结语

在人工智能与大数据技术快速发展的今天,深度合成技术是人工智能领域中的一种新型应用和实践,不但给用户带来个性化、精准化、智能化的信息服务,更是得到了很多行业场景的推广和应用,并且衍生出“元宇宙”这一种新型应用场景。但是网络传播的环境越来越复杂,新的合成方法不断涌现,深度合成技术如果违法应用,还易造成对用户合法权益的侵犯、违法信息散布、社会舆论操纵等一系列的问题,滥用危险也越来越大。图书馆应积极应对,通过建立完善法律制度保障、强化主体责任机制、健全管理等方式来防范和规避这些风险,以更好地发挥深度合成技术的社会价值与作用。图书馆深度合成前景光明,应用领域广,是公共文化服务人工智能发展的需要。人工智能的发展也要求图书馆不断加强自身的数据基础设施建设,逐步健全数据安全技术人才与管理人才培养体系,进一步提高深度合成自主创新能力,增强安全保护力,持续拓展深度合成的多样文化应用场景,对人工智能语境下的公共文化服务产生带动效应,推动科技向上向好。

参考文献:

[1] 梁楠.三部门发布《互联网信息服务深度合成管理规定》[J].新闻文化建设,2022(24):2.

[2] 互联网信息服务深度合成管理规定[J].中华人民共和国国务院公报,2023(4):22-25.

[3] XUE Y,GUO Y C,ZHANG H,et al.Deep image synthesis from intuitive user input:A review and perspectives[J].Computational Visual Media,2022(8):3-31.

[4] POPOVA M.Reading out of context: pornographic deepfakes,celebrity and intimacy[J].Porn Studies,2020(7):367-381.

[5] S.3805-Malicious Deep Fake Prohibition Act of 2018[EB/OL].[2023-03-10].https://www.congress.gov/bill/115th-congress/senate-bill/3805.

[6] 深度合成十大趋势报告(2022)[R].北京:清华大学人工智能研究院,2022.

[7] 吴静.“深度伪造”技术在传媒领域的新应用和异化风险[J].传媒,2023(3):51-54.

[8] 魏泳安.算法視阈下文化虚无主义新症候及应对策略[J].毛泽东邓小平理论研究,2022,423(12):35-44,104.

[9] 萬志前,陈晨.深度合成技术应用的法律风险与协同规制[J].科技与法律(中英文),2021(5):85-92.

[10] 李伟.从“深度合成”到“深度伪造”[J].检察风云,2021(12):11-12.

[11] 李明鲁.“深度伪造”的刑法治理路径[J].科技与法律(中英文),2021(6):40-47,73.

[12] 王榕.深度合成技术行政监管的困境和路径[D].兰州:甘肃政法大学,2021.

[13] 眭占菱,何亮亮,蒋洁.深度合成待证数据的风险剖析与辨识机制[J].图书与情报,2020(6):59-64.

[14] 蔺琛皓,沈超,邓静怡,等.虚假数字人脸内容生成与检测技术[J].计算机学报,2023,46(3):469-498.

[15] 魏玲.基于Nuke的深度图像合成[J].电子测试,2015(1):69-71.

[16] 贺明明.基于GPU的深度图像后期绘制与合成系统[D].杭州:浙江大学,2014.

[17] 任婧,生奇志.智能·虚拟·沉浸:“深度合成”赋能新媒体[J].科技传播,2022,14(6):126-129.

[18] 毕韦达,罗江林,吕鑫.基于深度信息的图像渲染与合成流程的研究[J].电脑知识与技术,2022,18(16):86-88.

[19] 刘顺堃.基于深度神经网络的MR图像合成CT图像方法研究[D].上海:上海应用技术大学,2022.

[20] HEATON J,IAN G,YOSHUA B,et al.Deep Learning[J].Genet Program Evolvable Mach,2018(19):305-307.

[21] KANTER J M,VEERAMACHANENI K.Deep feature synthesis: Towards automating data science endeavors[C]//2015 IEEE International Conference on Data Science and Advanced Analytics(DSAA).New York:IEEE,2015:1-10.

[22] OSSIA S A,TAHERI A,SHAMSABADI A S,et al.Deep Private-Feature Extraction[J].IEEE Transactions on Knowledge and Data Engineering,2018(32):54-66.

[23] SENGUPTA J,RUJ S,BIT S D.SPRITE:A Scalable Privacy-Preserving and Verifiable Collaborative Learning for Industrial IoT[C]//2022 22nd IEEE International Symposium on Cluster,Cloud and Internet Computing(CCGrid).New York:IEEE,2022:249-258.

[24] SARMADI A,FU H,KRISHNAMURTHY P,et al.Privacy-Preserving Collaborative Learning through Feature Extraction[J/OL].IEEE Transactions on Dependable and Secure Computing,2023:1-13[2023-07-03].https://ieeexplore.ieee.org/document/10089424.

[25] CHESNEY R M,DANIELLE K C.Deep Fakes:A Looming Challenge for Privacy,Democracy, and National Security[J].California Law Review,2018,107:1753.

[26] BOH??EK M,FARID H.Protecting world leaders against deep fakes using facial, gestural, and vocal mannerisms[J].Proceedings of the National Academy of Sciences of the United States of America,2022,119:48.

[27] FORD B.Technologizing Democracy or Democratizing Technology? A Layered-Architecture Perspective on Potentials and Challenges[C]//Digital Technology and Democratic Theory.Chicago:University of Chicago Press,2020:274-308.

[28] GILSON A,SAFRANEK C W,HUANG T,et al.How Does ChatGPT Perform on the United States Medical Licensing Examination? The Implications of Large Language Models for Medical Education and Knowledge Assessment[J/OL].JMIR Medical Education,2023:9[2023-07-03].https://www.semanticscholar.org/paper/How-Does-ChatGPT-Perform-on-the-United-States-The-Gilson-Safranek/cd4d112f3f9120d0715f22a9de2ce4720822368c.

[29] DENG J,LIN Y.The Benefits and Challenges of ChatGPT:An Overview[J].Frontiers in Computing and Intelligent Systems,2023,2(2):81-83.

[30] 李书宁,刘一鸣.ChatGPT类智能对话工具兴起对图书馆行业的机遇与挑战[J/OL].图书馆论坛:1-8[2023-03-18].http://h-p.kns.cnki.net.i.jllib.cn/kcms/detail/44.1306.g2.20230307.0928.002.html.

[31]刘泽,邵波,王怡.数据驱动下图书馆智慧参考咨询服务模式研究[J/OL].情报理论与实践:1-11[2023-03-22].http://kns.cnki.net/kcms/detail/11.1762.G3.20221107.1357.008.html.

[32] 周正宏.论人工智能语言标准化及其战略意义[C]//中国标准化协会.中国标准化年度优秀论文(2022)论文集.北京:《中国学术期刊(光盘版)》电子杂志社有限公司,2022:8.

[33] WU D Y,CHEN Y H,LEE H Y.VQVC+: One-Shot Voice Conversion by Vector Quantization and U-Net architecture[EB/OL].[2023-07-03].https://arxiv.org/abs/2006.04154.

[34]武玥.公共图书馆有声阅读推广服务探析[J].农业图书情报学报,2022,34(3):61-67.

[35] DONG H W,ZHOU C,BERG-KIRKPATRICK T,et al.Deep Performer:Score-to-Audio Music Performance Synthesis[C]//ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing.New York:IEEE,2022:951-955.

[36] 蕭萍.具身·想象与共情:人工智能音乐生成与传播的技术现象学研究[J].现代传播(中国传媒大学学报),2022,44(9):155-161.DOI:10.19997/j.cnki.xdcb.2022.09.002.

[37] 王晓璇.未来音乐新风向:人工智能赋能音乐发展——世界音乐人工智能大会述评[J].人民音乐,2022(1):84-87.

[38] 杨庆峰.从人工智能难题反思AI伦理原则[J].哲学分析,2020(11):2.

[39] ELHOSENY M,SELIM M M,SHANKAR K.Optimal Deep Learning based Convolution Neural Network for digital forensics Face Sketch Synthesis in internet of things (IoT)[J].International journal of machine learning and cybernetics,2021(11):12.

[40] PATHAK D,KR?HENB?HL P,DONAHUE J,et al.Context Encoders:Feature Learning by Inpainting[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).New York:IEEE,2016:2536-2544.

[41] 陈亚芳,杜响成,郑莹斌.数字智能修复技术在历史档案领域中的应用[J].中国档案,2022(12):32-33.

[42] 侯文军,卜瑶华,刘聪林.虚拟数字人:元宇宙人际交互的技术性介质[J].传媒,2023,393(4):25-27,29.

[43] 张超,陈莎.深度合成的外生性风险及平台治理原则[J].中国新闻传播研究,2022(5):39-49.

[44] 时建中.专家解读|规范深度合成服务 营造风清气正的网络空间[EB/OL].[2023-03-22].http://www.cac.gov.cn/2022-12/12/c_1672217053955777.htm.

猜你喜欢
应用场景公共图书馆人工智能
2019:人工智能
人工智能与就业
数读人工智能
室内外布线用新型光缆技术规范应用研究
MOOC时代公共图书馆服务探索研究
公共图书馆延伸服务的实践与思考
谈公共图书馆如何建立自助服务推广长效机制
下一幕,人工智能!
物联网关键技术与应用
就业信息服务平台数据隐私保护方案设计