声起数字人：有声阅读中的人机互动、情感依恋与可能关切

2024-04-29 00:44:03林一民邓香莲

数字出版研究 2024年1期

林一民邓香莲

专题主持人

李武，男，博士，上海交通大学媒体与传播学院教授。研究方向：媒介心理和出版阅读。

主持人语

对于“阅读”这一概念，几乎所有人都认为它是一种从符号语言中获取信息和意义的社会行为、实践活动和心理过程。但是，对于“符号语言”的不同理解导致了阅读在广义和狭义层面上的意义分野。狭义的“符号”往往特指文字或以文字为主的符号体系，而广义的“符号”除了文字之外，还包括声音和影像等其他符号语言。在新媒体时代，阅读的载体不再局限于纸张，电脑、手机、电子阅读器等电子屏幕成为人们接触阅读的主要入口。与此同时，阅读的对象也从印刷文字扩展为图片、音频、视频等不同符号语言。

本专题是对上述这种变化潮流的一种积极回应——“超越文字”。本专题共三篇文章，前两篇聚焦于有声阅读，第三篇重在视频阅读。当下，新媒体的发展催生了新的移动场景，这种变化重新彰显了声音的重要性。与此同时，随着AI及语言合成技术的发展，数字人的声音已可以媲美真人。因此，探讨有声阅读的用户体验、考察有声阅读中的人机互动等相关声音传播的问题是非常及时的，也是非常有价值的。本专题的最后一篇文章则以媒介融合理论为分析框架，从技术、产业和文化的层面探讨在文字和声音之外，在线视频作为一种新型数字阅读文本的可能性。

“超越文字”，不是说要抛弃文字阅读，而是在文字阅读的基础上丰富其他的阅读形态。有声阅读、视频阅读与文字阅读共同构筑新媒体时代的阅读“新景观”，这应该要成为更多人的认识。本专题的初衷即在此。

摘要：信息传播技术革新发展塑造人类社会数字交往新范式，推动数字人新形态迈入文旅消费新领域。基于对数字人有声阅读内容生产技术机理与人机互动特征及其机制的考察，可以发现，处于人机关系中的数字人有声阅读在声景沉浸中建构了从“人机互动”到“人机情感互动”再到“人机情感依恋”的互动程式。而与此同时，数字化隐忧也随之生成。应提高对数字对象依恋、虚拟伴读依赖、碎片阅读沉溺和粉丝文化泥淖等问题关注和应对的程度，构建健康的人机关系，从而使数字人有声阅读抵达信息内容服务、知识传习和文化传播的本质要义。

关键词：数字人；有声阅读；人机互动；情感互动；情感依恋

DOI： 10.3969/j.issn.2097-1869.2024.01.002 文献标识码：A

著录格式：林一民，邓香莲. 声起数字人：有声阅读中的人机互动、情感依恋与可能关切[J].数字出版研究，2024，3（1）：8-15.

1 研究缘起

信息传播技术发展一日千里，将人类社会推向数字交往的全新范式。数字人的发展与产业革命一直是生命医学和信息传媒领域关注的重要议题。1989年，美国国立医学图书馆（National Library of Medicine，NLM）即开始建立可供检索查阅的人体结构图像资料库，被称为“可视人计划”（Visible Human Project，VHP）。我国也在2001年和2003年两次香山科学会议后，启动了中国人体数据集的研究工作^[1]。在信息传媒领域，机器人、电子人一直是科幻文学和影视作品的重要主角。随着AI、云计算、大数据、虚拟现实等技术群快速发展并广泛应用于信息传媒产业，数字人再次以全新面貌走进大众视野。虚拟人、数字人、数智人等各种称谓时见报端，呈现井喷态势。而元宇宙产业的大热，特别是ChatGPT的问世，则进一步突破了公众对于AI的认知。

近年来，互联网企业、文旅广电与新闻出版机构纷纷推出数字人，并在多领域实现应用。例如，上海广播电视台虚拟主播申?雅、国家博物馆虚拟数智人员工艾雯雯、抖音虚拟美妆达人柳叶熙等。由燃麦科技开发的虚拟偶像、超写实数字人（MetaHuman）AYAYI更是担任天猫超级品牌日的数字主理人，成为阿里巴巴的首位数字人员工^[2]。同样地，数字人也已走入国内有声阅读领域，2023年5月，数传集团面向全国出版单位推出AI阅读服务数字人小睿，开启我国出版业的AI新时代^[3]。2023年8月，番茄小说正式官宣虚拟数字人IP番卷卷，作为读者阅读的“小说搭子”^[4]。在喜马拉雅平台上，已有以真人原型衍生的AI主播，其作品也获得读者关注。例如，单田芳AI书场、喜小道、苏小刀等AI主播分别有2.2万、9.3万、2.0万的粉丝订阅，喜马拉雅和阅文集团联合出品的AI多人有声剧《深空彼岸（第一季）》则有232.4万播放量，成为数字人有声阅读内容生产实践先导。不过从总体来看，将数字人引入有声阅读产业的实际应用还相对较少，处于发展初期。作为与数字平台、数字技术紧密关联的文化业态，有声阅读无疑还将进一步拓展数字人应用蓝海。由此，数字人如何参与有声阅读内容生产，促成何种人机关系和文化消费体验，成为开展本研究的核心关切。

2 文献回顾

2.1 数字人及其界定

“数字人”概念主要源自电子人，即“赛博格”（Cyborg），该词在1960年克莱因斯和克莱恩发表的《赛博格与空间》（Cyborg and Space）中被首次提出，直到1985年唐娜·哈拉维（Donna Haraway）发表的《赛博格宣言》将“赛博格”定义为“机器与有机体的混合体”^[5]。孙玮从媒介融合的视角分析媒介正在迈向主体层面的融合——技术与人的融合，这造就了新型主体赛博人，赛博人成为传播主体，媒介因而转为身体本身^[6]。在他们的阐释中，自然人是行动主体，而技术（媒介）的扩张和嵌入会进而导致人的电子化、赛博化或曰数字化。区别于“赛博人”的概念，沈浩和刘亭利将虚拟数字人定义为通过计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技（Converging Technologies）创设，并具有人的外观、行为甚至思想（价值观）的可交互的虚拟形象^[7]。同样，郭全中指出，虚拟人和虚拟数字人都属于数字人，虚拟数字人是最小的概念范畴，虚拟人包含虚拟数字人，是数字人的组成部分^[8]。据此，本文将数智人理解为数字人高度智能化的理想形态，并统称虚拟人、虚拟数字人、数智人等为数字人。

2.2 有声阅读研究面向

近年来，国内学者对有声阅读的研究主要围绕以下几个方面展开：有声阅读发展中的听觉文化回归及其场景化实践的现实意义^[9]、有声阅读对于促进儿童和青少年教育^[10]、弥合老年人及视障人群数字阅读鸿沟的作用^[11]、公共图书馆有声阅读资源建设及其推广等^[12]。此外，用户的有声阅读偏好和平台消费特征也是有声阅读研究中的重要方向。例如，邓香莲以上海大学生为例，重点考察了新媒体环境下大学生的有声阅读行为特征^[13]；尹章池和徐景熙基于统计数据分析高校学生有声阅读行为特征及有声阅读推广策略^[14]；韩生华等以可用性理论为视角对有声阅读App用户体验及发展策略进行了研究^[15]。可以发现，有声阅读是当前出版与阅读研究中的热点领域，其文化消费特征和公共文化服务效益也更加受到关注。

2.3 数字人与有声阅读的关系

现有研究中，学者们主要关注数字化场景及AI技术支持下有声阅读的应用和发展趋向，如探讨智媒时代有声出版的作用机理^[16]，流动空间中有声书的叙事模式优化^[17]，AIGC技术在音频内容生产和数字音乐创作等应用场景的赋能潜力^[18]等。另外，与之相关的人机传播（Human-Machine Communication，HMC）、人机互动也是学者们关注的议题，不过研究对象主要集中于数字化环境下的新闻^[19]、电视消费^[20]等领域。当前，学界还较少直接探讨数字人之于有声阅读（出版）的作用关系，虽然有部分研究关注到AI对于有声阅读内容生产的促进作用，但也未能更多涉及其中的人机互动关系和情感转向研究。

就此来看，以AI为重要技术支撑的数字人对于有声阅读的作用效果值得予以更多考察。为便于表述，本文将以数字人作为有声阅读内容生产、传播支持要素的有声阅读产品（包括采用某一数字人的专属声音或形象等进行的有声内容创作，也包括以某一数字人为内容角色开展的有声内容创作）和服务统述为“数字人有声阅读”。

3 数字人有声阅读内容生产与人机互动

当前，数字人仍属于新生事物，数字人有声阅读的发展、应用、实践还有极大的探索空间。可以确定的是，数字技术的赋能作用贯穿于数字人有声阅读各环节中，明确其内容生产技术机理及人机互动特征和机制，有助于更好地从用户需求出发推动数字人有声阅读的创新发展。

3.1 数字人有声阅读内容生产技术机理

区别于普通的电子有声读物或网络有声读物，数字人有声阅读具有明确的对话感和对象感。当前的数字人有两种技术路线：一种是“中之人”虚拟人，是在通过CG建模、手绘等制作方式完成形象创作后，借助“中之人”联合动捕和面捕技术实现虚拟数字人的驱动；另一种是超级自然虚拟人（AI Being），从创建、驱动、内容生成到实现交互的全程均由AI技术完成，不需要自然人参与其中^[21]。

从产业发展视角来看，将数字人引入有声阅读内容生产是数字出版的必然趋向。有声内容的声音来源可以分为三类：一是人声朗读录制；二是基于文语转化（Text to Speech，TTS）的机械语音合成；三是AI语音合成，以自然语言处理技术（Natural Language Processing，NLP）为技术核心。从艺术创造性来看，单纯地将既有文本经由人声朗读、录制或通过TTS技术、AI技术实现的有声化，不被认为具有艺术创造性，且可能存在合成语音语流不畅等问题，而“TTS+AI”的组合则可以使得电子合成语音愈发自然和准确^[22]。当然，注入配音演员或有声录制工作者的设计与巧思的有声创作则具备了艺术性。作为数字出版领域的新业态，数字人有声阅读是以特定数字人（形象）的音色进行配音、合成或朗读制作的有声内容，而在读者实际的有声阅读消费过程中，该数字人的视觉形象则可以不出现。

3.2 数字人有声阅读人机互动特征

人机交互是一个专注于计算机技术的设计和使用，并研究人与计算机之间界面的领域^[23]。数字人有声阅读则进一步创设了屏幕交互界面之下的人机互动，并呈现出四个方面的人机互动特征：一是数字人与内容文本并置，提高读者对数字人的关注。在以往的阅读体验中，阅读内容的有声化以文本为核心基础，而随着配音等有声创作的兴起，有声化的艺术性得到不断加强，数字人有声阅读的内容生产提升了数字人的“创作”主体地位，进而促进了读者与数字人之间的相互关注和互动。二是优质人物设定（一般简称“人设”）与仿真声音，优化读者阅读体验。基于对数字人的人设打造不断丰满数字人的形象表征，使其成为某种优质形象的代言人，而基于AI语音合成技术，数字人的声音表达能力更加趋近于真人，声音中的抑扬顿挫、情感表达也更加贴合文本叙事基调。三是强烈的对象感受，提供读者情感投射标的。数字人从外在形象到声音传递愈发趋于真实，使得阅读的对象感不断增强，为读者的阅读提供了情感互动可能。四是高度的听觉沉浸，营造读者可想象空间。数字人有声阅读以特定数字人为声音的主体，虽然在实际的阅读产品中，数字人一般不以视觉形象出现，但读者已经预知了阅读内容的声音主体来源，视觉的“退场”反而增强了阅读的听觉沉浸性，为读者的数字人有声阅读消费提供了更大的内容想象空间。

3.3 数字人有声阅读人机互动机制

如果将数字人有声阅读看作基于机器（技术）驱动所开展的内容生产模式，那么读者进行有声阅读消费的过程实质就是“人”与“机”的互动过程。由此，数字人有声阅读的人机互动机制也趋于明朗：其一，媒介延伸、链接人机并建构可沟通的人机关系。从麦克卢汉“媒介即人的延伸”的论断出发，面对数字人已然步入人类社会的现实，可以进一步将媒介视为数字人的延伸。内容媒介和媒介内容共同搭建起人机互动通道，读者的有声阅读消费过程也就是人与数字人以有声读物为中间环节而展开的人机接触、沟通和关系建构过程。其二，有声阅读消费创设人机互动场域。数字人有声阅读涉及读者的内容选择、内容阅读及内容批评（如评论留言、点赞、收藏、转发分享等）多个环节，而这一流程的推进正是基于有声阅读活动场域所开展的人机互动的具体实践。其三，社交属性能激发人机互动的情感转向。“如果我们要和机器人共享现实，我们就必须将机器人的行为看作世界‘正常的部分，我们可以像对待其他人一样对待它。”^[24]数字人有声阅读行为开展的前提在于读者允许数字人进入自己的情感世界，数字人有声阅读的实质就是以人机互动为底层逻辑的情感互动。其四，情感满足需要持续驱动人机互动实践。数字人有声阅读所呈现的人机对话等人机互动模式塑造强烈的对象感受和情感投射，“这样的人机对话也会向情感互动方向发展，即使机器的情感是模拟的、机械的，也会给人们带来一定的满足。”^[25]因此，情感满足的需要会驱动读者持续进行有声阅读消费并开展人机互动行为。

4 基于人机关系的声景沉浸与情感互动

有声阅读为读者搭建了基于文本内容的声音景观，营造了一种特有的声音沉浸模式。声音景观（Soundscape）由穆雷·谢弗（R.Murray Schafer）提出，其声景理论聚焦于声音、听者、环境三者的互动关系^[26]。基于对数字人有声阅读的人机互动特征和人机互动机制的分析可知，处于人机关系中的数字人有声阅读在声景沉浸中建构了从“人机互动”到“人机情感互动”再到“人机情感依恋”的互动程式。

4.1 声景沉浸强化人机互动

时下，不少开车族喜欢使用演艺明星的语音导航，一方面是出于新奇，另一方面则是因为相较于软件默认的机械合成语音，演艺明星的语音导航通过声音联结了明星本人，塑造了一种非具身的声音在场，形成了行车环境沉浸中人机互动下的人人（导航语音所对应的声音主体）互动。同样地，在数字人有声阅读建构的声景沉浸中，往往能基于人机互动生产人人（数字人指向的自然人，或被想象为自然人的数字人）互动的听觉幻象。对读者而言，相较于日常化的人际对话关系，数字人是一位“熟悉的陌生人”，在关闭或弱化视觉体验的同时，听觉感官的信息接收效果得到强化。数字人有声阅读的基础形式仍然是“你讲我听”，但读者可以进一步通过语音对话（提示）操作收听界面、选择听阅内容、参与有声内容书写。由此来看，数字人有声阅读以声音搭建了超越文本的直接互动，又去除了数字人影像技术形态可能存在的破绽，进而提供了更多读者对于文本、声音及数字人的可想象空间。

4.2 人机互动牵引情感互动

阅读是一种文本与读者双向思想交流与情感互动的文化活动。在兰德尔·柯林斯（Randall Collins）看来，情感能量是人类交流互动的核心要素，人们参与传播的动机实质上应归结于“情感能量的理性选择”，互动仪式的参与者在关注点与情感的相互连带中，能够产生一种共享的情感体验与身份认同，进而形成新的社会定位与社会形象^[27]。在数字人有声阅读活动中，既发生着读者与文本的互动，也发生着读者与数字人的互动。其核心动机来源于读者对于有声内容的兴趣选择，又交织着读者对于特定数字人的个性化偏好，其皆指向阅读活动对读者的情感牵引调动。读者的内容选择既涉及读者主动通过关键词检索进行的阅读产品选择，也包含平台基于算法的阅读内容推荐。随着数字人与GPT等大模型相结合，当读者的需求提示进一步限定，由数字人提供及基于数字人创作的阅读内容都将更契合读者的情感偏好。“多样的情感形式诞生于身体的感触经验，因际遇不同，情感总在悲苦与快乐间变化流转，这种情感的流变即是‘情动。”^[28]在阅读活动中，情动的发生链接读者与数字人的情感互动，而这种互动更大程度上隐藏于内容文本之下，在最初不为读者所察觉。

4.3 情感互动催生情感依恋

持续的情感互动催生情感依恋。“情感依恋”（Emotional Attachment）作为心理学范畴的概念，由英国心理学家约翰·鲍比（John Bowlby）基于依恋理论提出。情感依恋起初用来解释婴儿与其养护者之间的亲密联系，后来被引入到管理学、消费者行为学、社会学等领域，强调消费者与特定消费对象（产品、品牌、企业等）之间形成的涵盖认知、情感特性的心理纽带和行为反应^[29]。数字人有声阅读既是一种文化活动，也是一种文化消费实践，读者之所以愿意持续这种消费行为，其情感本质上反映的是读者对于特定数字人的依恋。正如马库斯·沃尔法伊尔（Markus Wohlfeil）关于消费文化中的名人与粉丝的阐释，“恋慕作为私人的名人”反映了粉丝对在媒体焦点外作为真实人类过着私人生活的影星或其他名人的情感依恋^[30]。他们将数字人想象为真实存在的自然人，乃至形成对于有声阅读中数字人的粉丝式追随。

5 数字人有声阅读的可能关切

信息传播的数字化令数字人有声阅读内容生产和阅读消费搭上了“数字便车”，使得数字人在有声阅读活动中的存在感不断增强。但是，其也可能引致读者对于数字对象的依恋、虚拟伴读的依赖和碎片化阅读的沉溺，以及对于数字人的粉丝式追随，这都是数字人有声阅读中需要加以重视的环节。应当明确其中的文化需求，加强观照应对，从而使数字人有声阅读不脱离信息内容服务、知识传习和文化传播的本质要义。

5.1 正视数字对象依恋

如前所述，读者在数字人有声阅读过程中，基于声音的传介生成了对于特定数字人的个性化想象，并在声景沉浸和有声会话过程中持续修正或深化这种个人专属式的想象。一般的有声阅读主要体现的是读者对文本内容的偏好，当然其中也有对于配音演员、内容主播或行业专家、文化学者的追捧，在这样的有声内容产品背后，是实在的、具身化的自然人。

而一定程度上，数字人有声阅读则将数字人引向具体文本，与文本内容并置、共在。在此情况下，读者对于数字人有声阅读的消费实践可能超越了对于内容的需求，更表现为对数字人的对象化依恋。具体而言，数字人有声阅读在使得视觉感官暂时“退场”的同时，提供并放大了读者对于数字人人设基础上的个人想象，数字人成了读者恋慕的对象。因此，需要正视读者的数字对象依恋，把握其中的平衡点。一方面，不可否认其促进了读者的有声阅读消费，满足了读者的文化需求。而另一方面，读者持续的有声阅读消费不断具象化对于数字人的想象，深化对数字对象的依恋，则可能忽视了文本的重要性，乃至模糊了数字人与自然人的情感真实。

5.2 抽离虚拟伴读依赖

如同收音机时代的广播节目给人以温情陪伴，有声阅读既能复刻收音机式的陪伴，又可以凭借声景打造沉浸式的听阅体验，在剥离视觉文化霸权主义的同时，给读者创造了更多与内容相关联的想象空间。如此，可以牵动阅读主体更多的主动思考，读者对于有声内容产品的情感依赖更深，驱动阅读趣缘社群的形成，读者与有声阅读内容的契合度及读者群体之间的紧密性也就更高。在此基础上，数字人有声阅读进一步强化了虚拟伴读体验，正如番茄阅读上线的数字人“番卷卷”，其擅长推书、帮助读者催更，乃至在和读者共读的过程中可以根据阅读内容实时呈现相应表情，营造了强烈的阅读陪伴感受。

然而，这也可能导致读者自主文字阅读能动性的消减，对于虚拟伴读的依赖增强，不益于读者的知识习得等基础能力的培养。故需引导读者抽离这种虚拟伴读依赖，有声阅读平台的陪伴式阅读体验的营造亦需考量读者的接受阈值，既要为读者提供更优质的听阅体验，又要避免形成程式依赖。

5.3 消解碎片阅读沉溺

就整体出版行业来看，相较于实体书阅读，数字阅读特别是有声阅读的“听书”方式更符合人们在碎片化时间的实际文化消费需求。数字阅读使得实体书方寸隐于无形，一“屏”在手，既无需额外负重，也不必疲于翻动书页。而有声阅读更进一步解放了双眼，人们可以在更加碎片化的时间内开展阅读活动。

不过，有声阅读看似从空间与时间的双维中解放了双眼和双手，却也降低了文字性的阅读接受，以碎片化形式进行数字人有声阅读容易仅成为一种娱乐行为，同时也容易使人们产生碎片阅读沉溺，难于花费更长时间沉静地开展阅读，无法达成深阅读式的知识学习效用。因此，做好有声读物的内容把关、产品质量提升和深化阅读接受同样重要。消解碎片阅读沉溺，避免读者惯于以碎片化的方式进行有声阅读，从而不背离阅读的本质价值，让有声阅读不仅仅成为一种娱乐式的消遣活动，而是让读者读一页有一页的意义，听一分钟有一分钟的体悟，并愿意持续将阅读进行下去。

5.4 跳脱粉丝文化泥淖

从虚拟歌姬“初音未来”，到虚拟歌手、虚拟偶像“洛天依”，再到文旅机构、电视台、互联网平台等推出的各式各样的数字人，其人设塑造近趋完美。数字人凭借优质形象，或是成为文化艺术产品、文旅服务的代言人，或是为商业活动站台背书，能够在更短时间内收获大量关注，并且相较于真人演艺明星的出场成本更低，对于现有的二次元深度用户也会产生更大的吸引力。

但是在数字人井喷的现实情况下，对于数字人的无限度追捧将催生用户的粉丝式消费，或将致使“饭圈”文化移植入数字人圈层。虽然打榜、做数据、控评等粉丝经济行为表面上使得数字人产业愈加蓬勃，但用户可能跌入粉丝文化泥淖，这是在数字人明星化日趋火热的现实下必须重点关注的环节。进而言之，对于数字人有声阅读，或者说对于阅读活动而言，跳脱粉丝文化泥淖，才可使得阅读的本质要义不被遮蔽。

6 结语

在技术的升级迭代和消费终端的持续普及之下，数字人有声阅读的声音塑造和内容呈现将更加符合人们的听觉审美和自然感受，凭借更低成本、更高生产效率和更便捷的消费形式，其将成为数字阅读的全新趋向。当然，数字人有声阅读内容生产、传播、消费的核心导向仍然是信息内容和文化知识的服务和接受。数字人有声阅读提供了数字社会阅读的全新形态，但是新事物可能带来的新问题也需要得到充分关注。应当切实重视深度媒介化社会之中大众阅读消费活动面临的人机关系应对和数字交往平衡问题。有声出版主体一要坚守有声阅读产品生产的初心，始终坚持把社会效益放在首位；二要重点把关有声阅读产品中数字人的积极形象塑造和文化价值引领；三要借力发行营销有意识地引导人们在数字世界的健康交往行为，营造风清气正的数字文化空间。

未来，人与数字人的共生不无可能，构建健康的人机关系，方能实现有声阅读内容文化性和艺术性的充分呈现和传播，进一步促进数字人有声阅读等数字文化新业态的创新增长，为广大读者在数字交往环境下提供更多供需匹配的优质文化产品和服务。

作者简介

林一民，男，华东师范大学传播学院（出版学院）博士研究生。研究方向：数字阅读与文化产业。

邓香莲，女，博士，华东师范大学传播学院（出版学院）教授。研究方向：国民阅读、数字出版与新媒体传播。

参考文献

[1]钟世镇.数字人：信息与生命科学结合的新领域[J].科技导报，2005（2）：9-12.

[2]佩森.6亿估值：超写实数字人AYAYI从创意到资本的商业版图[EB/OL].（2021-10-30）[2023-09-09].https：//zhuanlan.zhihu.com/p/427462942.

[3]中国出版传媒商报.首个AI阅读服务数字人诞生，20多家出版单位已展开应用[EB/OL].（2023-05-04）[2023-09-18]. https：//www.sohu.com/a/672788413_121418230.

[4]36氪.小说搭子已上线，数字人的A面与B面[EB/OL].（2023-08-25）[2023-09-19].https：//new.qq.com/rain/a/20230825A083AC00.

[5]阮云星，梁永佳，高英策.赛博格人类学：全球研究检视与当代范式转换[M].杭州：浙江大学出版社，2021：234-235.

[6]孙玮.赛博人：后人类时代的媒介融合[J].新闻记者，2018（6）：4-11.

[7]沈浩，刘亭利.虚实共融，若即若离：全面进击的虚拟数字人[J].视听界，2022（3）：5-10.

[8]郭全中.虚拟数字人发展的现状、关键与未来[J].新闻与写作，2022（7）：56-64.

[9]张莉.移动有声阅读场景分类与场景应用路径探析[J].出版科学，2020，28（2）：103-107.

[10]赵光敏.儿童有声阅读的发展现状与改进策略[J].上海教育科研， 2021（8）：62-66.

[11]徐佳.有声阅读作为弥合视障人群数字鸿沟的场景研究：政策、技术与法律、市场[J].中国出版，2021（17）：55-59.

[12]尚硕彤.公共图书馆有声阅读资源建设及推广策略探究[J].出版广角，2020（15）：86-88.

[13]邓香莲.新媒体环境下大学生有声阅读行为特征研究：以上海大学生为例[J].图书情报知识，2018（5）：81-94.

[14]尹章池，徐景熙.高校学生有声阅读行为特征及其有声阅读推广策略研究：基于SPSS统计数据分析[J].传播与版权，2023（3）： 43-46.

[15]韩生华，郑东和，李易蓉.可用性理论视角下有声阅读APP用户体验及发展策略探析[J].中国出版，2023（6）：24-29.

[16]沈悦，金圣钧.智媒时代有声出版的作用机理及优化路径[J].中国编辑，2022（11）：86-91.

[17]朱赫男，王鹏涛.声音回归与“理想听者”：流动空间中有声书叙事模式优化研究[J].现代出版2023（5）：103-112.

[18]李雅筝，刘宇星.AIGC技术赋能数字音频内容生产：应用场景、存在问题与应对策略[J].数字出版研究，2023，2（3）：13-20.

[19]陈阳，李宛真，张喆喆.数字新闻消费与人机关系：一项关于阅读机器人新闻的在线实验[J].新闻记者，2023（8）：40-50，85.

[20]张蓝姗，蒋亚娟.智能时代的电视社交化演进：人机分离、人机互动到人际交往[J].现代传播（中国传媒大学学报），2021，43（6）：163-168.

[21]郭嘉.虚拟数字人在图书出版领域的多元身份构建研究[J].科技与出版，2022（8）：56-63.

[22]李武，谢泽杭，杨飞.AI有声书：价值优势与未来进路[J].科技与出版，2023（6）：41-47.

[23]TABONE W， DE WINTER J. Using ChatGPT for human-computer interaction research： A primer[J].Royal Society Open Science，2023，10（9）：231053.

[24]何双百.“机器同伴”：新型亲密关系下的“人机共情”现象思考[J].西南民族大学学报（人文社会科学版），2021，42（7）：185-192.

[25]彭兰.新“个人门户”与智能平台：智能时代互联网发展的可能走向[J].新闻界，2023（9）：1-12.

[26]侯丹丹.从电影声景到声景电影：基于声景理论的电影声音探究[J].电影文学，2023（12）：47-52.

[27]吴迪，严三九.网络亚文化群体的互动仪式链模型探究[J].现代传播（中国传媒大学学报），2016，38（3）：17-20.

[28]汪民安.何谓“情动”？[J].外国文学，2017（2）：113-121.

[29]沈鹏熠，李金雄，万德敏.“以情动人”还是“以理服人”？人工智能聊天机器人角色对顾客情感依恋的影响研究[J/OL].南开管理评论：1-20.

[30]马库斯·沃尔法伊尔.消费文化中的名人与粉丝[M].刘津，译.北京：社会科学文献出版社，2022：232.

Voice from Digital Human： Human-Machine Interaction， Emotional Attachment and Possible Concerns in Audio Reading

LIN Yimin， DENG Xianglian

School of Communication （School of Publishing）， East China Normal University， 200241， Shanghai， China

Abstract： The innovation and development of information and communication technology has shaped a new paradigm of digital communication in human society and promoted the new form of digital human to enter a new field of cultural and tourism consumption. Based on investigation of the technical mechanism of digital human audio reading content production and the characteristics and mechanism of human-machine interaction， it was found that digital human audio reading in human-machine relationship constructed an interactive paradigm from “human-machine interaction” to “human-machine emotional interaction” and then to “human-machine emotional attachment” in immersion of soundscape. At the same time， digitalization worries were also generated. Attention and response to possible problems such as digital object attachment， virtual companion reading dependence， fragmented reading addiction and fan culture quagmire should be developed to build a healthy human-machine relationship， so that digital human audio reading could be able to reach the essence of information content service， knowledge transmission and cultural communication.

Keywords： Digital human; Audio reading; Human-machine interaction; Emotional interaction; Emotional attachment

数字出版研究2024年1期

数字出版研究的其它文章: 中国文学作品的海外扩散机制研究; 海外初创教育出版企业融合发展方式研究; 作茧与破茧：算法时代学术传播的价值重塑与权力规制; 湘教版教材融合出版的工作实践与探索; 智能化出版知识服务转型升级的技术实现路径研究; 2023年中国出版融合发展报告