● 梅 凯 刘鸣筝
智能语音技术以智能语音设备为依托,目前主要有两种存在方式:其一是嵌入手机或电脑之中,以手机或电脑等终端为依托,成为其功能的一部分,如苹果公司的Siri、微软电脑的Cortana、小米手机的小爱同学等。其二是独立存在的智能设备,如智能音箱、翻译机等。智能语音技术作为人工智能生态链中的关键一环,其应用的场景愈发广泛。笔者依据智能语音技术运作中的各环节要素,将智能语音技术的应用总结为:“三种模式”“多种应用”。
1.机器主导、用户接收模式。此种模式是以机器作为语音信息发出者,用户作为接收者的单程模式,主要涉及语言合成技术。用户需要凭借搭载智能语音技术的智能设备接收信息,其与报纸、广播和视频等媒介的碰撞将会迸发出新样式的传播形态。
智能语音与报纸的结合将会促成有声报纸的出现。有声报纸是指区别于传统纸质报纸仅单文本信息使用的新型报纸形态,用户只需调动听觉即可进行信息消费。亚马逊Alexa 语音助手面向用户推出“新闻简报”服务,用户可根据需要询问Alexa 即可获取相关新闻信息。智能语音与广播的融合导致AI 合成主播的诞生。广播与智能语音技术有共同的组成元素——声音。二者结合,一方面给播音员带来了极大的职业危机;另一方面,智能语音技术的助力能够减少广播中的人为错误,给听众带来全新的听觉体验。智能语音与视频的结合促进视频新闻的崛起。短视频的兴起使得人们信息接收形态产生了从单媒体到多媒体的转变,智能语音技术能为音视频自动翻译匹配字幕,在给视频产品生产提速的同时,也能更好地贴近用户的信息消费喜好,更好地为用户服务。
2.用户主导、机器接收模式。这一模式是以用户为中心,依据用户不同需求和各自特点开展个性化服务,主要涉及语音识别技术。机器作为接收语音信息方,运用语音识别技术,将用户发出的语音转换成某种信号,机器接收后以其他非语言符号的形式反馈给用户的模式。音频搜索是伴随着智能语音技术发展而成长起来的,是指用户向智能语音设备口头提问,设备接受指令后筛选音频信息,并将这些搜索结果反馈给用户的过程。声纹识别适用于多主体发声场景,声纹和指纹一样具有独特性。智能语音技术依据这种独特性,将不同发声主体的声音录入系统中,久而久之形成该用户特殊的语音新闻产品消费喜好。除此之外,声纹识别还常用于会议场合。
3.人机交互模式。该模式是综合了以上两种应用场景而形成的一种更具现实意义的应用模式,用户与机器之间类似于人际传播面对面交流的场景。在智能家居领域,家用电器等产品之间物与物的相互连接和运转需要一个调节和控制各物品的媒介,而智能音箱很好地扮演了这一角色。在医疗服务领域,科大讯飞在疫情期间推出“智能语音外呼助手”,协助疫情严重的省份做好人群的筛查与防控工作。
1.新闻采访:策略性、准确性与时效性上的提升。在访前策划会中,运用智能语音中的声纹识别技术可精准地记录下每个人的发言内容,为后期的新闻写作和编辑提供参考,防止新闻采写过程中出现目的不明的问题。在采访过程中,记者提问与受访者的回答都能够实时在智能语音设备中进行语音转写,在解放记者双手的同时还促进了访谈的顺利进行。同时,记者将整个采访过程以录音和文本的形式保存下来,便于记者在后期调查取证中以及消息写作中灵活运用,增强了新闻的可信性和时效性。
2.新闻写作:口语化与通俗化的转变。在智能语音转写技术的帮助下,记者可在云端进行写作。但智能语音技术可能会弱化原有新闻文本间的边界。随着智能语音技术的普及,记者和受访者双方以人际传播的方式进行内容生产,语言成了双方使用的首要媒介,这就使得智能语音技术转写的文本具有口语化和通俗化的特点。同时,新闻业一直存在“抢新闻”的现象,这迫使记者在新闻写作过程中没有太多时间斟酌文本内容。这样生产出来的新闻产品会呈现出一种通俗的口语化倾向,在迎合用户快速阅读需要的同时,也增强了新闻的可读性。
3.新闻编辑:记者与编辑职能一体化。智能语音技术在新闻编辑过程中缓解了记者的工作压力。在智能语音技术的帮助下,记者编辑新闻时可根据不同的音频节点准确找到需要修改的部分。与传统的新闻编辑不同的是记者和编辑的职能分配发生了变化,二者间的边界逐渐消融,出现了记者采访、记者写作、记者发稿的一套完整的新闻生产体系,从罗杰斯的创新扩散理论可以得出,新技术的普及和应用给原有的产业带来变革的同时,也将他们更深层次地融合在一起。智能语音技术的普及和发展进一步提升了人们对新时期“全能记者”的期待。
4.新闻呈现:新闻进入“可听化”时代。与传统纯文本的文字阅读相比,智能语音技术在新闻呈现阶段促成了可听化新闻的出现。早在2006 年就有媒体尝试过“有声新闻”,但是囿于技术原因,其发展不具有普遍性。如今,以智能音箱为代表的接收终端渗透率稳步提升。智能音箱促生了“零用户界面”语音信息接收的实现,用户听觉感官的重要性也进一步得到了提升。
声控智媒以便捷的操作方式、互动式的用户体验、强大的功能设计令消费者获得了全新的体验,同时也悄然催生着新闻传媒业的变革。[1]一方面,智能语音技术在新闻生产中的应用给传统新闻业的转型以及记者素养的提升带来了一线生机;另一方面,其变革的背后也充满了重重挑战。
1.记者:“记”的能力的“延伸”与“截除”。书写文字的发明并非增进记忆与启迪智慧,而是促使遗忘。[2]同理,记者凭借智能语音技术可直接将所说转换成文本,后者也逐渐成为前者开展新闻工作的“亲密搭档”,记者手中的笔却在逐渐消失。记者的“记”有书写、记忆的意思。在新闻实际业务中,一名优秀的记者不仅要能说会道而且要有扎实的文字功底。智能语音技术通过延伸记者部分感官功能(如耳听和手写)来协助记者工作,看似提高了新闻工作效率,减轻了记者的工作量,但实际上也逐渐削弱了记者耳听手写的能力。因此,若记者过分依赖智能语音技术,其立业之根“记”的能力便会逐渐“截除”,从而不利于全面发展。
2.新闻文本:口语化冲击下的文本泛化。记者的采访工作以人际传播的形式展开,口语媒介的使用导致智能语音技术转写的材料呈现出具体事例多、抽象内容少,口语内容多、书面语言少的特点。其次,传统的新闻记者在进行新闻写作时,尤其是在进行通讯写作时,往往对一个词的使用反复推敲。但在智能语音输入技术的支持下,记者与受访者的对话往往是感性大于理性的,加之追求新闻时效性无法进一步完善新闻作品,最后的新闻产品质量与传统的新闻产品相比可能会大打折扣。
以人为本,积极创新,才是新闻工作者面对新兴技术应有的态度。智能语音技术虽然在收音、记录和储存等方面优于人类,但是在个性化、思维能力等方面仍存在不足。因此,记者在智能语音面前要合理确认自身的角色,不能完全依赖智能设备。在采写一般新闻消息时可合理运用智能语音设备,但在采写重要的特殊的新闻时则要积极动用多感官,进一步地锻炼“脚力”、抬升“眼力”、提升“脑力”、拔高“笔力”。人机互助,各取所长。同时,智能语音技术的应用促成新闻文本的泛化,记者在面对这一问题时,既要继承好已有的新闻文本,又要与借助智能语音技术产生的新闻泛化文本结合起来。传统的通讯和评论是两大较复杂的新闻文体,具有很强的独特性。智能语音技术在这方面的能力相对欠缺,但智能语音技术在传播语态的通俗化和口语化方面具有天然优势。记者应在继承既有文本的基础上,对技术生成的新内容进行综合运用,给新闻文本注入新的活力,不断满足用户在新的媒介环境下的信息消费需求。在智能语音等人工智能技术的助力下,未来新闻生产领域的分工边界将逐渐消失,而记者的身影将会出现在新闻生产流程的各个阶段,这也促成了新媒体时代“全能记者”的诞生。