有声书产业的发展困境和破局

2020-03-10 08:53冯白
出版广角 2020年24期
关键词:声纹音频语音

【摘要】近年来,人们逐渐养成了有声阅读习惯,且越来越多的用户开始愿意为优质内容付费,爆发式增长的市场需求给有声书出版带来了巨大的机遇。然而,在市场红利的背后,有声书出版也面临着诸多困境,如盗版盛行、盈利模式单一、内容匮乏、生产效率低、生产成本高等问题,有声书出版如何破局成为业内人士关注的焦点。

【关  键  词】有声书;音频版权;人工智能;场景化阅读

【作者单位】冯白,南京大学商学院。

【中图分类号】G230.7 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2020.24.010

艾媒网数据统计,2016年我国有声阅读市场的用户仅有2.18亿人,而截至2019年用户数量已高达4.78亿人,有专家预测,2020年我国有声阅读市场的用户将超过5.62亿人。有声市场的快速扩张主要源于两个方面:一是用户规模快速增长,二是用户使用有声应用的频率和时长有所增加。例如,喜马拉雅在2013年上线之初,活跃用户每天的平均使用时长仅30-40分钟,而截至2020年9月,活跃用户每天平均使用时间增长至170分钟。在移动互联网高速发展的今天,各种移动应用瓜分着用户的时间,而在激烈的市场竞争中,有声读物获得了更多的用户以及更高的使用时长,这意味着有声市场的需求量和市场规模正逐步扩大。2019年,我国有声阅读市场规模达到63.6亿元,比2018年增加了17.3亿元,增幅高达37%。2020年,有声阅读市场规模预计达到82.1亿元。

有声阅读市场的扩大给有声书出版带来了极大的机遇。一方面,出版社开始纷纷入驻有声书市场。如接力出版社在原有纸质图书的基础上推出500余种有声书,用户覆盖白领、大学生、少年儿童等群体;中国出版集团整合旗下人民文学出版社的丰富资源,仅在喜马拉雅推出的有声书就超过300种。另一方面,有声书单品也获得了多数用户的喜爱,如《平凡的世界》在喜马拉雅平台上的播放量超过1.8亿次。

一、有声书快速发展下的困境

智能终端的普及、移动互联网的高速发展给有声书出版提供了广阔的发展空间,但用户需求量的激增与行业内的竞争所带来的内容劣质及盗版盛行、生产效率低且生产成本高、听书场景单一等问题始终困扰着出版机构。

1.劣质内容及盗版问题

有声阅读平台最大的特点是具有开放性,其主要内容来源于用户生产,也就是UGC模式。UGC模式下,用户的水平参差不齐,制作的内容也良莠不一。一些用户为获取粉丝流量随意侵权修改内容,甚至制作违规内容。随着有声阅读用户规模不断增大,平台的UGC内容也呈爆发式增长,平台工作人员的审核精力不足,加剧了劣质内容的盛行。在版权保护上,虽然越来越多的出版机构和作者纷纷开始关注有声书版权以及图书的有声化授权,但有声市场仍缺乏系统的法律保障。因此,在版权保护方面,除了要重视对原作者的版权保护,也要重视有声读物本身的版权。有声书在制作过程中融入了大量的创造性思维,是智力劳动的结果,然而我国对有声书的二次上传、盗录、修改等问题的发现和处理机制尚未完善,参差不齐的内容、猖獗的盗版现象是制约有声书市场良性发展的重要因素。

2.生产效率低且生产成本高

近年来,有声市场的需求量逐年攀升,不仅用户规模有了较高的增长,用户的平均使用时长也有了提升,这意味着市场需要更多的优质内容来满足用户需求。尤其在新冠肺炎疫情期间,各有声阅读平台发起免费阅读的举措使用户量激增,有声书的制作方要在短时间内做出快速响应。然而,有声书在制作工序、人力投入以及开发周期上比其他音频内容更为复杂,需要耗费的时间及费用成本更高。有声书在开始录制前需要获得授权,而其他有声内容则不一定需要经过授权程序。在制作内容的过程中,如果是人工录播,还需要有声书的编辑筛选主播,录播后期还要对作品内容进行配乐、剪辑、校对,需要消耗大量的时间、物力和人力。与高额的制作费相比,用户为有声书付费的意愿不高,用户的付费习惯也需要长时间养成。因此,有声书想要破局,降低制作成本是一项重要举措。

3.音频传播载体的局限

传统的纸质阅读将读者限制在特定的场景中,而随着移动互联网的发展,碎片化的时间与快节奏的生活使人们阅读的场景变得更为多样。有实验证实,人类在获取信息时,83%来自视觉,11%来自听觉,其余则来自嗅觉、味觉和触觉。因此,当无法通过视觉获取信息时,听觉就成了人们的第二选择,这也是有声市场能够生存壮大的原因之一。早在20世纪60年代,人们就开始通过收音机收听广播电台,这是有声阅读最初的形式,这一形式受到阅读场所、阅读时间的限制。而在移动互联网时代,人们可以在更多的场景下进行阅读,但大部分的阅读都是以手机终端为主要载体,不能满足不同群体的需求。现阶段的有声阅读载体较为单一,这也导致了有声书只能在一定的群体和范围中推广,而有声书的陪伴性特点也较难得到深入发展。

二、有声书出版的破局之路

随着5G商用的普及,大数据、移动互联网、人工智能以及智能终端设备将迎来高速发展期。在新一代信息技术快速发展的背景下,有声书行业只有找到与新兴技术的契合点并充分融合发展才能走出困局,激发出更大的市场潜力。

1.技术革新推动有声书市场规范

第一,解决有声书的版权保护问题是有声书市场良性发展的第一要务。2020年以来,声纹识别技术快速发展,众多领域在使用声纹识别技术,如门禁系统、用戶认证、刑侦工作等。声纹识别的原理即语音同一认定,主要依据个人语音特征的稳定性、个人语音的总体差异性、语音反应性等进行系统运作。不同的人说话发音的习惯、语音的音调和音色各不相同,结合这些特性可以建立有声书制作者的声纹数据库。基于声纹数据库,可尝试结合数字水印技术,将经过智能分析提取的制作者的声音特性作为音频水印,在制作有声书的过程中,将音频水印嵌入作品中,即可为作品录入隐形的声音版权标记。此外,声纹数据库还能够用来比对和认证音频内容。早在2018年,科大讯飞的声纹识别技术就能够实现将说话者的声纹信息与声纹库中已有的用户声纹进行对比验证。将声纹技术深度应用到有声书的版权保护中,可以有效识别并检验二次上传、音频盗录、恶意篡改、恶意剪辑等侵权行为,帮助有声书制作者维护自身权益,从而保证有声书市场的良性发展。

第二,劣质内容泛滥的现象不容忽视,利用语音鉴别技术提升语音内容的筛选是突破有声书内容审核困难的有效途径。语音内容的审核过滤系统主要利用语音转写技术,即将长段的音频数据转化成文本数据,再结合自然语言处理技术将音频审核文字化,该系统能够将审核效率提升90%以上。当前,音频审核技术广泛应用于直播平台、视频网站等平台的音频审核工作中。如一下科技旗下的秒拍、一直播等APP,通过百度人工智能提供的技术,从文字、画面以及音频多个方面对内容进行多方面审核,把原本需要120秒才能完成的审核缩短至24秒,且内容审核准确率高达96%,人力成本降低了50%以上。有声阅读平台也可以充分利用音频过滤系统进行高效审核。首先,根据审核的标准建立违规词、敏感词等内容数据库;其次,通过结合语音转写技术把音频内容转化为文本内容;最后,通过语义识别、关键词识别等技术对文本内容进行判断和分析,并与数据库进行匹配,即可及时发现含有不合规内容的有声读物。相比于人工审核,依托智能语音的审核技术不仅速度快,还可以不间断工作,审核效率更高。

2.人工智能技术提升有声书制作效率及多样性

第一,利用声音复刻技术可降低有声书的制作成本,使有声书产品更加多样化。为提高用户的付费意愿,有声书的制作要以用户青睐的故事性强、娱乐性强的作品为主。但一味地满足用户阅读需求也会导致有声书产品的单一性。虽然目前语音合成技术在情绪表达以及情感认知上还不够成熟,但是对于专业图书、教材教辅等这类对情绪表达要求不高、配音枯燥且多重复性内容的图书,可以利用人工智能技术进行配音。如微软旗下的朗文小英就结合了语音识别与语音合成技术,为用户提供教材的朗读和教学服务。此外,通过扩大语音库、丰富语音类型,能够弥补人工智能制作的有声书的不足。如当前语音合成技术支持多种外语及地方特色方言,一本有声书可复制成不同版本,不仅增添了内容的趣味性,还可以更好地满足用户的个性化需求。

第二,利用人工智能技术进行内容分析,精准匹配音频,提升有声书的制作效率。一方面,通过语音识别技术把有声书的音频内容转化为文字,形成相应的内容数据库,并标记关键词、高频词等,每段音频设置独立标签。在后期对有声书进行制作和修改时,便可通过检索标签、关键词等快速找到相关片段,极大地提升了后期制作的效率。另一方面,利用人工智能深度学习技术训练机器,辅助有声书的制作,有效降低有声书的制作成本,提升有声书的质量。首先,结合大数据对有声书的用户流量、反馈评论、销量等进行分析;其次,将数据交给人工智能进行学习理解,建立有声书的特征、音频特征、用户的反馈的联系,继而搭建有声书模型。新技术的发展可以提升有声书优质内容的生产效率,降低有声书的制作成本。

3.用户精准画像,深挖场景化阅读需求

随着5G商业化的广泛应用、移动互联网技术及智能终端的快速发展,有声阅读的场景开始逐渐跳出单一的APP载体,向多元化的阅读场景发展。如以iReader、Kindle为代表的电子阅读器,以科大讯飞机器人为代表的互动性、陪伴性极强的绘本阅读器等,满足了更多阅读场景的需求。智能硬件设备及智能终端产品的普及,极大地提升了有声书给用户带来的交互式陪伴体验,由于智能音箱具有语音入口优势,用户只需通过语音便能随时检索、播放有声书。此外,在5G技术赋能下,AR/VR的沉浸式阅读可以更好地融入人们的日常生活学习中。不同的载体可以满足用户对不同场景的需求,这些新的需求也将成为有声书行业发展的新机遇。

不同的用户属性要求内容的开发制作要更加精准地满足用户的需求。首先,分析不同平台、不同用户对不同场景的需求;其次,结合自身优势进行选品制作;最后,选择适宜的方式表现内容,如主播讲解图书、制作纯有声书、将原有图书制作成知识付费课程等。只有把握用户在不同场景下的需求,才能给用户提供优质体验。如湛庐文化打造的湛庐阅读APP,主要围绕湛庐系列图书为用户提供精读和通读服务,并且有针对性地服务30-45岁的用户,内容强调实用性而非娱乐性。清晰的用户画像明确了湛庐文化有声书的打造方向,使其牢牢抓住了流量市场。

5G时代,技术的加持给有声书行业带来了巨大的发展机遇。通过与新技术结合有利于实现有声书的版权保护,提升有声书制作的效率及质量,降低有声书的制作成本,促进有声书市场的发展。而依托人工智能技术、大数据技术挖掘用戶的场景化阅读也将成为有声书出版的发展方向。

|参考文献|

[1]康宁. 有声阅读发展趋势与中小型出版社应对策略[J]. 传媒论坛,2019(12):156-157.

[2]陈栋. 数字有声出版行业的发展瓶颈与破局[J]. 出版广角,2017(11):23-25.

[3]刘一鸣,高玥. 人工智能语音在有声读物中的应用研究[J]. 出版发行研究,2019(11):35-39.

[4]熊宏蕾. 网络环境下有声读物版权利益平衡探讨[J]. 出版参考,2019(2):64-66.

猜你喜欢
声纹音频语音
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
对方正在输入……
基于Daubechies(dbN)的飞行器音频特征提取
音频分析仪中低失真音频信号的发生方法
Pro Tools音频剪辑及修正
基于数字水印的人脸与声纹融合识别算法
声纹的妙用