■林爱珺 马瑞萍
2020年5月28日,十三届全国人大三次会议正式审议通过《中华人民共和国民法典》(以下简称民法典),首次明确对自然人声音的保护。在法律上明确对声音权益进行保护,是民法典人格权编的一大亮点,对进一步保障个人尊严和个人自由,规范合理使用声音权人的财产利益和精神利益、解决由智能语音技术引发的声音侵权问题具有重大意义。
“声音”是指通过介质传播并能被人或动物听觉器官所感知的波动现象。声音权是自然人享有的自由支配其声音,并以此实现其声音利益的一种权利。随着科技的发展,声音的应用范围越来越广。
首先,声音具有专属性。自然人的声音无法脱离自然人的肺、声带、喉头、口腔、鼻腔等身体器官而产生,声音无法离开自然人的身体而单独存在,所以声音权的权利主体只能为自然人而不能为法人。此外,自然人对自己的声音进行使用、录制、处分及获取收益,不受任何人的干涉或阻碍,并且任何个人和组织,如果未经自然人同意,不能擅自使用其声音。
其次,声音具有精神利益。人格权最主要体现的是精神利益,这是人格权最本质的属性。①声音权是一种具体的人格权,所以精神利益是声音权的基本利益。自然人的声音关系到个人的尊严,即“声音利益”当中包含“人格尊严价值”。每个人的声纹都是独一无二的,每个人的音调、音色和响度等声音的物理特性都各不相同,声音的物理特征是与生俱来的,后天的训练也无法改变,所以人的声音具有人格标识的重要作用,可用于识别自然人身份。
同时,声音又具有财产属性。声音的财产属性是其精神利益与特定物质载体相结合而派生出来的,是一种附属性利益。在市场经济条件下,声音相关产品多元化,语音产业不断发展壮大,声音的财产属性越来越凸显,尤其是名人的声音拥有更高的商业价值。自然人可以通过法律所许可的方式,如签订声音许可使用合同,允许他人使用、录制或合成自己的声音,从而获得经济报酬。
在传统媒体时代,互联网还不发达,声音主要是通过电视、磁带、光盘等媒介传播,侵犯声音权的具体行为主要包括歪曲、偷录、剪接、模仿、公开和失真处理不当。②由于传统媒体传播速度慢、传播范围狭窄,所以侵犯声音权的损害后果不是特别明显。随着人工智能技术、大数据技术和互联网技术的发展,声音利用范围越来越广,传播速度越来越快,传播成本越来越低,使得声音侵权案件频发。
智能语音技术主要包括自然语言理解技术、语音识别技术和语音合成技术等技术方向。AI语音合成等相关技术,在过去几年间迎来了不断发展壮大、提升应用规模的过程。语音合成技术只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。如阿里巴巴发布的新一代语音合成技术KAN-TTS,将合成语音与原始音频录音的接近程度由85%到90%之间提高到97%以上,制作周期压缩3倍以上,并将语音合成定制成本降低10 倍以上。这意味着AI 语音合成技术基本不再存在任何的用户门槛,很多免费的语音合成软件使得用户不用学习复杂的技术,不用浪费大量的时间和金钱,就能以非常简单的方式定制语音,这将降低犯罪的成本,增加了自然人声音权益被侵犯的风险。此外,AI语音合成技术合成的语音亲切、自然、饱含情感,达到了以假乱真的地步,使得一些不法分子有机可乘。AI 语音合成技术不仅能合成声音音调、音色等物理特性,还能合成语音蕴含的情感。这些惟妙惟肖的合成语音一旦被不法分子利用,转发给朋友、家人、同事等熟人,后果将不堪设想。
语音识别和语音合成等技术会侵犯声音权的精神利益和财产利益。每个人的声纹都是唯一的,所以每个人的声纹密码也是独一无二的。如果AI 语音合成技术合成了与样本语音相同的语音,那么它就可以破译用户在银行卡、房卡和应用App等设备上设置的声纹密码,给大家的人身安全和财产安全构成威胁。此外,一些不法分子通过合成用户的声音给用户的家人、朋友、同事等打电话借钱,或者使用合成的声音打电话给银行贷款,由此导致了很多财产诈骗案件的发生。据《每日邮报》2019 年9 月6日报道,一名诈骗犯利用AI 语音合成软件冒充德国公司老板,给一家英国能源公司的CEO打电话,成功让该CEO转账22万欧元到该诈骗犯指定的银行账户。
信息时代,声音已经不仅仅是一个单纯的交流工具,更是一种商品化的人格标识。过去人们更注重身体权、健康权等物理性人格利益,当前在市场经济条件下,人格权商业化利用的现象十分普遍,特别是名人的肖像、声音等人格要素,具有较大的商业价值,使得大众对于人格权的商业化利用越来越重视。民法典规定的“未经肖像权人同意,肖像作品权利人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像”,实际上也是对声音权商业开发的保护和规范。
我国合成语音产业已经比较成熟,在某电商平台上,输入“语音包”关键词,十几件相关商品就会跳出来,售价从10 元到99 元不等。据商家介绍,他们可以提供上千条女声的微信语音信息,内容涵盖问好、道歉、自我介绍,甚至索要红包等多个方面。如果想要其他语音内容,还可以按照2 元每条的价格进行私人定制。此外一些卖家还可以提供真人语音变声服务,把自己的声音变成你想要的声音。
随着人工智能技术的发展,智能语音已经成功落地于影视娱乐、汽车导航、销售、客服、教育、游戏等领域,饭圈和家庭是智能语音应用的两个主要商业场景。家人的声音代表着陪伴、温暖和回忆等社会意义,智能音箱、学习机等智能语音产品将家人的声音合成为系统音,和孩子们聊天和讲故事。
相对于普通人而言,名人声音的商业价值更大,其声音要素也更容易被他人盗用和滥用,产生了各类声音侵权纠纷。例如,一些不法分子利用AI 语音合成技术合成与明星高度相似的语音,擅自使用合成的名人语音进行广告宣传或者电话销售活动;一些不法分子擅自将合成的歌手的声音用于商业表演,从而获得商业演出和演唱会的收益;还有一些不法分子通过恶意剪辑和歪曲的方式将合成的名人声音剪辑进色情、暴力和种族歧视等音频中,从而故意丑化、污损明星的声音和名誉。
民法典规定“声音权”,将肖像权和声音权结合起来保护,首次在法律上明确了对声音利益的保护,相比以往法律对声音利益保护的空白,这是对自然人声音利益保护的巨大进步,及时将新型人格权在人格权法上加以确立,弥补了法律保护的漏洞,扩展了人格权的保护范围,完善了我国人格权法体系。
但是,某种程度上,“声音”和“姓名”“肖像”是并列的人格标志。笔者认为,单独创设“声音权”有一定的合理性。由于声音权与肖像权保护的客体和内容各不相同,法律工作者在司法实践中可能会存在摩擦和疑问。人格权具有法定性和开放性。③法定性是指人格权的具体类型、权利和内容,需要在法律上加以确定。开放性是指人格权法是一个不断发展变化的体系。随着人工智能、大数据等技术的发展,声音的利用方式越来越多元,声音与人格自由、人格尊严紧密联系在一起,以独立的具体人格权的形式对声音权进行立法,将声音权与肖像权、姓名权和身体权等其他具体人格权在法律上并列,民法典未来仍有待改善。
总之,民法典在法律上明确对声音权益的保护,体现了人文关怀的精神,解决了由智能语音技术引起的声音侵权新问题,聚焦了老百姓深切关注的热点难点问题,保障了人民群众的声音利益,回应了新时代人民群众对美好生活的需求,彰显了以人为本、立法为民的理念。随着技术的发展,信息环境已经发生了翻天覆地的变化,法律只有迅速反应才能跟上社会发展的步伐。
注释:
①李雪:《论声音权的民法保护》,湖南师范大学2014年硕士学位论文。
②梁震:《探寻对声音利益的民法保护途径》,《法制与社会》2017年第1期。
③王利明:《论人格权的法定性与开放性》,《经贸法律评论》2018年第1期。