语音重翻录对录音资料真实性鉴定产生影响研究

2022-12-28 05:28陈拥军王云峰
网络安全技术与应用 2022年6期
关键词:音节真实性频谱

◆陈拥军 王云峰

(1.甘肃政法大学刑事司法学院 甘肃 730070;2.甘肃政法大学人工智能学院 甘肃 730070)

重翻录技术作为录音资料众多篡改手段之一,不仅可以掩盖篡改痕迹,使得篡改语音自然流畅,还可以伪造录制场景,转移办案人员视线。在声纹识别应用领域,重翻录语音的识别错误率逐年增加。因此对于重翻录语音的识别与检测已成为声像资料鉴定的一大难题。

Villalba J等人[1]提出重翻录操作会改变原始语音信号的频谱和调制指数,可以利用判别分类器鉴别原始语音和重翻录语音。罗达[2]等人提出重翻录操作会导致原始语音和重翻录语音的信噪比产生差异。Chettri等人[3]利用实验证明原始语音前几帧的能量比剩余帧的能量低,而重翻录语音所有帧之间的能量并没有太大差距,呈均匀分布。上述方法均是在对比了原始语音和重翻录语音某些特征差异之后所得,所以很难在没有对比样本材料的情况下甄别出重翻录语音,在录音资料真实性鉴定中无法广泛应用。

重翻录操作必然会为不法分子利用,从而影响声像资料的真实性鉴定,尤其是录音资料鉴定领域。本文从传统的听觉辨识、频谱检验和数据分析检验三个方面,分析重翻录语音检测难的原因及其对录音资料真实性鉴定产生的影响。

1 录音真实性鉴定依据

录音真实性鉴定也称录音完整性检验,是指分析检验录音资料,对该录音是否存在剪辑和伪造行为进行鉴定的一种技术手段。录音资料主要有删除、插入、替换和拼接四种常见的剪辑方式,近年来随着科学技术的发展,又出现了利用重翻录技术篡改录音资料的新技术。目前录音资料真实性鉴定主要从以下三个主要方面进行检验。

1.1 听觉辨识

听觉辨识又称听觉检验,在没有失真、升沉和掩蔽等特殊情况外,人耳就是最好的辨音“仪器”,运用人耳进行听觉分析检验主要从以下几个方面进行:

(1)检验录音资料语义的逻辑性和连贯性,原始录音资料中的语音在语义上应该具有连贯性和逻辑性,而经过剪辑后的语音在剪辑位置上往往会出现语音前后语义逻辑不通,出现“前言不搭后语”的情况,这就为录音资料真实性鉴定提供了突破口。

(2)对话录音的连续性和同一性,原始录音资料中话者的嗓音音质是一致的,语句间相邻音节的过渡与衔接是自然的,而剪辑处理后的对话语音中话者嗓音音质存在差异,需要通过频谱分析进一步检验。

(3)话者语音的相似度,在正常的谈话录音资料中,会不可避免地出现同一人多次重复某些音节的情况,这和某个人的说话习惯有关。这些重复的音节之间应该都存在着一定程度的差异。如果待检录音资料中某一个人的重复音节之间几乎无差异,则极有可能存在剪辑处理的可能。

(4)录音资料中是否出现脉冲信号,录音资料中如果出现了轻微的音强突变情况或者“咔”声,这有可能是录音器材受到撞击产生或是外界的其他瞬态噪声所形成,当然也不排除是剪辑行为产生的,需要通过频谱进一步分析。

(5)背景噪声的连贯性和一致性,正常的录音资料会不可避免产生背景噪声。如果录音资料未经过剪辑处理,音频文件中的背景噪声应当是连贯的和一致的,剪辑处理行为有可能使语音内容处理的相对连贯,但很难使背景噪声一起连贯。但是背景音一致连贯并不代表该录音资料没有经过剪辑,因为剪辑处理后可以通过重翻录技术添加连续、一致的背景音加以掩盖。

1.2 频谱检验

在录音资料被实施剪辑处理以后,会不可避免地留下篡改痕迹,通过频谱分析可以寻找并分析这些痕迹,就可以对该录音资料的真实性做出鉴别和判断。频谱分析的主要内容有:

(1)本底噪声的检测,由于录音器材本身或线路和信号传输的原因,在输入无声信号时会产生噪声,称之为本底噪声。如果对不同的原始语音进行剪辑处理时,因为本底噪声的不同,必然会在剪辑处形成噪声频谱的间断情况。在本底噪声呈现出明显的周期性,即使在无语段进行剪辑,本底噪声谱线的等距离性也会受到破坏。

(2)观察语音强度的变化,原始的语音中除了塞音和塞擦音的起始位置以外,语音强度均呈现出渐变性。如果一段录音资料中出现声门脉冲谱线强度发生变化、擦音强度发生变化或爆破噪声强度发生变化等反常的语音强度变化情况,一般均为剪辑痕迹。

(3)观察音节间的过渡段形态是否一致,当一段录音资料的某个关键音节被删除后,如果剪辑点后面紧跟的音节与被剪掉的音节不是同声母音节,剪辑后形成的过渡段与待检话者存在于录音资料中其他部分的与被删掉相同的过渡段,在频谱的形态上会出现差异。

(4)观察音节的完整性,在实施剪辑行为时,剪辑点并不能很准确的确定,这就会导致删除不干净的情况,也就是在剪辑点会遗漏下小的音段,进而导致音节频谱图不完整的情况出现。

(5)观察频谱上出现的脉冲信号,使用模拟器材剪辑录音资料时,按键的操作会在频谱图上出现竖条状的脉冲信号谱线。如果利用语音分析软件进行剪辑语音资料,就可以对着语图进行剪辑,该操作可以在很大程度上提高剪辑点的精准度,避免出现音段遗漏的情况。但如果剪辑点处在有声段中,则在频谱图上会出现竖状隔断式的脉冲信号。要注意,并不是所有类似的脉冲信号都是剪辑形成的[4]。

(6)观察录音音频的水印间隔,这类鉴别方法常用于手机通话录制音频资料的真实性检验。许多手机厂家均会在芯片中装一个利用软件控制的哔哔声发生器,为了在录音通话时发出“哔哔声”来提醒用户对方正在录音,这种发出的“哔”声被称作“音频水印”。任意两相邻水印的时间间隔是固定的,如果发现手机录音音频中的音频水印间隔时长与设备固有间隔时长不一致的情况,则认为该音频存在剪辑处理。

(7)对比检验相同对话语音频谱,即使同一个人重复说出相同的音节或句子,其语音频谱只会出现相似情况,不可能出现完全相同的情况。如果发现存在声纹相似度高度吻合的情况,则可推定在剪辑过程中出现了重复使用某音节或句子的情况,由此可直接做出存在剪辑的结论。

(8)观察录音中信号丢失的情况,剪辑行为会导致录音资料出现信号丢失的情况,在正常录音资料中也会出现因为信号丢失导致频谱瞬时或短时能量空白,所以在发现存在信号丢失情况时,需要进行模拟实验来确定形成的原因。

1.3 数据分析检验

对于录音资料真实性鉴定数据分析检验的方法多种多样,常见的有以下两种:

(1)检验分析文件属性,利用文件属性分析软件,对于录音资料的文件属性信息进行检验,以此来判断录音资料文件是否存在篡改痕迹。检验的主要内容包括文件名称、文件格式、采样率、文件大小、持续时长、声道参数、创建时间、修改时间、待检录音文件与此设备中其他录音文件之间的文件属性差异等。

(2)检验子带平滑度,在实施音频剪辑过程中,经常会改变音频信号的采样率,特别是在两个或两个以上不同音频序列中进行拼接等操作时。提高采样率需要针对原信号进行插值处理,若进行线性差值,插值信号就会出现可供检测的痕迹。通过人耳很难分辨音频信号的插值处理,利用信号波形亦难区分。但是当音频信号被实施插值处理以后,插值信号与原始信号相比,不同频段的频谱分布将有明显差异,这是由信号插值原理决定的,不可避免。因此可以对音频信号做子带平滑度检测,提取子带的频谱特征进行录音资料的真实性检验[5]。

2 语音重翻录技术

语音重翻录是将已有的音频文件在播放的过程中利用录音设备重新进行录制,从而获得新的录音文件的技术。重翻录过程中会不可避免地留下与外界环境和重翻录设备相关的某些痕迹,但是语义并不会发生改变。同时语音重翻录技术会改变原始录音资料的文件名称、录制时间、文件格式、文件大小、持续时长、采样率、声道参数、录制地点、录制设备信息等。如果重翻录语音被用作非法目的,必然导致不良结果的发生。例如非法分子通过利用重翻录语音获得声纹识别系统的访问权限,系统内其他用户的个人信息安全将遭受威胁;语音重翻录技术还可以将某人的语音在特定环境中进行录制,通过创造特定的背景噪声伪造录制环境,这些录音如果作为法庭证据,可能影响司法审判的公正性,这些重翻录操作会带来严重危害[6]。

由于语音重翻录技术得到的是利用录音设备录制的“真实录音”,它可以轻易绕过现有的音频资料真实性检测算法。语音重翻录的检测是录音资料真实性鉴定的一大难题,主要因为以下原因:

2.1 重翻录音频很难通过听觉辨识

从一定意义上来说,重翻录音频是通过特定录音设备录制的“真实录音”,很难辨别出是真人发声还是扬声器发声。和其他篡改音频的方式相比,重翻录音频的背景噪声更加自然,而且可以人为添加背景噪声,使得背景噪声更加具有连贯性和一致性,营造虚假语音场景。同时拼接的音频经过重翻录操作,重翻录的平滑效果使目标人物的声音听起来更加自然真实。因此,对于重翻录录音资料的听觉检测,只能借助于分析语义的逻辑性、对话的连续性和话者前后语音的相似度来进行,鉴别出存在删除、增添、拼接等操作的重翻录语音。

2.2 重翻录操作彻底改变原始音频文件属性

检验分析录音资料的文件属性是鉴别语音真实性最重要的数据分析检验方法之一,通过检验对比录音资料与声称录音设备中其他文件在文件名称、格式、文件大小、持续时间、码率、声道、采样率、帧率、流大小等文件属性参数之间的异同可以分析鉴别出待检录音资料是否为所声称的录音设备录制形成。但是对于重翻录语音来说,其所有文件属性的参数必然与录制设备内其他音频文件的属性参数具有一致性,因为它们均为同一录音设备所录制,所以文件属性检验法对于重翻录语音没有了用武之地。

2.3 重翻录技术可以对拼接的音频文件起到平滑效果

对于经过复制、删减、增添、拼接等篡改操作之后的录音资料,会在该语音文件上不可避免地留下一定的篡改痕迹,这些痕迹可以为鉴别录音资料真实性提供依据。但是篡改的音频再通过重翻录操作之后,原来的篡改痕迹就会消失,因为重翻录操作可以对篡改音频进行平滑处理,进而掩盖篡改留下的痕迹。

录音资料的剪辑操作过程中,为了更好拼接,通常会改变音频信号的采样率,导致插值信号和原始信号在不同频段的频谱分布上产生明显差异,可以通过子带平滑度检测来鉴别录音资料有无篡改痕迹。但是重翻录操作不仅不需要改变原始音频的采样率,而且经过特定录音设备重翻录以后会以一致的采样率输出,因此重翻录语音无法通过子带平滑度检测来鉴别。

3 语音重翻录对录音资料真实性鉴定的影响

录音资料的真实性鉴定是声纹鉴定中的重要和必要环节,只有真实有效且未经篡改的录音材料才能作为法定证据在诉讼中发挥证明作用。目前来说录音资料的增添、删除、重新编排、声音模仿、语音合成等篡改技术手段都可以被甄别揭穿,但是语音重翻录技术的检测仍然面临着巨大的问题。

由于语音重翻录可以在很大程度上隐藏篡改痕迹,或改变原始语音的录制场景和文件属性信息,但是语义可以不发生改变。如果重翻录语音被用作非法目的,必然导致不良结果的发生。例如非法分子通过利用重翻录语音获得声纹识别系统的访问权限,系统内其他用户的个人信息安全将遭受威胁;对于拼接形成的音频文件,通过重翻录技术可以起到很好的平滑效果,并以此进行电话诈骗等一系列违法犯罪活动;除此之外语音重翻录技术还可以将某人的语音在特定环境中进行录制,通过创造特定的背景噪声伪造录制环境,这些录音如果作为法庭证据,可能影响司法审判的公正性。这些重翻录操作给人们的生活带来的严重的危害,同时也给录音资料真实性鉴定带来了严重的挑战[7]。

录音资料真实性鉴定是司法鉴定领域的一大难题。对于录音资料来说,首要的一项检验就是参数检验,录音资料是由某一特定的录音设备所录制的,所以录音资料的所有参数特征必须与该设备具有一致性。现有“频谱检验”、“波形图检验”、“arm编码检验”等众多检验方法,针对不同的篡改方式进行鉴别。在录音资料真实性检验中,重翻录录音资料的检验难度最高、程序最复杂。重翻录操作不仅能伪造语音场景,还能精准攻击基于语音识别的安保设施。现针对录音资料重翻录检测的研究很有必要,虽然已有些许成果不断涌现,但其普适性不强,在实践中的准确率还需进一步验证,需要在大量的实战发现问题并优化。

4 结束语

本文在介绍了听觉辨识、频谱检验和数据分析检验三个录音资料真实性鉴定的主要科学依据,对比了普通篡改录音与重翻录语音之间区别的基础上,分析检测重翻录语音存在重大困难的原因。从物质的转移与交换理论角度来说,即使是高质量的录音机,在重翻录过程中,一定会对语音产生一定影响,重翻录语音与原始录音一定存在着某些特征上的差别,这要求我们在未来的研究中,通过更多的、更深入的研究学习与数字音频相关知识,为录音资料真实性鉴定提供更便捷、更科学的技术方法。

在声纹鉴定实践中,首先要做的就是录音资料真实性鉴定,我们要特别注意审查待检语音,综合全面考虑影响录音资料真实性的每一个因素,在确保待检语音真实、完整、充分的基础上才能进行下一步鉴定。从这一意义上来说,录音资料真实性鉴定的问题关系到声纹鉴定的科学性与权威性,以及所得出的鉴定意见能否被采信等问题。

猜你喜欢
音节真实性频谱
电机在60Hz运行过程中的故障频谱分析
论三维动画特效数字模拟真实性与艺术性的结合
r(re)音节单词的拼读规则
全媒体时代关于新闻真实性的思考
拼拼 读读 写写
新闻报道坚持新闻真实性原则的重要性
FCC启动 首次高频段5G频谱拍卖
看音节说句子
动态频谱共享简述
认知无线电中一种新的频谱接入方法