摘要:声纹识别技术的应用有一些特殊优势,语音获取自然,声纹提取便捷,识别成本低廉,适合远程身份确认等。同时,其技术应用也面临困境,存在着环境复杂性与识别精确性的矛盾、海量的识别任务与有限的识别能力的矛盾、便捷性与安全性的矛盾。声纹识别技术的发展应与高新技术高度融合,着力提升识别准确率;同公安实践紧密结合,发挥声纹识别技术的优势;和智慧城市建设同步发展,广泛拓展应用领域;注重防范风险,确保系统安全稳定。
关键词:声纹;声纹识别;发展前景
1 声纹识别技术的发展及特点
众所周知,每个人发声都是身体几大器官多重配合的结果,通过鼻腔、口舌、声道、胸肺最终形成看不见的声波和听得见的声音。声纹是指借助科学仪器描绘出来的说话人的声音的图像,即人的声音的频谱图。声纹具有人的个性特征,与指纹类似。声纹识别技术,是一项通过语音信号提取代表说话人身份的相关特征,进而识别出说话人身份的技术[1]。
1.1 声纹识别技术的早期应用
随着科学技术的发展,科学家们在20世纪30年代开始了说话人的识别研究。1945年,这项研究取得了突破性的进展,贝尔实验室的科学家经过多次科学实验,完成语谱图匹配,提出了“声纹”的概念。1966年,美国法院采用“声纹”取证,声纹技术开始走上了司法实践舞台。这种技术开发之初,主要秘密应用于军事情报领域,后来逐渐被司法以及金融等领域采用。
1.2 我国声纹识别技术的发展
我国声纹识别技术首先是从公安、司法系统开始研究与应用。从20世纪80年代末起步的我国声纹鉴定技术的研究,至今已经取得显著成就。多种声纹智能鉴定系统,在许多案件的侦查中发挥了重大作用,其功能被人们逐渐认识。在说话人辨认领域的应用有:刑侦破案、罪犯跟踪、个性化应用等等;在说话人确认领域的应用有:银行交易、证券交易、公安取证、身份证、信用卡的认证等。
1.3 声纹识别技术特点
以指纹、人脸、虹膜、语音等生理特征为识别对象的生物识别技术快速发展,在众多领域获得了应用。例如,苹果手机运用指纹识别替代密钥,一些单位的门禁系统也应用了人脸和指纹相结合的认证技术。这是因为指纹、人脸、虹膜、语音等人体生理特征具有稳定性、相对唯一性的特点,识别率较高,备受用户喜爱。美国圣何塞州立大学国家生物特性测评中心的专家曾对各种生物特征进行了比较,总结出这些同样识别准确率高的生物特征在现阶段因为技术等各种原因,在易用性和应用成本上存在较大差异。如技术成熟的指纹识别因为样本采集困难,应用成本增加;虹膜、人脸识别因其技术原因易用性不强;与其他生物特征相比,声纹识别的应用有一些特殊优势:语音获取自然,声纹提取便捷,识别成本低廉,适合远程身份确认,声纹辨认和确认的算法复杂度低,与说话语言、方言无关,适应人群范围很广等。这些特点是其他生物特征识别技术难以比拟的。
2 声纹识别技术面临的挑战
声纹识别的过程是通过录音设备把声音信号转换成电信号,再用信号处理算法提取以上特征,然后使用机器学习算法来识别说话人的身份。目前,声纹识别技术在公安系统应用广泛,成绩显著。但是,在商业领域却进展缓慢,社会效益和经济效益并不令人满意,声纹识别技术面临着许多挑战。
2.1 声纹识别技术的两个关键问题
声纹识别技术应用,需要解决两个关键问题:即特征提取和模式识别。
在特征提取方面,声纹识别技术与语音识别不同,声纹识别的特征必须是“个性化”特征。而这种“个性化”的根本要求在于提取对象人语音信号的基本特征,以便有效地区分不同的说话人。目前的声纹识别系统主要依靠声学特征进行识别。
在模式识别方面,声纹识别技术要求选择适合的识别方法。声纹识别常用方法可以分为模板匹配法、概率模型法、人工神经网络法等。近年来,许多专家提出了以高斯混合模型和通用背景模型为基础的声纹识别建模方法[2],显著提高了声纹识别技术的性能。
2.2 环境复杂性与识别精确性的矛盾
声纹特征提取是在现实环境中进行的。其环境的复杂性既包括声纹识别的说话人,也包括客观的生活环境。作为说话人,其语音声学特征不可避免地具有发展性和变异性,既便是同一个人,即便采集到的两段语音内容都是相同的,但是在不同的时期或特殊的情境下,由于情绪、语速、疲劳程度等原因,声纹特征也不尽一致,语音都会有一些差异性。这是提高声纹识别的精确性必须面对的事实。
从生活环境上说,如何降噪以及去混响依然是声纹识别的一大难题。人们发现,不知从什么时候开始,高楼平地起,市区越来越热闹,汽车噪音、商贩吆喝、广场音乐,此起彼伏,人们相互交谈,嗓门似乎也越来越大了。目前,声纹识別并不仅仅是静态检测,更多的是动态检测。在外部环境中,各种噪音都会通过录音设备采集进来,这些噪音不仅在一定程度上混淆或者淹没了说话人信息,使得声纹系统无法获取准确的说话人声纹特征。加之,环境噪音通常又不可预测,这便增加了声纹识别性能的不确定性。背景环境复杂性和传输信道等的差异性,对语音信息会造成不同程度的损伤,为声纹识别增添了不少的问题。
在目前的市场上,声纹识别技术的产品应用并不大广泛,其原因并不是意味着这项技术本身不成熟,而是因为实际商业应用场景的复杂性,很可能导致身份识别的产生较大误差。从理论上说,声纹识别的核心介质是声音,为了获取纯粹和真实声纹素材,客观上要求最大限度地降低杂音。虽然运用相关技术,能够过滤杂音,但这只是相对而言。外界的杂音干扰,很可能带来误判。因此,应用声纹识别技术的产品大多只适合在相对安静的场合进行,而超市、机场、车站等人群集中之地就不太适宜。
2.3 海量的识别任务与有限的识别能力之间的矛盾
精确地进行声纹识别,需要声纹数据库的技术支撑。目前,公安系统经过多年的努力,建立了比较齐全的声纹库。声纹库在侦查破案中发挥了重要作用。而对于一些从事声纹产品研制的企业来说,大多数企业建立时间不太长,自行采集所有的声纹数据,并建立声纹库,既具有相当难度,又需费时费力,还不现实。在声纹数据不齐全的情形之下,声纹特征的提取和建立自然而然受到了阻碍,难以提高识别的准确率。
如同人脑和电脑由于各种因素的影响,会不可避免地会出现失误一样,声纹识别技术不可避免也会出现失误。由于各种人体特征千变万化,基于声纹的身份识别会出现偶尔识别不出或者发生识别错误的情况。这就要求,在一些领域,声纹识别技术跟其它的识别认证技术相辅相成,即在声纹识别技术出现不正常的情况下,用户还可以用另一手段来验证身份。
2.4 便捷性与安全性的矛盾
当诸如指纹识别、脸部识别等工具开始普及之时,人们也在担忧,这些新技术安全吗?应该说,这一担忧不无道理。任何一項高新技术的运用,都可能是一把双刃剑。它给人们生活带来便利的同时,也不可避免会有风险。声纹识别技术同样存在一定风险。2017年4月,有一家加拿大创业公司宣称开发了一款产品,只需要最短 60 秒的录音,即可“复制任何人的声音”[3]。
声纹识别作为一种安全身份认证手段,不可避免的要面临非法用户的恶意模仿和重放攻击风险。[]声纹识别算法目前有多种,现在大部分的算法都可以控制在误识率在千分之一。而问题在于,在随机 1000 个不同人的刻意攻击中,有可能999人被堵截,但可能会有1人因声音过于相似而通过,这个“千分之一”就隐藏着很大风险。这说明,基于语音的身份鉴别系统,必须防范安全风险。
3 声纹识别技术发展前景广阔
人们逐渐看到,身份识别技术较之传统的证件识别和密钥认证方式具有优势,这项技术的应用普及将会对我们未来的经济与社会生活带来深远的影响。
3.1 与高新技术高度融合,着力提升识别准确率
对声纹识别技术而言,人们十分看重准确率这一指标。科学家们和各厂商也都在不懈努力。现代高新技术的迅猛发展,为提高声纹识别能力提供了重要机遇。声纹识别技术与其它高新技术高度融合是未来的发展趋势,如物联网、人工智能以及地理信息技术、虚拟现实技术、可穿戴技术、区块链和深度学习等技术,都可与声纹识别技术加以融合,大大提升声纹识别的精确性。
3.2 同公安实践紧密结合,发挥声纹识别技术的优势
近年来,各地公安部门结合工作实际,努力发挥声纹识别技术的优势,有力地维护了社会治安。有的地方公安机关建立了“110”报警声纹采集与辅警系统,也取得了较好的社会效益,各地的经验值得借鉴和推广。应加强总体规划,加强专业技术队伍建设,深化包括声纹识别在内的生物特征识别技术研究,建立和健全相应的声纹库,在实践中逐步扩大声纹技术的识别应用范围,为提高破案率提供技术支撑。
3.3 和智慧城市建设同步发展,广泛拓展应用领域
近年来,在各级政府的大力推动下,各地智慧城市建设取得了举世瞩目的成就。随着各地智慧城市建设的进一步展开,声纹识别技术可以在许多领域大显身手。在一定意义上说,现在需要用证件和数字验证的方式将都有可能使用声纹识别的方式,有的或者终将被声纹识别代替。声纹识别技术在金融、证券、社保、公安、国防和公共服务等领域和部门有着广泛的需求。就连人们经常遇到的一些生活小事,也可应用声纹识别技术,提高人们生活的舒适度。如收取邮件,借阅图书,启停车辆,开关家用电器等等。
3.4 以防范风险为重点,确保系统安全稳定
为有效防止非法用户的恶意模仿和重放攻击,确保系统的安全稳定,将声纹技术同其它识别技术结合运用,是一项重要措施。通过融合人脸、指纹、虹膜等技术的优势,提高系统识别认证的安全性。在远程身份认证中,可以进行双重认证,即以声纹认证为主,人工认证为辅。在手机支付及声纹锁认证中,可借助动态随机码和语音识别以防止录音假冒的闯入。同时,重视对先进技术防范手段的运用。目前,科学家们已经研究出活体检测技术和随机内容声纹技术,通过这些技术手段有效阻止提前录好的声音或者模仿的声音的攻击。我们相信,随着信息技术的不断发展以及人们对声纹技术科学规律认识的深化,在不太长的时间内,我国声纹识别技术必将取得重大进展,必将获得更好的社会效益和经济效益。
参考文献:
[1]陈拥权,张羽,胡翀豪,楚瑾.声纹识别技术及其应用前景分析[J].网络安全技术与应用,2013.11(24).
[2]郑方,等.生物特征识别技术综述[J].信息安全研究,2016.1(17).
[3]唐玮婕,生物识别升级你的“解锁”姿势[N].文汇报,2017.7.22(6).
[4]郑方,李蓝天,张慧,艾斯卡尔·肉孜.声纹识别技术及其应用前景[J].信息安全研究,2016.1(44-57).
作者简介:郑永红(1962-),女,汉族,湖北咸宁人,湖北警官学院侦查系教授,公安情报学方向。