近日,標贝科技推出一项可商业落地的声音转换解决方案,可将任何一种声音的音色,精准迁移至目标声音的音色,实现声音的转换。
据介绍,上述声音转换解决方案是基于深度神经网络学习,应用语音信号处理和语音识别技术,可将原说话人的音色转换成目标人音色。
目前,该解决方案已达到商业场景落地要求,如有声阅读、儿童教育、媒体、泛娱乐等多场景均可使用。
标贝科技语音技术相关负责人表示,声音转换和变声器存在显著不同,具体表现在4个方面。
一是声音转换效果。无论是变声器软件还是传统变声技术,合成的效果都存在机械味偏重问题,整体听感不自然。而新声音转换方案,依托智能语音技术和深度学习技术,可以高度还原原说话人的语气和韵律等。
二是交互体验。传统的变声软件输出的声音音色转换较单调,缺乏个性化的声音表达。新声音转换技术方案能够很好地解决传统变声的问题,可以达到高辨识度、高自然度、高流畅度的变声效果,同时能够保留原发音人的语气、韵律节奏等特征,让变换后的声音更有层次,更有个性。
三是应用场景。为了适应不同场景需要,声音转换技术有针对性地进行输出声音的优化训练,进而可以更好地满足用户差异化的需求。
四是转换价值。传统变声器输出的效果很不稳定,需要大量人工的调节,整体音质质量只能满足部分娱乐场景的需求。而新变声技术,提供一站式转换,无需人工参与,便可获得稳定的自然声音效果。