标贝科技推出声音转换解决方案 AI技术助力音色精准迁移

2020-07-18 16:17

近日，標贝科技推出一项可商业落地的声音转换解决方案，可将任何一种声音的音色，精准迁移至目标声音的音色，实现声音的转换。

据介绍，上述声音转换解决方案是基于深度神经网络学习，应用语音信号处理和语音识别技术，可将原说话人的音色转换成目标人音色。

目前，该解决方案已达到商业场景落地要求，如有声阅读、儿童教育、媒体、泛娱乐等多场景均可使用。

标贝科技语音技术相关负责人表示，声音转换和变声器存在显著不同，具体表现在4个方面。

一是声音转换效果。无论是变声器软件还是传统变声技术，合成的效果都存在机械味偏重问题，整体听感不自然。而新声音转换方案，依托智能语音技术和深度学习技术，可以高度还原原说话人的语气和韵律等。

二是交互体验。传统的变声软件输出的声音音色转换较单调，缺乏个性化的声音表达。新声音转换技术方案能够很好地解决传统变声的问题，可以达到高辨识度、高自然度、高流畅度的变声效果，同时能够保留原发音人的语气、韵律节奏等特征，让变换后的声音更有层次，更有个性。

三是应用场景。为了适应不同场景需要，声音转换技术有针对性地进行输出声音的优化训练，进而可以更好地满足用户差异化的需求。

四是转换价值。传统变声器输出的效果很不稳定，需要大量人工的调节，整体音质质量只能满足部分娱乐场景的需求。而新变声技术，提供一站式转换，无需人工参与，便可获得稳定的自然声音效果。