谷歌AI语音服务大更新降价并新增7种语言和31种声音

2019-09-10 07:22:44吴霞
计算机与网络 2019年5期
关键词:计画人机语音

吴霞

近日,为了扩展AI语音服务的市场,谷歌除了加强语音辨识模型、语言支持数量和声音种类之外,也调整了语音服务的价格。

谷歌更新文字转语音和语音转文字服务,除了优化语音辨识模型、新支持7种语言和31种声音之外,也调整了语音服务的价格,在特定的应用情境中,用户最多可以省下约50 %的支出,谷歌提供每月前60分钟免费的语言转文字服务。

谷歌指出,语音辨识和生成技术在人机互动的应用中非常关键,要让人机互动更加自然、简单且普遍,并不容易,即便使用准确度高达90 %的语音辨识模型,还是很难真正达到有效的对话,由于许多企业的语音辨识模型都是要在电话中运行,受到噪音的干扰,产生的文字资讯让模型难以处理,谷歌于2018年4月针对这种应用场景推出电话和影片的語音转文字服务。

经过不断优化,现在电话的文字错误已降低了62 %,而影片的语音转文字模型错误率也降低了64 %,除此之外,影片的语音转文字模型在辨识多个说话者的情境中,像是会议或是广播,也有很好的表现。

在价格方面,为了吸引更多用户,谷歌将影片语音转文字模型收费调降了25 %,而在标准和影片模型服务中,选择加入资料收集计画的用户,收费价格会减少33 %。因此,若使用影片模型且选择加入收集资料计画的用户,将能够减少约50 %的支出。

此外,支持的语言也是企业使用语音转文字辨识模型的一大考量,现在谷歌新增了7个语言和方言,包含:丹麦语、葡萄牙语、俄语、波兰语、斯洛伐克语、乌克兰语和挪威语,加上上述新增的语言,目前总共支持21种语言,这些新增的语言都还是测试版。在语音生成模型方面,谷歌的语音生成系统WaveNet也新增了31种声音,目前总共有包含21种语言的57种声音。

猜你喜欢
计画人机语音
人机“翻译员”
从内到外,看懂无人机
南都周刊(2021年3期)2021-04-22 16:43:49
魔力语音
基于MATLAB的语音信号处理
电子制作(2019年14期)2019-08-20 05:43:38
基于MQ3与MP3的价廉物美的酒驾语音提醒器
电子制作(2019年9期)2019-05-30 09:42:10
对方正在输入……
小说界(2018年5期)2018-11-26 12:43:42
“人机大战”人类智慧遭遇强敌
海外星云(2016年7期)2016-12-01 04:17:50
未来深空探测中的人机联合探测
太空探索(2016年5期)2016-07-12 15:17:58
蔡锷与《五省边防计画》
军事历史(1988年5期)1988-08-20 06:50:48