“语音引擎”可从15秒样本复制原声

2024-06-05 13:23
文萃报·周五版 2024年14期
关键词:测试阶段障碍者引擎

OpenAI公司3月29日最新推出了一项名为“语音引擎”的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音,让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。

“语音引擎”展示了一些已经開始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。

“语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。

“语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。

(摘自《科技日报》)

猜你喜欢
测试阶段障碍者引擎
特殊学校听语障碍者体能提升困境与路径
自灸 睡眠障碍者的自救
浅谈计算机软件工程技术中的逻辑运用
听觉障碍者社会融合的现状与路径叩问
蓝谷: “涉蓝”新引擎
Android应用软件测试研究
抽样技术在政府审计中的应用研究――基于细节测试阶段
关于改进英语专业高级英语教学过程的分析
无形的引擎
基于Cocos2d引擎的PuzzleGame开发