Kaldi和小米AIoT生态

2020-11-28 02:18崔宝秋
软件和集成电路 2020年8期
关键词:学术界小爱开源

什么是Kaldi?

Kaldi是目前全球最流行的开源语音识别工具集。Kaldi在学术界降低了语音技术的入门门槛,为各大学术研究和挑战赛提供基线系统。

初创公司和团队纷纷使用Kaldi,结合自己的数据迅速验证业务,并为用户服务。几乎所有做语音识别的机构和企业都在使用Kaldi。

Kaldi的前身是基于Daniel Povey博士提出的SGMM模型,Daniel主导了Kaldi项目的开发和维护,开发了很多Kaldi模型(包括目前使用广泛的Chain模型),维护了一个开源的语音识别语料库(OpenSLR),并基于此开发了大量的语音识别训练脚本。Daniel几乎24小时在线回答Kaldi社区用户的问题,他的努力获得了社区的认可。

下面谈谈Kaldi的发展历程。

2009年,在约翰霍普金斯大学夏季研讨会上,语音识别工具包Kaldi正式开始开发,并完成了早期的系统,包括轻量级的解码器和基于HTK的训练脚本。

2010年,布尔诺理工大学Kaldi研讨会,Kaldi作为语音识别工具包的功能被完善,同时研究人员开发了独立于HTK的训练脚本,大量的代码在2010年被开发。紧接着后面的每一年,Kaldi都做出了里程碑的贡献。

Kaldi在学术界的地位非常高,因为开源模式开放共享共建精神,奠定了它在学术界的扎实地位,成为了学术研究的利器,大大降低了准入门槛,今天有4000多篇论文都在引用Kaldi。

在工业界,Kaldi是语音落地的基石。只需对Kaldi做简单的封装,即可构建承受真实场景压力的语音引擎。很难找到一家研究语音算法的机构或企业不使用Kaldi,基于Kaldi的语音引擎,正在每天为数亿用户持续提供服务。

2019年,Daniel正式加入小米。最近几个月,学术界、工业界的同行都在称赞小米,我们没想到Kaldi有如此大的影响力,也没想到Daniel在业界如此地受尊重。

很多开源界和AI界,尤其是语音界的人纷纷称赞小米为中国语音界作出的巨大贡献,这从侧面反映了Kaldi在业界的影响力。

Daniel为什么选择小米?我个人认为,除了小米对技术的热爱、对技术人才的重视之外,最重要的两个原因是小米强大的AIoT生态,以及小米极致的开源文化。

什么是AIoT生态?小米的AIoT生态为什么如此强大?谈到生态,我们先谈一下我们所处的这个智能新时代。智能新时代是AI、IoT、5G三个时代的交汇期。

为顺应这个时代,小米在2019年年初启动了“手机+AIoT”双引擎战略,AIoT第一次被提升到了与手机同样重要的位置。

小米布局AIoT非常早,2014年就开始布局生态链,布局智能家居。目前,小米的AIoT平台已经是全球首屈一指的消费级AIoT平台,AIoT平台连接的智能设备数超过2.52亿台,并且,这个数字还不包括小米所有的智能手机、笔记本等。

为什么语音技术在AIoT生态中如此重要?从IoT到AIoT,我们正在经历一个质变。

第一,从GUI到VUI是交互的质变,G是指图形、用户界面,V更多的是指声音。

第二,从IoT到AIoT发生着从个体到整体的质变,从互联互通到以人为中心的智能服务质变,其背后都是AI的功劳,所以,从IoT到AIoT正在经历一个巨大的质变。

谈到小米的AIoT战略,不得不提小爱同学。小爱同学最早是一个语音助理,后来被升级为智能助理。

广义的定义是小米的AI系统把小爱同学打造成分布式计算能力,小爱同学被定义为小米AIoT生态的核心。小米强大的AIoT生态,我认为是吸引Daniel、吸引Kaldi来到小米、来到中国的一个理由。

小米纯粹、极致地拥抱开源文化,是吸引Daniel加入小米的一个重要理由。小米几年前喊出开源的理念,今天这个理念被业界同行高度认同,这个理念是:不仅要站在巨人的肩膀上,而且还要为巨人指方向。

过去20年,我坚定地认为开源是软件的未来;过去3年,我更加坚信开源是AI的未来。Daniel最在意的是能不能保证Kaldi100%地开源,他非常崇尚技术,非常纯粹,也追求极致。近半年多来,Kaldi有很多新的进展,并有很多贡献者提交代码。

Daniel加入小米后,小米集团技术委员会专门成立了一个新的团队,叫新一代语音技术,由Daniel直接带领这个团队。

目前,这个团队发展得非常好,希望未来Kaldi能真正在小米得以发扬光大,真正做到四赢:Daniel和Kaldi项目要赢,Kaldi的全球社区要赢,小米AIoT生态要赢,基于Kaldi的初创公司也要赢。我们要坚持开放和共享,实现多方共赢。

我们会一如既往地秉承“坚持开源”的理念,打造Kaldi,让Kaldi在中国所有开源热爱者的推动下,成为一个比较典型的开源项目,成为一个没有国界的全球化的开源项目。

猜你喜欢
学术界小爱开源
智慧机器人
智慧机器人
校园武术“学、练、赛”一体化实践探索
告别“兔兔”
国内学术界马克思民生思想研究述评
小米发布小爱同学3.0
国内学界关于日本“印太战略”分析的研究综述
五毛钱能买多少头牛
2019开源杰出贡献奖
新时期红军长征研究文献综述 