科大讯飞:人工智能时代的战斗者

2018-12-06 08:40李艺雯汪婷
国际人才交流 2018年7期
关键词:方言语音领域

文/李艺雯 汪婷

2018年6月14日,科大讯飞与麻省理工学院计算机科学和人工智能实验室签订战略合作协议,成立人工智能联盟,宣告将向人工智能研究的前沿领域深度探索。双方明确将在语音处理、推理认知和类人人工智能等领域开展合作。双方还达成共识:中美科研机构不仅要在研究层面加强合作,还要在人工智能相关应用、标准、法律、伦理、人文等方面携手。科大讯飞董事长刘庆峰表示:“人工智能如何避免未来对世界带来的挑战和风险、更好地建设世界、造福人类,这也需要全球范围的联手和合作。”麻省理工学院计算机科学和人工智能实验室主任Daniela Rus教授评价说:“科大讯飞是最具创新思维的公司,我们非常期待和他们一起在科技之旅中探索。”她表示,21世纪的最大挑战是发展科学和智力工程,以及寻找更好的处理人类与人工智能间关系的方式,而这正是双方正在努力探索的方向。

1999年年底,一群中国科学技术大学的年轻人以“讯飞”为名,注册成立了一家小型创业公司,梦想通过人工智能语音技术,让全世界聆听中国的声音。十多年后的今天,科大讯飞股份有限公司的语音技术,每天使用量已达46亿人次,第三方开发团队数量达52万家,拥有国内语音识别70%的市场份额。作为一家重视源头技术创新的公司,科大讯飞19年来坚持“语音产业”的梦想,并在人工智能时代走在了阅读理解、逻辑推理等认知智能研究领域的前沿;在2017年成为国家新一代人工智能开放创新平台,并承建唯一的国家级认知智能实验室。

“人才资金正在迅速进入这个行业,人工智能产业在中国进入了一个快速发展期。”科大讯飞联合创始人、高级副总裁江涛表示。就科大讯飞在产业发展、人才培养和源头技术创新等领域的经验,《国际人才交流》杂志对科大讯飞进行了独家专访。

《国际人才交流》:录音宝、录音笔、智能会议系统等是讯飞的拳头产品。讯飞目前还能支持多种方言的语音输入。讯飞是如何做到支持方言的语音识别的?除了方言外,能支持多少国家的语言?

科大讯飞:讯飞翻译机2.0、讯飞输入法、听见、讯飞语记等是讯飞的重要产品。讯飞输入法总用户超6亿、语音输入月覆盖率超过46%,支持22种方言;讯飞翻译机热销超过20万台、走遍全球140多个国家,新品2.0版本支持中文与33种语言的及时互译、四种方言翻译、拍照翻译和中英离线翻译,预售开启后很快被抢购一空。

方言是具有鲜明地域文化特征的语言符号,是中国语言文化的瑰宝;也是人们乡情的根系,具有丰富的人文价值。2017年10月,讯飞输入法与新华字典等联合发起“方言保护计划”,致力于用智能语音技术长期保护和留存方言,为世界留下更多乡音。作为科大讯飞“AI+公益”的一部分,“方言保护计划”邀请大家通过上传方言发声内容的方式,引起大众对方言保护的关注,并亲身参与到保护的过程中来。

方言保护如何实现?作为亚太地区最大的智能语音和人工智能上市公司,科大讯飞在智能语音领域拥有国际领先的技术水平与成果。目前,科大讯飞已经拥有多语种、多方言的语音系统;长期的语言积累系统地归纳了语言的共性和个性,并培养了一支具有综合知识的多语种专家团队;讯飞的语音系统框架,可以提升方言语音合成、识别效果,在方言留存方面具有独特的技术优势。目前,讯飞输入法已可以识别22种方言,是支持方言识别种类最多的输入法。

《国际人才交流》:讯飞的智能语音识别技术毋庸置疑在国内是领先的,而且讯飞在国际最高水平的语音合成比赛Blizzard Challenge(暴风雪竞赛)中荣获该竞赛2006—2017年十二连冠。那么讯飞在国际上是处于什么样的一个水平?讯飞还涉足了人工智能领域的哪些方面?

科大讯飞:科大讯飞董事长刘庆峰在2018年全国两会代表通道上表示:“中国在人工智能的源头创新上,很多方面已经跟全世界并跑甚至部分领域领跑,下一步的关键是如何强调‘应用是硬道理’,在应用驱动中让数据迭代不断进化。可以说中美两国在很多领域是同步进入‘无人区’,但我们相信,由于人工智能的数据驱动特点,由于中国的用户基础和政府应用创新方面的能力,中国一定能够赢得人工智能的未来。”

人工智能分为运算智能、感知智能和认知智能三个阶段,而中国的人工智能技术研究在很多方面已经不输美国,甚至达到全球领先水平。

在智能语音技术上,语音合成技术让机器可以开口说话。2017年,科大讯飞不仅在国际语音合成大赛上第12次获得第一名,而且是英语比赛的全球第一名。语音识别方面,2016年,科大讯飞在国际语音识别大赛(CHiME)取得全部指标第一。

在认知智能领域,2016年相继获得国际认知智能测试(Winograd Schema Challenge)全球第一、国际知识图谱构建大赛(NISTTAC Knowledge Base Population Entity Discovery and Linking Track)核心任务全球第一。另外代表人工智能未来的自然语言理解,全球最顶尖的比赛是斯坦福大学发起的SQuAD(Stanford Question Answering Dataset)机器阅读理解挑战赛。2017年7月,哈工大讯飞实验室(HFL)获得全球第一名,IBM、谷歌、微软、Facebook都参加了,今年1月,科大讯飞再次刷新了全球纪录。

在图像识别领域,车载、医疗、安防都是很常见的场景。2017年11月,科大讯飞在国际自动驾驶领域权威评测集Cityscapes获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界纪录,充分彰显了科大讯飞在计算机视觉领域的技术水平,以及在智能驾驶等新方向的研究拓展能力。2017年8月、2018年3月,科大讯飞相继在国际权威肺结节竞赛LUNA和国际权威眼底图分析竞赛IDRiD上取得第一,验证了在医学影像领域科大讯飞的技术实力。同场竞技者不乏国际知名高校、科研机构,而科大讯飞用实打实的成绩证明,中国的人工智能技术并不落后,相反,在源头技术上我们甚至能够走在世界前列。

《国际人才交流》:AI产业的竞争,说到底是人才和知识储备的竞争。只有投入更多的科研人员,不断加强基础研究,才会获得更多的智能技术。在讯飞的核心人才梯队中,核心专家是如何加入讯飞的?讯飞又是如何组织、管理、服务专家团队,以释放他们最大能量的?

科大讯飞:“世上岂无千里马,人中难得九方皋。”在科大讯飞2016年公司年会上,刘庆峰董事长宣布启动“春晓行动”,面向全球人工智能领域,计划引进10名国际顶尖人才、100名行业领军人才、1000名各类骨干人才,一起用人工智能改变世界。刘庆峰表示,通过“春晓行动”,将全国乃至全球顶尖的技术、产品、营销等专家聚集在科大讯飞,对现有研究体系、产品创新、产业进步进行有效的补充和完善,进一步巩固公司人工智能技术的国际领先优势,并将全面确立及巩固公司人工智能产业领导者地位。

2017年,陶晓东博士正式加入科大讯飞,担任智慧医疗事业部总经理一职,致力于科大讯飞在智慧医疗领域的技术研发、产品落地及市场推广等工作,带领科大讯飞智慧医疗团队钻研人工智能+医疗的无限可能。

2018年4月,科大讯飞引入声学及语音信号处理的顶尖人才马桂林博士,担任科大讯飞苏州人工智能研究院副院长一职。马桂林博士带领团队从事消费类电子音频系统、车载高级音频解决方案以及重点行业应用音频方案的研发。马桂林博士的加盟进一步提升了科大讯飞在语音技术领域软硬一体化的整体优势。

2018年5月,科大讯飞正式引进信号与图像处理、计算机视觉的国际顶尖人才李世鹏博士,担任科大讯飞副总裁、讯飞AI研究院联席院长。李世鹏博士将领导科大讯飞研究团队在人工智能核心技术上的探索和创新,助力科大讯飞的AI技术应用落地,并主导科大讯飞的国际技术合作拓展。

目前,经过十多年的发展,科大讯飞已经聚集了一批具有全球视野的顶尖科学家,2017年《麻省理工科技评论》“全球35位35岁以下科技创新青年”(MIT Technology Review Innovators Under 35)中国区榜单里,讯飞AI研究院副院长魏思名列其中,被归入“远见者”一列。

科大讯飞正呼唤着有更多科学家精神的企业家和有企业家精神的科学家加入到人工智能的战队,在中国改变世界!

《国际人才交流》:讯飞在成长壮大的过程中,尤其是专家团队在开展工作中遇到过哪些挫折或问题?是如何解决的?

科大讯飞:2017年,科大讯飞董事长刘庆峰曾表示:“科大讯飞现在还未到达登顶的状态,只能说是已经开始登山,刚克服了爬坡之后的艰难,开始到慢慢适应的状态。我更愿意给团队传达的信息是,每时每刻都有一个新的山峰在前面,当你快到一个山顶时,还有另一个更大的山峰在前面。这样才有不竭尽的动力。”

1999年,刘庆峰和中国科学技术大学十几位同学一起创立了科大讯飞公司,登山的脚步刚刚踏出第一步。然而“理想很丰满,现实却很骨感”,科大讯飞2000年就碰到了第一道“缓坡”:当时,公司开发出一款试图用语言控制电脑的桌面软件,按照刘庆峰的设想,把手写输入的随意性、键盘输入的准确性和语音输入的高效性完美结合起来的软件,肯定会让人耳目一新。然而,市场的反馈却让人大跌眼镜:用户自己操作时满意度瞬间降至30%,投入的资金血本无归。一年多时间,公司几乎颗粒无收。2000年,在合肥巢湖半汤会议上,团队里就有人提出质疑:“我们还要不要做语音,要不干脆做房地产吧。”那时刘庆峰就说了一句话:“凡是不看好语音产业的,请走人。”自那以后,科大讯飞就坚定了走语音产业的道路,也明确了目标:第一,这个产业未来有着100亿元的市场空间;第二,科大讯飞能成为这个领域的第一。

刘庆峰说:“直到今天,我仍然会坚定地走语音发展的道路,因为我觉得讯飞就应该做讯飞该做的事情。尽管在当时,我们手上仅仅只有中文语音合成技术,提出这个‘第一’的目标,显然是天方夜谭。直到后来合肥市领导带着三家投资机构前来考察,并对讯飞的创业团队给予了肯定和支持;随后,三家投资机构以‘3060万元占股51%’的条件投资科大讯飞,这第一道‘缓坡’才终于爬过去了。”

《国际人才交流》:5月28日,习近平总书记在中国科学院第十九次院士大会、中国工程院第十四次院士大会上讲到,创新驱动实质是人才驱动,强调人才是创新的第一资源。对此,科大讯飞如何理解和落实?

科大讯飞:刘庆峰董事长在2018年全国两会媒体见面会上表示,人工智能发展作为一个国家战略,必须人才先行。我们要让人工智能走下神坛,在应用型人才的培养层面,可在现有的数学专业、计算和通信专业基础上,增加跟数论有关的数学知识,基础够了之后再用我们的人工智能的平台训练。我们希望在这方面为中国人工智能发展多做些贡献,2017年我们开放了AI大学,也设置了人工智能的课程体系,依托讯飞AI研究院的技术能力及解决方案打造国内首个AI在线学习平台,面向AI兴趣爱好者、学生、个体开发者、创业者、企业级开发者等全社会泛AI群体,提供学习分享和经验交流的机会,目前已有15万学员,今年的目标是50万以上,去真正培养一些人才。

“人工智能原创型人才我们要大力培养,但未来人工智能应该成为很多研究领域和方向的工具,各个领域的优秀学生接触到它之后,可能从交叉学科中对人工智能也会有突破,这个是多角度的。一方面,让一些人去做应用开发,另外一些人为人工智能源头技术和战略服务;另一方面,让人工智能成为工具,在社会生活各个领域中和开发应用的人才接触,将来就有望产生更多的交叉学科。所以我相信人工智能是一个伟大的历史进程,今天的算法已经可以解决一个又一个的社会刚需问题,但是如果有重大突破,还可以带来更大的未来。”刘庆峰直言。

2017年10月24日,科大讯飞(首届)1024开发者节在合肥举行并重磅发布了科大讯飞《1024计划》。科大讯飞希望通过人工智能开放平台和1024开发者节,为中国人工智能繁荣发展打造一个真正开放的AI人才库。

刘庆峰在2018世界制造业大会上表示:“我们希望通过培训体系让现有的AI走下神坛,让计算机、数学专业的研究生和博士生利用半年左右的时间上专门的课程和应用培训,能够成为AI开发型人才。”

在蓬勃的AI浪潮中,科大讯飞绝非孤独的战斗者。“我们今天站在这里不是讨论科大讯飞有多少世界领先,而是我们这个产业集群将如何发展。”刘庆峰表示,人工智能时代的比拼绝不是单个企业的市场,比的是产业链、比的是产业集群。“所以我们要把核心技术开放出来,通过人工智能的能力平台来构建整个生态体系。”截至2018年5月31日,讯飞开放平台开发者团队人数达85万,覆盖终端人数达19亿,日均调用46亿次。

“科大讯飞的使命是让机器像人一样能听会说,能理解会思考,认知智能是我们未来要突破的方向。”“春夏之交”的人工智能时代,不仅要保持核心技术全球领先,同时又要坚持应用落地,打造人工智能生态。刘庆峰表示,科大讯飞基于这样的使命和愿景,期待着跟产业界、科技界携手并肩,打造一个真正的具有全球影响力和话语权的人工智能和语音产业高地,共同在中国用人工智能改变世界。

猜你喜欢
方言语音领域
方严的方言
电子战领域的争锋
方言
将现代科技应用于Hi-Fi领域 Perlisten S7tse
2020 IT领域大事记
领域·对峙
魔力语音
哪些方言有利于经商
基于MQ3与MP3的价廉物美的酒驾语音提醒器
数字滤波在语音信号降噪中的应用