刘庆峰:抢占人工智能赛道

2017-11-16 10:27王世峰钱童心
中国中小企业 2017年10期
关键词:语音人工智能

文/王世峰 钱童心

刘庆峰:抢占人工智能赛道

文/王世峰 钱童心

“你所清楚预见的、热烈渴望的、真诚追求的,都会自然而然地出现。”这是科大讯飞董事长刘庆峰一直坚信的一句话,科大的发展也印证了这句话。

作为国内第一家语音行业上市公司,科大讯飞于2008年5月在深交所中小板正式挂牌,至今已经过去9年时间。可以说,A股市场见证了科大讯飞的成长和发展:从最初核心业务简单地围绕语音识别,到现在多项“人工智能+”技术落地开花;其股票市值也由最初的32.48亿元,到现在接近900亿元,增幅超过了20多倍。

虽然一直以来,围绕着这家公司忽悠圈钱、靠政府补贴、市值缩水等质疑声不绝于耳,科大讯飞已成长为中国语音技术领域的佼佼者。

可人工智能的边界宽广,语音智能只是其中一块,在这场科技大潮席卷而来的时代,科大凭什么能与国外的微软、谷歌与国内的百度、腾讯等巨头同台竞争?

戴着学术范儿金属边方框眼镜的刘庆峰,在科大讯飞近期业绩交流会上说:“今天的讯飞还只是一棵小苗。”

麻雀飞上枝头

学而优则仕,是中国文人千百年来的追求,然而在当下的时代,学而优则商,成为更多人的选择,刘庆峰恰好出生在这个时代。

中科大的“人机语音通信实验室”是孕育科大讯飞的母体,还在中科大攻读硕士研究生的时候,刘庆峰已经成为中科大语音实验室863语音合成项目组组长,在语音合成等领域做出多项关键技术创新。

1998年,刘庆峰带队参加国家863计划的一个比赛,他设计的语音合成系统是当时唯一一个达到可实用门槛的作品,这在当时实属重大突破,对于当时的刘庆峰来说,最大的成就感并非技术成果本身,而是将技术成果转化为实际应用。

20世纪的最后几年,未来将影响中国经济发展新动能的潜流正在孕育。百度、阿里巴巴、腾讯、搜狐等一批互联网公司在海归潮和资本潮的双重推动下纷纷成立。国外的IT巨头也觊觎中国语音市场,IBM、微软、英特尔等相继在中国成立了实验室。国内的诸如社科院、中科院等高校实验室也都摩拳擦掌,酝酿语音技术多年。

1999年,在远离北、上、深的合肥,27岁的刘庆峰和18位同学一起创立的科大讯飞悄无声息地落地了。他们当时或许不会想到,年轻时“攒”出的这么一家公司,未来会彻底扭转中文语音产业由国外IT巨头控制的竞争格局。

作为后来者的科大讯飞,要走的路注定不会是一帆风顺。

新成立的科大讯飞只有租来的几间民房,一群年轻人每天除了睡觉就是工作,可付出并不总会有回报。公司成立的第一年,残酷的市场就给技术起家、充满自信的刘庆峰浇了一盆冷水。

当时,科大讯飞开发出一款试图用语言控制电脑的桌面软件,按照刘庆峰的意图,把手写输入的随意性、键盘输入的准确性和语音输入的高效性完美结合起来的软件肯定会让人耳目一新。

然而,市场的反馈却让他大跌眼镜。“用户自己操作时满意度瞬间降至30%,投入的资金血本无归。”刘庆峰说。

开局不利,团队也变得迷茫,更要命的是,整个公司面临着巨大的财务压力。当时公司账上只剩下十几万,而所有员工一个月的工资开支就要20万。当时正值年关,不得已最后刘庆峰选择借钱给员工们发了工资。

尽管今天全世界都已经承认语音技术是未来交互的入口之一,语音为主,键盘和触摸为辅的交互时代正在到来。但在17年前科大讯飞刚刚创业的时候,几乎没有人认识到这一点。刘庆峰表示,最初的几年非常痛苦:“我们想让机器设备像人一样能听会说,但是当我们有这种想法以后,整整一年多时间,我们几乎颗粒无收。”他回忆道,“团队里有人提出质疑,我们还要不要做语音,语音到底是刚需吗?还有人提出我们干脆做房地产吧。”

一直到2001年,科大讯飞都还没有找到清晰的发展途径。为此,公司专门开了一次“巢湖半汤会议”,最终坚定了科大讯飞还是要做语音,要做中国乃至全球语音技术的龙头企业。刘庆峰回忆道:“我们当时定了三个目标,第一是这个产业未来有100亿的市场空间,第二是我们能成为这个领域的第一,第三是这是我们喜欢做的事情。”

命运也很快眷顾了这群满腔热情却又急需资金“输血”的年轻人。合肥市领导当年带着三家投资机构前来考察,听完刘庆峰介绍产业前景与团队实力后,当场表态:“这些小伙子必须留在合肥。”随后,三家投资机构以“3060万元占股51%”的条件投资科大讯飞。

刘庆峰无比激动,因为梦想从没有距离自己这么近过。“这笔钱可以将国内语音技术比较好的中科大、中国科学院声学所和中国社科院语言所的资源整合在一起。这是业界和学界多少年想做都没做成的事情。”

渡过了最初的难关之后,在2001年,柳传志又将联想进入风投产业后的第一单投给了科大讯飞。后来的故事就广为人知了,2004年,在语音市场上咬牙坚持了5年的科大讯飞终于实现扭亏为盈。2006年之后,其语音合成技术和语音识别技术陆续在多个国际专业大赛上拔得头筹。

2008年,科大讯飞成功登陆A股中小板,麻雀终于飞上了枝头。

“目标订立以后,17年了,我们一天都没有改变过。”刘庆峰说。

坚守应用才是硬道理

今年是人工智能概念提出的第61个年头,人工智能正在进入第三次浪潮,2017年被定义为人工智能商业化、产品化运用元年。

科大讯飞的人工智能生态也逐步构建起来。2010年,发布全球首个移动互联网智能语音交互平台“讯飞语音云”(现更名为“讯飞开放平台”)。截至2016年6月末,该平台覆盖终端用户数已达到8.1亿户,合作伙伴超过16万家,日服务量达24亿人次,业务规模的不断扩大,为公司在人工智能领域保持数据规模优势奠定了坚实基础。

2013年,科大讯飞与中国移动、中国电信、中国联通三大电信运营商全面建立战略合作关系。2014年,发布讯飞语音云3.0、灵犀3.0,正式启动“讯飞超脑计划”,即确定“从能听会说到能理解会思考”目标上的转变。2015年,重新定义了万物互联时代的人机交互标准,发布了对人工智能产业具有里程碑意义的人机交互界面——AIUI。

一直行进在路上的刘庆峰在不同场合曾明确表示过:人机协同、人工智能+行业,才是未来人工智能最有希望做成的事。

在他看来,人工智能时代的未来生活,将是人工智能助手帮我们解决诸多基础性工作后,人类去做有创意的事情,而这就是科大讯飞人眼中即将到来的美好时代。

科学杂志在2016年年初曾经预测,到2045年全世界50%的工作将会被人工智能替代,而在中国这个数据是77%。根据科大讯飞最新的研究和产业探索,十年内,人工智能即可在一个又一个的领域帮助人类释放劳动力。

“人工智能+个人”,也是讯飞未来要做的。科大讯飞一名内部人士表示,未来科大讯飞还将通过人工智能平台为全社会赋能,通过人工智能为每个人赋能。让人工智能像水和电一样,成为每个人都能触摸的助手。

截至2017年4月,科大讯飞已占有中文语音技术市场70%以上市场份额。在8月10日的投资者交流活动上,刘庆峰阐述了公司“平台+赛道”的AI战略蓝图,“当人工智能(AI)在全球引发全新浪潮的时候,坚守应用才是硬道理,让大家能看清技术逻辑、商业逻辑,我觉得比什么都重要”。

所以,讯飞在研发和产业设计中,已经考虑人机协同的机制,不仅包括脑机接口,而且包括人脑智能和机器智能的协作职能,这也是人工智能的伦理和人文道路的选择。

科大讯飞开放平台市场经理吴剑堃表示:“中国人工智能机遇巨大,因为在中美创新能力对比中,科学研究和工程技术员方面是美国强,客户中心和效率提升方面是中国强。但人工智能到底是什么?是应用驱动需要不断去迭代更新,很多领域中美同步进入无人区,这让我们更有机会站在世界之巅。”

据吴剑堃介绍,科大讯飞已经和Nvidia以及Tesla合作,应用Nvidia的深度学习GPU计算平台对外提供先进的移动互联网语音交互服务。

在管理层看来,未来几年是人工智能整个最关键的格局定义的窗口期,科大讯飞已明确将不以“当前税后利润增长为第一目标”,而是谋求技术迅速落地,在未来智能产业中占领先机。

商业模式的轮回

在湖畔大学,刘庆峰分享了自己对商业模式的看法,“同样一个技术,不同的商业模式,决定企业的生死存亡。”这样一句看似简单的话,是刘庆峰从科大讯飞曲折的发展历程中悟出来的。

1999~2004年的五年间,科大讯飞连年亏损一度受到质疑。对此刘庆峰曾表示,就是因为最初没有找到合适的商业模式。创业之初,科大讯飞想做面向个人的消费者的产品,但是很快发现市场已经被大厂垄断。

以上述桌面软件的失败为例,他总结了原因:一是因为盗版猖獗,科大讯飞正版软件刚一面世,盗版已经铺天盖地;二是因为大部分用户是老年人,操作电脑的能力很差,时常因为电脑本身的硬件问题呼叫售后服务,这推高了科大讯飞的成本,跑两三次售后,卖软件的利润就没有了;三是因为团队都是技术出身,缺乏建渠道做推广的营销经验。

“在这种情况下,我们决定要从面向消费者(2C)转向面向商户(2B),于是推出ifly inside去向那些大厂出售设备,让他们去推给运营商,推给银行,我们分成。”

放弃B2C模式,转向为有渠道、有市场的大公司提供核心技术的B2B模式后,科大讯飞终于赚到了第一桶金,而这个过程公司摸索了两年时间。“科大讯飞只负责开发引擎、语音合成和语音识别芯片,而应用集成则由下游的开发商或客户自己完成。这一模式也就意味着越来越多的市场主体进入语音的产业链当中。”刘庆峰分析道,等到公司上市后,又发现只针对B端还不行,要成为一个消费大众品牌,一定要做C端,把想象空间打开,“今天讯飞正处在2B往2C的过程中,我觉得一两年就会见成效。”

在他看来,创业企业要持续实现盈利非常困难,因此创业者的内心一定要足够“粗糙”,能扛得住各种压力,千万不要因为某个时期的痛苦,或者社会外界的质疑,就否定了整个产业,而应该去打开整个产业链,看看到底是哪个环节出了问题,技术、市场、管理还是商业模式。

坚持下去 等待爆发

李开复曾经说过,大多数情况下,人工智能并不是一种全新的业务流程或全新的商业模式,而是对现有业务流程、商业模式的根本性改造。

人工智能是对现有的业务流程和商业模式的根本性改造,是指人工智能围绕深度神经网络算法,结合云计算、大数据及移动互联网,对原有业务流程或商业模式进行的优化,从而提高工作效率。

人工智能改变世界有三个要素:核心算法、行业大数据和行业专家。核心算法就好比一个无比聪明的孩子。当他没有学习天文学,他不知道天文;他没有学习医学,他不懂医学。但是只要他足够聪明,他有足够强的学习能力,把行业数据给他后,他很快便会具备各个领域的知识。

刘庆峰的结论是:人工智能并不是普适万能的,还需要脚踏实地地跟各个领域的专家结合,才能真正地改变世界,这三要素必须合在一起。

Gartner的新兴技术成熟度曲线显示,任何技术从概念的导入到最终的大规模使用都要经历一个漫长的积累过程,也许是10年、20年甚至更长的时间。

刘庆峰简介:

1990年考入中国科学技术大学,1998年获“通信与电子系统”专业硕士学位,2003年7月获“信号与信息处理”专业博士学位。中国科学技术大学兼职教授、博士生导师,中华全国青年联合会委员、中国科协七届委员和十届、十一届全国人大代表。1999年创办科大讯飞股份有限公司,并担任总裁至今,2009年4月起同时兼任董事长。

他在智能语音核心技术研究和产业化方面都做出了突出成绩。科大讯飞在竞争中扭转了中文语音市场几乎全被国外IT巨头垄断的格局,占据了80%以上的主流市场,并连续七次夺得国际英文合成大赛冠军。2008年至今,科大讯飞连续在国际说话人、语种识别评测大赛中名列前茅。2016年,国际语音识别大赛(CHiME)科大讯飞取得全部指标第一;在认知智能领域,相继获得国际认知智能测试全球第一、国际知识图谱构建大赛核心任务全球第一。

“如果要做原创技术,心中一定要有这个曲线图。”刘庆峰解释道,“在技术触发期,有很多社会资本的关注和媒体吹捧的成分,这会让新技术迅速达到期望膨胀的巅峰期,但即便如此,任何技术也都必定会经历泡沫破裂的幻灭期,那时很多创业项目失败,风投血本无归,只有坚持下来的企业,才能逐步进入到复苏的爬升期,最终进入到真正的技术成熟的爆发期。”

这一点与百度创始人李彦宏的想法不谋而合,日前在亚布力中国企业家论坛上,李彦宏也表示人工智能的潜力真正爆发出来,预计还需要5~10年,“这个潜力不是说十年之后就没了,我觉得这是一个30~50年的机会,可能要到50年之后,这个潜力才慢慢地不明显了。”

在这样的环境下,人工智能相关领域的人才争夺战也愈演愈烈。今年年初,媒体上曾流传出关于科大讯飞人才流失的传闻。对此,刘庆峰回应称:“自科大讯飞2008年上市以来,总监级别以上的近30位管理层无一离职。公司最核心的骨干是拥有期权的,而近8年来,全公司700人的核心骨干团队,离职的只有40人左右,流动性不到1%,非常稳定。”

源于中科大的科大讯飞,在产学研一体化合作上是中国企业的典范,已经与国内包括清华大学、哈工大等10家院校建有联合实验室。此外,还与美国佐治亚理工学院、中科院自动化研究所、复旦大学等6所院校建立了合作项目。

刘庆峰表示,很多创业公司都希望在大学里建实验室,或者与某个教授合作,以获得最初始的技术积累和持续创新的土壤,但是他们必须学会分享。他说道:“在产学研合作体系中,企业的主体地位是第一重要的,必须要理解把握这个产业;第二,合作机制非常重要,是不是给到实验室负责人、合作导师股权,有真正的利益分配机制。是不是真的把他们当成跟你分享未来的共同的创业者。”

猜你喜欢
语音人工智能
我校新增“人工智能”本科专业
第二语言语音习得中的误读
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
一种基于生成对抗网络的语音去噪方法
2019:人工智能
对方正在输入……
人工智能与就业
数读人工智能