吴嘉雯
对于41岁的刘庆峰而言,2014年6月9日是值得纪念的一天。这一天的合肥晴空万里。刘庆峰动用了30多辆大巴,把科大讯飞3000多名员工一起拉到了近郊的大蜀山,用一场爬山比赛来庆祝公司成立15周年。从15年的历史轴线上看,爬山仿佛一种庄重的仪式。这家脱胎于中科大的企业,在语音技术的峭壁上不懈攀登,从一个18人的小公司,进化成了国内语音产业的龙头老大,甚至领先全球。
这是一段极具科幻色彩的创业历程。所谓科幻,便是以基于科技的想象力,打破人类认知的局限。在人类文明史上,语音是最自然最直接的交互方式,但仅限于人类与人类。而刘庆峰所做的,是让人类与机器之间实现语音交互,如同科幻电影里的情景。然而,想象与现实之间的落差,不仅是一道“把科幻变成科技”的峭壁,还有一条“把科技变成产业”的鸿沟。所幸的是,站得越高,看得越远,风也越大。技术峭壁上的刘庆峰,用执着与理性把鸿沟变成了风口。2013年,科大讯飞占据了国内70%以上的市场份额,拥有4亿多用户,年收入达到12.5亿元,自2011年以来的复合增长率高达40%。
不辞山万重,花开幽谷中。说的既是一个科学家笃信核心技术创新才能改变世界,进而为语音技术搏上一切的执着;更是一个企业家在不停地试错与试对中,自己为自己制造出一个产业风口的理性。
学霸的选择
1990年,成绩优异的刘庆峰被推荐到清华大学汽车工程专业,但他却放弃了这一常人求之不得的机会,转而参加高考,最终以高出清华分数线40分之多的成绩,考取了中国科技大学电子工程系。即便如此,他还认为自己发挥失常,没考到状元。按照刘庆峰原本的人生规划,他应该跟他的很多师兄们一样,凭借优异的成绩考取全额奖学金远赴国外留学,然后留在国外从事研究,或是进入外企担任高管。然而,他的命运轨迹在大二那年被彻底改变了。
1992年,19岁的刘庆峰凭借出色的数理计算能力,被中科大从事语音技术研究的王仁华教授相中。时至今日,他仍然忘不了22年前,第一次走进语音实验室所感受到的震惊——站成一排的计算机已经可以初步合成简单的人声。“以前我学数学是为了考第一,但不知道它到底怎么用。进了这个实验室后,才发现数学可以用于数字信号处理。这对我是一个很大的触动。”由此,刘庆峰决定跟着王仁华教授留在语音实验室。从后来的历史看,这是一个改变了中国语音产业的决定。实际上,当时的中国语音产业一片混沌。虽然早有科研机构从事语音技术研究,但都是单兵作战小打小闹,迟迟未见成果,产业化更是遥不可及。而另一边,IBM、微软和摩托罗拉等国际巨头早已大兵压境,纷纷在中国成立语音研究机构,觊觎着中国未来的语音市场。
在这样的时局下,王仁华教授的这个语音实验室,就如同一颗生机勃勃的种子。而刘庆峰进入实验室后很快如鱼得水。“王老师跟很多教授不同,完全放手让年轻人去做,还给予很多支持。”一次,王仁华认为实验室里一个产自日本的语音分析工具效率太低,问刘庆峰能否用两个月时间试着提高一倍。谁知刘庆峰竟然仅花了一个月时间,将效率提高了整整10倍。他甚至还向王仁华建议,可以将其用于优化语音合成系统。开明的王仁华打破惯例,让年轻的刘庆峰牵头做一个语音合成系统。结果,刘庆峰不负众望,在当年的国家863计划成果比赛中,他开发的语音合成系统,不但保证了音质,还具备了优良的语音自然度,合成出来的语句近乎人声。这成了当年比赛中最为轰动的科研成果。然而,对于当时的刘庆峰来说,最大的成就感并非技术成果本身,而是将技术成果转化为实际应用。1996年暑假,刘庆峰帮助华为优化114电话咨询平台的语音,通过语音合成技术,他使得计算机报电话号码的语音,近乎于真人语音,这让华为在原有4万元研发经费的基础上追加了一万元的奖励,还请他飞赴深圳参加研讨。
这次跟华为的合作,为刘庆峰打开了一扇广阔的门——他不但获得了王仁华教授更大的支持,让他可以调配实验室的全部资源,还看到了语音产业的市场前景。他意识到,只有产业化才能真正推动语音技术的自主创新。事实上,跟很多领域的科研工作一样,当时的语音技术研究工作,依靠国家划拨的科研经费维持。像刘庆峰这样的科研工作者,一个月的工资仅仅500元,而一些进入外企工作的师兄弟,年薪则可以拿到十几万元。巨大的收入落差,造成了本土科研人才的大量流失。“只有产业化才有钱留住人才。”于是,刘庆峰鼓起勇气向王仁华教授提议,自己一边攻读博士,一边办公司创业,其中最核心的诉求是,设立股权机制。这其实是一个打破常规的想法。在国内科研界,老师与学生的关系,不但类似于老板跟员工,还更具有权威。哪有学生敢于向老师提出这样的要求。但王仁华教授则不一样,他立即爽快地答应了刘庆峰:“你不但该拿股份,而且还应该拿得比我还多。”
最亮的火把
老师无私的支持,彻底点燃了刘庆峰心中的火把。激动万分的他登高一呼,不但实验室里的师兄师弟们纷纷响应,而且中科大BBS八个版主中的六个都加盟过来,最终组成了18人的创业团队。这些人里,有当年中科大电子工程系的第一名胡郁;计算机系第一名、获得中科院自动化所保研机会的胡国平;以及中科大BBS黑客版版主,网络ID名为“绝地战警”的陈涛。这一帮学霸们有着一股浓浓的技术报国的情怀。当初,刘庆峰邀请陈涛加盟时,陈涛反过来挖刘庆峰:“有一家日本的投资公司给我投资办软件公司,你到我这里来吧。”刘庆峰回应说:“你给别人打工没意思,我们有自主知识产权,将来能做产业领导。”冲着这句话,桀骜不驯的“绝地战警”最终选择了加盟刘庆峰。
然而,情怀只能是情怀,产业化的路需要一步一个脚印地走出来。1998年的夏天异常炎热,十八个年轻人蜗居在租来的民房中,舍不得买空调,在闷热的空气中夜以继日地工作。“那时几乎天天吃盒饭,有时候饿了就啃个黄瓜充饥。”当时的刘庆峰本认为只有研发才算是创新,才是有意义的工作,而诸如品牌、营销甚至公司注册等工作纯属浪费时间。所以,他将大量运营工作交给了一家福建企业,自己则担任总工程师,负责产品研发。他的团队则相当于这个企业设在合肥的研发基地。可是,经过了大半年的磨合,他发现这完全是一个错误。在这家福建企业的主导下,刘庆峰的团队辛辛苦苦开发了不少产品,在一些展览会上也颇受好评,但在市场上却举步维艰。事实上,技术变成产品,产品推向市场,需要一个有计划的孵化过程,而这家福建企业却东一榔头西一棒子。“今天恨不得做个语音PDA,明天又做语音听写软件,后天又搞工商查询系统,没有一个做深做透的,搞得团队很累又看不到前景。”产品卖不出去,这家福建企业也陷入困境,开始拖欠刘庆峰团队的工资。无可奈何的兄弟们找到刘庆峰说:“这样干不行,要不你出来当CEO,要不我们就解散!”解散?!兄弟们的请愿,确实把刘庆峰吓了一大跳。组建团队之初,王仁华教授曾对他说:“庆峰啊,我认为这事儿能成,这么多优秀的年轻人能团结在一起,在科大还从来没有过。”好不容易聚集了这么多学霸,如果解散那就太可惜了。于是,刘庆峰硬着头皮对着兄弟们说:“行!我试一试,如果做不好,半年我就走人!”1999年,26岁的刘庆峰正式创立科大讯飞。命运很快眷顾了这群满腔热情的年轻人。科大讯飞成立当年,合肥市领导带着三家投资机构前来考察。听完刘庆峰介绍产业前景与团队实力后,市领导当场表态:“这些小伙子必须留在合肥。”随后,三家投资机构以“3060万元占股51%”的条件投资科大讯飞,而刘庆峰的团队仍然是最大的单个股东,这也是科大讯飞后来进行几轮融资的原则。
沉甸甸的3000多万元现金揣在手里,刘庆峰在团队内部发话:燃烧最亮的火把,要么率先燎原,要么率先熄灭。说到底,这是一种破釜沉舟勇往直前的坚决,只是这把火首先应该烧向哪里?其实,当时国内语音技术的发展瓶颈在于机制。语音技术是一个典型的综合学科,涉及数字信号处理、声学研究和实验语音学等诸多领域。而诸如中科大、清华、中科院和社科院等科研院校只是擅长于某一领域,互相之间不但从来没有合作,甚至为了一些国家项目和经费,争得头破血流。更为严峻的是,这些院校的大量人才被IBM和微软等国际巨头挖走,民族语音产业岌岌可危。不把各种力量拧成一股绳,就无法与国际巨头们抗衡。刘庆峰逐个拜访了这些科研院校,向他们表达了三层意思:第一,中文语音产业已经被外国人掐住了喉咙,必须联合起来;第二,科大讯飞向他们提供项目经费,比国家划拨的经费还要多;第三,各个机构专注于自己擅长的研究领域,科大讯飞负责产业化整合,同时给各个机构股权,实现成果共享。“这些老师们都有很强的民族情结,不能让外国人把中文语音做得比我们好,那多丢人。”拔高了说,是民族危机感,实际一点,也有利益方面的考虑。在刘庆峰的轮番劝说下,中科院声学所、社科院语言所和清华大学等科研院校,最终跟科大讯飞结成了紧密的合作关系,科大讯飞也由此完成了对于产业核心源头技术的资源整合。刘庆峰得以一跃而起,攀上了语音技术的峭壁。第一次看见高处风景的他,一度认为过不了两三年,科大讯飞的营收就能突破10亿元甚至百亿元。
风往何处去
站在整合核心源头技术的基础上,刘庆峰看哪里都是一望无际的草原,这种乐观主义精神虽然激励着团队,但却迎头撞上了后来的现实,带给刘庆峰极大的失落感与挫败感。科大讯飞成立之初,刘庆峰一度认为,语音技术迟早要面对大众,融入人们的日常生活中,所以应该开发面向大众消费市场的产品。于是一款名叫“畅言2000”的电脑软件随后问世。
这是一款能把语音自动转换成文字的软件,甚至还可以让用户通过语音控制电脑。一开始,“畅言2000”受到了很多人的喜爱,尤其是很多退休的老干部,他们对电脑的接受程度低,用键盘打字很慢。但很快刘庆峰悲哀地发现,这款产品根本走不动货。他后来总结这次失败:一是因为盗版猖獗,科大讯飞正版软件刚一面世,盗版已经铺天盖地;二是因为大部分用户是老年人,操作电脑的能力很差,时常因为电脑本身的硬件问题呼叫售后服务,这推高了科大讯飞的成本,跑两三次售后,卖软件的利润就没有了;三是因为团队都是技术出身,缺乏建渠道做推广的营销经验。一番试错之后,刘庆峰得出结论:科大讯飞暂不适合大众消费市场,只能转而主攻企业级用户。2000年,中国电信的168电话信息平台铺向全国。其原本是人工录音接听,很难应付海量和动态的信息,而科大讯飞的语音合成技术,正好可以解决这一问题。于是,刘庆峰找到合肥电信和上海电信168平台的负责人,对方听了他的介绍也很感兴趣,答应实验成功后再商量合作。这无疑给了刘庆峰一道曙光。如果真能跟电信达成合作,一个省会城市的单子就有上千万元,30多个省会城市就能上亿元,还别说更多的三四线城市。更令他激动不已的是,最终的实验效果非常理想。但是,就在刘庆峰志在必得时,对方却突然拒绝了合作。原因很简单:当时的科大讯飞只是十几个人的创业团队,注册资金才几百万元,对方出于稳妥,怎么敢把上千万元的单子交给科大讯飞,要合作也是跟华为这样的大企业合作。刘庆峰彻底傻眼了。原来电信这样的大企业,需要的并不是单点技术,而是系统集成能力和企业综合实力。这对于初创的科大讯飞来说,根本遥不可及。天下之大,但何以立足?为了能让科大讯飞活下来,刘庆峰只能退而求次,他转念一想:既然电信愿意找华为这样的大企业,那么何不干脆把技术嵌入到华为的系统平台上?随即他飞赴深圳,通过多次拜访,终于让华为答应在他们的系统平台上试用科大讯飞的语音技术。然而,问题随之而来,刘庆峰很快拿到了华为反馈的测试报告:系统兼容性不强、语音合成不自然、连续性差……
面对这份满是差评的报告,十几个年轻人集体沉默了,更迫在眉睫的是,华为只留给科大讯飞一周的时间解决问题,否则合作免谈。在10多年后的15年周年庆典上,科大讯飞轮值总裁吴晓如回忆起了当时这至关生死的艰难一战。“在随后的一个星期里,整个团队没有一个人离开过办公室。所有人不分白天黑夜地加班加点,几乎不眠不休,终于赶在华为给定的时间节点前解决了全部问题。当时,我走出办公室的时间大概是下午四点半,回到家便倒头就睡,一直睡到第二天的中午。”经此一役,科大讯飞不但获得了华为的高度评价和长期订单,更重要的是,在迂回曲折中终于找到了一种适合自己的商业模式,即把技术嵌入合作方的系统平台。至2000年底,刘庆峰拓展了包括华为、中兴和联想在内的50多个合作伙伴,这其中跟联想集团的合作,还为后来的第二轮融资埋下了伏笔。
华山一条路
从大众消费市场,到企业客户市场,再到技术授权市场,在一次次的商业模式调整中,刘庆峰从最初的乐观主义里彻底清醒过来——科大讯飞不可能在短短两三年内就做到上亿元的规模。更残酷的现实是,在核心源头技术的整合上投入了重金,却迟迟未能在市场上真正打开局面,这让科大讯飞的资金链几近断裂,最困难时公司账上只剩20万元。最亮的火把还未燎原,就要熄灭了。
整个2001年,刘庆峰都在一种莫大的痛苦中煎熬。在他此前乐观主义的鼓舞下,他的创业团队放弃出国留学的机会和唾手可得的高薪,拿着两三千元的月薪跟他玩命奋斗,股东们也投入真金白银并寄予厚望,大家为的就是一个指日可待的结果。然而,一些股东和同事试着问他:“庆峰,你不是说今年我们能上亿吗?怎么没做到?”这种有负于人的压力,时常让他夜不能寐。最终,经过了激烈的思想斗争后,他决定跟大家说实话:“我们不可能一步登天,只能脚踏实地。成功一定会来,但绝对不是现在。”这一残酷的现实,随即让团队军心动摇。有人质疑,语音产业到底能不能做大;有人提议,语音业务赚不了钱,不如改做网络游戏;还有人甚至说,做房地产来钱快。“我们当时就像迷失在大海里,我作为船长,必须要指明一个方向。”面对种种杂音,刘庆峰专门将团队拉到合肥巢湖边上开会,大家七嘴八舌地议论了一通后,他最终掷地有声地说了一句话:“如果不看好语音,请走人!”众人立即鸦雀无声。这次巢湖会议在科大讯飞创业史上的意义,如同红军长征时的遵义会议。从那一天起,科大讯飞明确了“语音是唯一方向”的战略,此后无人再有任何异议。
实际上,在市场上经历了几番摸爬滚打后,刘庆峰跟团队达成了一个共识:语音产业就是需要10年的时间,来进行技术积累。而枯燥的技术研究,如果不是发自内心的热爱,是很难坚持下去的。当语音产业开始爆发式增长时,竞争者们会发现,很难在短时间内达到科大讯飞的技术水平。自古华山一条路,但这条路要继续走,还需要战略投资者的支持。在一次全国青年大会上,刘庆峰找到了复星集团董事长郭广昌,两人发现,科大讯飞出自“科大系”的经历,跟一帮复旦学子创立复星的历史有着很多相似之处。郭广昌当即对科大讯飞表现出了浓厚的兴趣。而后,通过一些业界内的合作关系,刘庆峰还找来了联想投资和英特尔。自2000年12月到2002年3月,三家知名企业相继入股科大讯飞,为这一国内语音产业最亮的火把,注入了资本实力和产业资源。投资方在资金、资源和经验上的助推,将科大讯飞推向了产业化的快车道。而刘庆峰的团队也没有辜负股东们的期望。
2003年,刘庆峰大学时的同学,在华为已经能拿到百万年薪了,而他和创业团队的月薪仅有两三千元。一次,复星集团副董事长梁信军来参加董事会,惊讶地发现这帮人的工资竟然这么低,随即对刘庆峰说:“庆峰啊,你们还是多发点工资吧,别把自己搞得这么苦。”刘庆峰摆了摆手说:“我们还在用股东的钱,还在亏损,所以我们情愿少拿点。”正是这种自己强加给自己的饥饿感,迫使刘庆峰带领团队在语音产业化的荒原上不断觅食。比如在电信168和114呼叫中心的应用基础上,延伸进入旅游信息服务、工商税务查询等业务,以智能语音替代人工服务;又比如开发智能语音芯片,植入家用电器、车载系统和儿童玩具等终端设备;还比如以语音评测技术切入口语考试、语言教学等教育市场。由此,科大讯飞终于在2004年扭亏为盈,并从2005年至2007年保持了净利润130%的复合增长。2007年,科大讯飞营收达到2亿元,净利润达到5300多万元。次年科大讯飞成功登陆深交所,成为中国第一个由在校大学生创业的上市公司,也是中国语音产业唯一的上市公司。
草原与荒原
风的确来了,事实印证了刘庆峰当初在巢湖会议上的判断,科大讯飞站在了业界同行难以企及的高度上。而衡量这一高度的,不仅仅是上市公司骄人的业绩数据,还有高不可攀的技术峭壁。
在与产业化平行的另一条历史轴线上,科大讯飞逐步形成了以语音合成和语音识别为核心的技术体系。这一系列的技术突破,不但在国内屡获大奖并牵头制定中文语音技术标准,还连续8年在全球英文语音合成大赛中夺得第一,连续5年在美国国家标准技术研究院主办的语音识别大赛中夺得多项第一。然而,纵然身处资本市场和技术领先的高度上,但时代在变,草原与荒原也在更替变幻,刘庆峰仍然需要面对“试错与试对”的产业命题。毕竟,语音技术的应用范围实在太广。那么,何处是草原,何处是荒原?刘庆峰的思路是:“看哪些人群在哪些场景下,最需要语音交流。”比如,2008年刘庆峰瞄准了无线音乐市场。科大讯飞跟移动、电信和联通达成合作,通过拨打电话,用户可以通过说出歌手名、歌曲名甚至哼唱等方式,从数万首的歌曲库中快速搜索到歌曲,而用户通过这样的方式定制彩铃,科大讯飞就会有收入分成。全国50多家省级电信运营商,先后成为科大讯飞的合作伙伴,仅2010年一年,这项业务就贡献了7000万元的收入。草原一大片,荒原也有不少,刘庆峰的思路并非全都指向草原,但试错与试对也绝非完全对立。2009年,刘庆峰认为语音识别能够应用于会议记录,科大讯飞随即成立项目小组,研发相关技术与产品。然而,在一次次测试中,刘庆峰发现由于会议环境噪音较大,又有多人同时说话,现有的语音识别技术无法完整而准确地把语音转写成文本。无奈之下,他最终暂停了这个项目。但是,东边不亮西边亮。在这一研发过程中,刘庆峰观察到语音信息一旦数据化后,虽然不能转写成完整的文本,但其中一些关键词是可以被捕捉到的,这就给语音信息检索提供了基础。实际上,语音信息检索拥有庞大的市场需求。诸如银行、保险和电信行业,每天都要接听海量的客服电话,每家公司每天大约会产生几十万条电话录音,很难一个个去查听,以检测服务质量和洞悉用户需求。而语音信息检索正好可以解决这一难题,其通过搜索某些关键词,不但可以快速而全面地监测客服质量,还可以即时反映出客户更关心理财产品还是存款利率,更热衷于某个4G套餐的某项业务。由此形成的数据分析报告,则可以供给企业即时参考进而调整业务,这也正符合了时下大数据的浪潮。在曲曲折折的试错与试对中,刘庆峰渐渐觉得科大讯飞不可能通吃各个应用领域,尤其是迅速崛起的移动互联网,打开了语音技术面向广大终端用户的闸门,各种语音技术与各种终端形态,可以结合不同的市场需求,排列组合成无数种应用。
除此之外,更关键的是,独木不成林。语音交互说到底是一种行为习惯,要让用户从键盘输入的习惯切换到语音交互上,单凭科大讯飞一家难成大气候。如何才能让风吹得更大一些?2010年10月,科大讯飞在业界率先发布了“讯飞语音云”平台。这个集成了语音合成、语音搜索和语音听写等交互能力的云平台,不但可以成为语音数据库的重要来源,还让更多的草根创业者可以免费借此进行语音产品的研发和测试。这一战略布局看似开放了核心技术,但实则为科大讯飞的未来带来了不可估量的收益。一方面,讯飞语音云不仅扶持创业团队,还跟携程、新浪微博和58同城等大公司合作开发APP,在铺开语音交互功能的同时,还借船渡海般地获取了大量用户;另一方面,讯飞语音云通过跟大公司的收费合作直接获取收入,而将创业型公司扶持到一定规模后也会与其共享收益,由此产生源源不断的经济效益。
创造下一个风口
2004年,刘庆峰找到教育部普通话测试中心负责人,提出以语音技术替代人工进行普通话测试。这位负责人摇了摇头说:“你们做做研究可以,但这事儿太难了,还是放弃吧。”其实,在科大讯飞之前,已有一些科研机构打了这样的算盘,但由于技术标准实在太高,最终都知难而退。这位负责人也是出于好心,希望刘庆峰不要白费力气。但刘庆峰不依不饶地回答:“我们就要把自己放在火上烤,如果三年不成就五年,五年不成就十年。”刘庆峰的执着最终获得了这位负责人的支持,但当他把这一消息带回公司时,却遇到了极大的困难,研发团队觉得这一技术的难度确实太大。但刘庆峰并没有妥协。为了说服研发团队,他随即带着大家去全国各地考察普通话考试的情况。大家发现,庞大的考生群体给人工测试造成了极大的压力,一名老师往往要面对成百上千的考生,难免不会出现疏忽。庞大而固定的市场,与人工的天然缺陷,正好是语音技术改变世界的落脚点。科大讯飞的研发团队顿时觉得,这是一件非常有价值的事情。刘庆峰借机放下狠话:“横竖都要搞出来!”而这一决心不仅仅是放狠话,为了这个项目刘庆峰投入了上千万元的研发成本,以至于2008年上市时少拿了8000万元左右的融资。功夫不负有心人。2008年,科大讯飞的普通话测试技术顺利通过了教育部的测评,随后在全国普通话考试中全面铺开。而在刘庆峰的计划中,这只是打开教育产业的一个切口。
尽管团队内部有人提出,科大讯飞在教育领域并无资源,也不知道开发什么产品,但刘庆峰则坚持认为,教育是一个上百亿甚至上千亿元的大产业,语音产业跟语言教学的关联度极大,而科大讯飞脱胎于中科大的学院气质,也适合做教育产业。随后,他调整了内部组织架构,成立了教育产品事业部,以普通话测评技术为起点,开发了面向中小学普通话与英语教学甚至全学科教学的畅言智能教具,以及普通话和英语口语测试系统。这些产品正在逐渐改变传统的语言教学方式——其不仅能够用标准发音进行教学,还能为学生的口语发音打分,至今已在国内拥有7000多万的师生用户,还在新加坡94%的中小学校普及开来。2013年科大讯飞的教育产业收入增长超过100%,达到四五亿元。时至今日,拥有技术壁垒和产业规模的科大讯飞,已是当之无愧的业界霸主,其在国际市场上仅次于美国纽昂斯公司,而在国内市场上难逢对手。然而,高处不胜寒,变革的大风无时无刻不吹打着41岁的刘庆峰。
“现在,你对空调说,调到20度,空调会自动降到20度。但在未来,你说调到20度,空调会提醒你,调到26度会既节能又制冷,还不会让你着凉。”——这像极了科幻电影里的场景。从科幻到科技再到产业,15年至今,刘庆峰和他的学霸团队仍然在技术峭壁上不懈攀登,因为站得越高,听到的风才会越大。