陈义欢
百度人工智能技术不仅仅在图像识别、语音识别、自然语言理解方面有非常大的推动作用,另外一个很大的推动作用实际上是百度Apollo无人车。无人车是看得见的,看不见的则是百度对技术突破的不懈追求。
尽管4个月前,百度Apollo Robotaxi因为长沙民众接受度不高而停止,深秋十月,却在北京街头引发追捧。
百度不懈追求技术突破20年,至此总算有了点回响。
突破“卡脖子”技术需坚守信仰
2016年,李彦宏就说过,过去十几年来,百度的技术一直藏在后台。他的语义是指百度在云计算、大数据和人工智能领域有深厚的技术积累,即百度有人工智能技术的创新,有大规模处理数据的能力,有非常精准的用户画像能力,有非常好的定位能力。实际上,百度在开放云方面的布局始于2014年,开放推出包含IaaS、PaaS、SaaS的完整云体系,并相继推出13款行业应用产品。不过,李彦宏认为,百度的云计算发展从最初做搜索就已经开始了。这么说,意味着百度一直在寻找搜索之外的突破口。如果说,2016年“云计算是百度的战略,人工智能是云计算的未来”,那么这个未来已经初见曙光。目前,人工智能已成为百度实现技术突破的关键。李彦宏认为,人工智能作为能容纳百川的 “大海”,将在三个层面带来重大的变革和影响。首先是产业智能化,会给工业生產领域带来创新和效率升级;其次是人机交互智能化,人和设备的交互会越来越接近自然,浑然一体;第三是基础设施的智能化。
在产业智能化层面,随着智能技术的应用,AI 将彻底改变我们的生产方式,生产中遇到的难题将在代码中找到 “新解法”,推动产业智能化的进程。以智能交通领域为例,百度 Apollo 推出的智能交通解决方案 “ACE 交通引擎”已经在北京、长沙、保定等十余个城市落地。李彦宏表示,要让城市拥有 “汽车自由”。他预测,随着 AI 技术的进步,智能交通体系将逐步完善,未来五年内,中国一线城市将不再需要限购限行;十年之内,可以基本消灭交通拥堵问题。
关于人机交互智能化,李彦宏认为,智能化的人机交互正从 “无处不在”到 “浑然一体”。在智能经济时代,智能终端会远远超越手机的范围,包括智能音箱、各种可穿戴设备、无处不在的智能传感器等,应用与服务的形态也会发生与之相应的变化,人们将会以更自然的方式和机器、工具进行交流。
在基础设施智能化层面,李彦宏表示,推动技术开源开放,有利于实现社会经济发展的 “乐高模式”。通过模块化的开源开放的技术能力,不同的开发者和企业获得了人工智能技术的 “乐高模块”,并在不同领域中搭建出新的经济推动力,为社会经济做出更大贡献。
但是,作为人工智能技术基础的芯片和操作系统仍是被“卡脖子”的技术。李彦宏认为,要想实现“卡脖子”技术的突破,需要耐得住寂寞,守得住信仰。
技术突破与创新之路
1996年,还身在华尔街工作的李彦宏曾获得超链分析的技术专利,这项技术后来被引入搜索引擎。正是凭借这一信息技术与互联网应用的结合,李彦宏在21世纪初突破了新一代搜索引擎的关键技术,并创造了百度。
可以说,百度的诞生就起源于技术突破与创新。
从2000年1月百度成立到今年是整整20年,这20年,百度从未停止技术突破的脚步。
2000年6月,百度首次为门户网站提供搜索技术服务,随后又提供中文网页信息检索服务。此后不到两年时间,百度就占据了全国80%的网站搜索技术服务市场。
不久之后,百度从提供搜索技术服务,转型自行经营搜索引擎。商业模式虽然有变,但不变的是对技术的追求。
例证就是2002年的百度“闪电计划”,在9个月内,将日访问页面提升10倍,页面反应速率与谷歌一样快,内容更新频率全面超越谷歌;2005年,百度即开启了搜索引擎与语义理解、语言分析等智能技术的结合;2009年,百度扛起技术创新大旗,在智能手机还没有兴起时,李彦宏即首次提出了“框计算”的概念。用户只要在“百度搜索框”中输入关键词,就可以得到解决办法或详细内容,而不再是所关联的网页。即使从今天去看,“框计算”也算得上是前瞻性技术。因为,从本质上来看,“框计算”就是AI中非常关键的需求识别与知识图谱。也就是从这个时候起,百度将其技术突破的核心关注在了AI。百度CTO王海峰,当年作为AI科学家加入百度即缘于此。
那个时候,中国互联网领域的专业人士对AI几无讨论,更别说关注了。
从另一个角度来看,王海峰加盟百度,开创了科学家将技术注入互联网公司的先河。而如今,科学家的多寡已经具有了“指标”意义。仅仅10年间,高科技公司就由“英雄时代”彻底转变到“技术时代”。技术迭代已完全成为任何一家互联网公司生存发展,占据先机的不二法门。
百度在布局AI技术的同时,在2013年率先成立了深度学习研究院(IDL)。此时,中国互联网产业对于“深度学习”的了解几乎仍是一片空白。在IDL成立后,百度大数据实验室BDL、硅谷人工智能实验室SVAIL等相继成立,它们共同组成了开展前瞻性技术探索的百度研究院。
“飞桨”开源深度学习平台的开发就是百度研究院的技术突破成果。针对当时主流欧美开发框架仅支持单一GPU,无法进行大规模数据处理的问题,百度决定自主研发,在经过一个相当长时间的内部应用后,“飞桨”在2016年正式开源。这一技术创新让百度成为继谷歌、Facebook、IBM之后,全球第四家、中国第一家开源深度学习开发框架的科技公司,也让中国在新的关键领域迅速跟上了世界科技潮流。
基于“飞桨”的高成长性,2018年7月,百度成立了深度学习技术平台部。此后,“飞桨”的升级加速,成为源于产业实践的开源深度学习平台,集深度学习核心框架、工具组件和服务平台为一体的技术先进、功能完备的开源深度学习平台,被中国企业广泛使用。目前,“飞桨”已走向标准化、自动化和模块化发展阶段,持续解决产业开发者复杂多样的AI开发需求,并且具备开发便捷的产业级深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、开源开放覆盖多领域的产业级模型库四大全球领先的核心技术。
“飞桨”被誉为AI时代的操作系统,而百度大脑被誉为AI时代的技术集大成者。
秉承百度技术开放的初心,百度大脑2.0在2017年公开发布,积累数年之久的AI核心技术和AI平台对外开放。开放包含了基础层、感知层、认知层和平台层在内的完整AI技术体系,以及语音、图像、视频、增强现实、自然语音处理等60多项AI核心能力。
2018年百度大腦升级至3.0,所开放的核心AI技术达到110多项,形成了从芯片到深度学习框架、平台、生态的AI全栈技术布局。尤其“多模态深度语义理解”的技术突破,让百度大脑走向了世界AI产业的技术最前沿。
2019年,百度大脑完成跨越式升级,已是5.0版本。在百度大脑5.0版本里,语音、视觉、语言和知识等核心算法都得到了再次突破。这一年绝大多数互联网公司开始聚焦技术中台,而百度的技术平台化已经是几年前的往事。不要小瞧这几年的时间,以现在科技的发展速度,几个月就足以造就一项领先技术。更具深远意义的是,百度大脑的开放,使得AI技术企业,无须从头再来,就可以站在百度的肩膀上进行技术创新和应用。
截至2019年,百度大脑已开放了228项领先AI能力,开发者数量超过150万,日均调用量突破1万亿次,语音、人脸、NLP、OCR调用量中国第一,是业内最全面、最领先、服务规模最大的AI开放平台。百度大脑集深度学习框架、场景化AI能力、定制化训练平台到软硬一体模组和解决方案等于一体,可以为多样性的AI需要提供技术支撑。
截至2020年5月,百度全球AI专利申请量已超过1万件,其中中国专利7000多件,位列中国第一,并在语音识别、自然语言处理、知识图谱和自动驾驶四个细分领域排名国内第一,展示出AI新基建领军者深厚的技术底蕴和蓬勃的创新能力。
未来30~50年是人工智能时代
在李彦宏看来,过去20年是互联网时代,未来30到50年将进入人工智能时代。
对于将互联网和人工智能混为一谈,甚至认为人工智能只是互联网一个分支的看法,李彦宏完全不认同,他坚定地认为这是完全不同的两个时代。
理由是,人工智能技术有可能脱离网络而独立存在。他以无人驾驶为例,一辆车可能驶向没有网络的环境,即使在这种环境下仍能自动驾驶所能依靠的就是人工智能。也只有这样的人工智能才是真正的人工智能,这其中的技术突破想一想都是激荡人心的。
为此,李彦宏笃定,AI思维必将取代互联网思维。
人工智能时代不仅仅会深刻地改变、影响消费领域,同样会深刻彻底地改变产业、改变To B领域,它对于人类社会的影响比互联网对人类社会的影响要更加深远。
其实,互联网涉足To B也不是最近一两年才开始的事情,更早可以追溯到上世纪90年代末期,那时的电子商务,有To C的,也有To B的。但是,如果要把互联网理念搬到各个To B的垂直领域,经常会发现力不从心。原来的用户产品方式,到了一个垂直行业就无所适从,许多东西在太多互联网玩家哪里搞不清,也理解不了。
但随着人工智能时代的到来,那些搞不清、辨不明的东西,不仅在互联网玩家那里,即使在从事传统行业的人那里,就有了许多共同语言。比如,被认为是传统产业的炼钢厂,使用人工智能技术可以提升生产效率,可以在生产流程再造中的很多环节发挥作用,但互联网给一个IP地址,带宽再宽却没有多大直接作用。
所以在人工智能时代,真正要想改变产业、改变各行各业的,会是非常不一样的东西,它与我们过去熟悉的互联网极为不同,尽管目前难以完全描摹清楚。可以确定的是,我们需要不断地适应这个全新的时代。
如果把互联网比喻为神经网络,作为系统工程,大脑、小脑和末梢神经都不能缺少。李彦宏形容互联网是开胃菜,人工智能则是主菜。因此,人工智能的影响力无疑要更大一些。
进入全新的人工智能时代,一定要有与之相适应的新思维、新战略。一方面从移动的角度来讲,仍有很多创新的空间,虽然现在它的影响力已经非常巨大了,未来仍有增长。但更重要的是,人工智能会带来更多新的机会。
对于百度来说,一方面继续加强百度大脑这一基础平台建设,把人工智能的一些基础设施、基础能力,如深度学习的框架,以及一些常用的应用技术,如语音识别技术、图像识别技术、自然语言理解技术等,呈现出来。一方面继续开放,可以让大家自由使用。
在应用层面有两个场景,一个是智能家庭,一个是智能交通,其中当然包括无人驾驶。在今天,人工智能在智能家庭上已经发展到了一个节点,就是人机交互模式可以从原来的鼠标、键盘转向触摸屏,这是PC时代向移动互联网时代的转换,人工智能时代就是从触摸屏转换到语音对话。
在过去,如果你说什么,计算机是听不懂的,无法做到语音交互。到今天,大家如果使用过智能音箱,就知道每过一两个礼拜,它都会变得比之前更聪明一些。你说的话过去它听不懂,经过深度学习,现在它就能慢慢听懂了。当然,同一语言的交互是极为容易的,但PC时代成长起来的人们,却觉得键盘是最自然的人机交互方式。等到智能手机出现之后,他们竟觉得触摸屏太难用,手指头根本就点不准某一个链接,很麻烦。可是从三岁开始就学会了用智能手机的孩子,使用触摸屏,使用iPad,又觉得用手指确实是比鼠标、键盘更自然的人机交互的方式。
如果用语音、用自然语言,与用触摸屏相比,语言就是更加自然自如的一种人机交互方式。在未来家庭里,人们与各种各样的设备交互,应该是用自然语言,这是人工智能时代的鲜明特点。
就智能交通来说,无人驾驶是很多人的梦想,也是一个非常大的市场,有很多公司,包括OEM的厂商,以及大量创业公司都在做无人驾驶的相关技术。与此同时,基础设施,如公路也要做相应的改造。路面怎样改造,需要很多智能技术深入进去,可以大幅度提升人们的出行效率。即使不能完全自动驾驶,起码可以使得交通拥堵的状况得以大幅改善。
以上两个方向,都是百度从应用角度一直在做的,并一直在做降低进入门槛的工作。
在李彦宏看来,不管你的技术做得多复杂,你怎么能够把这个门槛降得足够低,让别人一上手就能使用,是技术突破的应有之意。如果说某项技术什么都不用学,就可以很方便地使用,那才是对社会做出了贡献。如果是束之高阁,实际上并没有什么意义。
且不说,智能搜索时时在你身边,2020年突如其来的新冠肺炎疫情,让我们看到,AI、大数据、云计算等新技术设备,已经成为疫情防控中冲在前线的新武器,如AI助力新冠病毒研究,百度地图时空大数据支持疫情防控决策,百度AI测温系统解决佩戴口罩及帽子造成的面部识别特征较少的问题,AI问诊减少交叉感染,疫情防控机器人集测温防控、医护助理、无接触配送和消毒巡检为一体。以上都是百度技术便利化使用的最新突破。
此外,百度大脑、百度翻译、百度智能云、百度 Apollo、百度飞桨多方位免费开放。
由此,百度AI新基建技术飞速发展,开发生态加速繁荣。
今年6月11日,百度AI新基建版图亮相。百度正在依托包括百度大脑、飞桨、智能云、芯片、数据中心等在内的新型AI 技术基础设施,推动智能交通、智慧城市、智慧金融、智慧能源、智慧医疗、工业互联网和智能制造等领域实现产业智能化升级。