文/王 刚
2017年,百度董事长兼CEO 李彦宏乘坐无人车开上五环,收到无人车历史上第一张罚单。4个月后,北京自动驾驶新规出台。这一幕非常具有戏剧性,但我们也看到百度成为AI 之路上的一个“狠角色”。如果说,从2000年的那个元旦开始,最初的10年,百度依靠着李彦宏的搜索引擎专利技术,在中国互联网版图上打下了一片江山;那么后10年,可谓是百度悄悄屯兵AI,逐渐让“行业气候”变化的10年,并且在语音、视觉、语言等领域提前占据最好的跑道。到今天,AI 经历过三起三落,成为显学,乃至催生“第四次工业革命”,势能强大,而百度则给了AI 落地足够多的场景,在产业智能中检验AI 的实用性,可谓是互相促进的典例。这些,都收录在百度官方晒出的2019年AI“成绩单”中。正如李彦宏所说:“数字经济在经历了PC的发明与普及、PC 互联网、移动互联网这3个阶段后,正在进化到以人工智能为核心驱动力的智能经济新阶段,智能经济将给全球经济带来新的活力,是拉动全球经济重新向上的核心引擎。”
有人曾在这个新时代来临之前,就喊出了“技术!技术!技术!”这样的口号。技术会改变所有生意的模式,改变着社会的历史进程。于是,技术由内向外、技术由底座到平台的升维、技术由表面进入核心地带,几乎成为所有商业领袖一致瞄准的“靶心”,谁能射中?大环境不太妙的2019年,AI 这支箭是否可以逆风而上?百度,在AI 上似乎给了一个很好的答案,铺陈到今天风起云涌的商业版图上一看,既新鲜到让你惊讶,又硬核到让你不得不服。百度CTO 王海峰说,2019年,百度探索了AI进入工业大生产的真实路径,推动AI 迈入自动化、标准化和模块化的新阶段,并与百度业务以及各行各业的生产实践深入结合,加速了产业智能化的进程。于是,我们试着回首这300多天百度AI 的成绩,发现了很多不偏不倚、满满十环的例子。比如:百度大脑的算法、算力取得突破,成为“软硬一体AI 大生产平台”;AI 进入百度核心业务,百度智能云承载了“云+AI”的野心;推动了AI 伦理建设等。2019年,中国人工智能专利申请量排名中,百度以5712件位列第一,并包揽了深度学习技术、语音识别、自然语言处理、智能驾驶等多个人工智能核心领域第一。在百度2019年举办的AI 开发者大会上,百度大脑全面升级为5.0,成为软硬件一体的AI 大生产平台。在算法突破和计算架构升级的基础上,百度大脑5.0进行算法、计算架构与应用场景的重构。
有哪些最顶尖的技术冒了出来?语音识别方面,百度提出流式多级的截断注意力模型 SMLTA,在国际上首次实现流式注意力建模超越整句注意力模型的性能,也是国际上首次实现在线语音识别大规模使用注意力模型。语音合成方面,针对风格迁移、音色模拟和情感拟人的三大挑战,百度推出语音合成技术Meitron,将声音中的音色、风格、情感等要素映射到不同的子空间里,在使用时,不同的要素任意组合,灵活控制合成语音的风格。“百雀灵计划”就是百度地图推出的全球首个地图语音定制功能。视觉技术方面,百度已经形成了包括图像、视频、AR/VR、重要垂类、软硬一体化五大方向的特色视觉技术矩阵。OCR、物体检测、视频理解、目标跟踪等业界领先的图像与视频技术多次在国内外顶级赛事中取得佳绩,例如在“CVPR 2019”就取得了10项冠军,并已在机械制造、金融、医疗、教育等领域得到了广泛的应用。NLP(自然语言处理)方面,百度打造了知识增强语义理解框架ERNIE,通过建模海量数据中的实体、概念等先验知识,学习真实世界的语义关系。融合知识的语义建模大幅增强模型的语义表示能力,在共计16个中英文任务上超越BERT、XLNET,取得SOTA 效果。2019年12月,ERNIE 在自然语言处理领域权威数据集GLUE 中荣登榜首。
据了解,基于百度飞桨研发的AI 控制系统,百度在建的云计算中心将拥有超大型神经网络、超大规模高性能计算集群,设计年均PUE1.15,基础设施能耗降低70%,每个可用区每年节电超过2亿度,相当于10万户居民一年的用电量。作为百度AI to B 的重要承载者和输出者,百度智能云基于百度自主研发的中国首款云端全功能AI 芯片“昆仑”的云服务器正式上线。这个云服务器在150瓦功耗下能带来260万亿次定数的AI 运算,并且提供一套图编译框架XTCL,在支持百度飞桨等主流深度学习框架上表现优异。在国内云厂商中,百度智能云单季度营收突破10亿用时最短,稳居中国公有云市场前列,并在互联网、金融、智能城市、工业制造等行业已经拥有标杆性落地案例。此外,2019年7月,专为远场语音交互打造的百度鸿鹄芯片流片量产。鸿鹄芯片采用双核HiFi4架构,2.8M 大内存,台积电 40nm 工艺,在此硬件规格上,100mW 左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力,为车载语音交互以及智能家居等场景带来不少想象力。
AI 技术之于百度,是边界扩充的利器,也是其完整生态里最核心的枢纽。2019年,小度助手5.0的对话能力迎来了重大技术革新——全双工免唤醒能力,实现了“一次唤醒,多轮交互”免唤醒词连续对话。在7月的百度AI 开发者大会上,李彦宏亲自做了演示。2019年,百度合成虚拟形象技术结合多模态识别与理解、面部、肢体和嘴型生成、GAN、TTS 等技术,实现了业界首个可以量产视频的真人形象虚拟主播。此外,浦发银行还与百度合作打造了业内首个“金融数字人”,拥有颜值、情感和专业的银行知识。2019年,利用百度3D 视觉技术,机器人可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,机械臂可以对工作空间进行碰撞检测,避开障碍物。机器人更接近于人了。在CVPR 2019上,百度Apollo 公开了国内唯一的纯视觉L4级自动驾驶解决方案——百度Apollo Lite,能够支持对10路摄像头、200帧/秒数据量的并行处理,单视觉链路最高丢帧率能够控制在5‰以下,实现全方位360°实时环境感知,前向障碍物的稳定检测视距达到240米。截至目前,百度L4级别自动驾驶城市道路测试里程已经突破300万公里,已在23个城市进行测试,智能汽车专利1237项,位列全国第一。此外,百度自动驾驶路测牌照总数达到150张,占中国全部获批自动驾驶路测牌照一半以上。当然,百度搜索、百度地图、百度输入法、百度智能小程序都是AI 加持的不同场景。
令百度骄傲的几个数据是:自2016年以来,百度至今已经开放了228项领先AI 能力,开发者数量超过150万,日均调用量突破1万亿次,语音、人脸、NLP、OCR 调用量中国第一。另外,百度的代表作“飞桨”在2019年彻底火了。据IDC 报告显示,百度飞桨与谷歌、Facebook 名列前三,领衔中国深度学习平台市场,也是市场份额前五名中唯一的国货。据了解,从2012年起,百度就开始研究和应用深度学习,后来经过开源,飞桨平台才在满足开发者和产业界越来越复杂的需求方面发挥重要作用。目前,百度AI 落地最领先的Apollo 自动驾驶,也有很多开源项目。截至目前,百度Apollo 平台已经汇聚了全球177家生态合作伙伴。在全球,有97个国家超过3.6万名开发者使用Apollo 开源代码,开源代码数量超过56万,Apollo 自动驾驶平台已成为全球最强大、最开放、最活跃的自动驾驶平台。过去一年中,小度技能开放平台上的技能开发者数量已经超过3.7万人,包含了游戏、效率工具、网络电台、直播、儿童教育、智能家居等3500多种技能支持。到今天,小度助手可以控制的IoT 智能家居设备已经超过了7000万。除此之外,百度宣布将百度智能边缘计算框架BAETYL 捐赠给社区,BAETYL 成为中国首个开源的边缘计算框架,还宣布将国人自研的底层区块链技术XuperChain 正式开源。
在强调科技伦理、科技向善的2019年,我们也看到AI 已经走到了最大众化的层面。在“百度AI 寻人”平台,用户发起照片比对接近40万次,9000多个走失者与家庭重新团聚。百度APP 全面上线“百度AI 垃圾分类”智能小程序,基于百度AI 视觉和语音能力,通过语音搜索或识图搜索,就可以帮助用户方便快捷地对垃圾进行分类。此外,AI 手语翻译、AI 台风路径查询、濒危土家语保护、AI 改造视障者按摩院都是一个个接地气的技术产品,最终将完全融入社会整体的脉络之中。这依然是一个技术主导的世界,我们追索,我们畅想,并期冀用科技让复杂的世界更简单。这也是一个技术转型的大时代,时代丛林里的飞禽走兽、花草植被都在迎接新的太阳。而AI,没有身体,没有声音,没有相貌,却无处不在,以AI 技术为核心驱动力的第四次工业革命的大幕正在拉开。