孟醒
一个创建刚刚三年的公司,不仅获得了大量投资,而且引来世界一流公司的合作。其开发的无人驾驶处理器芯片更为领先世界的美国公司所用,它的启示在于找到了创新领域的突破点,并推出领先的产品。
地平线发展航路
2015 正式成立于北京,同期成立深圳子公司
2015 获晨兴资本、高瓴资本、红杉资本、金沙江创投、 线性资本、创新工场和真格基金投资
2016 ADAS原型系统亮相智车优行发布会
2017 联合英特尔于CES联合发布ADAS系统
2017 登榜2017年世界经济论坛“技术先锋”成为中国唯 一当选企业
2018 地平线智能驾驶方案、智能摄像头方案全面亮相 2018CES
2018 地平线自动驾驶计算平台Matrix及征程2.0架构亮 相北京车展
北京地平线机器人科技有限公司成立于2015年6月8日。仅仅三个月之后,即当年9月,地平线就完成了首轮融资。2016年更获得风险投资家Yuri Milner的投资。
之所以有如此成绩,其创办人余凯曾说,地平线创办之前已有一些根基。余凯是百度深度学习研究院的创立者,成功地以FPGA打造深度神经网络硬件,并领导语音识别、图像搜索、百度大脑、百度无人驾驶等项目建设。
几位联合创始人都颇具实力。地平线软件副总裁杨铭博士,是Facebook人工智能研究院的创始成员之一,曾主持DeepFace项目;地平线算法副总裁黄畅博士,曾担任百度主任架构师,是计算机视觉、机器学习、模式识别和信息检索等方面的算法研发专家;地平线硬件副总裁方懿女士,曾任诺基亚大中华区研发副总裁,并带领团队推出诺基亚智能手机Lumia520。
我刊上一期的“创业故事”写的是“寒武纪”,本期所写为“地平线”,之后可能会再写到“深鉴”。将这几家芯片创业公司进行比较,会是很有意义也很有趣味的。从背景来说,“寒武纪”源自中科院计算所,相同背景者有联想和龙芯。公司成立前已基本成型,从社会上招聘了一些人来做产品。深鉴是清华电子+斯坦福的学术背景,股东基本为清华系。“寒武纪”与“深鉴”都是将科技转化为生产力的典型。与上述二者不同,“地平线”不是出自研究所与高校,而是从百度挪移出来的。但“地平线”不是只做芯片,它还有一个目标:“嵌入式人工智能”解决方案,将算法与芯片结合用在端上。从机器学习链条来说,“寒武纪”选取的是最通用的方向,涵盖所有机器学习的训练和应用;“地平线”选择的是另一端,即最专用的方向,聚焦在算法固化的ASIC芯片;而“深鉴”则是在两者的中间选了一个点,专做深度学习的应用处理器。
目标:AI制高点
今年5月30日,在美国加州举办的Code大会上,“互联网女皇”玛丽·米克尔发布了《2018年度互联网趋势报告》。该报告在谈到人工智能赋能传统零售行业时,举了“地平线”对百丽(BELLE)进行线下改造的例子。BELLE应用地平线芯片对收集到的用户数据进行分析,提升了生产效率,完善了用户定制化场景等。
以上实例,只是地平线AI芯片的一个方向。地平线的目标是AI制高点——AI芯片。在余凯看来,在AI芯片领域,中国的创业团队并不落后:“AI芯片由场景和算法驱动,需要对场景、算法、芯片设计都有深入的理解、整合、优化;目前在AI领域,中国和世界处在同一水平线上,中国公司在开发AI应用的时候,应该尽量不去依赖别人的算法和处理器,进而让中国AI产业赢得最终的竞争。”余凯的话是在总结中国AI领域现状的同时,也表达“地平线”的进取心。
而雄心必须落实到实际应用。地平线的应用主要在无人驾驶和智能摄像头两个领域。在2017年底,地平线推出了首款两个版本的嵌入式人工智能芯片。一个是征程(Journey)1.0处理器,应用于智能驾驶;一个是旭日(Sunrise)1.0处理器,应用于智能摄像头。
征程1.0可同时对行人、机动车、非机动车、车道线、交通标志牌、红绿灯等12类目标进行精准的实时监测与识别,同时满足车辆多种行驶环境的要求以及不同环境下的视觉感知需求;旭日1.0处理器则能够在本地进行大规模人脸抓拍与识别、视频结构化处理等,可广泛用于商业、安防等多场景。
两个1.0版本是完全由地平线自主研发的AI芯片,它所采用的是地平线第一代BPU架构,其性能全球领先:可实时处理1080p 30(全高清每秒30帧)视频,每帧中可同时对200个目标进行检测、跟踪、识别,典型功耗1.5W,每帧延时小于30ms。
不僅如此,地平线还同步发布了针对中国实际的智能驾驶、智能城市和智能商业三大应用场景的AI解决方案。
在今年4月的北京车展上,地平线发布征程2.0处理器架构,以及高级别自动驾驶计算平台Matrix 1.0。
AI解决方案重在产业化。
智能驾驶解决方案对驾驶场景中的目标进行精确定位,形成自动驾驶大脑,实现车道偏离、车辆及行人碰撞预警等高级辅助驾驶(ADAS)功能。在地平线搭建的模拟交通场景里,对行人检测的精准度可以达到100%。据说,在实际道路上,基于征程1.0的ADAS对车辆、行人、车道线、交通标志的检测准确率已大于99%。
智能城市解决方案可进行高性能、低功耗的人脸抓拍、识别与相关属性分析、视频结构化解析,可广泛运用于车站、学校、商业、楼宇等安防及泛安防领域。基于旭日1.0处理器的摄像头,可以从几百人中准确抓取并识别特定人物,且能够同时抓拍百人以上。
智能商业解决方案以顾客为中心进行线下商业运营数据的结构化,实现客流分析、人员ID管理、客户与商品分析等,更好地促进商业营销,提升商业运营效率,增强消费者的购物体验。通过摄像头可以实时识别顾客身份、兴趣喜好和在商店内的行动轨迹。
三套解决方案需要打造多家相关合作方的生态圈。生态圈建设基于嵌入式AI芯片和相应解决方案,最终解决AI在更多产业领域的实际应用。
令人振奋的是,世界上最领先的美国自动驾驶领域的公司,实现四级自动驾驶所使用的处理器,不是美国产的,而是地平线的处理器。这在中兴被制裁及中美贸易战的大背景下,无疑具有鼓舞作用。
由此,地平线的中期目标值得期待:到2025年,实现3000万辆汽车搭载地平线自动驾驶BPU(Brain Processor Unit),自动驾驶“中国芯”时代将会来临。
在余凯看来,比造芯片更难的,是围绕芯片搭建软件生态。在PC时代与移动互联网时代,Wintel联盟与ARM+Android联盟已经相继搭建起了一个统治性的软硬件生态,座次已定。在此情形下,中国半导体的突破点,只能是一个新领域,而AI芯片就是其中的最大机会。
路径:嵌入式人工智能
“嵌入式人工智能”是与当前通行的互联网连接人工智能相对而言的。与通过互联网和数据中心进行数据计算来实现人工智能不同, “嵌入式人工智能”則是在工作现场实时搭建一个环境感知、人机交互与决策控制的人工智能平台。所要解决的是目前存在于互联网人工智能中的决策延迟问题。余凯曾就嵌入式人工智能在无人驾驶上的应用举例说,当孩子横穿马路,如果自动驾驶系统感知到后,需要把信号传送到云端再做决策,已经比现场计算出现极短的延迟,一旦遇到实时网络不稳定的情况,后果将不可设想。起码在交通领域,嵌入式人工智能提供的独立解决方案,具有安全性方面的优势。
地平线在嵌入式人工智能上的规划是:提供不断升级的“处理器+算法”的嵌入式人工智能解决方案,包含算法、软件、芯片整体优化打包。同时搭配深度学习处理器(BPU)IP。因为人工智能必须有计算资源做基础,深度学习在对硬件性能提出更高要求的同时,算法优化也极为关键。也就是说软硬件的优化匹配才能得到性能提升,并非单纯的软硬件配置高,就会自动有出色的性能。从手机性能上可以很轻松地体会到这一点。
地平线嵌入式人工智能一直在快速迭代中。地平线第一代嵌入式人工智能处理器架构IP为高斯架构,第二代为伯努利架构,第三代为贝叶斯架构。不同代际架构对应不同的自动驾驶分级,提供不断升级的解决方案。去年1月,地平线联合英特尔推出的ADAS系统,基于高斯架构进行研发。同时,地平线自建的嵌入式人工智能处理器架构IP平台“雨果1.0”,也是基于高斯架构的。 同样,雨果平台也会回应自动驾驶分级进行迭代更新。最初的侧重点在感知认知,随后走向三维建模功能,未来会完成自主的强大决策能力。同时,处理器架构也会循着这样的轨迹前进,由深度神经处理居于主导地位,升级到自主决策做主导,也就是从高斯架构,到伯努利架构,再到贝叶斯架构。
与三个架构相适应,其技术路线基本可分为感知、建模、路径规划三个步骤。
从感知来说,地平线研发的算法具有特异性,即单网络多输出特性,只要输入单一数据源,就可以在同一个网络中获得不同的输出。比如,输入一张包含多个要素特征的实时图象,只要通过神经网络架构计算,就能发出车道线、车辆和行人等分类信息。这一点在以前的算法和神经网络中是难以做到的。也就是说,在传统计算机视觉中,识别车辆的算法却无法识别行人。因此,单网络多输出的优势就是资源利用率高,运算速度大幅提升,协同处理能力增强。
从建模上说,自动驾驶汽车所使用的摄像头、激光雷达、毫米波雷达等,配合探知车辆周围的环境。它们同时会采集到相同的信息,也会按照不同的分工采到独有的信息。比如,红绿灯信息就基本归于摄像头。
地平线嵌入式人工智能将多个传感器的信息融合进行环境建模,可以定义不同类型数据的接口,如行驶速度、车辆距离、信号灯状态等。摄像头获得的4类数据、激光雷达取得的4类数据以及毫米波雷达捕获的3类数据,通过传感器输入对应信息,在信息筛选后做出统一决策。
从决策和路径规划方面来说,地平线嵌入式人工智能就是要把信息“黑箱”透明化。所谓“黑箱”,是指深度学习过程中端到端直接输出了结果。中间没有了人工介入,这个过程就看不到了,因此被称为“黑箱”。具体到自动驾驶上,如果应用了深度学习算法的车辆发生了事故,查找原因就会出现困难,安全隐患不易排除。
为了解决这个问题,地平线嵌入式人工智能就把信息“黑箱”透明化。贝叶斯架构将神经网络布设到各个节点上,清晰显示中间过程与结果,随时可以进行有针对性地调整,使问题可追溯并解决。
对于未来,根据地平线自动驾驶平台的规划,雨果1.0是面向自动驾驶L2的技术,预计会与车企和Tier 1在2019年左右量产。雨果2.0是面向限定场景下自动驾驶L4的技术,而雨果3.0则是完全面向自动驾驶L4的技术。
布局:智慧城市
目前,地平线智慧城市的落地场景包括了机场、车站、智慧园区、酒店、旅游景点、社区、智能交通、边检等八大场景。每一个场景,地平线都推出了示范应用案例。
安防是多场景应用的重点方向。这样的选择,很大程度上是市场规模决定的,而不是盈利压力所致。从市场规模来看,2017年的安防产业产值已过6000亿元,地平线在AI上的特长大有用武之地。比如,城市里布置的数量庞大的摄像头,所积聚的数据不可能仅靠后台服务器来处理,由此产生了对大带宽以及强计算力服务器的需求。仅以公安系统为例,大约有超过半数的公安系统客户对地平线前端AI处理感兴趣。这为地平线的解决方案落地提供了巨大的机会。当然,对地平线前端AI感兴趣的不只是公安系统,还有大型国有企业,在园区及办公区智能管理上有相关需求。
基于旭日1.0芯片打造的智能摄像头,能以每秒30帧的速度实时处理1080P的视频,在5万人脸数量级的数据库中可进行快速比对。那么,基于旭日2.0芯片的智能摄像头的性能将大幅度提高,其计算力将提升4~8倍。
这其中系统的匹配仍存在待解决的问题。地平线AI系统与各行业既有的系统如何融合,不仅是地平线的问题,而且是整个业界的问题,目前还没有标准答案。没有答案并没有让地平线停下脚步,关键在于搭建出一个合理的架构,以最小的代价发挥地平线的既有能力,与已有管理系统相融合,并在不断迭代升级。
对于智慧城市布局,地平线明确将自己定位在AI图像识别核心解决方案的提供者,包括硬件(主要是芯片与搭载地平线芯片的下游硬件产品)、算法、开发工具以及部分云服务。
地平线智慧城市布局,并不提供上下游开发与运营一条龙服务,而是更加聚焦于技术。对于下游客户,地平线会提供封装算法的智能摄像头硬件,但仍需要将数据存储、系统运营等交给专业公司去做。用流行的说法,地平线所做的就是“赋能”,将AI芯片、算法打包为一个模块,并将智能识别能力赋予运营系统。地平线的工作方式是与产业链中终端客户合作,提供整套智能识别的解决方案,匹配与运营交给别人去解决。当然,智慧城市布局的落地仍然是一个长期的过程。
目前,地平线与各方合作伙伴打造的智慧城市示范应用,发挥了两个作用,一是展示并验证了地平线智慧城市解决方案的强大能力,二是以实际案例直观告诉客户,让客户易于接受创新的解决方案,从而形成良性的智慧城市生态。
对于智慧城市中的智能交通,地平线有一个“五道口计划”讨论群,余凯将之类比于“曼哈顿计划”。五道口特指位于清华大学东南角的一个路口。这里的交通状况极为复杂,有行人,有各种车辆,包括火车。且多条道路交叉,在一平方公里区域内,有三处交叉路口。什么时候自动驾驶车辆能够安全穿越五道口的话,无人驾驶就可以说不仅在中国成功了,而且是在全世界成功了。同时,因为地平线公司里有很多清华毕业生,所以地平线内部的自动驾驶讨论群就顺理成章地被命名为“五道口计划”。
地平线的创业基因与未来都可以在这里找到发端。
地平线永远在前方,创业者不会停下脚步。也难怪余凯说,创业并不浪漫。