张博
2012年,滴滴的创立是源于一个非常简单的想法。
在打出租车的场景下,无论是司机还是乘客效率都非常低。在滴滴出现之前,一个乘客想要打出租车必须要下楼招一下手,这个信号是以光为媒介向外传播。出租车司机没有乘客的时候,必须要用眼睛接收这种光的信号。在寻找乘客的过程当中,出租车司机有30%的时间和油耗浪费,这造成了巨大的浪费和排放。
那么,可不可以用移动互联网替代“光”这个媒介?消费者希望打车的信息以移动互联网的方式一秒之内可以传达到周边几公里的司机那里,出租车司机一秒之内可以马上知道几公里范围内有哪些乘客想要打车,甚至可以预约明早去机场。
在纵向方面,从一开始的出租车到后来的专车、快车、优享、拼车等各种各样的交通工具,现在都被滴滴联系起来。
而在横向的延展,从一线城市开始,逐渐延伸到二线、三线、四线甚至五线城市。滴滴从中国走向了全球,不仅在中国提供服务,在巴西、墨西哥、日本、澳大利亚等国家也有了滴滴的身影,很快会在50个国家陆续开启。现在滴滴已经服务了全球1000多个城市,有5.5 亿的用户,每年输送乘客超过100亿人次。
每天在地球上有大量低效的人员流动和物体流动,浪费了大量的能源及人类的时间,造成了尾气排放、拥堵,甚至是傷亡。在未来,交通将发生巨大变革,有了AI的加持将大大改善这些问题。
滴滴的战略是 AI For Transportation。每天在地球上有大量人的流动和物体的流动是非常低效的,浪费了大量的能源及人类的时间,造成了尾气排放、拥堵,甚至是伤亡。
在未来20年里,交通将会发生巨大的变革,我对交通的认知分为三个层面。
最下面的一层是智能交通基础设施。我们看到了大数据、AI给交通基础设施带来的巨大变化。滴滴目前在和很多城市合作,比如优化红绿灯。
举一个例子,在车辆行驶过程中,会遇到从东向西没有车,而这时从南到北的车还要等固定时间的一个红灯。这是由于我们对交通流量的实时感知能力不够。现在我们利用网约车的数据,不用在马路上安装任何设施就可以知道斑马线后面有多少车。通过这个数据,只要网约车在马路上达到一定的密度,可能 5%左右,就可以准确预测每条斑马线等车队列的长度,根据这个数据动态调整红绿灯。这个技术可以瞬间扩展到全国,滴滴有一个团队正在非常大的投入在推进这个技术。这只是滴滴改变提升交通基础设施众多案例中的一个。
中间层是智能交通工具。未来能源会从石油变成电,然后传统驾驶将变为智能驾驶。
第三层是智能共享出行。我认为越来越多的人会放弃拥有属于自己的一辆车,而是按需使用车辆。因为你拥有一辆车每天也就只会开1个小时,在剩下的23 小时里,车是在停车场的。你还要为停车付费,政府还要修大量的停车场,这都造成了大量的资源浪费。共享的下一步,车会降维到座位。我们正在大力度地推进拼车,如果说我们把马路上的车两两合并,马路上的车会减少到一半。
最近我们用北京的出行数据做了一个推算。假如北京所有的出行乘客愿意在出行时间这个选项有5分钟的灵活度,愿意在上车地点这个选项有50米的灵活度,北京出行需求的70%是可以两两合并的。当然,拼车背后重度依赖地图和 AI 大数据的使用。滴滴已经具备了这样的能力,滴滴正在非常大力度的推进拼车。
而自动驾驶会在交通两个方向产生巨大价值。第一个是安全,每年有135 万人因道路交通事故而死亡,这其中 90%的伤亡是因为司机的分心、疲劳或者是醉酒,自动驾驶会显著降低这个事情的发生。第二个是很多的交通事故是因为司机不合理的行为而发生的。未来自动驾驶时代到来之后,车和车之间是可以由协同的,这样可以达到全局效率的最优。
在整个自动驾驶发展过程当中,我认为今年已经进入到第二阶段,第一阶段是原型验证。在过去3年左右时间,大量创业公司,大量资本进入到这个领域。现在整个产业进入到第二阶段,第二阶段是真正要把自动驾驶技术变成产品、商品进入到每个人的生活中。这个阶段的竞争从公司和公司之间的竞争变成联盟与联盟之间的竞争。
这当中有四个资源是非常重要的:一是出行网络,二是要有核心技术,三是要有汽车产业链的支撑,最后是要有足够的资本。
这是一个非常长期的大量的研发投入,因此要形成产业联盟才可以推进这个技术真正进入到产品和商品。
为解决乘客很难找到上车点的尴尬,滴滴尝试用AR交互式导航引导乘客从大型场站中步行走到上车点。此外,滴滴在智能出行和自动驾驶方面还具备多重优势。
下面想介绍一下滴滴智能出行网络——AR导航。
乘客在大型场站(如机场、火车站和购物中心等)中使用滴滴打车,通常会面临很难找到上车点的尴尬状况。对此,滴滴出行App在首都机场T3航站楼和一个大型商场上线了AR导航功能,尝试用AR(增强现实)交互式导航引导乘客从大型场站中步行走到上车点。
一方面,依托视觉定位技术和三维场景构建能力,滴滴的AR导航在保持较高稳定性的同时,能够将定位精度控制在1米之内。
我们采用了只依赖于视觉信息的三维重建技术来构建三维场景视觉地图,这相比WiFi、蓝牙和超宽带等其他室内定位技术而言有构建成本低、采集设备简单易得等优势。提出了分块重建(part based constraction)、参数自适应等策略克服了面积大、场景空旷等问题,实现了近万平方米范围内的精确视觉地图重建。
完成了地图重建之后,我们使用基于视觉匹配的定位技术,该技术通过用户手机的图像信息与视觉地图进行对比和匹配,进而通过置信度估计、3D-2D位置解算等方法精确计算出查询图像所在的空间位置和姿态,并为用户下发到达目的地的路径信息。
在导航过程中,为了提供更加精确的增强现实引导信息为用户提供沉浸式体验,需要精确、实时地感知用户手机的姿态,其将视觉信息和传感器信息有效的融合,实时估算用户手机姿态。但是因导航过程中图像易受人群遮挡、光照变化等影响,存在位置估算不稳定的问题。
针对这个问题我们研发了不使用视觉信息的基于纯传感器(IMU)的PDR(Pedestrian Dead Reckoning)算法,通过计算步数、步长、手机姿态等状态,有效估算用户空间位置。
目前,我们已经上线了共计7个大型场所,如机场、火车站和大型商场等。
此外,我認为滴滴的自动驾驶有几个方面的优势:
第一个是科技。现在我们的自动驾驶是成立于2017年1月份,现在已经两年半多一点的时间,现在在中美有两百多个科学家和工程师,在感知、预测、决策、高精度地图、工具链等等方面。
第二个是数据。最后的1%是非常重要的,它要求你有非常大规模的车队才可以很快发现低频发生的事件,才能验证你的问题到底有没有解决。现在滴滴每天有几百万辆网约车在马路上跑,有大量司机行为数据,我们知道我们人类司机在面对各种各样的场景行为是什么,这是最宝贵的数据。
第三是我们已经有很好的运营经验。
我认为L4和L5无人驾驶技术未来最大的商业化场景还是在像滴滴这样的出行网络。从技术的角度,在十年之内,无人驾驶技术还是有限制的,仅仅是在好的天气、好的路段、好的交通基础设施的地方可以进行无人驾驶,但是消费者在这样一个时期去买无人驾驶车仅仅在天气好、在特定的区域里开,这个并没有吸引力。
但是大家不用担心,在很长一段时间内,自动驾驶汽车都是人类司机很好的补充,而不是取代人类司机。目前自动驾驶系统在一辆车上的成本大概是1万美金,如果说是消费者自己使用的话可能很难实现,但是在商业应用经济账是完全可以算得过来的。因此我说未来10 年,L4和L5的自动驾驶技术最重要的商业化场景是在像滴滴这样的出行网络。
滴滴也有重资产运营的经验,每年我们有1000多万司机在滴滴平台上工作,这些运营体系都会为无人驾驶带来价值。
滴滴也有车路协同的技术,我们利用车路协同看一些盲区和信号灯。在两周前的WAIC上我们演示了我们的车路协同技术。我们也和很多的曾是和协会推动 V2X和V2V的标准。
滴滴是有机会率先在中国实现大规模无人驾驶应用的,因为我们有上述的这些优势。我们很快会在上海嘉定提供安全合规的自动驾驶出行服务。滴滴非常重视AI赋能社会,我们现在正在跟国家的环保局还有一些健康方面的医疗机构合作,我们在很多的网约车上面安装监测PM2.5的设备,去帮助城市更好的治理。