滴滴成立于2012年,受益于移动互联网的飞速发展,现在发展成为一个全球性的一站式出行平台。当前,我们的业务不仅局限于中国,在巴西、智利、哥伦比亚、澳大利亚等国家也有我们的身影。这些业务背后真正的本质是把网约车业务线上化,通过线上化积累大量的数据。在中国,我们的业务遍布400多个城市,滴滴平台上的每辆车每秒钟都会上报定位点数据,通过这些轨迹数据我们可以实时地知道路况的交通情况,并对未来路况做出预测。我们基于这些数据对任意两点之间的预计到达时间做计算,包括路径规划等。
滴滴本质上是技术驱动的公司,无论是轨迹数据,还是POI的数据、用户行为数据、司机驾驶行为数据、车载设备的视频音频数据等,这些数据都有非常大的价值。滴滴有非常多的预测场景:路况、ETA、智能派单、未来时空的分布等。有了数据之后,我们可以大量地应用人工智能算法来进行路线规划。重要的是,出行数据涉及个人隐私,信息安全对每一个用户都非常重要,因此我们非常重视信息安全和信息隐私保护。
在滴滴看来,未来智能出行时代会分为三个层次。一是道路基础设施更加智能化、网联化。随着5G、边缘计算、车联网的进一步发展,更多交通基础设施会联网,产生大规模协同效应,比如全程信号灯的控制。二是涉及交通工具层面,交通工具本身会变得更加电动化、智能化、网联化。在未来,尤其是自动驾驶实现后,交通工具会更加共享化,共享可以极大地提高出行频率,增加交通工具的使用效率以及道路的使用效率。所以智能共享平台的第三个层次就是共享平台了。
滴滴做自动驾驶有两个优势:第一个是数据上的优势。滴滴是世界著名的网约车平台,我们可以在现有的网约车上搜集大量的数据。目前,我们正在构建车载设备覆盖50%以上的订单、一天大概1.5亿公里以上的数据。第二个是如果遇到司机急刹车的场景,我们可以把该场景拿回来放到仿真平台上面,仿真平台就能看出现在的自动驾驶算法能不能应对该种情况。这大大加快了自动驾驶算法的迭代,并且比路测的成本低很多。
2020年6月,滴滴自动驾驶在上海市嘉定区开启自动驾驶载人应用示范项目。上海市嘉定区有巨大的汽车产业基础,滴滴在嘉定区覆盖的区域大概是20%,这20%的面积里面覆盖有很多文化场所、商业区、地铁、学校等。大家在上海出差或者来上海旅游的时候,可以通过滴滴App报名申请在嘉定区的测试区域进行自动驾驶车辆的试乘。未来,滴滴的派单模式是混合模式,输入滴滴自动驾驶在嘉定区的20%示范区域,有可能是自动驾驶接单,送你到达目的地。
滴滴的底层软件,包括自动驾驶,都大量运用了开源软件。滴滴的技术发展受益于开源,我们也积极拥抱开源,把我们所做的项目回馈给开源社区,把数据集合对业界进行开放。事实上,在第一个项目对外发布之前,滴滴内部也设立有开源委员会,我们一直在积极地建立企业开源文化和内部开源项目。
到现在,滴滴涵盖了比较多的开源项目,这些项目涉及中间件、前端、系统工具等领域。这些年根据应用场景,我们积累了一些开源经验。目前,滴滴已经开放了43个项目,也吸引了一部分外部开发者,大概有5000家外部公司在使用我们开源的软件。另一方面,滴滴也积极对社区进行贡献,我们用了很多知名社区有名的开源软件,在使用软件的过程中我们也会注意到一些问题。有时候我们会自己动手解决这些问题,如果这些问题是通用性的,或者可以降低企业的维护成本,我们会回馈给社区。2018年我们向17个开源社区回馈了100多个通用性的patch,2019年回馈了300多个patch。
滴滴花了大量的资源在做开源。一方面,滴滴在内部做一些开源的建设,将所有部门之间的壁垒打掉。我们公司会进行内部的开源以及开放协作,除了一些绝密代码外,所有代码均对其他部门开放。我们公司有一个平台,在该平台上大家可以对内部所有的项目进行评价,如果发现有些代码不满足业务要求时,即使是其他团队的人员,也可以对其进行评价。滴滴通过内部开源共享共建,消除重复建设,从而提高了整个公司的运营效率。另一方面,滴滴希望对外部输出影响力,我们希望开源一些项目,发展开源社区生态,从而吸引更多的外部开发者参与进来,真正把开源社区的生态建设起来。
中国在数据上有巨大的优势,滴滴在交通领域可以算是世界首屈一指的数据集,在2017年对外软件开源的同时,我们进行了数据开放,陆陆续续开放了很多数据,基本上把各个维度的数据都汇聚选取了一个片断,并定期更新这些片断,每年持续把数据开放出来。这些数据的开放,更多的是为了能够给学术界、产业界带来一定的帮助。目前,这些数据已经有5000多人次申请,720多家学校、科研机构使用这些数据产出了近百项科研项目。
数据的开放不仅仅是软件开放,还会对整体业界有很大的促进作用,滴滴在这方面将不断贡献自己的力量。