周文辉
(公安部道路交通安全研究中心,北京 100062,中国)
由于道路环境及相应的驾驶任务的复杂多变,导致自动驾驶汽车面临的行车场景异常复杂,其数量巨大,甚至是无穷的。传统的基于行驶里程测评汽车的办法变得基本不可行,应用自动驾驶道路测试中的“接管”“事故”等指标也难以全面有效地评估自动驾驶功能的运行安全性。为此,业内普遍推崇基于场景的自动驾驶汽车运行安全测试办法。
基于场景的自动驾驶汽车运行安全测试和认证面临的最大挑战,是确定可靠的、具有科学性和代表性的测试场景集,并基于此开展具体测试和评价。国内外在这方面开展了大量的研究,形成了基本的技术框架。具体如下图所示:
图1 基于场景的自动驾驶汽车运行安全测试和认证技术流程
上述流程中,处于中间核心位置的是场景数据库,各类场景均在此汇集和存储。场景主要有三个层次,最高层次是功能场景,即通过自然语义描述的场景,抽样程度最高,如“切入”。第二层次是逻辑场景,需要给出影响场景的每个因素的参数的范围,如切入时的横向速度范围。第三层次是具体场景,是各个参数均明确的场景,如切入时道路交通环境、两车初始速度和距离、切入车辆的横向速度等。上图中,场景数据库的左侧,是构建场景库的过程;右侧,描述的是从场景库中抽取场景,并开展测试和安全评估的过程。
总体而言,场景库数据来源主要有两种。一种是知识类的,另一种是数据类的。知识包括各种表现形式的抽象信息、相关标准规范,或者是实际事故案例数据。数据主要来源于实际道路交通数据,如场地测试数据等。最具代表性的是实际驾驶数据。近年来,通过无人机获取实际驾驶数据的做法被逐渐使用。通过无人机拍摄实际交通场景,可以以视频方式获取各交通参与者的速度、位置、轨迹等信息。这种获取数据的方式无须额外安装使用传感器,较为经济和高效,也不会对实际交通造成严重干扰。不足之处是获取交通场景的范围一般在400米以内,这对高速公路来说,略显不足。随着自动驾驶技术的发展,各相关组织和企业都纷纷开始构建属于自己的实际驾驶数据,但往往不对外开放。
根据场景数据来源的不同,场景生成的方式也不同,具体分为基于知识的场景生成方法和数据驱动的场景生成方法。
基于知识的场景生成方法,其实质是系统化地将知识转化为场景。抽象的交通安全知识,以及交通规则、事故案例数据、消费者测试结果、自动驾驶伦理准则、自动驾驶交通安全分析方法、专家意见等均是场景构建所需的知识来源。其中基于已有知识资源和专家经验构建场景的方法使用最为广泛,在此过程中,大部分使用本体方法论来存储和结构化专家知识。
这种方法又细分为三类具体方法,分别是数据抽取法、数据聚类/分类法、参数化法,上述具体方法均广泛应用了机器学习和模式识别技术。
数据抽取法,主要用于构建边缘场景,是直接从各类数据范围内抽取具体数据,形成具体场景,具体采用直接寻找场景中对自动驾驶具有挑战性的参数或通过触发动作构建具体场景。触发动作一般是对其他交通参与者的行为作“更具挑战性”的预测。更进一步的,应用神经网络和贝叶斯网络方法,数据抽取法还可用于形成新的具体场景。
数据聚类/分类法的主要特征是将基于实际数据生成的单个场景进行分组。聚类主要通过非监督学习方法实现,具体应用的技术主要有相似测量法、层次聚类算法或贝叶斯模型过程算法,在聚类过程中,分组的原则和标准是逐渐清晰的,事先并不知晓;分类时,根据事先确定的原则和标准进行分组,主要通过监督学习方法实现,具体应用的技术较为多样,例如根据潜在的目标车辆与其他交通参与者的碰撞方向或相对运动状态,确定分组。更进一步的,可以应用不同变量下的人工智能方法对场景进行分组(如学习决策树、神经网络和深度学习等)。
根据逻辑场景的定义,其是通过参数及其范围、分布进行描述的。通过聚类和分类形成分组后的场景,为进一步的场景参数化,形成逻辑场景奠定了基础。即各组场景所需的参数,是通过提取各实际测量参数获取的。对于连续型参数,根据参数最大值和最小值,确定参数范围;对于离散型参数,根据各具体测量数值确定参数集。根据实际参数的发生概率,可确定参数的分布。另外,各参数间的相关关系也需要考虑。这方面面临的一大挑战是,如何通过实际观测到的有限数据,确定各参数的分布规律。
对于基于场景的自动驾驶汽车运行安全测试和认证而言,核心要素是建立测试场景库。由于测试场景库数量及各场景参数数量庞大,建立能够高效描述和存储场景的数据库尤为必要。场景库建立后,主要目标是为相关数据的读取和处理提供标准化接口和易于机器读取的格式。
选择具体场景后,就可开展自动驾驶功能测试工作。由于参数范围较大,因此理论上的具体场景数量是无限的。为了使测试工作具有可操作性,需要对具体场景进行科学选取。理想的状况是,利用最小的测试量,对自动驾驶功能最大程度、最可靠的测试。具体场景的选取,主要有基于测试和基于关键数值这两种方法,在其之下,还有更细化的方法,具体如下图所示:
图2 基于测试的具体场景选择方法
图3 基于关键数值的具体场景选择方法
通过测试选择和评估具体场景。评估工作通过微观交通指标值进行,上述指标值可以是与交通事故相关的、与临界参数相关的,或者是依据相关标准、规范确定的。通过测试选择具体场景时,可以通过在参数范围内抽样或在参数分布内抽样两种方法选取参数。前者能够较好地控制参数的覆盖度,但由于不可避免的参数丢失,导致从微观评估结果推导形成宏观评估结果受到限制,而参数分布抽样中的参数代表了具体行为或事件发生的概率,因而可以较好地得出宏观评估结果。
最简单的在参数范围内抽样的方法是N-wise抽样方法。采用这种方法时,所有的连续型参数均被离散化,之后对所有离散化参数进行重组。由于数据量较大,因此一般应用于简单的驾驶辅助系统测评。如果应用在自动驾驶领域,需要进行改进以使测试效率更高,如应用实验设计法、回归测试、快速遍历随机树算法等。
常用的参数分布内抽样的办法是蒙特卡罗方法,该方法对实际中出现频率高的参数抽取的次数也高,反之亦然。由于大量高频出现的参数对自动驾驶功能的挑战性不大,因此使用该方法的测试效率不高。最近有不少研究致力于提升该方法的测试效率。例如,通过将极值理论和重要性采样理论结合,可以提高测评的效率。其做法是在参数分布的外边界选取测评参数,通过这样系统化地选取参数,可生成更多的挑战性场景。
该方法的目的是尽可能高效地在车辆运行设计域内找出使自动驾驶不能达到合格要求的具体场景,既可用于具体场景,也可用于逻辑场景。具体方法有以下4种:
(1)基于交通事故。从现有事故案例数据生成关键场景,并可通过调整部分参数的办法优化形成具体场景。但现有事故案例数据主要是针对人类驾驶人的,对人类驾驶人具有挑战性的场景,不一定同样对自动驾驶汽车具有挑战性。
(2)基于临界参数。通过评估真实数据,或在已有具体场景基础上通过优化算法形成临界参数,但在此过程中,需要考虑自动驾驶功能行为对上述参数的影响。另外,在使用真实数据过程中,同样面临着“对人类驾驶人具有挑战性的场景,不一定对自动驾驶汽车具有同样的挑战性”这个问题。
(3)构建挑战情形。通过直接调整参数数值或限制逻辑场景参数范围的办法,增加场景难度,进而暴露更多自动驾驶功能的不足。
(4)仿真优化。根据上次微观测评结果的结果,调整下次具体场景选择测评,通过这样不断迭代的方式形成具体场景。另外也可使用成本函数优化评估被测对象安全性能,应用这个办法时,可将每次迭代目标设定为使被测对象“即将不符合要求”,进而加速优化选择的效率。
具体场景选择完成后,就可在各种测试环境下开展实际测试,包括真实世界测试(如场地测试、道路测试)和虚拟仿真测试。由于成本、测试效率、结果评估等方面独特的优势,近年来使用虚拟仿真测试的情况越来越多。
由于测评中,实际事故很难发生,因此一般使用安全替代指标评估自动驾驶安全性,即进行微观评估,其中最广泛知晓的是碰撞时间(TTC)指标。利用微观评估的结果,可进一步开展宏观评估。在这方面,使用基于测试的方法选择具体场景并得到微观评估结果后,能够较好地进一步得出宏观评估结果,特别是若具体场景是根据参数分布抽样获取的,则可根据参数分布和频率,较为方便地得出宏观评估的统计数据。使用基于关键数值的方法选取具体场景,其主要目的是得出对自动驾驶功能最具挑战的场景要素,因而很难根据其微观评估结果开展宏观评估。
以上概要介绍了基于场景的自动驾驶汽车运行安全测试和认证的技术框架。这其中起枢纽作用的是保存所有场景的数据库。场景生成以及选择用于测试的具体场景是整个框架中最重要的部分。具体场景选择后,就可以启动基于场景的自动驾驶功能测试。另外,在最后一步,需要根据具体场景的微观测试结果,进一步得出安全性能的宏观评测结果。
深圳市人大常委会表决通过了《深圳经济特区智能网联汽车管理条例》(以下简称《条例》),《条例》于今年8月1日起施行。这是国内首部关于智能网联汽车管理的法规,对智能网联汽车自动驾驶的定义、市场准入规则、路权、权责认定等多方面进行了具体规定。
智能网联汽车,通常指自动驾驶汽车。本次《条例》从道路测试、准入登记、使用管理、交通违法及事故处理等进行全链条立法,全力为智能网联汽车发展铺平法律道路。有专家表示,《条例》的出台,将为全国其他城市制定自动驾驶准入政策提供参考标准,有望加速我国自动驾驶立法进程。
自动驾驶发生交通事故时该谁担责,是长期以来社会各界普遍关注的问题。《条例》对此作出明确规定:有驾驶人的智能网联汽车发生交通违法或者有责任的事故,由驾驶人承担违法和赔偿责任;完全自动驾驶的智能网联汽车在无驾驶人期间发生交通违法或者有责任的事故,原则上由车辆所有人、管理人承担违法和赔偿责任,但对违法行为人的处罚不适用驾驶人记分的有关规定;交通事故中,因智能网联汽车存在缺陷造成损害的,车辆驾驶人或者所有人、管理人依照上述规定赔偿后,可以依法向生产者、销售者请求赔偿。同时,《条例》规定,智能网联汽车相关企业应当制定数据安全管理制度和隐私保护方案,并将存储数据的服务器设在中国境内。