编译/陈亮
机器学习算法在无人驾驶中的应用
编译/陈亮
无人驾驶被认为是未来人工智能技术应用的最大市场规模和影响力的落脚点。近年来,为了使汽车能够安全可靠地“自主”上路,研究人员可没少花心思。本文编译自kdnuggets,该文全面概述了无人驾驶现阶段使用的机器学习技术。我们一起来看看,哪些技术将影响未来下一代出行?
今天,机器学习算法被广泛应用,以解决制造无人驾驶汽车行业中出现的各种挑战。随着传感器数据处理在汽车ECU(电子控制单元)中被引入,我们必须越来越多地使用机器学习来完成新的任务。潜在的应用涉及通过来自不同外部和内部传感器(如激光雷达、雷达、照相机或物联网)的数据融合来评估驾驶员状况或驾驶场景分类。
运行汽车信息娱乐系统的应用程序可以从传感器数据融合系统接收信息。例如,如果车辆注意到驾驶员状态不对劲,则可以将汽车指引到医院。这种基于机器学习的应用程序还包括驾驶员的语言、手势识别和语言翻译。算法被分类为无监督学习和监督学习。两者之间的区别在于他们学习的方式。
监督学习算法利用训练数据集学习,并持续学习直到达到他们所期望的信息(最小化错误概率)的程度。监督算法可以分为回归、分类和异常检测或降维。
无监督学习算法尝试从可用数据中获取价值。这意味着,在可用数据内,算法产生关系,以便检测模式或根据它们之间的相似程度将数据集划分为子组。无监督学习算法通常被分类为关联规则学习和聚类。
强化学习算法是另一组机器学习算法,这种学习算法介于在无监督和监督学习之间。对于每个训练示例,在监督学习中有一个目标标签;在无监督学习中完全没有标签;强化学习包括时间延迟和稀疏标签——也就是“激励”。
每个agent会根据环境奖励学习自身行为。了解算法的优点和局限性,并开发高效的学习算法是强化学习的目标。强化学习可以解决大量实际应用,从人工智能的问题到控制工程或运筹学,这些都是与自动驾驶汽车开发相关的。它可以分为间接学习和直接学习。
在自动驾驶汽车上,机器学习算法的主要任务之一是持续感应周围环境,并预测可能出现的变化。这些任务分成四个子任务:
图1 回归算法
·物体识别及分类
·物体定位
·运动预测
机器学习算法被分为4类:
·决策矩阵算法
·聚类算法
·模式识别算法
·回归算法
我们可以利用其中一类机器学习算法来完成2个以上的子任务。例如,回归算法既可以用于物体定位,也可以用于对象检测和运动预测。
决策矩阵算法能系统地分析、识别和评估信息集和值之间关系的表现。这些算法主要用于决策。汽车是否需要制动或左转基于这些算法对物体的下一次运动的识别、分类和预测的置信度。决策矩阵算法是由独立训练的各种决策模型组合起来的模型,在某些方面,将这些预测结合起来进行总体预测,同时降低决策中错误的可能性。Adaptive Boosting就是其中最常用的算法。
图2 Adaptive Boosting算法
Adaptive Boosting算法也可以简称为AdaBoost,它是可以用于回归或分类的多种学习算法的组合。与任何其他机器学习算法相比,它克服了过度拟合问题,并且通常对异常值和噪声数据非常敏感。为了创建一个复合强大的学习器,AdaBoost需要经过多次迭代,因此,它具有适应性。学习器将重点关注被分类错误的样本,最后再通过加权将弱学习器组合成强学习器。
图3 K-means算法
AdaBoost有助于将弱阈值分类器提升为强分类器。图2中的图像描绘了如何在一个可以理解性代码的单个文件中实现AdaBoost算法。该函数包含一个弱分类器和boosting组件。弱分类器尝试在数据维度之一中定位理想阈值,将数据分为2类。分类器通过迭代部分调用,并且在每个分类步骤之后,改变了错误分类样本的权重。因此,它实际创建了级联的弱分类器,但性能像强分类器一样好。
有时,由系统获取的图像不清楚,并且难以定位和检测物体。有时,分类算法有可能丢失对象,在这种情况下,它们无法对系统进行分类并报告。原因可能是不连续的数据、非常少的数据点或低分辨率图像。聚类算法专门用于从数据点发现结构。它描述了分类的方法和分类的问题,如回归。聚类方法通常通过对分层和基于质心的方法进行建模来组织。所有方法都利用数据中的固有结构将数据完美地组织成最大共性的组。K-means是一种常见的聚类算法。
K-means是一个著名的聚类算法。K-means存储它用于定义集群的k个质心。如果一个点比任何其他质心更接近该集群的质心,那么这个点被说成是在一个特定的集群中。通过根据当前分配数据点到集群和根据当前质心将数据点分配给集群,在选择质心之间进行交替。
K-means算法——聚类质心被描绘为十字,训练样本被描绘为点。 其中(a)表示原始数据集;(b)表示随机初始聚类中心。(c-f)表示运行2次k-means迭代的演示。每个训练样本在每个迭代中分配给最接近的聚类中心,然后将每个聚类中心移动到分配给它的点的平均值。
通过高级驾驶辅助系统(ADAS)中的传感器获得的图像由各种环境数据组成,需要过滤图像以通过排除不相关的数据点来确定物体类别的样例。在对物体分类之前,模式的识别是数据集中的重要一步。这种算法被定义为数据简化算法。
图4
数据简化算法有助于减少对象的数据集边缘和折线(拟合线段)以及圆弧到边缘。直到一个角落、线段与边缘对齐,并在此之后开始一个新的线段。圆弧与类似于弧的线段的序列对齐。以各种方式,将图像的特征(圆弧和线段)组合以形成用于确定物体的特征。
通过PCA(原理分量分析)和HOG(定向梯度直方图),支持向量机(SVM)是ADAS中常用的识别算法。我们也经常用到KNN分类算法和贝叶斯决策规则。
SVM依赖于定义决策界限的决策平面概念。决策平面分离由不同的类成员组成的对象集。图4是一个示意图。在这里,物体属于RED或GREEN类,分离边界线将红色和绿色物体分开。任何落在左侧的新对象都标记为RED,如果它落在右边,则将其标记为GREEN。
这种算法有利于预测事件。回归分析会评估2个或更多个变量之间的关系,并将变量的影响整理到不同的量表上,主要由3个指标驱动:
·回归线的形状
·因变量的类型
·自变量的数量
图像(摄像机或雷达)在启动和定位中在ADAS中起着重要作用,而对于任何算法来说,最大的挑战是如何开发一种用于进行特征选取和预测的、基于图像的模型。
回归算法利用环境的重复性,以创建给定物体在图像中的位置与该图像之间的关系的统计模型。这个模型通过图像采样,提供快速在线检测,同时可以离线学习。它可以进一步扩展到其他物体上,而不需要大量人类建模。算法会将某一物体的位置以一种在线状态下的输出和一种对物体存在的信任作为反馈。
图5
回归算法也可以用于短期预测和长期学习中。在自动驾驶汽车上,回归算法可以是决策林回归、神经网络回归和贝叶斯回归等。
神经网络用于回归、分类或无监督学习。他们对未标记的数据进行分组,对数据进行分类或在监督训练后对连续值进行预测。神经网络通常在网络的最后一层使用逻辑回归的形式,将连续数据变为变量1或变量0。在上图中,“x”是输入,从网络上一层传出的特征。进入最后一层隐藏层的每一个节点,将传递给许多x,并将每个x乘以w,相应的权重。对于偏移,乘积之和将被移动到一个激活函数中。激活函数是ReLU(整流线性单元),它不像Sigmoid函数那样在处理浅层梯度问题时容易饱和。ReLU为每个隐藏节点提供一个输出,激活a,并且激活被添加到通过激活和输出节点中。这意味着,执行回归的神经网络包含单个输出节点,并且该节点将先前层的激活总和乘以1,该网络的估值“y hat”将是结果。“y”是所有x映射到的因变量。您可以以这种方式使用神经网络来获取与您尝试预测的y(一个因变量)相关的x(自变量)。
陈亮 本刊编辑