自动驾驶汽车的可视化因果关系解读
未来,神经网络将广泛地应用在自动驾驶汽车中。但是,神经网络的缺点是网络结构和隐含层神经元的机制与整个神经网络的估计结果没有太大的关联。所以,研究在卷积神经网络的基础上增加一个视觉关注网络模型,该模型没有上述神经网络的缺点。视觉关注网络模型可以提供空间关注图(网络所关注的图像区域),来解释视觉关注网络是如何工作的。所以,该视觉关注网络模型分为3部分:(1)编码器,用于卷积特征提取;(2)视觉关注机制的粗粒度解码器;(3)视觉关注机制的细粒度解码器,用于因果关系的视觉检测,并细化空间关注图。
编码器:使用卷积神经网络提取编码的视觉特征向量,称为卷积特征立方体。每个特征向量具有输入图像的部分特征,这些特征是视觉关注网络模型筛选出的特征。
粗粒度解码器:采用深度学习中的软注意力分析,寻找最优的背景向量,称为卷积特征向量。利用一种标准反向传播方法进行训练。
细粒度解码器:改进了关注图像,并检测了局部视觉效果。
通过视觉关注网络模型获得了3个数据集(Comma.ai、Udacity和现代综合车辆安全系统控制中心(HCE))收集的超过120万帧(≈16h)的图像。将图像分割成200×64的像素,传送至粗粒度解码器。训练算法采用优化的Adam算法。自动驾驶车辆通过采集图像,并将图像输入到神经网络中,根据神经网络对图像的识别结果,来控制车辆转向。
试验结果表明,引入视觉关注网络模型不会降低控制精度,有助于降低图像的复杂程度。
网址:arXiv.org>cs>arXiv:1703.10631
作者:Jinkyu Kim et al
编译:野晨晨