基于自动驾驶的机器视觉原理及应用

2018-09-13 05:43笪陈宇唐明雷鑑铭
无线互联科技 2018年10期
关键词:自动驾驶机器视觉

笪陈宇 唐明 雷鑑铭

摘要:机器视觉是一门跨越多门学科的前沿研究课题。视觉是生物亿万年进化的结晶,一代代科学家、工程师在模拟视觉的道路上倾注了无数心血,经过数十年的研究,人类终于窥探到了神奇视觉的一角。文章将以自动驾驶系统为例针对现有的机器视觉原理和图像分析的典型算法进行介绍,并展望机器视觉巨大的应用前景。

关键词:机器视觉;自动驾驶;直接感知

1 视觉概述

视觉是生物数十亿年来进化的产物,是人类和其他高等生命体重要的信息来源。以人的视觉系统为例,它具有十分复杂的构造:光线通过角膜和瞳孔进入眼球内部,经过晶状体的聚焦调节到达视网膜,视网膜上的感光细胞再将光信号转化成神经冲动,最后由视觉中枢进行分析。如何模拟人类视觉的全部或部分功能来实现所谓的“机器视觉”,是几十年来科学家和工程师不懈努力的方向。从20世纪50年代的图像识别问题[1]得到研究以来,机器视觉获得了长足的发展。20世纪80年代,Marr[2]首次提出了“重建”和“识别”的自底向上的视觉框架,而后又有自顶向下的框架提出。到如今,机器视觉已经成为一门贯通硬件和软件的庞大研究课题,其中的图像分析和语义理解更是和人工智能密不可分[3]。机器视觉的原理和其广阔的应用前景是本文的主要讨论内容。

2 机器视觉的基本原理

一个完整的机械视觉流程包括图像采集、图像处理和图像分析3部分[4]。

2.1 图像采集

传统的工业电荷藕合器件图像传感器(Charge CoupledDevice,CCD)相机是将相当数量的CCD排成阵列[5],如:512X480, 640X480, 800X600, 1024X768 等等,称作解析度,决定了最后成像的清晰度。光线通过镜头聚焦投射到CCD阵列上,每个CCD单元根据自身接收到的光线强度发生光电效应,电信号再通过模数转换得到一个数字量。这个数字量被称为灰度或者灰阶。最后计算机根据设定好的算法还原出图像。

近几年用互补金属氧化物半导体(ComplementaryMetal-Oxide-Semiconductor,CMOS)组成阵列的CMOS相机发展迅速。与CCD阵列集成在半导体单晶材料上不同,CMOS是集成在被称为金属氧化物的半导体材料上的[6]。CCD工业生产的技术难度大成本高,被索尼、松下等大公司垄断,而CMOS生产成本和难度都较低。同时CMOS相机还有抗辐射、低功耗、高集成等优点,在克服噪音较大和感光灵敏度较差等不足后,取代CCD相机是大势所趋。

2.2 图像处理

狭义的图像处理是指利用计算机强大的计算能力,对采集到的海量数字信号进行转换、压缩等操作。传统的预处理包括滤去噪声、均衡直方图、矫正畸变等[7]。广义的图像处理甚至包括了图像分析的过程,涵盖了识别、增强、对比、依托人工智能进行“理解”等[8]。

2.3 图像分析

图像分析是当今机器视觉研究的热点领域,涌现了众多算法和框架。这也是一个跨越多学科的课题,图像分析方法的进步同样也帮助人们理解人类视觉的原理[3]。其中人工智能可视化、三维重建、虚拟现实是图像分析的几个研究的重点。随着智能化、信息化时代的到来,人工智能和大数据的运用势必成为图像分析研究的主要方向。本文将以自动驾驶技术中涉及的动态图像理解为例介绍两种典型的图像分析方法。

3 自动驾驶系统中两种典型的图像分析法

3.1 间接感知型

基于间接感知型的自动驾驶技术是通过多个子系统的合作间接达到图像分析目的的方法。其中主要包括目标检测、目标跟踪、场景语义分割、三维重建等子系统。每个子系统都不断有新的发展、新的理论补充,这形成了间接感知技术包容并蓄、集百家之长的特点。但同时,庞杂的子系统又使间接感知技术冗杂繁复,无形中提高了应用的成本[7]。

3.1.1 目标检测

要准确地检测出目标不仅要靠单一的光学传感器,同时还要结合红外传感器、激光雷达等采集的信息综合分析。目前普遍的目标检测方法的主要思路是通过优化过的穷举法分割图像,再将分割的区域与数据库中的已知数据对比,最后确定目标。为了提高检测的精准度和正确率,人们已经将神经网络、深度学习的技术融入其中[9]。

3.1.2 目标跟踪

在车辆行驶的过程中,行人或结伴而走,或被障碍物遮挡,车辆或加速,或急停,目标的状态时时刻刻都在变化。自动驾驶系需要在混乱的路况中通过跟踪目标得出距离、速度、加速的这些基本的物理量,从而做出正确的行为。在天气良好、目标无遮挡的理想条件下,可以采用直接匹配的方法:将相邻两帧的图像直接对比找出目标的运动规律。但当条件受限,目标被遮挡时,还需要采用基于区域统计的跟踪法[10],轮廓跟踪法[11]、基于贝叶斯滤波的跟踪法[7]等复杂的算法。

3.1.3 场景语义分割

场景语义分割的作用是将图像中的像素划分行人、车辆、道路这些基本的元素,为自动驾驶提供参考。传统上研究人员常运用概率图模型进行分割。但因为单个像素所表达的信息十分有限,有的学者将超像素的思路引入了图形分割领域,还有的学者通过车辆行驶过程中常见目标关系提出优化的概率图模型。近年来,卷积神经网络等人工智能技术也推动了图像语义分割技术的发展。

3.2 直接感知型

直接感知,顾名思义是不通过分析图像中的目标信息而通过直接学习图像代表的车辆状态信息从而指导驾驶的感知模式。自动驾驶系统利用卷积神经网络[9]学习汽车的第一视角图像所表示的各种道路参数,在研究人员的监督下不断提高驾驶技术、丰富知识储备。直接感知型的圖像分析法省却了各种子系统的集成和整合,复杂性降低,在高速公路等标志明显的路况条件下表现良好。但是,当此系统在日常道路这样没有明显特点的路况下运作时表现却不理想。

4 机器视觉的应用前景

4.1 自动驾驶汽车

机器视觉是自动驾驶汽车、自动驾驶技术的重要组成部分。驾驶员的观察、监视、分析的工作都将由机器视觉系统和其他传感系统承担。近几年来,自动驾驶、智能汽车发展迅速,消费市场急剧扩大。行业内普遍预测自动驾驶汽车将在2025年前后呈现爆发式增长;到2035年,自动驾驶汽车将取代当今一般的车辆,届时自动驾驶整车及相关设备、应用的收入规模总计将超过5 000亿美元。

4.2 工业制造领域

机器视觉拥有人类视觉不可比拟的精确度和稳定性,在精密仪器检测、电子元件装配等制造业领域有巨大应用前景[12]。人眼无法察觉超过可见光范围的信息,但机器视觉系统可以利用红外传感器、超声波传感器获得比人眼更多的信息。同时机器不知疲倦、不存在主观观测误差,所以在工业领域,机器视觉正以极快的速度替代肉眼观察。印刷电路板时,可以使用机器视觉进行定位,减小误差;加工机械零件时,可以使用机器视觉捕捉产品的瑕疵误差,提高效率;在食品包装、物流分类、零件装配等领域,机器视觉已经大量取代了人工。

[参考文献]

[1]李延浩.机器视觉在多领域内的应用[J].电子技术与软件工程,2018(1):93-94.

[2]MARR D.Vision-A computational investigation into the human representation and processing of visual informantion[M]. San Francisco:W H Freeman and Company, 1982.

[3]周勇.智能车辆中的几个关键技术研究[D].上海:上海交通大学,2007.

[4]何涛.或谈机器视觉的原理及应用[J].技术与市场,2011(5):11.

[5]朱飞虎.机器视觉原理及应用[J].自动化博览,2005(2):81-83.

[6]王旭东,叶玉堂.CMOS与CCD图像传感器的比较研究和发展趋势[J].电子设计工程,2010(11):178-181.

[7]白辰曱.基于计算机视觉和深度学习的自动驾驶方法研究[D]哈尔滨:哈尔滨工业大学,2017.

[8]郭元戎.图像处理与识别技术的发展应用[J].电子技术与软件工程,2018(1):58-59.

[9]LECUN Y, BENGIO Y, HINTON G.Deep learning[J].Nature, 2015(7553):436-444.

[10]DORIN C, VISVANATHAN R, PETER M.Kernel-based object tracking [J].Pattern Analysis and Machine Intelligence, 2003(5):564-577.

[11]GEMIGNANI V, PATERNI M, BENASSI A, et al.Real time contour tracking with a new edge detector[J].Real-Time Image, 2004(2):102-116.

[12]李延浩.機器视觉在多领域内的应用[J].电子技术与软件工程,2018(1):93-94.

猜你喜欢
自动驾驶机器视觉
大场景三维激光扫描仪在研究生实践教学培养中的应用
特斯拉中国官网不再提“自动驾驶”