张晖 张欣 胡琳
1 引言
机器视觉可以借助光或电磁波的辐射,通过使用含CMOS(互补金属氧化物半导体)或CCD(电荷耦合器件)的图像摄取装置来探测及解析来自目标物体的反射光而生成图像,将该图像传送至处理单元进行数据处理与分析,从而感知并判别出目标物体和环境的特征,根据判别结果来控制现场设备的动作以执行实用的功能。机器视觉综合应用了光学、机械、电子和计算机软硬件等方面的前沿技术,涉及到计算机、图像处理、模式识别、人工智能、信号处理和光机电一体化等多个领域。目前机器视觉已广泛应用于食品饮料、化妆品、建材和化工、金属加工、电子制造、包装印刷和汽车制造等众多生产性行业和服务性行业。随着第五代移动通信技术(5G)的不断发展,在5G网络的加持下,基于AI的机器视觉系统正在催生更大的应用市场,它可以把数据发送到云端,能够实现更加复杂的运算并且实时返回结果。如今通过在生产线或巡检机器人上部署工业相机,采集图像视频上传到云端,结合5G大带宽、低时延的特性以及机器视觉技术进行智能化检测与分析已成为不少企业的首选。
2 机器视觉技术发展历程
机器视觉的发展史可追溯至20世纪60年代末,基本上每经历十年机器视觉技术与应用都会产生一次深刻变革和飞速发展。国外机器视觉的发展历程如图1所示。
1969—1979年:在成像传感器诞生的驱动下,机器视觉进入产业萌芽期。此时受限于半导体工艺成熟度和成本等因素制约,机器视觉只在极高端的科学研究和航天、军工项目中有少量初级应用,尚未形成完整的概念。1969年美国贝尔实验室成功研制出CCD传感器,可以直接把图像转换为数字信号并存储到电脑中参与计算和分析,从而奠定了机器视觉技术诞生的基石。CCD的发明可视为机器视觉发展的起点,它使得“为机器植入眼睛”成为可能。2009年,CCD的两位发明人维拉·博伊尔(Willard S. Boyle)和乔治·史密斯(George E. Smith)获得了诺贝尔物理学奖。
1980—1989年:在应用的驱动下,机器视觉进入起步期。机器视觉的概念首次在产业界被提及,但未形成精准的定义。在此期间产生了首批机器视觉企业,如加拿大的DALSA、美国的柯达和仙童、英国的E2V等CCD传感器与工业相机公司,以及美国康耐视等具有代表性的软件算法公司。
1990—1999年:在应用的进一步驱动下,机器视觉产业进入成长波动期。1990年半导体产业的发展使机器视觉定位与检测成为替代人工必不可少的技术,机器视觉产业首次得到蓬勃发展的机遇。在美国和日本等发达国家,机器视觉技术开始得到实际应用,但由于成像技术和算法算力的发展尚不成熟,不能全面满足行业应用需求,无法全面推广。由于技术门槛和系统成本过高,虽然出现一些专门从事机器视觉技术的新企业,但规模普遍较小。
2000—2009年:在应用和算力的共同驱动下,机器视觉进入产业发展早期。在此期间,FPD平板显示制造、 PCB检测和汽车制造等行业陆续对机器视觉技术应用表现出强烈需求。同时,CPU算力提升使机器视觉系统在PC-Base条件下可以处理一般性的问题。产业需求和技术进步共同促进了机器视觉产业的快速发展与繁荣。我国机器视觉产业也在这个阶段加入全球阵营。
2010—2020年:AI算法的发展推动机器视觉进入发展中期。2016年,人工智能算法AlphaGo打败人类顶尖棋手李世石,开启了人工智能发展的新纪元。随后,人工智能赋能的机器视觉开始在智能制造应用中加快普及,产业得到了空前发展。随着应用的暴发式扩展,预计2021年后机器视觉将迎来高速发展期。
3 机器视觉的概念与技术架构
机器视觉系统是集光学、机械、电子、计算和软件等技术为一体的工业应用系统,它通过对电磁辐射的时空模式进行探测及感知,可以自动获取一幅或多幅目标物体图像,对所获取图像的各种特征量进行处理、分析和测量,根据测量结果做出定性分析和定量解释,从而得到有关目标物体的某种认识并作出相应决策,执行可直接创造经济价值或社会价值的功能活动。机器视觉系统一般具有物体定位、特征检测、缺陷判断、目标识别、计数和运动跟踪等功能。
机器视觉的技术架构如图2所示。
如图所示,机器视觉覆盖成像、信号分析与处理以及决策及执行等关键环节。图像信息获取对应着成像环节,是机器视觉系统的最前端,主要包含光源、镜头、相机和图像采集卡、控制器和相关配件,其中图像采集卡主要是针对模拟相机可以实现模拟信号向數字信号的转换。图像分析处理对应着信号分析与处理环节,主要由信息处理平台和机器视觉算法库组成。其中信息处理平台主要有基于个人计算机(PC)及其通用中央处理器(CPU)进行视觉信息处理、使用专用的图形处理器(GPU)或嵌入式神经网络处理器(NPU)进行视觉信息处理、使用专有的嵌入式系统进行视觉信息处理(也称嵌入式视觉)等不同形式。机器视觉算法库[1]主要包括目前在工业机器视觉应用较多的halcon、visionpro和NIvision等机器视觉算法库,也包括Opencv这样的开源算法库。智能决策执行对应着决策及执行环节,由AI能力平台和现场应用软件组成。其中AI能力平台中的模式识别是基于人的经验来赋予机器智能;机器学习是由机器通过统计概率对大量数据进行分析从而总结规律获得智能(如线性回归、逻辑回归、神经网络和SVM等);深度学习可以看作机器学习更深层的分支,具有超多层的神经网络,能够学到更多特征获得更高智能。现场应用软件主要有面向检测、定位、识别和测量等四类应用场景的机器视觉软件。
机器视觉已在电子制造、半导体、轨道交通、印刷包装、锂电池、卷烟、光伏以及汽车制造等典型行业得到广泛应用。作为多学科的交叉应用,机器视觉系统涉及精密光学、精密机械、电子器件、光电半导体、5G移动通信、深度学习以及AR/VR等支撑技术。在实际应用市场中,机器视觉主要表现为成像器件、工业智能相机、视觉机器人、可配置视觉系统、视觉应用专机和视觉检测测量产线等不同产品形态。机器视觉系统尚属新技术新产品,具有蓬勃旺盛的市场需求,也是推动工业转型升级的重要手段,但是目前从概念到产品未形成统一的系列标准规范,标准体系的构建将进一步规范市场,引导机器视觉产业健康快速发展[2]。
4 机器视觉系统的典型特性
形象地说,机器视觉的本质是为机器植入“眼睛”和“大脑”。为机器植入眼睛,代表着机器视觉利用环境和物体对光的反射来获取及感知信息;为机器植入大脑,意味着机器视觉需要对信息进行智能处理与分析,并应用分析得到的结果来执行相应的活动[3]。
机器视觉系统具有以下几个典型特性:
1. 使用精准成像扩展人眼的视觉范围和能力
机器视觉系统具有较宽的光谱响应范围,例如使用人眼不可见的红外光进行测量,可以扩展人眼的視觉范围。系统可以长期稳定工作,承担大量的测量、分析和识别任务,而人眼由于易疲劳难以对同一对象进行长时间不间断观察。
2. 通过人机交互和图像采集实现人机物互联
机器视觉不止通过光学图像采集将“物”和“机”有效结合,还通过用户界面将“人”和“机”进行了有机整合,从而实现人-机-物的互联。机器视觉是实现工业互联网的重要手段之一。
3. 采集图像信息能够全面满足实际应用需求
在实际部署过程中,机器视觉系统往往需要定制化设计多模态多视角的专用图像采集部件,以使得采集到的图像信息能直接精确反映行业具体应用需求的深层次特征。另外除了实时处理之外,还需要将海量的图像数据进行存储以供事后查询和数据分析挖掘。
4. 以需求适配为目的做到成本可控性能均衡
机器视觉系统是面向市场应用以直接创造经济和社会价值为目的,而不盲目追求高性能。在此前提下系统设计应做到两个适配和最小化:一是成像与精度适配,即在达到成像精度的前提下成像器件成本最小化;二是算法与算力适配,即在算法满足实际需求的基础上算力供给最小化。
5. 应用场景多有实时性和近实时性指标要求
机器视觉系统主要应用于工业领域。作为工业生产过程中的关键环节,在很多应用场景中(比如工件在线检测和机器人视觉定位等),系统要达到实际可用必须满足实时性或者近实时性的指标要求。
6. 主要应用于工业环境兼具可靠性与易用性
机器视觉系统多应用于工业环境,机器需要7×24 h运转,要求具备高可靠性;机器视觉使用场景属于非接触测量,对于测量和被测双方都不产生任何损伤,可以提高系统可靠性;此外,系统使用者包括不同知识层次的管理者和工人,需要具备极高的易用性以方便他们迅速掌握和使用。
5 基于5G的工业机器视觉技术应用
5G具有高速率、低时延和大连接等特点,对于普通消费者而言最直观的感受就是下载电影更快、打游戏不卡等等网络性能改善,但数据传输速度的提升只是5G的一个方面,它将赋能千行百业,其海量应用场景更值得探索与期待。全球研究机构Marketsand Markets最新研究报告显示:2020全球机器视觉市场规模为107亿美元,到2025年,该市场将增长至127亿美元[4]。
在工业应用领域,5G网络提供了便捷、高速、高带宽、低延迟和高可靠性的数据传输通道,对于机器视觉来说这些特性尤为重要。通常,高清图像传感器采集的数据量都比较大,例如机器视觉每次采集一帧画面的数据量可能达到144 MB(12bit/pixel)。如果没有高速、高可靠性的网络,这样的大数据量就只能在终端直接处理,对于机器视觉系统的信息处理和交互能力扩展将带来极大的削弱和限制。
面向工业机器视觉应用,中国电信和中兴通讯已经联合提出了基于5G移动边缘计算(MEC)的分布式通用机器视觉平台。通过边缘云计算能力,简化现场的工控机方案和设备检测、识别方法,加快视觉算法的优化,实现工业智能化。通过云边端部署,将机器视觉系统的能力按需部署在MEC平台上,借助中国电信提供的具备专业运维的网络和计算环境、差异化的路由策略以及按需编排下沉部署等服务,实现高效稳定的5G MEC+机器视觉方案。5G MEC平台使内容与服务更靠近用户,满足低时延、本地化需求,可以根据业务本地化需求,按需动态下沉网络能力到边缘网关,在靠近移动用户的网络边缘提供IT和云计算的能力。通过云边业务相关能力的协同,形成中心云+MEC的整体云服务能力。
工业机器视觉应用对于5G通信环境有着自身的特殊需要。由于工业企业的数据安全性要求和工业实时性操作的超低时延要求,面向普通消费者的5G商用基站和终端并不完全适用于工业机器视觉系统。这种情况下必须要为企业部署5G专网和MEC平台,就近为企业提供可靠的超低时延通信服务。工业机器视觉未来的广泛应用也将以5G行业专网作为主要的无线网络支撑。
除此以外,在4G时代,网络能力主要用于消费者视频数据的下载以下行为主,更多的数据流向是由企业端自上而下发送给个人端。到了5G时代,通信网络应用范围大增,上行数据流量大增,对上行的网络宽带提出了更高要求,但是如何使上行接收到足够的信号,成为摆在方案提供商面前的难题。比如实际应用场景中工业相机每帧图片数据量约几十至百兆,单场景300 Mbps、500 Mbps、1 024 Mbps等上行传输速率需求非常普遍,导致传统的机器视觉解决方案对5G的上行速度提出了巨大挑战。
针对于工业机器视觉等这种不同于一般5G高速下行低速上行的商用特点的高速上行的特殊网络使用需求,华为同中国电信共同合作研发了5G超级上行技术,并已写入3GPP国际标准。该技术能够大幅提高5G网络上行能力,并降低时延,从而降低终端门槛,极大促进5G应用的产业化。
所谓5G超级上行,就是通过上下行通道的时分双工(TDD)与频分双工(FDD)协同,高频和低频互补、时域和频域聚合,充分发挥3.5G大带宽能力和FDD频段低、穿透能力强的特点,既提升了上行带宽,又提升了上行覆盖。换句话说,5G超级上行是一种FDD/TDD时频域复用聚合提升上行覆盖和容量的技术。终端以时分复用方式使用两个上行载波,同一时刻仅在一个载波上发送。通过超级上行技术,终端可利用低频FDD和高频TDD的上行资源,实现网络覆盖、容量性能的提升,以及更低的空口时延,全面满足5G时代应用对于更大上行流量和更低时延的需求。它是移动通信首个时域和频域结合的技术,是移动通信又一个里程碑式的创新。5G超级上行好比在TDD的车道上加开了一条FDD上行车道,这样一来上行车辆不用分时段限行,全时段畅通无阻。
5G行業专网的部署和5G超级上行技术的突破,在工业机器视觉应用领域,真正解决了工业机器视觉未来发展的网络瓶颈问题,实现了完整的基于5G的工业机器视觉系统解决方案,体现出5G是解决工业互联网重要手段的重要意义。
6 我国机器视觉发展的问题与建议
6.1 我国机器视觉发展面临的问题
我国机器视觉产业起步于20世纪90年代末,经过20多年的摸索实践已经得到了一定的应用,但由于起步较晚,较美、英、日以及德等国家仍有较大差距。他们占据生产系统基础端,掌握住了价值链当中价值含量高的部分,从源头和价值的投放端掌握其竞争力的核心优势。近年来,国际贸易竞争日益激烈,对我国机器视觉发展带来了前所未有的挑战。
从限制政策角度来看,一是国外品牌对华出口许可审核的条例逐渐增多,周期逐渐拉长;二是终端用户黑名单上的中国企业也越来越多。例如,美国商务部将把包括海康威视、大华科技、依图科技等在内的多家中国机构和公司列入美国出口管制“实体名单”,限制其零部件的购买。
从产品形态角度来看,美、英、德和日等制造强国的技术产品目前仍牢牢占据生产要素上游。在机器视觉产业中,实现智能感知的视觉系统所包含的高端相机、镜头、光源、成像芯片、嵌入式处理芯片和视觉应用软件平台,依旧以其为主导。近年来,西方国家已对华禁运性能极其高端的成像器件和在科研及国防领域获得广泛应用的成像器件,国外品牌芯片基本切断对华出口,对我国的机器视觉产业化带来了严重阻碍。
国际局势变化给我国机器视觉发展带来了巨大的挑战,同时也暴露出我国机器视觉产业发展过程中关键技术国产化率低等突出问题,主要体现在基础层产品与技术自主化薄弱,尚缺少较强的核心技术产品与之抗衡,国产化替代的需求亟待重视与解决。
6.2 推进我国机器视觉发展的政策建议
1. 加强机器视觉核心关键技术支持与突破
突破机器视觉基础理论及关键核心技术瓶颈,以先进成像技术与算法为双轮驱动核心,以数据和硬件为基础,以5G通信网络为支撑,以大规模知识库的构建与应用为导向,实施重大关键技术攻关工程,制定机器视觉共性技术开发路线图,重点提升先进成像、AI智能算法、工业云边端通信等多种成像与智能信息处理技术,形成开放兼容、稳定成熟的技术体系。同时,通过梳理和细化标准化需求,以技术突破带动核心技术标准突破。
2. 加大机器视觉科研创新投入力度,加快体系构建
基于机器视觉的基础理论、基础技术、应用,作为人工智能战略的重要基础,制定机器视觉三年、五年以及十年行动计划,将机器视觉作为新增的重大课题专项方向,导入至国家自然科学基金、国家重点研发计划和制造业高质量发展专项等大专项中。同时,服务于纵向课题专项,在研究方向中设置更大比重的与机器视觉关联的任务。
3. 加强机器视觉顶层设计与统筹推进机制建设
政府对机器视觉领域创新要素如人才、资金、技术和信息等的支持,应直接扩大供给,以此推动提升科技活动、产业创新能力;通过金融税费、法规监管、政策规划等政策影响并优化机器视觉领域的产业环境因素,以此间接促进科技、产业的可持续发展。确定机器视觉未来10~20年谋定发展框架,具体包括基础理论、基础技术、工程技术等方面的发展重点,并以此在国家部委专项中设置专项课题进行支持,牵引关键核心技术的攻关。另外,确定以企业为主导,在机器视觉产业中的视觉器件、智能视觉设备等产业链优势领域,重点培育加快打造出几家在全球有相当影响力的机器视觉产业龙头企业和品牌。
4. 促进产学研用深度融合,培育机器视觉产业人才
引导企业作为机器视觉创新的核心力量,对机器视觉产业的无形资产的构建与积累,使学术界和产业界共同驱动机器视觉创新发展,在5~10年登上国际制高点,成为领军阵营,形成创新张力和聚集力。通过更大力度的科研经费投入,促进产学研用深度融合,攻关关键共性技术,丰富专利产出,为企业作为创新链条的主力军营造宽松环境,同时出台专利保护政策保障原创团队的最大利益。在机器视觉构建的各环节都需要大量业务知识的摄入及业务专家的参与,有待加强同时具备机器视觉与其他领域知识储备的交叉复合型人才,为机器视觉应用与企业需求及业务场景的高度匹配提供保障。
参考文献
[1] 王璜.可重用的机器视觉检测算法库设计[J].湖北工业大学学报,2013,28(02):49-52.
[2] 吴繁.工业机器人单目双视的应用研究[D].武汉:武汉科技大学,2009.
[3] 章炜.机器视觉技术发展及其工业应用[J].红外,2006(02):11-17.
[4] Global Markets for Machine Vision Technologies.[Z/OL].[2021-03-20]https://www.electronics.ca/store/ machine-vision-technologies.html.