基于监控视频流的手持探针探测位置检测算法的设计

2024-04-01 03:00:48张建鹏杨承翰林奇洲
计算机测量与控制 2024年3期
关键词:视频流前景探针

张建鹏,徐 云,杨承翰,林奇洲

(1.浙江理工大学 信息科学与工程学院,杭州 310018;2.浙江理工大学 机械工程学院,杭州 310018)

0 引言

智能制造水平直接关乎着一个国家制造业发展的水平[1]。目前,计算机视觉、工业控制数据、物联网技术等极大化地推动了制造业的发展。制造业数字化转型、网络化协同、智能化变革是制造强国建设的主攻方向。随着智能工厂中监控设备的普及,针对工厂监控视频开展生产流程的有效性检测,提高工厂的生产质量、生产效能、减少资源消耗是推动产业技术变革和优化升级的必经之路[2-7]。

空调外机结构复杂,出厂前需人工探测空调外机中铜管焊接的可靠性,从而保障压缩机壳体与储液器的密封性。该过程中,人工检测的不确定性将导致空调外机中铜管焊点的检测存在漏检、误检等情况的发生。利用工厂的监控视频设备,开展基于监控视频流的手持探针探测位置检测算法的研究,利用计算机实时分析人工手持探针探测过程的有效性,对提高工厂的生产效能具有重要的研究意义[8-10]。

本文以空调外机气密性探测为研究背景,利用人工智能技术和机器视觉技术对空调外机生产企业的工厂监控视频流进行研究,采集监控视频流中人工手持探针的图像并对其进行前景和背景分离研究,构建基于像素搜索的探针位置探测模型,对比理论应检测的真实位置,从而判断人工手持探针检测的有效性,保障出厂前空调外机铜管焊点气密性检测的有效性。

1 基于机器视觉的探针识别算法

空调外机出厂前,机身上铜管的焊缝(如图1(a)所示)需进行气密性检测,从而保证空调外机压缩机壳体与储液器的密封性。一般而言,需人工对其焊缝点进行手工探测。该过程中监控视频捕获的图像如图1(b)所示。

图1 空调外机焊缝检测

图1(a)可以看出,外机待检测的焊缝数量多、分布零散、背景复杂,且部分待测焊点相对较密集,极大化地增加了手持探针探测的难度。图1(b)给出的工厂监控视频流捕获的图像中,工人手持探针进行探测时,探针细长,图像背景复杂,探针特征难以直接提取,不利于开展手持探针探测位置的检测。

针对上述问题,本文设计了基于前景背景分类模型和目标检测相融合的手持探针探测位置检测方案,探测流程如图2所示。

图2 探针有效性探测算法流程

图2所示的探测算法流程主要可分为4大部分:1)前景背景分类模型;2)探针目标识别部分;3)探针位置推算部分;4)探测位置有效性辨别。

在前景背景分类模型中,需要提取视频流中前100帧的图像,然后利用KNN分类模型对该100帧图像进行训练与分析,KNN分类模型具备精度高的优势,利用该前景背景分类模型对实时采集的监控视频中前后帧视频图像进行前景和背景的分离,捕获工人手持探针的前景图像,并将其应用于后期探针的目标识别。

探针目标识别部分,旨在实现视频图像中人工手持探针的识别。基于Yolov5算法对工厂监控视频流采集的图像中人工手持探针进行目标跟踪与识别。该算法主要包括输入端、主干网络层、颈部层以及预测端层。根据工厂监控视频流采集的图像,利用主干网络层、颈部层实现人工手持探测的图像特征加强,从而最终实现监控视频流采集的图像中人工手持探测的识别与跟踪。

探针位置推算部分是实现探针有效性辨别的核心。本文提出基于像素搜索的探针位置推算的算法。该算法基于像素搜索的方式对视频图像中人工手持探针探测位置进行搜索与推算,在此基础上利用最小二乘算法对搜索与推算获得的探针位置进行拟合,在保证拟合相关系数的前提下,对监控视频流采集的图像中手持探针的长度进行补偿,从而实现监控视频流采集的图像中人工手持探针探测位置的判断。

探测位置有效性辨别根据当前监控视频流采集的图像中人工手持探针探测的位置,结合实际待检测的位置进行判别,求解手持探针检测的实际位置与待检测位置的交并比,从而实现人工手持探针探测位置有效性的辨别。

下面针对上述各部分的模型和算法进行详细阐述与分析。

1.1 前景和背景分类模型

前景和背景的分离旨在实现对监控视频流采集图像进行前景和背景的分离,从而获得人工手持探针探测的前景图像。根据监控视频流中前后帧视频图像的时空特征,去除复杂的工作环境背景,即可获得工人手持探针探测的前景图像。本文监控视频流中的每帧视频图像像素为1 920×1 080。

1) 前景、背景分类模型训练。提取当前视频图像的前100帧视频图像,利用KNN分类算法对每个像素的特征做前景、背景训练,从而获得视频图像中前景和背景的分离模型。

2) 前景提取。利用该前景、背景的分离模型对当前视频图像进行前景提取,设当前第i帧视频图像中第n个像素点像素为:

(1)

第i-100到第i-1帧视频图像中第j帧视频图像中第n个像素点像素为:

(2)

分别计算第i帧图像与前100帧图像中第n个像素点Xin和Yjn的欧式距离:

(3)

根据式(3)计算的100帧视频图像的欧式距离,寻找与第i帧像素点最近邻的像素点。应用训练得到的前景背景分类模型对第i帧图像中所有的点进行前景和背景的分类,获得当前第i帧图像中的前景图像,并将其应用于后续视频图像中的人工手持探针的识别。

1.2 探针目标识别

针对工厂监控视频中的人工手持探针,开展探针探测位置的有效性检测。基于Yolov5算法对工厂视频中的探针探测的位置进行跟踪与识别,从而判断工人进行空调外机铜管焊缝气密性检测的有效性。基于Yolov5算法的人工手持探针跟踪与识别算法构架如图3所示。

图3 基于Yolov5算法的人工手持探针跟踪与识别算法构架图

基于Yolov5的算法具备快速高效、准确率高、模型轻量化、易于部署和使用的优点。图3中的算法构架主要分为4个部分。

1) 输入端:采集监控视频中的图像,并将其输入至该算法的输入端并进行输入端的前期处理。输入端进行前期处理的算法主要包括Mosaic数据增强算法、自适应锚框计算、自适应图像缩放算法等预处理。其中,Mosaic数据增强算法通过随机缩放、随机裁剪、随机排布的方式对输入的图像进行拼接以增强图像数据,增加训练集的多样性和难度,同时提高检测模型的鲁棒性和泛化能力,降低过拟合的风险;在每次图像训练时,自适应锚框计算用于自适应地计算不同训练集中的最佳锚框值,提高检测的精度和鲁棒性;自适应图像缩放算法是将原始采集的图像自适应地缩放到一个标准尺寸,再输入到检测网络的主干网络中进行处理。经过上述图像的预处理,还能够有效减少工厂监控视频因探测环境光照亮度不足对图像采集的影响。

2) 主干网络:由下采样层、卷积层、瓶颈层和池化层组成。对于输入为608×608×3的图像而言,经过下采样层的操作,可将其变为304×304×12的特征图。再经过卷积层,利用32个卷积核的操作,将其变为304×304×32的特征图。瓶颈层为Yolov5算法的重要部分,将输入特征图分为两部分,一部分进行子网络处理,先使用卷积层将输入的特征图像进行压缩,然后再进行卷积处理,从而提取出相对较少的高层次的特征,另外一部分直接输入颈部层进行处理。Yolov5算法中随着网络的不断加深,可增加网络特征提取和特征融合能力,因此图3中主干网络层采用了多层网络。瓶颈CSP层1的作用可有效减少网络参数和计算量,提高特征提取的效率。主干网络旨在实现输入图像的特征提取。

3) 颈部层:由特征金字塔网络(FPN,feature pyramid network)和聚合网络(PAN,path aggregation network)组成。FPN为自顶向下的设计,通过上采样操作,将高层的特征信息和底层的特征信息进行融合,计算出预测的特征图。FPN中顶部信息流须通过主干网络逐层往下传递,由于层数较多将导致计算量较大。PAN层在FPN层的基础上提取网络内特征层次的结果,引入自底向上的路径,经过自顶向下的特征融合后,再进行自底向上的特征融合,实现底层位置信息的深层传递,从而增加多个尺度的定位能力,将底层的特征信息和高层特征进行融合,最后输出预测的特征图给预测端进行预测。颈部层利用瓶颈CSP层2加强网络特征的融合能力。对步骤2)中提取的有效特征进行上采样和下采样的特征融合,实现视频图像中特征的加强提取。

4) 预测端:通过卷积层输出特征后,利用CIOU_Loss损失函数计算预测框和真实框的损失值,采用加权非极大值抑制方法针对多目标框进行筛选,实现手持探针的识别与跟踪。

1.3 探针位置探测推算

基于分离的前景图像以及目标识别捕获的手持探针的位置,开展人工手持探针位置探测的推算分析,本文提出基于像素搜索的探针探测位置推算算法,主要由以下5部分组成:

1) 设手持探针的初始位置为O(x,y),记背景分离后的前景图像中探针宽度所占像素为a。根据探针的方向,分别沿x轴和y轴搜索5个检测框,每个检测框的像素为a×a,共9个检测框,如图4所示。

图4 探针位置探测搜索示意图

2) 根据搜索的9个检测框,分别计算各个检测框中的像素之和Pn:

(4)

其中:Px(i)为背景分离后各检测框中第i个点的像素值。基于像素搜索的方式开展探针探测位置的推算。

3) 判断Pn是否超过设定阈值,如果未超过,则在起点位置的基础上增加a个像素,沿探针所在的方向建立x轴和y轴继续搜索。重复5次,仍然未超过设定的阈值,则跳出搜索转向下一帧图像处理;如果超过设定的阈值,判断该检测框对应的原视频图像中的颜色与探针的颜色是否相符,若相符,则认定该点为探针上的点,否则在起点位置的基础上增加a个像素,并分别在探针所在的方向沿x轴和y轴继续搜索。

4) 当该点判定为探针上的点时,则以当前探针上的点为起点O(x,y),返回1)继续搜索并进行探针探测位置的推算。

5) 采用最小二乘法对获得的探针探测位置上所有点进行拟合,保证拟合的相关系数r值大于0.98。根据探针标准长度,对拟合算法获得的探针长度进行补偿,从而最终判定人工手持探针探测的位置。

1.4 探测位置辨别

在探针位置探测推算的基础上,结合实际待检测的位置进行判断,求解探针位置和待检测位置的交并比(IOU,Intersection over Union),从而判断人工手持探针探测的位置是否有效。

(5)

其中:TP为被判定为正样本,实际也是正样本。FP为被判定为正样本,但实际是负样本。FN为被判定为负样本,但实际为正样本。

2 实验测试

2.1 实验测试环境与说明

利用python3.7编写探针探测有效性检测算法的代码,选用的主板为Inter(R) Core(TM) i7-11700,显卡为RTX3070Ti,内存为16 GB,操作系统为Windows10的计算机开展实验测试的研究。根据工厂提供的实时监控视频,选取其中一段监控视频数据,每秒提取一帧视频图像,共提取包含探针的1 645张图像作为数据集。随机划分该数据集,其中训练集、验证集和测试集的比例为8:1:1。采用精确度、召回率、F1值对本文设计的人工手持探针的有效性检测算法进行综合评判。

根据人工手持探针有效性探测算法的流程,针对算法的测试效果进行测试,主要包括前景背景分类模型的效果测试,探针探测位置的有效性测试。1)前景背景分类模型的效果测试用于对监控视频流中采集的图像进行基于KNN算法的前景和背景的分离,并对分离的效果进行测试和分析。2)探针探测位置的有效性测试用于对监控视频流中手持探针探测位置的有效性进行测试与分析。

2.2 前景背景分类模型的效果测试

分析监控视频中前后帧图像的时序特征,去除复杂工作环境背景,采用KNN算法,获得前景图像。截取视频中的一帧图像,以图5(a)为例,设前景图像为白色,背景图像为黑色,对其原视频图像进行前景、背景分离,效果如图5(b)所示。

图5 背景分离效果图

图5(b)可以看出,监控视频中的前景和背景图像已充分分离,能够获得人工手持探针的前景灰度图像。

2.3 探针探测位置的有效性测试

探针探测位置的有效性测试步骤如下:1)每秒采集监控视频中的图像,基于每帧视频图像建立包含人工手持探针的数据集,按照Yolov5算法的要求对数据集进行探针的标注;2)随机划分数据集,其中训练集、验证集和测试集的占比为8:1:1;3)利用Yolov5算法对训练集进行训练,利用验证集对训练的模型进行效果验证,从而获得最优的人工手持探针探测位置的检测模型;4)在测试集中,采用训练的人工手持探针探测位置的检测模型进行测试,并输出探针探测位置的辨识结果。

根据训练获得的人工手持探针探测位置的检测模型,对工厂监控视频中工人手持探针探测的位置进行实时检测。记工人手持探针的检测框为Tool_box,目标概率记为Tool_score,其阈值设为0.5。筛选所有目标概率大于0.5的检测框,并且筛选目标概率最大的两个检测框,区分左右手检测框,并分别记为Tool_box_L和Tool_box-R,如图6所示。

图6 手持探针检测效果图

图6可以看出,工人手持的探针能够有效识别出该目标,为后续探针探测位置的检测奠定了基础。

根据分离的前景图像以及基于Yolov5算法的手持探针检测获得的检测框Tool_box_L和Tool_box_R,开展基于像素搜索的探针探测位置的检测。根据1.3节给出的手持探针探测位置的推算流程,图7给出了人工手持探针探测位置推算的示意图。

图7 探针探测位置推算过程图

图7(a)为利用分离的前景图像,开展基于像素搜索的探针探测位置的推算过程图。图7(b)为搜索的检测框与原始图像中的探针进行对比的效果,其中小方块的标注为探测的探针上的点。图7(c)为采用最小二乘法对检测到的探针进行拟合和补偿的效果图。图7(d)为根据拟合与补偿后的探针推算出的探针检测的位置推算结果,图中采用圆圈标注。

根据手持探针检测的位置,对标实际待检测的位置,求解探针检测的位置与实际待检测位置的交并比,若交并比大于50%,则视为检测正确,否则视为检测错误,最终实现人工手持探针检测位置有效性的辨别。本文采用精确度、召回率、F1值对设计的手持探针有效性检测算法进行综合评判。召回率旨在评价探针探测位置为正确的待探测位置的概率,F1值是用于评价探针探测位置模型精确度的一种指标。精确度、召回率越高越好,F1值同时考虑精确度和召回率,让两者同时达到最高,取得平衡,F1值越大越好。

针对工厂提供的监控视频,计算机利用计时器对探针有效性探测算法进行测试,记录一帧视频图像从采集到有效性检测完成所需的时间,计算获得探针有效性探测算法的平均检测速度为9.66 fps/s。此外,对手持探针有效性的检测进行了10组测试,检测结果如表1所示。

表1 探针有效性检测结果统计表

表1可以看出,采用本文所提的手持探针有效性检测算法的检测精确度达到93.26%,召回率约81.11%,F1值约86.76%,实现了工厂监控视频流中人工手持探针位置的有效性检测,检测精度和检测速度均能够满足工厂实际的生产需求。

3 实验数据分析

工厂实际监控视频的测试结果可以看出:1)采用工厂监控视频流训练的基于KNN的前景背景分类模型能够有效地实现视频流中采集图像的前景和背景分离,获得人工手持探针的前景灰度图像,为后续开展探针探测位置的检测奠定了良好的基础;2)探针探测位置的有效性测试中,根据分离的人工手持探针的前景灰度图像,基于像素搜索的探针探测位置推算算法,结合最小二乘拟合算法能够有效实现探针的拟合和补偿,在此基础上获得人工手持探针探测位置的推算;3)基于人工手持探针探测位置推算的结果,结合实际待检测的位置进行分析,最终实现了工厂监控视频中手持探针探测位置的有效性检测。

4 结束语

以空调出厂前空调外机中铜管焊缝的气密性检测为研究背景,开展基于工厂监控视频中人工手持探针探测位置的有效性检测算法的设计研究。首先,采用KNN算法对监控视频中前后帧图像的时空特征进行提取,实现视频图像中前景和背景图像的分离;其次,基于Yolov5算法开展探针探测位置的检测模型研究,提出基于像素搜索的探针探测位置推算算法,结合最小二乘拟合算法实现探针检测位置的有效推算;最后,对标实际待检位置,判断工人手持探针探测的有效性。工况实检测试结果表明,本文设计的手持探针检测算法的检测速度可达9.66 fps/s,平均检测精确度约为93.26%,召回率约81.11%,F1值约86.76%,能够满足工厂实际应用的需求。

猜你喜欢
视频流前景探针
边缘实时视频流分析系统配置动态调整算法研究
我国旅游房地产开发前景的探讨
四种作物 北方种植有前景
今日农业(2020年17期)2020-12-15 12:34:28
基于视频流传输中的拥塞控制研究
离岸央票:需求与前景
中国外汇(2019年11期)2019-08-27 02:06:32
多通道Taqman-探针荧光定量PCR鉴定MRSA方法的建立
美国视频流市场首现饱和征兆
量子纠缠的来历及应用前景
太空探索(2016年10期)2016-07-10 12:07:01
BOPIM-dma作为BSA Site Ⅰ特异性探针的研究及其应用
透射电子显微镜中的扫描探针装置
物理实验(2015年9期)2015-02-28 17:36:47