廖鑫婷 , 李泉洲 , 邱权 , 徐海 , 刘振国
(1.工业和信息化部电子第五研究所, 广东 广州 511370;2.工业装备质量大数据工业和信息化部重点实验室, 广东 广州 511370)
随着当前人工智能、 云计算、 5G 网络和大数据等技术的快速发展, 印制电路板(PCB) 作为现代电子信息产品的核心组成部件, 其功能要求不断地提升[1]。 PCB 的生产过程有覆铜、 蚀刻和钻孔等各种复杂工艺, 使得其生产质量的保障具有一定的难度。 缺陷检测是PCB 生产制造中一项不可或缺的质量控制技术。 现今PCB 缺陷检测方法主要有人工目视检测和基于传统机器视觉的自动光学检测[2]。 面对繁重的检测任务和复杂的检测环境,传统的人工目视检测具有重复性差、 主观影响大、劳动强度大、 一致性差、 耗时长、 效率低和成本高等缺点。 传统机器视觉技术的自动光学检测方法,则局限于人工设计特征和复杂图像处理方法, 增加模型通用化应用难度, 影响其在PCB 生产环境下的检测效率[3]。
目前主流的基于机器视觉的PCB 缺陷检测方法, 根据是否使用PCB 模板图像可以分为参考法和非参考法两类。 参考法借助图像处理算法, 将PCB 模板图像与PCB 待测图像进行像素级别比较。赵翔宇等[4]针对极性错误与元器件丢失等缺陷,提出一种基于数学形态学与种子填充相结合的分层提取匹配算法。 该方法首先利用种子填充算法分层提取各类元器件, 然后对其分别进行基于单链表的模板分类匹配。 朱寒等[5]将缺陷检测分为两个环节, 首先, 基于多方向Sobel 算子的改进模板匹配环节, 匹配PCB 模板图像与PCB 待测图像; 其次, 利用基于图像差分法的多级二值化检测法来实现PCB 漏件缺陷检测。 李文静等[6]结合图像预处理、 图像分割技术及模式识别方法检测漏焊和短路缺陷。 该方法对模板分割图像和待测分割图像进行连同区域提取, 然后根据预设阈值和连同区域面积判断是否存在缺陷。 然而, 参考法严重地依赖于PCB 模板图像, 存在对准困难、 存储量需求大等问题, 并且在实际复杂的工业环境下难以获取与PCB 模板图像角度和距离一致的图片。
非参考法无需借助PCB 模板图像, 利用传统机器学习加图像处理技术的方式, 检测PCB 是否存在缺陷。 李云峰等[7]首先利用滤波去噪和图像分割操作获得PCB 敷铜层区域, 然后设计了邻域梯度方向信息熵作为特征描述子, 并结合边缘像素在局部区域的分布特性, 进行缺陷特征提取和特征向量构造, 最后利用支持向量机(SVM) 实现缺陷识别和定位。 Yuk 等[8]先利用SURF 特征提取算法进行特征提取与特征描述, 再结合加权核估计技术和随机森林算法进行缺陷检测。 陈寿宏等[9]利用PCB 焊点的形状和纹理特征参数及方向梯度直方图(HOG) 作为特征, 提出一种基于多特征的SVM 多分类缺陷检测方法, 先对提取到的形状和纹理特征利用SVM 中最优核函数进行焊点初步缺陷检测, 对于误检的焊点再使用基于HOG 特征的SVM 多分类算法对其进行二次检测分类, 得到最终分类准确率。 在真实复杂的缺陷检测工业环境中, 该方法存在缺陷特征提取困难、 检测算法复杂和耗时长等问题。 难以进一步地取得较好的检测效率。
近年来, 随着工业数据量的快速增长和计算机运算性能的不断提升, 深度学习以其强大的表征能力和复杂关联关系的学习能力在计算机视觉领域取得了卓越的成绩[10]。 为了进一步地提升PCB 表面缺陷的检测效果, 本文对基于深度学习的PCB 缺陷检测技术进行了研究, 为PCB 制造过程的相关检测技术提供了重要参考。
近几年, 深度学习技术因其自动提取特征和高效自动学习的能力, 攻克了因传统方法有限的原始数据处理能力而导致的难点。 本文采用YOLOv3 深度学习模型作为PCB 缺陷检测模型。 YOLOv3 将缺陷检测任务定义为回归问题, 省去目标候选框提取操作, 直接利用卷积神经网络在输入图像上进行特征提取, 获得缺陷的位置和类别, 完成端到端的缺陷检测任务。
YOLOv3 基于YOLOv2, 提出了新的主干特征提取网络Darknet-53, 在保持速度优势的情况下进一步地提高了检测精度, 具体如图1 所示。 图1 中Conv_BN_L 代表包含卷积Conv、 批量归一化BN和激活函数Leaky ReLU 的常规卷积网络操作,Residual Block 代表残差模块, Concat 为通道维度的特征合并[11]。 Darknet-53 主干特征提取网络大量地使用ResNet 中的残差模块Residual Block, 并省去YOLOv2 中的池化操作, 直接用卷积层中的步长来实现降采样。 对于预测网络部分, YOLOv3 引入了多尺度预测的概念, 使其更好地融合了上下文特征信息, 其中预测层数量增加为3 层, 分别地对应13×13、 26×26、 52×52 这3 个不同尺度的特征图; 并沿用YOLOv2 中的锚框机制, 利用K-means聚类出锚框的尺寸, 不同的是锚框个数由5 个增加到9 个, 按照其尺寸大小分到3 个预测层级。 由于Darknet-53 网络结构的改进和多尺度预测思想的引入等优化措施, YOLOv3 检测性能表现较YOLOv2有显著的提升。
图1 YOLOv3 网络框架图
在实验环境的选择上, 本文实验采用了Ubuntu20.04-64 位操作系统, 型号为Intel Xeon Gold 6242R 的CPU 处理器, 型号为GeForce RTX 3090 的GPU, Python 开发语言, PyCharm 编译软件, PyTorch 深度学习框架为 CUDA11.2 +cuDNN8.0.4 的并行计算架构。
为了更好地初始化网络权重, 减少训练时间,以及避免过拟合或欠拟合现象, 我们采用迁移学习加微调训练方法。 基于迁移学习原理, 采用基于VOC 数据集的模型作为预训练模型。 在网络训练过程中, 网络输入大小设为608×608, 优化损失函数采用Adam 优化器, 总训练批次量为100, 每批次大小为8, 初始学习率为0.000 1。
本文实验采用由北京大学智能机器人开发实验室提供的PCB 缺陷数据集[12]。 该数据集通过工业摄像机拍摄不同PCB 裸板的图像后, 均衡不同缺陷种类的数量再进行修图, 最后得到每张图像含若干个同类缺陷的缺陷图像数据集, 主要包含断路、短路、 缺孔、 鼠咬、 毛刺和残铜6 类常见的PCB表面缺陷。 数据集包含共693 张PCB 缺陷图像,其平均像素为2 777×2 138。 由于原始数据集样本量较少, 采用裁剪和旋转的数据扩充方法对其进行扩充, 并使其统一为608×608 的大小, 在丰富数据集的同时一定程度地抑制过拟合。 最终得到包含34 378 张图像的PCB 表面缺陷数据集, 其中每张图片包含若干个同类表面缺陷。 随后将其按9∶1的比例均匀地划分为包含30 940 张图像的训练集和包含3 438 张图像的测试集, 数据集细节如图2和表1 所示。
图2 PCB 缺陷种类
表1 PCB 缺陷数据集信息
目前模型常用的性能评价指标主要有精确率(P: Precision)、 召回率(R: Recall)、 F1 得分、某一类别的平均准确率(AP: Average Precision)、多类别的平均准确率 (mAP: mean Average Precison) 和衡量检测速度的每秒传输帧数(FPS:Frames Per Second), 具体的计算公式如下:
式(1) - (4) 中: TP——正样本被正确识别为正确样本的个数;
FP——负样本被错误识别为正样本的个数;
FN——正样本被错误识别为负样本的个数;
C——缺陷类别的个数。
文中通过对比Faster RCNN、 SSD、 YOLOv3和YOLOv4 4 个主流的检测模型, 验证深度学习在PCB 缺陷检测的适用性, 优选更加符合检测的模型。 实验结果如表2 所示, 从表2 中可以看出,YOLOv3 取得了最好的检测精度, 其mAP 达到98.99%, 分别比Faster RCNN、 SSD 和YOLOv4 高39.51%、 0.75%和0.08%。 在检测速度方面,YOLOv3 同样具有最快的检测速度, 其FPS 为71.28, 分别比Faster RCNN、 SSD 和YOLOv4 高23.72、 5.20 和28.29。 实验对比结果显示, 针对PCB 缺陷数据集, “一步走” 检测模型在检测精度和检测速度上均比“两步走” 检测模型表现更好。 虽然“一步走” 检测模型的检测精度差异略小, 但YOLOv3 取得更快的检测速度。 同时, 由实验结果(图3) 可知, 针对PCB 缺陷种类多、 缺陷微小、 位置随机、 尺寸不一和数量任意等特征,YOLOv3 检测模型可精确地分类与定位, 并均可获得较高的置信度。 这表明了YOLOv3 均衡精度与速度, 更加符合实际的PCB 实时在线缺陷检测需求。
表2 不同检测模型的性能表现
图3 YOLOv3 的部分检测结果图
文中针对目前PCB 缺陷检测算法存在严重依赖标准模板、 人工提取特征和成本高等局限性, 提出了基于深度学习的PCB 缺陷检测方法。 该方法首先对现存的PCB 缺陷数据集进行图像扩充, 再利用不同的主流检测模型进行检测性能的实验对比。 由实验结果可知, YOLOv3 检测模型的mAP 高达98.99%, FPS 为71.28, 满足PCB 实时在线的检测需求。 此外, 本研究中的数据集仅囊括6 种常见的PCB 缺陷, 后期需要不断地更新缺陷种类数量,充分地发挥深度学习的自主学习和自动提取特征的能力。