陈法法,邓斌,刘莉莉,陈保家,肖文荣
(三峡大学 水电机械设备设计与维护湖北省重点实验室,湖北宜昌 443002)
带钢作为工业领域中重要的基础材料,受加工环境、生产工艺及原材料的影响,其表面极易产生划痕、孔洞、夹杂物等缺陷[1-2]。针对带钢表面缺陷进行精准识别,可以明确带钢表面缺陷的主要类别,据此调整并改进轧制工艺,提升带钢成品的产品质量[3-4]。然而,带钢表面缺陷类型复杂多样,部分缺陷形貌相似,区分度较小,难以有效分类辨识。传统依赖人工目测对带钢表面缺陷进行分类辨识,其分类准确度在很大程度上取决于检测人员的检测经验,同时由于长时间的重复劳动,容易产生视觉疲劳,准确度较低[5-6]。
在基于视觉图像进行带钢表面缺陷辨识的过程中,由于带钢表面缺陷类型复杂,缺陷特征多样,部分不同缺陷之间形貌相似,而同类缺陷之内又存在较大差异,难以有效区分[7-8]。为了实现对带钢表面缺陷的有效辨识,首先需要构造能够有效表征带钢表面缺陷的特征集合。为此,本文从带钢表面的灰度特征和纹理特征出发,从不同角度构建表征带钢表面缺陷的混合域特征集,以期实现对带钢表面缺陷的精确定量描述。
随后,为了实现对带钢表面缺陷的自动辨识,还需要构建智能分类模型。现今,部分文献正在采用深度学习等先进的智能分类模型,深度学习对于特征向量规模庞大的大数据分类辨识场合,其优势无可比拟[9-10]。但是,在实际工程应用中,对于特征向量规模不大的小样本分类辨识场合,支持向量机(SVM)在算法复杂度、运行效率及泛化能力等方面依旧具有一定的优势[11-12]。在利用SVM 进行分类辨识的过程中,多核相对于单核在解决小样本、非线性问题等方面具有独特优势,尤其在面对区分度较小的带钢表面缺陷特征的分类辨识方面,鲁棒性更高,泛化能力更强。
为此,本文设计了基于混合域特征集与MK-SVM的带钢表面缺陷分类辨识方法。首先,将预处理后的缺陷图像转化为灰度图像,提取带钢表面缺陷的灰度特征和纹理特征,构建混合域特征集,然后建立多核支持向量机的分类辨识模型,通过K 重交叉验证和网格搜索对核函数参数和权值参数进行优化,最后将获取的混合域特征集输入给优化后的多核SVM 分类器实现对带钢表面缺陷的分类辨识。
为了对带钢表面缺陷进行准确定量描述,本文以灰度图像为基础,提取带钢表面缺陷的灰度特征和纹理特征,构建带钢表面缺陷的混合域特征集。
1.1.1 灰度特征参数
灰度特征是图像识别领域中最为直观的特征参数之一,不因图像旋转或尺寸变化而改变。灰度特征参数是在图像的灰度直方图的基础上通过统计计算来获取的。设P(k)为 灰度直方图中灰度级k出现的概率,则
式中:N为图像中像素点的总数;N(k)为灰度级为k的像素点个数。在此基础上,灰度直方图的均值、方差、倾斜度、能量、以及熵分别计算如下:
1)均值。反映了图像的平均灰度值,不同缺陷类别的图像,其灰度水平有一定差异。
2)方差值。反映了图像灰度分布的离散程度。
3)倾斜度。反映了图像灰度直方图分布偏离均值的对称情况。直方图分布越不均匀,倾斜度值则越大。
4)峭度。其值反映像素点灰度值分布的相对平坦性。当图像灰度集中于均值附近,峭度值较小。
5)能量。衡量图像灰度分布的平均程度。当图像中灰度值分布越均匀,能量值越大。
6)熵。衡量图像信息的失调程度。当直方图分布不均匀,即图像信息失调度变大,则信息熵增大。
1.1.2 纹理特征参数
纹理是一种反映图像中同质现象的视觉特征,该类特征指标主要表征在缺陷的形状和大小等方面,不受缺陷图像自身的颜色和亮度的影响。本文采用灰度共生矩阵[13-14],来计算带钢表面缺陷图像的纹理特征。
设灰度图像大小为M×N像素,灰度级为L,f(x,y)为 灰度图像在像素点 (x,y)处的灰度值,图像中像元 (x1,y1)的 灰度值为i, 像元 (x2,y2)的 灰度值为j,则图像的灰度共生矩阵可表示为
式中:1 ≤x1,x2≤M,1 ≤y1,y2≤N;d为生成步长,即两个像元间的距离; θ为两像元的连线按顺时针方向与横轴的夹角。文中,设定步长d=1, 灰度级L=16,θ 取0,45°,90°,135°。为便于计算,通常采用归一化的概率值表示灰度共生矩阵元素,即
式中s为灰度共生矩阵中各元素之和。
在此基础上,计算对比度、相关性、熵、方差、逆差矩以及2 阶矩,共6 种纹理特征参数来描述图像的纹理特征。各计算式如下:
1)对比度。反映了图像的清晰度和纹理沟纹深浅的程度,纹理沟纹越深,其对比度越大。
2)相关度。衡量灰度共生矩阵元素在行或列方向上的相似程度。当矩阵元素值均匀相等时,相关值就大;相反,若矩阵元素值相差很大,则相关值就小。
式中:ux为矩阵的行均值;为矩阵的列均值,为矩阵的行标准差,为矩阵的列标准差,
3)熵。反映图像中纹理的复杂程度和非均匀程度,纹理复杂程度越高,其熵值越大。
4)方差。反映了纹理的周期,周期越大,方差越大。
式中m为p(i,j)的均值。
5)逆差矩。反映了图像纹理的同质性,是纹理局部变化的度量。纹理越规则,逆差矩的值越大。
6)角2 阶矩。是灰度共生矩阵各元素的平方和,反映图像纹理的粗细程度。纹理越粗,2 阶矩的值越大。
支持向量机(SVM)是一种基于结构风险最小化原理的机器学习方法,在处理小样本、非线性和高维模式识别问题上具有显著的优势。目前,在实际运用中常用的核函数包括线性核函数、多项式核函数和径向核函数等。
线性核函数表达式为
多项式核函数表达式为
式中:g>0; coef0≥0;q≥1。
径向基核函数表达式为
多核相对于单核在解决小样本、非线性问题等方面具有独特的优势,尤其在面对区分度较小的带钢表面缺陷特征的分类辨识方面,鲁棒性更高,泛化能力更强。为此,本文设计多核支持向量机,进行带钢表面缺陷特征的辨识和分类。
多核函数一般表达式为
多核函数可由不同的基本核组成,在此选用泛化能力较强的多项式核函数和学习能力较强的径向基函数构造多核支持向量机MK-SVM,其表达式为
式中: c oef0默 认为0;q为 多项式阶数; σ为高斯核带宽;n为多核权重因子。
在带钢表面缺陷的分类辨识过程中,首先提取带钢表面缺陷的灰度特征和纹理特征,构建混合域特征集,根据缺陷分类辨识对特征指标的敏感程度对特征指标进行优化选择,去除不相关的非敏感特征,然后建立多核支持向量机的分类辨识模型,通过K 重交叉验证和网格搜索对核函数参数和权值参数进行优化,最后将获取的混合域特征集输入给优化后的MK-SVM 分类器实现对带钢表面缺陷的分类辨识。带钢表面缺陷分类模型结构如图1 所示。
图1 带钢表面缺陷分类模型
带钢表面缺陷分类模型具体步骤如下:
步骤1 对带钢表面缺陷图像进行滤波去噪、特征增强处理。
步骤2 基于预处理后的灰度图像,提取带钢表面缺陷的灰度特征和纹理特征。
步骤3 根据缺陷分类辨识对特征指标的敏感程度对特征指标进行优化选择,去除相关性较小的非敏感特征,构建表征带钢表面缺陷的混合特征集。
步骤4 建立MK-SVM 的分类辨识模型,通过K 重交叉验证和网格搜索优化核函数参数和权值参数,利用训练集对优化后的MK-SVM 进行训练。
步骤5 使用测试集对训练后的MK-SVM 模型进行测试验证,得到分类结果。
为了验证本文方法的有效性和适用性,采用东北大学宋克臣博士在国内某大型钢厂采集到的带钢表面图像[15]。图像采集的硬件配置主要包括光源和相机,其中光源为LED,型号为HLND-1 200-SW2;通过Balser 公司型号为acA640-90uc 的4 台面阵彩色CCD 相机获取带钢表面的缺陷图像,其分辨率为658×492,最大帧数为90 fps。为了提高图像处理效率,设置图像尺寸大小为200×200。
带钢表面缺陷数据集包含6 种典型的热轧带钢表面缺陷,即划痕、补丁、夹杂物、麻点、银纹和轧制鳞片,各个缺陷示例如图2 所示。6 种不同类型表面缺陷分别包含300 个图像样本,则数据库共包括1 800 幅灰度图像,每幅图像的原始分辨率大小为200×200。
图2 各类缺陷图像示例
带钢表面的缺陷类型及图像特征描述如表1 所示。在实际工程应用中,为了对带钢表面的缺陷进行智能检测与识别,需要对带钢表面缺陷的图像特征进行定量描述。为此,本文以灰度图像为基础,分别提取其灰度特征参数和纹理特征参数,构造带钢表面缺陷的特征集,从不同角度量化带钢的表面缺陷特征。
表1 带钢表面的缺陷类型及特征描述
1)灰度特征
带钢表面不同缺陷图像的灰度分布直方图如图3 所示。由图3 可以看出,划痕缺陷集中在左侧的低灰度值区域,直方图上升和衰减趋势都较快,呈现尖峰特性。补丁缺陷的灰度值分布范围大,集中分布在中间和左侧的灰度值区域,含有多个波峰。夹杂物缺陷的灰度值集中分布在中间区域,直方图左侧呈垂直上升趋势,右侧呈梯度衰减。麻点缺陷图像的灰度值集中分布在右侧高灰度值区域。银纹缺陷的灰度值集中于较高灰度值区域,分布范围较大,近似于正态分布。轧制鳞片缺陷的灰度值集中在灰度值较低的区域。
图3 不同带钢表面缺陷图像的灰度分布直方图
对灰度直方图进行统计计算,得到表征带钢表面缺陷的定量灰度特征,如表2 所示。为了直观观察灰度特征指标对带钢表面缺陷的可分性,从样本库中对6 种不同的带钢表面缺陷随机各抽取50 个样本,共计300 个样本,其中样本编号1 ~ 50 为划痕缺陷、51 ~ 100 为补丁缺陷、101 ~ 150 为夹杂物缺陷、151 ~ 200 为麻点缺陷、201 ~ 250 为银纹缺陷、251 ~ 300 为轧制鳞片缺陷。通过计算每一个样本图像的6 个灰度特征指标,绘制不同指标下300 个样本的特征指标序列如图4 所示。
表2 带钢表面不同缺陷图像的灰度特征参数
图4 各类带钢表面缺陷的灰度特征数值分布情况
由图4 可以看出,灰度特征中,平均值、方差、能量和熵4 个特征指标在带钢的所有表面缺陷类型上都有较为独立的分布区间。对于倾斜度和峭度两个特征在划痕缺陷下的特征分布具有一定的区分度,但对于其他缺陷类型的区分度极小,兼顾考虑灰度特征提取的全面性和敏感性,摒弃了对带钢表面缺陷不敏感的倾斜度和峭度两个灰度特征指标。
2)纹理特征
纹理特征是对于包含若干个像素点的某一区域的灰度变化进行统计计算,包括:2 阶矩、对比度、相关度、纹理熵、纹理方差、逆差矩等指标。对带钢表面缺陷图像的纹理特征进行统计计算,其结果如表3 所示。
表3 带钢表面不同缺陷的纹理特征参数
为了直观观察纹理特征指标对带钢表面缺陷的可分性,对前述的300 个样本,通过计算每一个样本的6 个纹理特征指标,绘制不同缺陷的纹理特征指标序列如图5 所示。
图5 各类带钢表面缺陷的纹理特征数值分布情况
由图5 可以看出,不同带钢表面缺陷之间具有较强的可区分性。通过比较可以发现,方差均值指标在补丁和银纹缺陷的数值分布上存在一定的混叠现象,但是在其他缺陷上还是具备一定的可分性。兼顾考虑纹理特征提取的全面性和敏感性,在此,保留了纹理特征的6 个特征参数作为后续识别模型的特征指标输入。
综合带钢表面缺陷的灰度特征和纹理特征对带钢表面缺陷的敏感程度,对每一幅带钢表面缺陷图像各提取4 个灰度特征和6 个纹理特征,构成识别带钢表面缺陷的混合域特征集。
为了避免混合域特征集中个别数值较大的特征指标在后续的分类辨识中起主导作用,同时进一步统一不同采集硬件和光照环境下所采集的带钢图像特征指标量值,在此将混合域特征集的特征指标进行归一化处理。设N类带钢表面缺陷样本图像的某一特征指标为Ei, 其中1
提取带钢表面缺陷各状态下的10 个特征指标作为后续辨识模型的特征输入,其计算结果如表4所示。从得到的缺陷样本中随机抽取6 种状态下各100 组数据作为训练样本,构建带钢表面缺陷的分类辨识模型,剩余样本作为测试样本。
表4 基于混合域特征集的特征向量.
为验证多核支持向量对在带钢表面缺陷分类辨识的有效性,本文将多核支持向量机与传统的多项式核、径向基核支持向量机作对比实验。从东北大学宋克臣博士公开的带钢表面缺陷图像数据集中抽取的1 800 个样本,包含6 类缺陷,每类缺陷各有300 个样本。取每类缺陷200 个样本,共1 200 个样本作为训练样本,其余600 个作为测试样本,所有模型的训练和测试均基于64 位的Windows 10 操作系统,计算机显卡配置为Intel(R) UHD Graphics 630,处理器为Intel(R) Core(TM) i7-8700 CPU @ 3.20 GHz,机带内存4.00 GB。利用上述分析得到的特征向量建立样本特征向量矩阵,通过相同的训练集进行训练得到分类模型,并以相同的测试集进行分类测试评估。
文中采用K 重交叉验证法对多项式核函数中核参数g和径向基核函数中的惩罚因子 γ和核参数进 行优化选取。参数 γ的取值范围设为g和g的取值范围设为步长设置为20.5, 设定多项式核函数的阶数q=1,对数据集进行5 重交叉验证的参数寻优,寻优结果为g=150、γ=5.656 9和
在MK-SVM 的相关参数确定过程中,多核函数内部各个单核函数的参数设置与单一多项式SVM与径向基SVM 设置相同,然后再通过网格搜索的方式对MK-SVM 的惩罚因子 γ和多核权重因子n进行优化选取,最终得到 γ =5.443,n=0.16。不同辨识模型的分类辨识准确率如表5 所示。为更直观的对比不同SVM 的分类效果的优劣,绘制各类缺陷分类准确率折线图,如图6 所示。
表5 3 种SVM 对各类缺陷的正确分类量
图6 3 种SVM 对带钢表面各类缺陷分类准确度
结合表5、图6 可以看出,划痕缺陷的正确分类数量明显低于其它缺陷,多项式SVM 识别准确率为64%,径向基SVM 的识别准确率为71%,MK-SVM对划痕缺陷的分类准确率显著提高,达到91%,但麻点缺陷的准确率有小幅降低。针对补丁、夹杂物、银纹以及轧制鳞片的缺陷,不同SVM 的分类准确率浮动较小,均有95%左右的识别准确率。由此可见,选择合适的核函数对带钢表面缺陷的分类识别准确率有较大影响,由于3 种核函数的SVM 均有一定的识别效果,单核SVM 的特征映射能力不如多核SVM,因此选择多核通过自适应调整核函数的权重能够达到最优的分类辨识效果,同时多核SVM 识别一张图片的平均时间约为50.98 ms,满足带钢生产时表面缺陷实时识别的要求。
为进一步分析MK-SVM 的分类效果,通过混淆矩阵直观观察MK-SVM 对不同缺陷类型的正确辨识以及误判情况,MK-SVM 对带钢表面缺陷的分类辨识结果的混淆矩阵如图7 所示。
图7 多核支持向量机的混淆矩阵
从图7 可以得知,对于轧制鳞片缺陷图像的分类效果最好,100 张测试图像的分类准确率达100%;补丁、夹杂物、银纹缺陷图像的分类准确率均超过了96%;划痕和麻点缺陷的误判率相对较高,而且通过混淆矩阵可以看出,划痕被错识为夹杂物缺陷,麻点缺陷较易被识别为划痕缺陷,这与实际的带钢表面缺陷图像特征一致。
本文设计了一种混合域特征集与多核支持向量机结合的带钢表面缺陷特征识别方法,并通过实验验证得出以下结论:
1)针对带钢表面不同类型缺陷图像样本,从多个角度提取特征参数,构造混合特征集,包含了丰富的缺陷特征信息,保证了缺陷类别识别的准确度。
2)本文通过设计多核支持向量机,克服了单核SVM 在对规模较大、特征信息繁多、多维数据分布不规则等样本特征数据识别时泛化能力不强的局限性,显著提高了带钢表面缺陷辨识的准确率。