王福斌,刘 洋,霍晓彤,李占贤,潘兴辰
(1.华北理工大学电气工程学院自动化系,河北 唐山 063210;2.河北省工业机器人产业技术研究院,河北 唐山 063200;3.中石油北京天然气管道有限公司,北京 100101)
飞秒激光功率和加工方向影响等离子体光斑的亮度和几何形状,可通过分割光斑图像并对光斑的亮度特征和几何特征进行提取。飞秒激光等离子体光斑目标弱小,灰度变换后使得部分像素变得不易识别,影响分割效果。经典的Otsu分割方法[1]用来分割光斑图像时会产生过分割或分割不足,无法满足光斑图像精确分割需求。Niblack算法是一种经典的动态局部阈值算法,可以很好地保留图像细节,在低对比度图像分割上相比单一固定全局阈值分割有着明显的优势。对比分析表明:采用Niblack对光斑分割后,提取的光斑几何特征参数间的关联度及特征变化的一致性较高。
本文通过提取光斑图像的几何特征参数及亮度特征参数获得一个6维特征矩阵,构建基于特征矩阵的光斑图像分类识别模型。Huang[2]等提出结构简单、学习速度快和泛化性能良好的极限学习机ELM(Extreme Learning Machine),采用随机设置的输入层权值,一旦确定就不需调整,输出层权值则通过求解最小二乘范数来获得,其学习能力只与隐含层节点数有关。
等离子光斑微弱且与背景对比度低。在分割前对图像进行定位、裁剪,图像区域限定为225×225的方形区域。光斑实际由光斑烧蚀区、烧蚀过渡区及光晕三部分组成,为选择适合光斑图像的分割方法,对Otsu分割、Niblack局部分割效果进行了对比研究。传统的Otsu图像分割方法通过计算最大类间方差,使背景与前景差别最大[3]。Niblack局部分割是依据局部像素点的均值和标准差来决定中心阈值的局部特征二值化算法,利于避免激光光斑的过分割现象[4]。考虑到光斑核心烧蚀区易分割,光斑拖尾区域较难识别的特点,可借助局部阈值分割算法将部分有效的光斑拖尾过渡区保留下来,增强光斑特征。Niblack局部阈值T(x,y)求取公式为:
T(x,y)=m(x,y)+σ×(x,y)
(1)
其中,m(x,y)分别表示中心点(x,y)在邻域r×r内所有像素点的均值和标准差;σ为修正系数,用来限定判断同一类像素的偏移范围。进一步计算如下:
(2)
σ(x,y)=
(3)
式中,灰度值f(x,y)取值遵循如下条件:
(4)
Niblack算法通过动态确定各区域阈值,可较好的处理亮度不均的图像[5],若窗口中心像素点的灰度值小于当前窗口的阈值,则将当前点赋值为0,否则,赋值为255。
图1为采用Otsu方法及Niblack方法对50 mW光斑图像分割的效果。图1中(a)为光斑原始图像;图1(b)对应的三维图像;图1(c)为Otsu方法进行二值化分割结果,Otsu分割方法得到的图像受光斑光晕影响较大,分割后保留较大面积的无效信息,光斑目标分割效果不理想,降低了图像特征提取精度。通过调整k值得到图1(d)所示的分割结果,该图形不但包含核心烧蚀区还包括部分有效的烧蚀过渡区,分割后光晕以小面积块的形式存在,再通过面积筛选剔除干扰因素,最终得到图1(e)的光斑分割结果。
图1 光斑图像的Niblack局部阈值分割
采用Otsu方法对微弱光斑图像分割时,易造成过少或过多的去除光晕的影响,影响光斑目标图像特征信息提取精度,而采用Niblack方法分割结果能客观的反映烧蚀区变化,分割精度更高。分别采用Otsu和Niblack方法对50 mW、20 mW及10 mW烧蚀功率的光斑图像进行分割,Otsu方法得到的分割结果保留了大部分光晕,导致光斑的几何特征精度降低。Niblack方法分割后图像更能反映光斑烧蚀区特征,有助于光斑图像的特征提取及分析。通过提取光斑图像的像素面积、周长、长轴、短轴及长短轴比,得到两种分割方法获得的5种几何特征参数,如表1所示。
表1 不同分割方法分割后的光斑图像特征
依据光斑图像的特点本文提出基于Niblack光斑分割后,叠加在原始图像上获得光斑目标区域,在剩余光斑目标区域内对图像进行亮度特征提取。图2为通过叠加去除光晕影响的光斑图像。图2(a)为原始光斑的亮度特征区域,传统求亮度平均值的思想是从全图考虑,包括所有的像素,引入了光晕亮度的干扰。图2(b)为通过分割、叠加后保留的亮度区域,从图中可以发现,该方法剔除了光晕部分,可实现对特定光斑目标区域的亮度特征提取。
图2 基于分割的图像亮度信息
采用神经网络可将多种光斑特征数据,如亮度特征、几何特征有效的应用在光斑烧蚀功率分类中。本文采用BP神经网络、极限学习机网络对光斑图像烧蚀功率进行分类性能进行对比研究,网络输入向量为:像素面积、光斑周长、长轴、短轴、长轴与短轴的比及光斑图像亮度六个特征向量;网络输出为50 mW、20 mW、10 mW三类烧蚀功率。BP神经网络隐含层神经元个数选取按如下经验公式确定:
(5)
其中,h为隐层节点数;m为输入层节点数;n为输出层节点数目;a为1~10间的调节常数[6-7]。
选取50 mW、20 mW及10 mW烧蚀功率光斑图像各300幅,提取亮度和几何特征得到900×6的特征矩阵,矩阵的每一行表示一个样本特征。随机抽选840个特征作为训练样本,60个为测试样本,隐含层节点为7的BP神经网络对其预测,迭代次数为13,预测分类结果如图3所示。
图3 BP神经网络预测结果
图3中可以看出,有一个圆圈标记的实际值和星号标记的预测值没有重合,表明有一个测试样本没有被正确预测。经多次试验统计,BP算法分类预测正确率最优为98.33 %,平均训练时间为0.30624 s,预测时间在0.01 s左右,有较好的分类效果。进一步扩大数据集,减少特殊样本的干扰,将每种图像的特征扩大到1000个,总计3000个样本,从中随机选出2940个样本做训练集,剩余60个做测试集,预测结果如图4所示。
图4 大样本BP神经网络预测结果
2940个样本的平均训练时间约1.1133 s,预测时间0.01 s。由于20 mW和10 mW两者功率相差不大,光斑几何特征较接近,也导致了类别误判产生的预测误差加大。
为缩短神经网络的训练时间,进一步构建线性局部切空间排列LLTSA-BP(Linear Local Tangent Space Alignment)模型[8]和局部保持投影LPP-BP(Locality Preserving Projection)模型[9-10],采用流形学习降维方法将3000×6的特征矩阵降维到3000×3新矩阵,每个样本的维数由6维降低到3维,减小运算量。此时选取的隐含层节点数为5,预测效果如图5所示。
(a)LLTSA-BP预测结果
(b)LPP-BP预测结果
实验发现,降维后的数据有着很好预测效果。两者所需要的训练时间均在0.9031 s左右,比未降维数据训练时间节约了0.2 s。上述实验表明,基于构建的光斑亮度特征、几何特征输入向量数据,BP神经网络、LLTSA-BP及LPP-BP模型算法均可实现激光光斑功率识别。
极限学习机ELM神经网络内部连接方式与BP算法类似,其输入层、隐含层、输出层的神经元数目分别为n,l,m[11]。
其中,a为输入层节点到隐含层节点的输入权值,β为隐含层节点到输出层节点的输出权值,b为隐含层阈值,设:
(6)
激活函数为g(x),输出Y∈Rm×N包含N个样本,那么:
Y=Hβ
(7)
(7)式中,H为隐含层输出矩阵:
(8)
(9)
式中,H+为H的Moore-Penrose广义逆。
通过求解方程的形式,将复杂的神经网络训练过程简化为矩阵求逆问题,与传统的前馈神经网络学习方法相比效率较高。ELM训练过程如下:
(1)将部分标明类别的特征作为训练集输入ELM训练模型,选择一个合适的隐含层层数和激活函数,经训练得到a,b,β。其中a,b是随机数矩阵;
(2)测试集和a,b,β输入ELM预测模型,比较输出的预测和实际类别,得预测正确率。
为了和传统的BP算法作比较,随机抽取840个训练样本,60个测试样本,选用隐含层节点数为1100,激活函数为sig的ELM预测模型,20 mW烧蚀功率光斑分类结果如图6(a)所示。ELM分类预测正确率在93.33 %上下波动,分类效果尚可。平均训练时间为0.5812 s,预测时间在0.01 s左右。再随机选择2940个特征样本训练集,60个样本测试集,构建更大的样本集,观察预测结果如图6(b)所示。
图6 不同样本ELM预测结果
2940个样本的ELM平均训练时间约2.5653 s,预测时间0.01 s。为了达到90 %以上的正确率需要隐含层的个数至少为1000。表明增大其隐含层神经元个数,正确率的提高与运行时间亦增加。为缩短多隐含层ELM模型的训练时间,构建LLTSA-ELM和LPP-ELM降维模型,此时ELM隐含层层数为100,预测效果如图7所示。
图7 LLTSA-ELM和LPP-ELM预测结果对比
二者对降维后的数据有着很好预测效果。LLTSA-ELM模型的预测时间在0.0495 s左右,正确率在93.33 %上下浮动。LPP-ELM模型的预测时间约为0.0409 s,正确率约为96.67 %。由此可见LPP-ELM模型有着更好的预测效果。
对比研究隐含层节点数不同的各种模型的预测结果,期望选择一种较好的分类模型。首先对比模型取不同隐含层的分类效果,训练集2940×6,测试集60×6。对隐含层不同的网络训练五次取平均值,结果如图8所示。图8中,通过对比正确率和训练时间得到以下结论:BP和ELM随着隐含层神经元个数的增多所需训练时间逐步增加。可以看到BP神经网络的预测精度稳定在0.96之上,最短训练时间为0.7 s,最优分类效果所用时间约为1.8 s。ELM对该样本集的预测效果最大正确率为0.94,此时隐含层神经节点数为1900,所用时间为8.586 s。很明显,ELM对原始特征矩阵的分类效果不如BP神经网络,因此需要对数据集进行优化。通过流形学习算法降低样本维度,优化数据集,减少运算量。
图8 BP和ELM预测结果对比
进而构建LLTSA-BP、LPP-BP、LLTSA-ELM、LPP-ELM四种模型观察分类效果,如图9所示。
综合考虑正确率和训练时间,选择各个模型可以得到最优分类效果的隐含层数,如表2所示。
表2 不同模型的分类结果
由表2可以看出,LPP-ELM模型的分类速度最快,且分类正确率在0.95以上。
图9 四种分类模型预测结果对比
通过图像分割、特征提取、模型分类实现了对飞秒激光等离子体光斑烧蚀功率的分类。针对光斑目标弱小,亮度不均匀的特点,采用Niblack局部分割方法对光斑目标图像分割,得到了较好的分割结果。在分割的基础上对目标亮度区域进行掩膜覆盖,得到精确分割的光斑目标区域的亮度特征。采用不同模型,基于亮度特征和几何特征组成的特征输入矩阵向量进行烧蚀功率分类,发现LPP-ELM的分类较精确,速度更快,更适用于飞秒激光烧蚀光斑功率的快速分类。为发挥LPP-ELM模型速度快的优势,下一步将对LPP-ELM模型做进一步改进研究,提高算法分类准确率,使其达到平均正确率0.98的精度。