张学兰 李 军 孟范孔
(1.华南理工大学制浆造纸工程国家重点实验室,广东广州,510640;2.华南理工大学广东省造纸技术与装备公共实验室,广东广州,510640;3.华南理工大学机械与汽车工程学院,广东广州,510640)
在纸张生产过程中,由于设备磨损、生产原料质量和环境污染等原因,会造成一些外观纸病[1],而利用传统的人工检测方式进行纸病检测已经难以满足生产过程的需要。基于机器视觉技术的纸病检测系统的出现,不仅大大提高了检测效率,还实现了在线分析与控制。该技术能实时有效地监测运行中纸幅上的各种纸病,以便于操作人员及时反应,迅速找到导致纸病的原因,从而降低损纸率,提高成品率,减少操作人员的工作量[2]。
纸病的智能化在线检测的目的在于开发一套机器视觉系统,应用快速有效的算法,实现纸病的精确检测和定位[3]。纸病的智能化在线检测,即运用纸张图像的形态特征、灰度级统计、纹理特征、形态学、模糊逻辑及神经网络等进行纸病图像的分割和识别。针对现有的算法不能对同时含有不同种类纸病的图像进行分类识别,本研究提出了一种基于图像灰度变换和BP神经网络的纸病识别算法。
1.1 纸样图像的获取
本研究所用的图像是在反射光照条件下,通过扫描仪获取的纸病图像,像素大小为640×480,如图1和图2所示,分别为合格纸样图像和带有孔洞、脏点和褶皱的纸病图像。
1.2 纸病图像预处理
观察图2可以发现,孔洞和脏点与背景灰度有较大的区别,因此属于高对比度的纸病图像。大量实验统计表明,孔洞处的灰度比背景灰度均值高15%以上;脏点处的灰度比背景灰度均值低30%以上;褶皱处的灰度与背景灰度均值相差不大,但有很明显的灰度阶跃。
基于上述对3类纸病灰度特征的分析,本研究采用一种基于灰度经验的动态双阈值分割方法[4]来提取孔洞和脏点。首先计算得出纸病图像的背景灰度均值为220,再用图像背景灰度均值的1.15倍和0.70倍作为阈值进行分割,其中高于220×1.15的设为255,低于220×0.70的设为0,其余设为128。将图2的纸病图像进行双阈值分割后的结果如图3所示。
对比图2和图3可以发现,图3中保留了图2的孔洞和脏点的信息,而失去了褶皱的信息,原因是经过动态双阈值分割后褶皱处的灰度值被设为128。对于褶皱,由于其灰度阶跃比较明显,因此采用Prewitt算子来对其分割。经过Prewitt算子和形态学闭合运算后的图像如图4所示。在此检测过程中也可以将孔洞和脏点的边缘检测出来,但由于边缘检测后的脏点和孔洞的形态很接近,在后续识别中无法区分,因此还需要进一步处理。对图3和图4进行图像合成中的加运算,得到图5。从图5可以发现,脏点处的灰度为0,孔洞和褶皱处的灰度为255,但褶皱近似于直线,孔洞接近于圆形,这样就将孔洞、脏点和褶皱的代表性特征集合到一副图像中。但在脏点的外围同时有一个白色的圆环,其形态和孔洞很相似,在识别过程中会被当作孔洞来识别。因此,最终孔洞的数量应为识别出的孔洞的数量减去脏点的数量。
在图像识别中,常见的特征量按其类型可以分为形态特征、灰度特征、纹理特征。目标的形态特征[5]包括面积、长宽比、矩形度、周长、圆形度和偏心率等。灰度特征包括灰度平均值、方差、歪度、峭度、能量和熵等。纹理特征[6]包括二阶矩、对比度、相关度、纹理熵和纹理能量等。因此,图像预处理之后,就可以提取各类纸病的典型特征,以便对纸病进行分类。
经过对纸病图像的特征数据的统计,最终本研究选择目标的平均灰度、圆形度、长宽比和矩形度作为纸病识别的特征值。
(1)平均灰度
目标平均灰度Mean的计算公式[5]为:
式中,M表示目标像素的总数,P(x,y)表示目标范围内个各像素的灰度值。对图5进行特征提取后可知,对于孔洞和褶皱,其平均灰度应为255,而脏点处的平均灰度为0。因此,利用平均灰度便可以很好地将形态上很相近的孔洞和脏点区分开。
(2)圆形度
圆形度(ρc)是描述目标与圆形相似程度的量[5]。根据圆周长与圆面积的计算公式,圆形度的计算公式如下:
式中,As为目标区域的面积;Ls为目标区域的周长。圆形度越大,表明目标与圆形的相似程度越高。分别对20个形态各异的孔洞、脏点和褶皱的圆形度进行统计,结果如图6所示。
图6 纸病的圆形度
(3)长宽比
目标区域长宽比(ρWL)的计算公式[5]为:
式中,WR是包围目标区域的最小矩形的宽度,LR是包围目标区域的最小矩形的长度。分别对20个形态各异的孔洞、脏点和褶皱的长宽比进行统计,结果如图7所示。
图7 纸病的长宽比
(4)矩形度
矩形度(ρR)是描述目标区域与矩形相似程度的量[5],其计算公式如下:
式中,AS为目标区域的面积,AR是包含该目标区域的最小矩形的面积。对于矩形目标,矩形度取最大值1,对细长而弯曲的目标,矩形度的值较小。分别对20个形态各异的孔洞、脏点和褶皱的矩形度进行统计,结果如图8所示。
图8 纸病的矩形度
观察图6~图8可知,孔洞和脏点的圆形度和矩形度都远高于褶皱的,褶皱的长宽比远大于孔洞和脏点的,因此可以将褶皱识别出来。而对于在形态上十分相似的孔洞和脏点,主要是通过平均灰度来区分。这样利用平均灰度、圆形度、长宽比和矩形度便可以将3种纸病区分开。
图9 BP神经网络结构
本研究采用BP神经网络来建立纸病特征值和纸病种类之间的神经网络模型,并通过实验来验证该方法的可行性和准确性。
3.1 BP神经网络
基本BP算法[7]包括2个方面:信号的前向传播和误差的反向传播,即计算实际输出时按从输入到输出的方向进行,而权值和阈值的修正从输出到输入的方向进行。BP神经网络结构如图9所示,输入层m个神经元节点,隐含层n个神经元节点,输出层p个神经元节点。输入层第i个神经元节点与隐含层第j个神经元节点之间的权值为wji,隐含层第j个神经元节点阈值为bj;隐含层第j个神经元节点与输出层第k个神经元节点之间的权值为wkj,输出层第k个神经元节点阈值为bk。隐含层作用函数为sigmoid函数,输出层的作用函数采用纯线性函数。
3.2 分类器设计
3.2.1 输入层和输出层神经元节点数的确定
根据之前的分析可知,选取平均灰度、圆形度、长宽比和矩形度4个特征值便可以区分出孔洞、脏点和褶皱,因此BP神经网络的输入层神经元节点数为4个。根据3种纸病的特征值的特点,可以采用如下形式来表示输出:
孔洞:(1,1,0,1);脏点:(0,1,0,1);褶皱:(1,0,1,0)
每4个单元的输出代表一种纸病,因此输出层的神经元节点数也采用4个。
3.2.2 隐含层神经元节点数的确定
隐含层神经元节点数太少,容错性差,不能识别训练样本集中不包含的样本,而隐含层神经元节点数过多,不但使参数增多导致学习时间过长,而且会导致对样本的学习能力降低,使BP神经网络总体性能变差[8]。因此,实际应用中需要选择一个最佳隐含层神经元节点数。可根据参考式[9](5)~(7)求取最佳隐含层神经元节点数:
式中,m为隐含层神经元节点数;n为输入层神经元节点数;l为输出层神经元节点数;δ为1~10之间的常数[10]。由此可知,最佳隐含层神经元节点数在2~14之间。
3.2.3 分类器训练
本研究应用Matlab 7.6软件对纸病识别BP神经网络模型进行学习训练,以之前的60组数据作为训练样本进行训练。输入层和输出层均为4个神经元节点,隐含层神经元节点数在2~14之间,目标误差平方和为0.001,最高训练次数为1500,设置不同的隐含层神经元节点数达到训练精度时所需要的训练次数如图10所示。
图10 设置不同隐含层神经元节点数所需要的训练次数
因此,隐含层神经元节点数为12时,所需的训练次数最少,即BP神经网络的收敛速度最快。训练参数和训练结果图分别如表1和图11所示。
表1 BP神经网络的训练参数
3.3 分类器测试结果
BP神经网络分类器测试用的样本为通过扫描仪获取的含有若干个孔洞、脏点和褶皱的20幅纸病图像。根据网络实际输出和目标样本对照,对测试样本进行检测,纸病识别结果如表2所示。由表2可知,所选用的特征量和设置的训练参数是合理的。BP神经网络分类器对脏点的识别率可达到100%,但对于孔洞和褶皱的识别率却不能达到100%。主要原因是由于对于灰度阶跃不是很明显的褶皱,在图像预处理阶段容易造成欠检测而丢失掉褶皱的信息,导致后续无法识别;其次是扫描仪获取的图像的清晰度不够高。而对于孔洞的正确识别的关键是图像预处理过程中可以得到连通的脏点的边缘,这样识别出的孔洞的数量减去脏点的数量才是真正孔洞的数量。但由于实际脏点的多样性,会导致无法得到连通的脏点边缘,从而造成对孔洞的识别存在误差。
图11 BP神经网络的训练误差
表2 分类器识别结果
4.1 采用的双阈值分割和图像合成相结合的预处理方法,将孔洞、脏点和褶皱的特征信息集合到一幅图像中,再利用BP神经网络,可以很好地识别出同时含有孔洞、脏点和褶皱的图像中纸病的种类和数量,但识别率尚不能达到100%,主要是由于图像预处理阶段存在欠检测。因此,还需进一步改进图像的预处理算法,同时,尝试采用清晰度更高的图像获取设备。
4.2 实验结果表明,选取平均灰度、圆形度、长宽比和矩形度作为纸病的特征值,即作为BP神经网络的输入值,可以很好地对孔洞、脏点和褶皱进行分类。
4.3 由于本研究只讨论了3种常见的纸病类型,对于其他种类的纸病还存在着局限性。因此,在纸病样本的特征值选择和算法方面还需进行进一步的研究和优化,以便对更多的纸病类型进行检测。
[1]关建华.全幅纸病检测技术及在造纸中的应用[J].中国造纸,2002,21(6):32.
[2]徐 杰.基于机器视觉的纸病检测方法研究与应用[D].南京:南京林业大学,2008.
[3]陈文凯.基于机器视觉的纸病检测算法研究与集成[D].南京:南京林业大学,2009.
[4]吴 冰,秦志远.自动确定图像二值化最佳阈值的新方法[J].测绘学院学报,2001,18(4):283.
[5]朱 虹.数字图像处理基础[M].北京:科学出版社,2005.
[6]刘 禾.数字图像处理及应用[M].北京:中国电力出版社,2006.
[7]韩力群.人工神经网络教程[M].北京:科学出版社,2005.
[8]金成晓,俞婷婷.基于BP神经网络的我国制造业产业安全预警研究[J].北京工业大学学报:社会科学版,2010(1):8.
[9]范秋芳.基于BP神经网络的中国石油安全预警研究[J].运筹与管理,2007(10):91.
[10]Gallant Stephen I.Neural network learning and expert systems[M].London:The MIT Press,1993.