姚 斌 何立风,2 康世英 赵 晓
(1.陕西科技大学电子信息与人工智能学院,陕西西安,710021;2.日本爱知县立大学信息科学学院,日本爱知,480-1198;3.咸阳师范学院计算机学院,陕西咸阳,712000)
纸张加填的最初目的是为了改善纸张的光学性能并降低生产成本。随着造纸工业的不断发展,填料作为纸张的第二大组分,在改善纸张光学性能、表面性能方面发挥了重要作用。同时,造纸填料(或改性填料)的应用也赋予了纸张的特殊功能,如磁性、阻燃性、抗菌性、导电性等。由于在纸张中添加填料可以改善网部滤水性能从而有利于提高湿纸幅干度,提高纸机车速和节约蒸汽用量,因此可以达到节能降耗,降低成本的目的[1-3]。研究发现,填料的种类、粒径及粒径分布、表面形貌等都会影响纸张的性能。对于给定的某种填料,填料的粒径大小决定了纸张的松厚度[4]。粒径越大,孔隙越大,纸张松厚度越高[5],而填料粒径大小确定时,粒径分布越窄,纸张松厚度越高[6]。填料粒径除了影响纸张的松厚度外,粒径分布对纸张强度也有着重要影响[7]。当填料类型相同时,填料粒径的不同会造成粒子数目的不同,从而对纸张强度的影响也就不同。有研究表明,对于颗粒形状相似,粒径较小的填料具有较大的比表面积,对纤维间结合的负面影响更大;相比于较大粒径颗粒填料,粒径较小的填料对纸张的强度性能影响更大[8]。此外,填料粒径对于纸张的透明度也有影响,较小粒径的填料有利于改善纸张不透明度。造纸企业可以根据不同的纸张需求,在生产过程中选择不同粒径的填料进行加填,因此填料粒径的测量便显得尤为重要。
本研究用扫描电子显微镜拍摄造纸填料得到一定放大倍数的填料图像,通过对图像进行预处理得到较为清晰的填料颗粒图像,然后采用图像特征提取中的连通域标记和欧拉数算法对图像中的填料颗粒进行识别和统计,经计算得到填料颗粒的粒径分布数据。最后,通过比较图像处理方法得到的数据和用激光衍射法测量得到的数据,分析其中差异形成的原因,探究一种经济、便捷且有效的填料粒径分布测量方法。
随着科技的不断发展,有关颗粒粒径分析的技术受到人们的普遍重视,已经逐渐发展成为测量学中的一支重要分支。目前经常使用的测量方法有筛分法、光学显微镜法、沉降法、超声波法、激光衍射法等,这些测量方法在不同的颗粒测量、分析领域发挥了积极作用,但是也存在着测量步骤繁琐、耗时长、测量结果对测量仪器依赖度较大、受人为主观因素影响较大等问题。
目前对于纸张填料的粒径分析大多采用激光衍射法。激光衍射法采用一系列的光敏检测器来测量未知粒径的颗粒在不同角度上的衍射光强度,使用衍射模型,通过数学反演,然后得到样品的粒径分布。该方法操作较为简单,测试速度较快,测试范围大,重复性和准确性好,可进行在线测量和干法测量,但仪器造价较高,结果受分布模型影响较大。
随着图像采集技术、图像处理技术的快速发展,采用计算机处理图像技术已经被广泛运用到各个微观领域检测中。采用图像处理的方法进行粒径分析,可以明显提高分析速度且操作简便。如在评价铁矿石的粒径特征中,通过处理矿石图像获得颗粒的二维形态特征参数,并建立相关的评价体系,实验结果证实,采用图像处理技术有效地实现了铁矿石深度还原评价[9]。随着工业科技的不断发展,摄像器件的价格也不断降低。现如今市场上已经有数千万像素级别以上的摄像器件,采集的数字图像具有极高的分辨率,能满足绝大多数情况下颗粒图像粒径分析的要求,这也使得采用图像处理方法分析填料粒径的分布成为可能。
在图像处理过程中,图像的拓扑特性对于图像平面区域的整体描述很有用,如连通域、欧拉特征等。在图像中,同一目标的像素具有连通性,通常都是通过连通域标记来区分图像中不同的目标,进而提取它们的特征来进行下一步处理。图像的欧拉特征称为欧拉数,被定义为该图像中连通域数量与孔洞数量之差。欧拉数也是图像重要的拓扑特征之一,用来描述图像的结构。欧拉数不会因为图像的扩大、缩小、旋转及变形而改变,有很强的鲁棒性。图像连通域、欧拉数的快速提取、计算可以改进智能机器人和无人驾驶车辆的计算机视觉系统;根据欧拉数可以进行目标快速分类,利用人脸、指纹特征(面积、长宽比)和欧拉数相结合的方式可以加快人脸检测、指纹识别等处理过程;在医学图像处理中,利用欧拉数可以快速计算细胞数量、加速图像匹配等。
由于填料图像放大倍数越高,填料颗粒细节越明显,因此本实验采用扫描电子显微镜拍摄的放大1500倍图像进行计算。首先对图像进行预处理,具体步骤包括二值化、去噪、分割、孔洞填充等。由于部分填料颗粒存在粘连现象,因此需要对粘连处进行分割。传统分水岭算法中,每一个局部极小值及其影响区域都是一个集水盆。实验中图像放大倍数较大,由于噪声及其他干扰因素的存在,使得局部极小值很多,容易造成图像的过分割现象。因此实验中对传统分水岭算法进行优化,去掉一些图像中的“局部极小值”以达到较好的分割效果。图1(a)为扫描电子显微镜拍摄的原始图像,图1(b)为经过预处理后的二值图像。
本研究中将改进的图像连通域标记和欧拉数算法应用到纸张填料图像处理过程中,快速识别、区分图像中的填料颗粒。连通域是指图像中具有相同像素值且位置相邻的目标像素点组成的图像区域。在纸张填料图像中,每一颗填料颗粒为一个连通域;此外,由于填料颗粒没有孔洞,所以图像连通域的数量和图像欧拉数相等。采用连通域标记算法识别图像中的填料颗粒,通过连通域中包含的像素个数,可以计算填料颗粒的面积,计算等效粒径;在进行连通域标记的同时计算图像欧拉数,统计颗粒数量,完成粒径分布的计算。
图1 实验图像样例
2.2.1 连通域标记
为了标记图像中的连通域,需要进行两个步骤[10]:①对图像进行光栅扫描,为扫描到的每一个目标像素分配一个临时标记,同时寻找是否存在与此临时标记等价的标记;记录并解析所有等价标记。②用等价标记中的最小值替换所有与之等价的标记。
在进行连通域标记过程中,需要对目标二值图像进行两次从上到下、从左到右的扫描,如图2所示。在第一次扫描过程中,对于每一个目标像素p(x,y),需要检查与其形成八邻接关系的、已经扫描过的4个像素p(x-1,y-1)、p(x,y-1)、p(x+1,y-1)和p(x-1,y)并进行以下处理。
图2 连通域标记工作窗口
(1)如果像素p(x,y-1)是目标像素,当前像素赋以p(x,y-1)的标记。
(2)如果p(x-1,y)是目标像素,当前像素赋以p(x-1,y)的标记;此时,如果p(x+1,y-1)也是目标像素,记录当前像素标记和p(x+1,y-1)标记为等价标记。
(3)如果p(x-1,y-1)是目标像素,当前像素赋以p(x-1,y-1)的标记;此时,如果p(x+1,y-1)也是目标像素,记录当前像素标记和p(x+1,y-1)标记为等价标记。
(4)如果p(x+1,y-1)是目标像素,当前像素赋以p(x+1,y-1)的标记。
(5)否则,当前像素赋以新标记。
对像素赋以标记后,需要对等价标记进行处理,以便确定哪些标记属于同一个连通域。方法:对每一个新标记p,创建一个等价标记集S,使得S(p)={p};如果两个标记集a∊S(u)、b∊S(v)属于等价标记,合并两个集合,S(w)=S(u)∪S(v),其中,w是u和v中的较小值。第一次扫描完成后,所有位于等价标记集S(α)之中的标记是等价标记,α是这些标记的代表标记;第二次扫描的任务是标记替换,用代表标记替换等价标记集中的所有标记。
经过两次扫描后,所有的连通域被赋以相同的等价标记,实验中只需要统计每个连通域的像素个数就可以得到该连通域的面积,进而可以计算等效粒径。
2.2.2 欧拉数计算
图像欧拉数E被定义为图像中连通域数量c与孔洞数量h之差,即E=c-h。在图像中,每一颗填料颗粒都是一个连通域,对填料颗粒计数只需统计图像中连通域的数量即可。而在实际统计时,笔者认为填料颗粒没有孔洞,这样图像中连通域的数量和图像欧拉数相等,因此可以用图像欧拉数代替图像中连通域数量实现计数。
传统的欧拉数算法实现过程中,需要对图像进行扫描,检查到某一个像素p(x,y)时,只需要判断当前像素所处4方格是否属于需要统计的10种特定模式的4方格(如图3所示)。如果是需要统计的,则相应计数器累加,如果不需要统计,转而处理下一个像素。当图像中所有像素处理完毕,可以得到要统计的4方格数量,记为N1、N2和N3,根据公式(1)就可以计算得到给定图像的欧拉数。
图3 传统算法需要统计的4方格模式
按照文献[11]的分析,笔者对算法进行了优化,在计算给定图像欧拉数过程中只需要统计图像中包含如图4所示的3种特定4方格模式即可。当图像扫描完毕,统计出3种4方格模式P1、P2和P3的数量,记为N1、N2和N3,利用公式(2)就可以得到给定图像的欧拉数。
图4 优化后算法需要统计的4方格模式
图像欧拉数可以得到给定图像中填料颗粒的数量,结合用连通域标记算法得到的颗粒等效粒径,能够实现粒径分布的计算。
用MATLAB对拍摄的40张放大1500倍的沉淀碳酸钙(PCC)填料颗粒图像(图像分辨率为1024×800像素)进行预处理,用图像连通域标记和欧拉数算法实现填料粒径分布的计算。
粉体颗粒中位径也称中位直径,通常记为D(50),其意义为粉体样品累积粒径分布为50%时的颗粒直径大小,用来表示粉体的平均粒度,是粉体粒度特性的关键指标。
本研究中的粒径分布主要统计不同粒径所占比例及中位径。两种方法测量的结果如表1所示。从两种方法的实验结果看,填料颗粒中位径测量结果基本一致。基于计算机视觉方法测得的结果中,中位径附近填料颗粒所占比例略高于激光衍射法测得的数据,原因是在采集到的个别图像中,背景纹理比较明显,与填料颗粒颜色过于接近(如图5所示),在图像二值化过程中被识别为填料颗粒,导致中位径附近填料颗粒所占比例偏大。在后续实验图像预处理步骤中,可以考虑引入目标颗粒圆形度参数,剔除圆形度过小的目标,以期得到更好的实验结果。
表1 两种方法的测量结果
图5 背景被误识别为填料颗粒样例
图6 大粒径填料颗粒被分割为细小颗粒样例
此外,对比两种方法的结果,发现采用计算机视觉方法统计粒径6.5 μm以上填料的数量明显小于采用激光衍射法得到的结果。图6为大粒径填料颗粒被分割为细小颗粒样例图。从图6可以看出,由于在图像预处理阶段采用分水岭算法对粘连的填料颗粒进行了分割,图中矩形框部分的填料颗粒被分为几个小的填料颗粒进行计算,因此用计算机视觉方法统计的大粒径填料颗粒所占比例与用激光衍射法相比偏小。
本研究采用计算机视觉的方法对纸张填料进行粒径分析。结果表明,所测样本中位径结果与用激光衍射法所测结果基本一致,可重复性好。利用计算机视觉方法进行微观领域颗粒检测是一种经济、便捷且有效的方法,可以在一定范围内用计算机视觉的方法代替激光衍射法进行粒径分析。在后续实验中,可以考虑在图像采集过程中注意背景的选取,尽量增大背景和填料的差异,同时在图像预处理阶段,针对实际情况进行图像分割,避免过分割和欠分割情况的发生,以期得到与用激光衍射法测量更为一致的数据,为探究纸张纤维网络结构中填料的粒径特性与纸张性能的相关性提供技术支持。