张 炜,付 元,刘 昕
(1.北京理工大学,北京 100081;2.煤炭科学技术研究院有限公司,北京 100013;3.煤科院节能技术有限公司,北京 100013)
智能化是矿山技术发展的最高形式,煤岩识别是实现无人化综采工作面重要的核心技术之一,随着民用图像处理识别技术的飞速发展,应用于煤岩边界精准识别成为研究热点,但是距离将该项技术转化为成熟的煤岩识别解决方案,并实际应用于智能开采中,还有很多需要突破的技术瓶颈,其中煤岩图像处理的算法及模型就是技术瓶颈之一[1]。
国内外多位学者应用不同的技术研究煤岩识别,通过雷达探测、煤岩反射识别煤岩分类[2]特性,在20世纪90年代可实现将部分煤岩粗放型分类识别,但煤及岩石种类繁多,不同介质反射情况不同,识别效果不直观、不精确,且也会因煤岩介质的不同而区别巨大[3-5],此类识别技术对智能化开采缺乏推广应用的精准技术支撑。
近年来在应用图像处理技术的煤岩识别研究方面取得了一系列成果[6-7],但主要集中在从煤岩性状、机理上对煤岩分析,鲜有学者对工作面的实际煤岩分界图像进行分析建模研究[8-9]。为此,在前人提出的煤岩识别技术的基础上,着重研究煤矿综采工作面的煤岩界面识别问题,根据煤岩基本特征、性状、区别,从图像边缘和灰度阈值的研究角度出发,研究煤岩分界识别的可行性[10-12]。
聚类分析法为多变量数据分析统计技术,是一种非监督式的数据分析工具,将没有事先分类的样本,由分析系统自动对所有样本分类识别。常被应用于模糊模式识别、海量数据分析提取;通过分层聚类和迭代聚类,进行群分析、点群分析。聚类分析算法应用于煤岩识别,设煤岩分界相似度为统计量,以此为划分类型依据。将每类相似度高的图像边界聚合为一类,并设定变量迭代,直到把所有统计量聚合收敛[13]。聚类分析方法及算法包括K-MEANS、KMEDOIDS、CLARANS的3种算法。
采用K-MEDOIDS算法,K-MEDOIDS算法是基于有序样品划分的重叠聚类方法,定义样本不同数据特征向量、类型、标度等的多样性空间属性距离函数的相似度,拟定初始聚类中心后,衡量有序样本数据点之间的Euclidean距离相似度。根据距离最小的原则,依次选出n类分类对象,将动态聚类对象Mp和模糊聚类对象Mq归并为一新类有重聚类Mr,不停迭代计算Mp、Mq、Mr新特征值及聚类中心之间的距离,直至实现聚类中心收敛,区分出煤岩分解特征值最优分类结果。
煤岩分界图像选取n个任意样本,设定所有medoids分界点的总样本为M,煤岩分界图像被划分为k个子样本C,Ci为其中任一样本;选择k个聚类中心Cj(E),其中:j的取值范围为1-k,每个点aj的medoids分界点与聚类中心b的分界点距离为Cb(其中:b的取值范围为1-k),则medoids的聚类中心收敛为:
针对开采工作面采集到的煤岩图像,提取煤岩图像分界的纹理特征,通过计算出灰度共生矩阵(GLCM,Gray-level co-occurrence matrix),提取煤岩边界的方向、相邻间隔、变化幅度等综合特征值、排列规则。先对具有相似度高的灰度值进行像素块分割,每个像素块灰度值局部内有变化,偏离点的灰度共生矩阵发散,其偏离对角线的间隔幅度变化值增大。进一步细分割像素区域,直至其每个分割像素区域的灰度共生矩阵对角线间隔幅度趋于相似[14-15]。
灰度共生矩阵提取及计算的主要过程为:
1)图像纹理变化的度量阈值,直接反应图像灰度分布均匀特性、纹理相似的精细度,考虑到井下开采工作面粉尘、光线弱等复杂图像状况,将煤、岩石、开采设备的图像灰度横向分为i个不同的经度、纵向分为j个纬度(为避免灰度共生矩阵计算量太大,i、j的取值范围一般为2~4)。
3)判别惯性矩相关性。分割的像素区域在i、j方向,度量空间共生矩阵元素的相似度相关值越小,煤岩图像分界的纹理特征、惯性矩也越小,相关性越大,得出相似最佳度阈值,来计算出度量空间灰度共生矩阵元素在i、j方向上的相似程度,相关值与灰度矩阵具有高度相关性;当惯性矩元素值均匀相等时,相关值大,矩阵像元值相差很大则相关值小,灰度共生矩阵离散,煤岩识别度低。
多尺度分解是面向对象的图像分解算法,煤岩图像中的边界分解是依据图像分析和特征提取分解而确定的,通过多尺度策略对煤岩分界像素空间的关联性自适应模拟,提出煤岩图像去噪评估的保真度效果,其空间相关性尺度与前文设定好的聚类中心收敛、灰度共生矩阵相一致[16]。随图像分解经纬尺度越大,图像多尺度细节信息越详细,煤岩纹理特征准确率也越高。对于多尺度最佳分解效果,目前并没有定性定量的理论依据,其优化尺度一般根据煤岩分界纹理特征的区分度确定。
煤岩图像的多尺度特征值选择、分解变换的煤岩纹理特征抽取步骤为:
1)选定煤岩图像区分度较大的区域,分解煤岩图像的空间方向性及像素多尺度特点,提取多尺度表达的相关性指标。
2)引入“亚像素”跨尺度分析方法,提取煤岩分界的多尺度联合分量,重建煤岩分界灰度尺度的垂直、水平、对角共生矩阵等细节参数(包括均值、方差、斜方差、中心收敛值)。在同一分解尺度下完成跨尺度联合提取,垂直分量计量绝对值大于水平方向和对角方向;水平分量各统计量的绝对值大于垂直和对角2个方向,绝对值都随着分解层数增加而增大[17]。
3)煤岩分界分解区域内灰度变化最明显的地方是提取的多尺度共生矩阵的极值点,也是煤岩分界有代表性的特征值。增加多尺度的分解层数,极值点集中的图像顶端变得平缓,经过多角度、多层次的分解后,完成抽取煤岩图像分界的有效特征量。
4)选取区分度为3提取分析不同区域煤岩分界纹理特征,建立煤岩图像多尺度特征值数据库,抽取跨尺度的均值、方差、斜方差、中心收敛值,以及总均值和总方差,构造煤岩图像多尺度特征向量。为达到更高识别率,重复以上步骤1)~步骤3),提高区分度为4提取不同区域煤岩分界纹理特征。
煤岩分界的纹理特性不是基于像素点的特征定义,而是反映纹理空间结构的差异特征值,包含分解区域的多个像素点区域中统计计算结果的表面性质。不同于灰度共生特性,出现局部偏差而无法匹配成功,在模式匹配中,区域性纹理特征具有较大优越性。因此,煤岩分界纹理特征有效提取、构建一致性和差异性较好的纹理特征空间,对于精准煤岩识别具有重要价值。
常用的纹理特征提取方法为2类:统计方法和信号处理法。采用统计方法完成煤岩识别的纹理特征提取,包括局部灰度统计量、Gabor滤波器分组、分形模型、灰度共生矩阵、局部傅立叶变换等。
导向度均值μ为:
直方图熵AH为:
式中:M、N为选取煤岩分界典型图像提取纹理特性的横、纵分割值;L为分型矩阵阶数;δ为分型矩阵典型特征值均衡系数;f(i,j)为分型模型对纹理特性提取函数;h(L)分型矩阵对图像灰度共生的特征函数。
采集工作面煤岩分界图像,根据已经提取煤岩的灰度共生矩阵、纹理特征值,建立去噪后的“相似度”度量模型,首先赋予初始值初步判定模型样本,确定模型初始值;为提升模型“自学习”样本初值,可将支架与煤壁顶板识别分界图像作为为煤岩识别线;然后选定煤岩纹理分界明显图像样本特征值,赋予模型完成“自学习”样本修正;若煤岩图像其他提取的特征值表述效果较为接近,出现局部收敛,表明“相似性”模型具有较好的合理性。另外,在对煤岩图像分解之前,需先对部分图像的灰度值亮点噪,否则会影响模型样本“自学习”校正。
层次聚类模型(Hierarchical Clustering Model)是将数据对象组成聚类集合,采用距离矩阵作为聚类模型标准,自上而下逐步凝聚,一般由K个聚类数目组成,合并最小相异度节点矩阵,以递减方式凝聚层次聚类迭代,设定终止条件,并不断地重新定位新的集合,基于簇族互联性合并成聚类树(Clustering Feature Tree),形成多阶段动态模型层次聚类;从聚类煤岩识别算法的源数据对象中抽取随机样本集P,设定完整样本中一共有m个数据点,基于层次聚类的K个聚类数目,样本集合P分解为k个划分后的子样本,满足概率分布函数p(k),则形成由K个层次的聚类模型。
依据制定的收缩因子逐步向聚类中心收敛,重复迭代完成模型“自学习”修正。
借助聚类基本理论,分析煤岩分界图像灰度共生矩阵及纹理特征值,初步实现煤岩分类及分解背景信息识别。通过多尺度共生矩阵、对角共生矩阵等细节参数,采用层次聚类煤岩识别模型的区域增长方法,剔除无效参数及特征值信息,减弱无效数据对分类和精准识别带来的不利影响[18-19]。煤岩识别对2组图像进行多尺度分解方法特征抽取,构造相应的特征向量,并将数据随机分为2组,1组为“自学习”训练样本,用于确定识别阀值和权值,另1组为测试样本,用来测试分类性能。煤岩识别优化模型流程图如图1。
图1 煤岩识别优化模型流程图Fig.1 Flow chart of coal and rock identification optimization model
1)研究灰度共生均值算法的聚类煤岩识别算法,形成煤岩图像分界、灰度阈值、纹理特征提取方法,聚类的煤岩识别方案,提高煤煤矿综采工作面采煤机截煤过程中的煤岩识别方法普遍存在效果欠佳、稳定性差、应用范围小等问题。
2)研究多尺度分解变换的煤岩纹理特征抽取方法、煤岩图像“亮点噪声”分析及处理技术,构建分块区域煤岩分界数据的图像采高模型;建立煤矿综采工作面与采煤联动的控制模型;评估定义煤岩图像识别去噪效果的保真度方法,构造均值纹理导向度和方差纹理导向度。
3)提出一种煤岩图像的识别方法,煤岩界面识别图像改进型配准、煤岩识别时间复杂度分析、不同距离、角度煤岩分界二维模型分析,提高煤岩识别准确率,为工作面煤岩精确区分、减少采煤机截割岩引起的故障和安全问题,提升开采自动化精准性提供识别理论基础。