FCM聚类算法在岩石图像分析中的应用

2018-09-29 02:38程国建宋博敬
智能计算机与应用 2018年4期

程国建 宋博敬

摘 要:岩石的孔隙、喉道等特征是地质人员进行判断储层特征的重要参数。因岩石图像具有较高的复杂度,图像纹理相似,因而对岩石图像进行分析时有一定的难度。人工进行分析时,容易因为各种原因出现误差。本文提出利用模糊C均值算法(FCM)对鄂尔多斯盆地岩石铸体薄片进行聚类分析,实验结果能很好的将岩石铸体薄片中孔隙与岩石背景区分出来,为后期的岩石自动识别与分类奠定了基础。FCM是基于划分的一种非监督聚类算法。

关键词:岩石铸体薄片; 非监督聚类算法; 模糊聚类

Abstract: The characteristics of rock pores and throats are important parameters for geological personnel to judge reservoir characteristics. Due to the high complexity of the rock image and the similar texture of the image, it is difficult to analyze the rock image. When manual analysis is performed, errors may easily occur due to various reasons. This paper proposes the use of fuzzy C-means algorithm (FCM) to cluster analysis of the rock casting flakes in the Ordos Basin. The experimental results can well distinguish the pores and rock backgrounds of the rock casting flakes and lay a foundation for the later automatic identification and classification of rocks. FCM is an unsupervised clustering algorithm based on partitioning.

Key words: rock casting flake; unsupervised clustering algorithm; fuzzy clustering

[

引言

在今天,石油、天然气等已经成为人类生活的必须品。而要开采石油气,就需要获得储层的特征参数,所以获取岩石储层的特征参数是地质人员进行地质建模和地层解释的基础,其中岩石的孔隙度为识别油气层提供了依据。由于岩石的组织成分比较复杂,传统岩石图像的分类,仅仅依靠专业地质人员在光学显微镜下获取岩石图像的特征参数后再进行分类,不仅工作量很大,而且人工操作有一些不可控因素。比如:地质人员长时间的通过视觉对岩石薄片进行分类或者鉴定,会产生视觉疲劳,从而产生误差[1-2]。而本文利用FCM聚类算法对岩石图像进行聚类分析,不用人工进行样本标记,可获取岩石图像的孔隙,可以提取孔隙参数,为后期岩石图像分类奠定基础。这样地质人员工作量会进一步的减少,在一定程度上可以节省开支。目前FCM 算法已经被广泛应用于医学、遥感、数据挖掘等方面,而在岩石薄片中应用较少,本文利用FCM算法对岩石图像进行图像分割。聚类算法分为4种:层次聚类、密度聚类、方格聚类、模糊聚类。聚类算法的目的是要求类间相似性尽可能低,类内相似性尽可能高。

(1)基于层次聚类方法。一般有分裂式方法和凝聚式方法[4]。

(2)基于密度聚类方法。算法通过对稀疏区域加以划分高密度区以发现聚类和孤立点,此方法用于空间型数据聚类。基于密度算法中常用的是DBSCAN[5]。

(3)基于方格聚类方法。把对象空间划分为有限数目单元,形成一个能聚类分析的网格结构。如ENCLUS[6]、DCLUST[7]聚类算法等。

(4)基于划分的聚类方法。在已知聚类中心或者聚类数目的情况下,所取样本将被划分为几个中心簇,该方法是通过不断的迭代以此来获取新的聚类中心,当系统达到最大迭代次数或者比定义的误差值小时,迭代结束。FCM算法就是一种基于划分的聚类方法。

1 FCM算法和岩石图像分类

1.1 FCM算法簡介

2 实验结果与分析

图像分割的意义是将图像中的目标和背景中的像素划分为不同的类。本次实验利用FCM算法把岩石铸体薄片中的孔隙和岩石背景区分开来,在形成岩石储层时,岩石颗粒需要经过堆积、压实、溶蚀、成岩等过程。而形成的储层岩石受到温度、地热、地压等影响,可以形成不同类型的储层岩石。在堆积过程中,成岩颗粒随机堆放,然后经过压实,在压实过程中,孔隙会减少,岩石骨架会比堆积过程更加紧密地排列在一起。在这一过程中,孔隙减少,喉道会比之前更加细小,油气等其它有机物会储藏在岩石孔隙中,通过水驱油藏的形式或者其他形式来开采油气,但细小或者扁平状的喉道会使得该孔隙成为“死孔”或者称之为“无效孔隙”,进而影响渗透率,而渗透率是影响储层参数重要部分。所以获取岩石储层中的孔隙特征是判断油气储量的一个重要依据。压实过程中会受到温度、压力、张力等因素的影响。在成岩作用中,沉积微相带不同,形成的岩石成分也会有较大的差异,比如,存在于岩石中矿物质的成分以及比例等。而在溶蚀过程中,胶结物会在一定程度上减少,这在某种程度上孔隙半径会适当地增大,喉道也在某种程度上会增大,胶结物在某种程度上可以减少压实作用,使得在压实作用中,孔隙得以较好的保存,但胶结物也占据了一定的孔隙空间或者喉道空间,所以胶结物的存在对孔隙的影响是双面的。孔喉比是影响渗透率的重要因素,所以获取岩石储层中的孔隙特征是判断油气储量一个重要依据。而本文使用FCM算法对鄂尔多斯盆地苏格里地区的岩石铸体薄片进行分割,为后期的岩石组分识别打下了基础。

FCM算法是一种非监督聚类算法,在运行过程中无需地质或其它工作人员参与,待算法运行结束后得到分割的结果。实验中对3类岩石图像利用FCM聚类算法进行图像分割。本次实验聚类中心数目为2,即c=2。平滑因子为2,即m=2,当阈值小于0.1时,迭代次数为40时,即当ε<0.1时或者s≤40时迭代停止,运行结束。表1给出了此次实验的数据。图2左边为岩石薄片的原始图像,右边为利用FCM算法对岩石图像进行聚类分析的结果。实验结果显示,利用FCM聚类算法能很好的将目标孔隙与岩石背景区分开来。同时也表明,对于小数据量,FCM算法有较好的优势,运算速度快且有直观的意义,算法具有一定的鲁棒性。

从表1可以得出利用FCM算法对3类岩石图像进行分割的结果,实验结果显示该算法对3类岩石即粗粒长石砂岩、中粒长石岩屑砂岩、细粒长石岩屑砂岩都有较好地分割效果。FCM能较好地分割出目标孔隙和岩石背景,进而可以提取特征,为岩石分类提供了可能。在对中粒长石岩屑砂岩进行分割时,迭代次数最少为25次,实验用时最短32 s,系统误差值为0.095,最接近ε=0.1的值。对粗粒长石岩屑砂岩进行分割时,迭代次数为28次,耗时34 s,系统误差值为0.055。对细粒长石岩屑砂岩进行实验分割时迭代次数最多为31次,耗时37 s,系统误差值为0.060,细粒长石岩屑砂孔隙相比粗粒长石砂岩更难分割出来,因为细粒长石岩屑砂组成更为复杂,岩石颗粒更为细小。

3 结束语

本次实验利用FCM算法对3种类型的岩石彩色铸体薄片进行分割,取得了一定的经验,但也发现一些问题。FCM算法的缺点是对噪音数据敏感,不能收敛到目标函数的极小值;容易陷入局部最优、实验结果与初始聚类中心的选择也有很大的关系。下一步工作可以利用直方图的方法确定初始聚类中心,利用遗传算法全局随机搜索的特点,可以解决FCM算法在岩石图像分割中容易陷入局部最优的问题。这样在某种程度上,可以避免FCM的缺点,充分利用FCM对小数据量运算速度快、算法具有一定鲁棒性等优点,使得FCM算法在岩石图像的分析中有更清晰的一个结果,为后续的岩石图像分类,三维重建奠定基础。

参考文献

[1] 柴华,李宁, 夏守姬,等.高清晰岩石结构图像处理方法及其在碳酸盐岩储层评价中的应用[J]. 石油学报,2012,33( S2) : 154-159.

[2] MONJEZI M, SAEEDI S,TALEBI N. Application of neural network in prediction of fragmentation in Tehran limestone mine[J] . Journal of Mines, Metals and Fuels,2010,58 ( 7) : 177-179 .

[3] ZADEH LA. FUZZY SETS[J]. Information and Control, 1965, 8(3): 338-353.

[4] VOORHEES E M. Implementing agglomerative hierachic clustering algorithms for use in document retrieval[R]. State of New York: CORNELL UNIVERSITY,1986.

[5] ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial data sets with noise[C]//International Conference on Knowledge Discovery and Data Mining(KDD-96). Porland, Oregon:AAAI, 1996:226-231.

[6] 李智勇,童調生. 基于多物种进化遗传算法的神经网络结构学习方法[J].计算机工程与应用,2003,39(22):87-90.

[7] 高坚,贺秉庚. 网络结构拓扑扩展的混合遗传算法[J]. 计算机工程与科学,2002,4(3):3-4.