魏雨
(西安培华学院 智能科学与信息工程学院,陕西 西安 710125)
随着科学技术以及现代工业技术的不断进步,能源对于人类生活乃至社会发展变得尤为重要。尤其进入21世纪以来,我国对于石油天然气的需求量在不断地增长。然而随着油气的不断开采,目前已进入深层开采时代,大量的油气资源存储在致密或低渗的岩石中,开发难度较大。
深入地球更深部位,扩大地层深处油气资源,不仅对建设我国能源安全的资源基础具有重大的现实和战略意义,也是加强我国油气勘探开发力度的现实领域。我国深部油气资源丰富,勘探开发程度低,深部页岩气等资源潜力巨大,勘探开发前景广阔,是当前和今后的重点研究方向。加强对深部油气地层机理、分布规律和深部流体流动机理的研究,开展基于地球物理的深层目标识别与预测、复杂地层条件高效钻井、复杂油藏改造等关键技术的研究。对地下储层进行准确评价描述,进而提高油气开采效率,成为了目前的研究热点。岩石薄片是由岩心取样打磨制成,能直观地对地下储层特性进行描述。
以前人们对于岩石薄片的鉴定识别,通常是由专门的技术人员采用手工方式进行鉴别以及统计。利用偏光显微镜对岩石薄片进行观测,分析其中的矿物组成成分以及对应的光化学性质。这种传统的人工方式需要耗费大量的人力物力以及时间,不仅效率低,准确度也有限制,因此越来越多的专业研究人员开始致力于对岩石薄片的数字图像的分析和鉴定。
岩性油气储藏层其形成过程是非常复杂的,其主要组成成分岩石颗粒之间因为强烈的压实作用和胶结作用,它们之间彼此接触极为紧密。再加上其形成后期的溶解作用,使得岩石颗粒与空隙之间的边缘变得模糊难辨。在岩石薄片图像中,大部分噪声点都是由岩石颗粒溶解残留物以及空隙中的自带的物质产生的。在以往的岩石薄片边缘提取与分割方法中,大部分是利用图像的灰度信息以及相邻像素之间的关联关系进行的,但是对于信息量大复杂度高的图像岩石颗粒分割以及空隙提取的效果较差。鉴于这样的情况,在传统处理方法的基础上,相关专业人员提出了更优的岩石薄片分割算法。
2015年,徐永进等提出利用CT图像层间相关性自动计算分割阈值进行目标分割,并以分割效果较好的帧为中心,进行自动区域生长修复,从而完善分割效果。2016年,张嘉凡等根据“物以类聚”的统计原理,按距离相近或相似程度对岩石CT图像中的像素进行标定,从而实现图像分割及量化。2018年,李周等对叠加序列图像的融合图后利用分水岭法进行目标颗粒提取,然后使用AGNES法自底向上对过分割区域聚类,实现颗粒的自动分割。2018年,彭志伟等针对岩石薄片在固定可视范围下的偏光序列图,根据颜色以及亮度的变化特征对岩石薄片进行边缘分割以及修复。2019年,钟逸等提出了基于Fast-MBD变换的超像素算法用于岩石薄片图像颗粒的自动分割。2020年,潘代玉等利用改进的SLIC算法进行岩石矿物颗粒边缘分割。2020年,司晨冉等提出了一种基于Mask R-CNN和分水岭算法的岩石颗粒图像分割方法,避免过分割的同时防止细骨料区域出现欠分割。2021年,周恒等融合多尺度和多角度的特征表达提出了一种改进的C3相干算法。2022年,严良平等通过提取深度图像与可见光图像的随机特征和显著性特征,并根据多组随机特征和显著性特征得到多个分割预测结果,最后选择最优分割结果。
综上所述,目前岩石薄片图像分割和识别的研究大多集中于岩石薄片单偏光图像,主要存在两方面的问题:一是对于凝胶填充不充分的溶蚀孔隙及杂基微孔隙的识别存在一定的局限性;二是现有办法对于颜色差异不大的相邻颗粒无法准确分割。那么,解决以上问题就成为当前的研究要点。
遗传算法,简称GA,是一种计算模型。GA以Darwin的进化论为基础,其核心思想是模拟自然界生物进化的过程,包括基因的选择与遗传。在实际使用中,遗传算法通常被用来搜索得到问题的最优解。
遗传算法从初代种群开始,按照自然界优胜劣汰和适者生存的自然法则,经过选择、交叉和变异操作,逐代演化来产生出越来越优的结果。对于某一代的种群,先计算个体的适应度,然后再无规律地随机选择出若干个体,再对这些选择出来的个体进行交叉和变异操作,得到新的后代种群。在整个操作中,完全遵照大自然中适者生存的法则,以及优胜劣汰的原则,一代又一代地逐步演变,最终得到对环境适应能力最好的个体,也就是问题的最优解。遗传算法的操作过程跟自然进化非常类似,对于参数较多条件复杂的数学问题求解效果很好。
遗传算法的三种遗传算子:选择,交叉,遗传。
(1)选择。选择操作就是从某一代群体中选择出一部分个体组成新的下一代,选择的依赖条件是适应度。简单来说,就是优胜劣汰。换句话说,对于某个个体而言,它的适应度越高,那么它被选中的几率就越大。这里以轮盘赌法为例,假如某个种群中个体的数量是,对于个体来说,它的适应度表示为f,那么个体被选取的概率就是P,P的表达式如式(1)所示:
对于某个种群,其中每个个体被选中的概率是定的。若某个体被选中的概率大,那么它被选中的机会就多,它所携带的遗传基因就有很大可能性在种群中扩散开来;反过来,若个体被选中的概率比较小,那么其极大可能会被淘汰掉。
(2)交叉。为了产生新个体,通常从前代种群中随机选择两个个体作为双亲样本,通过双亲染色体的交换组合,产生两个新的染色体作为后代,此过程称为交叉或者重组。一般情况下,最多使用的是单点交叉算子,也就是在配对的染色上随机选择一个位置,然后两个染色体在该交叉位置处进行基因的变换,执行过程如图1所示。
图1 单点交叉算子流程图
如图2所示,双亲A和B,经过单点交叉变为A'和B'。
图2 交叉算子示例
(3)变异。为了保证遗传算法不陷入局部寻优保证得到的是全局最优解,在进化过程中要进行变异操作。使用最多的是单点变异。比如某个基因的二进制编码为10101,对第4个基因进行单点变异,由“0”变为“1”,最终的基因变为10111,如图3所示。
图3 变异算子示例
对上一代群体经过选择操作、交叉操作和变异操作,最终得到下一代群体。
岩石薄片是一种特别薄的小岩片,首先需要在岩石样本上,以垂直层理方向切取,然后将小岩片磨成薄片。为了要在偏光显微镜下观察,所以必须足够薄,薄到光线可以穿透,一般的标准岩石薄片厚度为0.03毫米。
岩石薄片图像,是将岩石薄片放置在偏光显微镜载物台上使用高清摄像头拍摄而成的图像。
岩石薄片鉴定,就是将制成的岩石薄片放在偏光显微镜下,通过观察薄片中矿物质的结构以及其结晶特征,从而确定岩石中矿物的组成成分以及光学特性。另外,通过分析薄片中矿物的形成顺序,推断岩石的成因和类型,最终得到薄片样本中岩石的名称。目前,岩石薄片的鉴定识别通常用于油气储层的勘探与评价、环境保护、以及水利勘测等领域。
最大类间方差法(OSTU)是在20世纪70年代由一名日本学者提出的,是一种可以自动寻找合适的阈值的方法。OSTU一般用来做灰度图像的聚类处理,经过聚类后图像会被划分为两部分,前景部分和背景部分,前景也称为目标。OSTU利用直方图来计算最优的类内方差。前景部分图像和背景部分图像的类内方差越大,则说明二者之间的相似性越小,即划分的准确性就越大。
OSTU的原理是:存在某图像A,假定当前阈值是TH,在图像A中前景部分的像素占总图像像素的比例为,前景部分的平均像素灰度值为;背景部分的像素占总图像像素的比例为,背景部分的平均像素灰度值为,前景部分与背景部分之间的方差表示为,整幅图像的平均灰度为。
假设图像A的大小为×,整幅图像中灰度值小于阈值TH的像素数量是NUM,灰度值大于阈值TH的像素数量是NUM,则存在:
采用遍历法,当前景部分与背景部分之间的方差为最大时,此时所对应的阈值TH就是最优阈值。
(1)适应度函数:OSTU全局算法。
(2)选择算法:轮盘赌选择算法。
轮盘赌选择法的过程如下:
1)计算出种群中每个个体的适应度P。
2)计算每个个体的累积概率Q。
3)产生0到1闭区间内的一个的随机数,若<,则选1,否则选,使得Q<Q成立。
4)将步骤2)、3)重复次即可。
(3)交叉算法:利用单点交叉,取小于0.7的随机概率。
(4)终止条件:进化代数5 000。
(5)交叉概率:直方图中各灰度的概率。
(6)变异概率,一般取0.001~0.1。
本文分割算法流程如图4所示。
图4 本文分割算法流程图
步骤1:读取岩石薄片原图像,将BGR图转为灰度图。
步骤2:计算岩石薄片图像的直方图;将各灰度值的概率作为选择操作中的适应度,产生第一代种群。
步骤3:计算当前代的适应度函数。
步骤4:用轮盘赌法,按照一定概率从上一代种群中选择出若干个体,组成下一代的种群。
步骤5:对新种群进行交叉处理。
步骤6:对新种群进行变异处理。
步骤7:转到步骤3执行,直到设定的执行次数完成。
本文采用长庆油田的50张岩石薄片进行了实验,同时对这50张薄片图像还采用最大熵阈值分割算法和迭代阈值分割算法进行了处理,对所有岩石薄片图像的三种算法的处理结果进行比较,本文列出了其中四张岩石薄片图像的处理结果,如图5至图9所示。
图5 岩石薄片原图
图6 直方图
图7 最大熵阈值分割结果
图8 迭代阈值分割结果
图9 本文算法分割结果
以图5中的岩石薄片1为例,对岩石薄片1进行人工分割标记,将岩石薄片1分割为6类,而本文算法将岩石薄片1分割为5类,准确率达83%,结果如图10所示。同时,对图5中四张岩石薄片图像进行人工手动标记,结果与本文算法分割结果进行比对,如表1所示。
图10 岩石薄片1分割结果
表1 不同分割算法准确率比较
由表1可知,相比最大熵阈值分割结果和迭代阈值分割结果,本文分割算法的准确率高,平均准确率达90%以上。
本文提出的岩石薄片图像分割方法,先使用原始岩石薄片图像生成直方图,再结合GA算法自动获取适当的图像分割阈值。为验证本文算法的分割效果,采用50张长庆油田的岩石薄片图像进行了分割实验,本文算法的分割准确率可以达到90%以上。结果表明,通过大量岩石薄片图像的直方图信息,能够实现岩石薄片图像的分割阈值的自动选取。但是由于所采用的岩石薄片图像样本较少,因此仍旧有一定的误差,并且随着图像内容复杂度的提升,GA算法需要更长的时间以及更丰富的特征才能达到预期的效果。因此下一步的工作会针对这两方面做一些改进,以期望得到更好的分割效果并适应于更多的岩石图像种类。