BP神经网络在测井数据预测原煤灰分中的应用

2014-05-03 02:56谢小国曹莉苹
四川地质学报 2014年2期
关键词:训练样本原煤灰分

谢小国,曹莉苹

(四川中成煤田物探工程院有限公司,成都 610000)

煤质的主要参数有灰分、水分、含碳量和挥发分等,在这些参数中,煤层灰分(Ad)是决定煤用途的重要质量指标,因而煤层的原煤灰分分析是煤质分析中的重要组成部分。以往利用统计模型法和体积模型法分析原煤灰分只是通过简单的数学表达式表达测井参数与灰分之间的关系[1-2],大都没有涉及到精度研究,所以有时分析结果会产生较大误差。

BP(Back Propagation)神经网络是目前应用最为广泛的神经网络之一[3]。采用BP神经网络对原煤灰分进行研究,可建立利用测井资料分析原煤灰分的BP神经网络模型,通过网络训练与测试,验证BP神经网络用于原煤灰分分析的可行性。

1 BP神经网络

BP神经网络属于多层前馈神经网络,网络模型一般由输入层、隐含层和输出层构成,其中隐含层可以有多个。BP神经网络是一种误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,通过各隐含层逐层处理后,传向输出层。若输出层的实际输出与期望输出不符,则转入误差的反射传播阶段。误差的反向传播是将输出误差以某种形式通过隐含层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,并以此作为修正单元权值的依据。通过正反向传播的不断迭代,不断调整其权值,最后使信号误差达到可接受的程度或达到预先设置的学习次数为止[4]。

2 基于BP神经网络分析原煤灰分

测井某些参数与原煤灰分具有良好的相关性,在掌握川东某矿区大量实测井数据和部分煤质实验数据的基础上,利用测井数据建立预测原煤灰分的BP神经网络模型。原煤灰分预测主要步骤如下:

1)煤质实验数据和测井数据预处理;

2)选取网络训练样本和测试样本;

3)构建BP神经网络,进行网络训练和网络测试。

2.1 数据预处理

测井参数中自然伽马(GR)、密度(DEN)和视电阻率(NR)是敏感反应煤质的重要参数,按0.20m的采样间隔在煤层位置处采集这三种测井参数的测井响应值。由于相同测井数据测井环境不同,不同测井数据量纲不一致,因而需要对所有测井参数做环境校正及对测井响应值做归一化处理,有助于数据的同等条件分析。

归一化处理的计算公式为:

其中x是表示煤层的测井参数原始数据,x’是归一化处理后的数据, xmax和xmin分别为采集区间内的测井参数最大值和最小值。通过(1)式计算出归一化后样本数据见表1。

表1 网络样本数据及输出结果分析表

2.2 训练样本与测试样本

在归一化样本向量中,网络输入为自然伽马、密度和视电阻率等3个因子,网络输出为相应的原煤灰分。目前,训练样本数目的确定还没有通用的方法,一般认为,样本过少可能使得网络的表达不够充分,从而导致网络的外推能力不够,因而从提高网络精度的角度出发,网络训练样本的数目越多越好,但是训练样本过多可能会出现样本冗余现象,导致网络训练负担增加,从而可能出现信息量过剩使得网络出现过拟合现象[5]。根据样本数据选择的原则,结合本文实际问题,选择18个样本中的15个样本数据作为训练样本集,用于训练神经网络,选择3个样本数据作为测试样本集,用于测试网络的训练效果。

2.3 BP神经网络结构模型

理论分析证明,单隐含层的感知器可以映射所有连续函数,因而具有三层(1个输入层、1个隐含层和1个输出层)的神经网络结构即可实现任意非线性映射问题[6]。因此建立基于BP神经网络的测井数据原煤灰分分析模型,选择三层神经网络拓扑结构:输入层、隐含层(单隐含层)、输出层。

网络输入向量有自然伽马、密度和视电阻率等3个元素,所以输入层神经元数为3个。网络输出向量为原煤灰分1个元素,所以输出层神经元数为1个。隐含层神经元个数比较难确定,无统一规律,一般通过反复试验确定。确定隐含层神经元数的常用方法是试凑法,通过逐渐增加隐含层节点数,对样本进行训练,确定误差最小时对应的隐节点数。确定隐含层神经元数的经验公式为:

其中m为隐层节点数,n为输入层节点数,l为输出层节点数,a为1~10之间的常数。由(2)式确定隐含层神经元数为7个。因此BP神经网络的结构为(1,7,1)型,网络模型结构如图1。

BP神经网络的训练次数最大为1000次,训练目标为1×10-5。当训练次数大于最大训练次数或训练误差小于训练目标时停止训练。

2.4 网络训练与测试

为了测试网络预测原煤灰分效果,分别用训练样本和测试样本作为网络输入。用训练样本训练神经网络,经过14次迭代,网络误差精度达到要求(1×10-5),网络训练停止,如图2。通过训练好的网络可能用测试样本进行测试,网络输出结果与其期望输出的对比见表1。

2.5 实验结果分析

从表1可见,利用测井资料建立的BP神经网络分析原煤灰分效果良好,训练样本输出结果的误差很小,相对误差在-4.02%~2.56%,说明训练精度较高。测试样本输出结果的绝对误差较前者有所增加,但相对误差最大也只有6.23%,说明网络具有较好的泛化能力,对训练样本之外的数据可以给出相对准确的预测结果。

3 结论

图1 网络结构模型

图2 BP神经网络训练结果

BP神经网络的高度非映射性和自我学习能力,很好地解决了多种测井参数与原煤灰分的非线性关系,网络输出结果与期望结果一致性好,因而采用 BP神经网络建立测井参数分析原煤灰分的模型具有较高的可行性和预测精度。但 BP神经网络对样本数据具有很大的依赖性,当样本数据较少时,网络学习能力差,预测效果则不理想。同时,网络结构和网络参数的确定非常关键,有待进一步优化。

[1] 王艳梅, 邓霜岭. 贵州某矿区煤中灰分与测井参数相关性研究[J]. 测井技术, 2006, 30(2): 173~176.

[2] 孟召平, 朱绍军, 贾立龙, 等. 煤工业分析指标与测井参数的相关性及其模型[J]. 煤田地质与勘探, 2011, 39(2): 1~6.

[3] 飞思科技产品研发中心. 神经网络与Matlab7实现[M]. 北京: 电子工业出版社, 2005.

[4] 李春辉, 陈日辉, 苏恒瑜. BP神经网络在煤与瓦斯突出预测中的应用[J]. 矿冶,2010, 19(3): 21~23.

[5] Sassan Saatchi, Kerry Halligan, et al. Estimation of forest fuel load from radar remote sensing [J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(6):1726~1740.

[6] 何长虹, 黄全义, 申世飞, 等. 基于BP神经网络的森林可燃物负荷量估测[J]. 清华大学学报(自然科学版), 2011,51(2): 230~233.

猜你喜欢
训练样本原煤灰分
基于灰分回控的智能密度控制系统在寨崖底选煤厂的应用
灰分在线检测对选煤智能化建设作用的思考
1-3月份全国规模以上工业原煤产量97056.1万t
3月份全国23个省、直辖市规模以上工业原煤产量34076.2万t
潘集选煤厂重介灰分控制系统的开发与应用
不同重量僵蚕总灰分含量的比较研究
人工智能
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法