高佳南,马乐天,白金阳,田皓天,黄曾宁,梁春燕,康 杰
(西安科技大学安全科学与工程学院,陕西 西安 710054)
随着浅部煤炭资源的大规模开发,未来浅部资源势必开采殆尽,煤矿将走向深部生产,由深部高地温引起的高温热害问题将不可避免[1-3]。井下风流是供工作人员呼吸、稀释排出有害气体、改善作业场所气候条件的基础,因此,准确预测井巷风温对于研究井下风流热力状态参数变化、科学评价矿井热害状况、合理制定热害防治方案、改善井下高温气候环境具有重要意义。
矿井进风井筒井底风温的准确计算对全矿井巷道风温的精准预测至关重要。对于有淋水的井筒,井筒风流与淋水水滴混合流的热湿交换为复杂的热力动态变化过程,井筒风温与其影响因素之间多为某种非线性关系,因此,淋水井筒风温解析计算较为复杂[4]。随着我国煤矿通风向信息化、智能化升级,机器学习模型广泛应用于煤矿通风安全领域,如通风网络故障智能诊断[5]、通风阻力系数确定[6]、通风系统可靠性评价[7]等。近些年来部分学者已通过机器学习算法开展了井巷风温预测探究性研究。如纪俊红等[8]采用网格搜索结合K 折交叉验证对XGBoost的参数寻优,建立矿井井底风温GSK-XGBoost 预测模型;张翔等[9]建立了井底风温PSO-BP 预测模型;吕品等[10]建立了井底风温BP 神经网络预测模型;马恒等[11]建立了淋水的井筒温度T-S 模糊神经网络计算模型。同时,上述文献研究结果也均表明,矿井井底风温机器学习预测模型具有适应性强、预测精度较高等优点,基于此,本文在文献[10]和文献[11]的基础上,利用皮尔逊相关系数分析各项特征参数与淋水井筒井底风温的相关性,剔除特征参数集中相关性弱或不相关的特征,提取主要特征参数作为构建淋水井筒风温预测模型的输入变量,利用遗传算法(GA)优化BP 神经网络的权值和阈值,建立参数优化的BP 神经网络模型(GA-BP 神经网络)进行淋水井筒风温预测,提高模型预测精度和特征参数获取效率。
皮尔逊相关系数为一种线性相关系数,其绝对值越大,两变量相关性越强,即相关性系数越接近1或者-1,相关度越强;越趋于0,则相关度越弱。皮尔逊相关系数法筛选特征变量步骤如下所述。
步骤一:数据初始无量纲化。不同的特征变量纲不同,在皮尔逊相关系数分析时,应首先对影响淋水井筒风温的特征变量进行无量纲化,具体计算见式(1)。
式中:i为不同特征变量;k为不同特征变量参数值。
步骤二:分别计算变量离均差平方和、变量离均差积和。变量X的离均差平方和见式(2)。
变量Y的离均差平方和见式(3)。
变量X与变量Y的离均差积和见式(4)。
步骤三:计算两个变量之间的皮尔逊相关系数,计算公式见式(5)。
按照以上步骤计算变量之间的皮尔逊相关系数,并对相关系数进行排序。
BP 神经网络是一种经典的有监督学习方法,通过输入信息的前向计算和输出误差信息的后向传递实现训练过程,具有强大的自学习、自适应和解决任意非线性映射问题的特点[12]。典型的三层BP 神经网络基本结构如图1 所示,输入层为接收特征变量,隐含层负责计算,输出层决策模型输出结果。
图1 典型BP 神经网络基本结构示意图Fig.1 Schematic diagram of the basic structure of a typical BP Neural Network
BP 神经网络类比人类大脑神经元突触结构来处理信息,通过输入层与隐含层、多层隐含层、隐含层与输出层间互联互通,由前向计算和误差反向传播信息,其中,前向计算是由输入数据沿着神经网络逐层向前计算传递信息,当输出层误差大于设定期望误差时进行误差反向传递,并逐层调整神经网络权值和阈值,重复上述过程至输出误差大于设定期望误差。
遗传算法是一种高效的启发式搜索、并行随机全局优化搜索算法,广泛应用于优化机器学习参数和求解最优值方面[13]。BP 神经网络模型所涉及的权值和阈值等参数对模型训练结果有较大影响,通常,建立传统BP 神经网络模型是取参数为[-0.5,0.5]的随机数,阈值与权值的适应度大小直接影响BP 神经网络模型的收敛速度,并且BP 神经网络容易陷入局部最小值[14]。因此,本次研究应用遗传算法优化BP神经网络的权值与阈值,算法流程如图2 所示,以提高BP 神经网络模型预测结果的准确性。
图2 遗传算法优化BP 神经网络模型算法流程Fig.2 Genetic algorithm optimization of BP Neural Network model algorithm process
遗传算法优化步骤如下所述。步骤一:对BP 神经网络的权值和阈值实数串进行编码生成初始种群;步骤二:通过适应度函数计算比较初始种群中每个个体的适应度值;步骤三:选择具有较高适应度值的个体作为父代进入下一阶段的交叉运算;步骤四:交换父代个体编码链中的部分基因产生新的个体;步骤五:以一定概率改变被随机选中的个体某些基因座上的值;步骤六:通过判定误差限或最大迭代次数获得权值和阈值最优解。
对于淋水井筒风温预测回归模型的预测结果,采用平均绝对误差MAE、平均绝对百分比误差MAPE等统计量对其预测效果进行评价。其中,平均绝对误差MAE计算见式(6)。
平均绝对百分比误差MAPE计算见式(7)。
式中:f(xi)为预测值,℃;yi为观测值,℃。
井筒围岩与风流间热交换是引起井筒风温变化的重要因素,它与井筒围岩热物性、围岩原始温度、风流温湿度等有关。此外,风流压缩热也是导致井筒风温增大的关键因素,其主要受井口大气压力和井筒深度的影响。由于恒温带以下深度地温梯度的存在,井筒围岩温度随深度逐渐增加,因此,地温分布不易测量。另外,煤系地层为沉积岩,井筒围岩是非均质各向异性介质,热物性差别较大,也不易测量。参考淋水井筒温度预测研究文献,结合矿井现场情况,选取影响淋水井筒风温的井口风流温度、井口风流相对湿度、井口大气压力及井筒深度等易测特征变量作为预测模型输入参数预测井底风温,选用50组数据作为建模样本,部分样本数据见表1。综合分析井口风流参数及井筒深度与淋水井筒风温进行皮尔逊相关性分析,选取其中相关性较大的指标。皮尔逊系数的相关性绝对值直接体现了影响因素与结果之间的关联程度,其绝对值越接近于1 表明指标间相关性越强;相关系数绝对值越接近0,相关性越弱。一般情况下,变量的相关强度按照以下取值范围进行判断:相关系数绝对值在[0.8,1.0]之间为非常强相关;在[0.6,0.8)之间为强相关;在[0.4,0.6)之间为中等相关;在[0.2,0.4)之间为弱相关;在[0.0,0.2)之间为非常弱相关或不相关。
表1 部分样本数据Table 1 Partial sample data
根据皮尔逊相关系数计算步骤分析了淋水井筒井底风温与井口气候参数及井筒深度的相关性,结果见表2。由表2 可知,经相关性分析后,井口风流温度对淋水井筒井底风温有显著影响,井口风流相对湿度及井筒深度与淋水井筒井底风温为弱相关,井口大气压力与淋水井筒井底风温相关系数接近0,相关性非常弱。因此,选取井口风流温度、井口风流相对湿度及井筒深度等三项指标作为输入变量。
表2 皮尔逊系数相关性结果Table 2 Pearson coefficient correlation results
依据皮尔逊相关系数分析结果,井口风流温度、井口风流相对湿度及井筒深度构成预测模型输入特征变量,预测模型输出变量为井底风温。随机选取80%的样本数据量作为模型训练集,用于构建模型;20%作为模型测试集,检验模型的预测效果。
构建全部特征变量输入和特征变量筛选输入的BP 神经网络模型与GA-BP 神经网络模型,淋水井筒风温GA-BP 神经网络预测模型中,交叉概率取0.8,变异概率取0.2,训练次数取1 000,学习速率取0.01,训练目标取0.000 1,初始种群规模取10,最大进化代数取30。预测结果见表3,不同模型预测值与实际值比较见表4,预测值与实际值对比曲线如图3 所示。
表3 模型预测结果Table 3 Model prediction results
表4 不同模型预测结果比较Table 4 Comparison of prediction results of different models
图3 不同模型预测值与实际值的对比曲线Fig.3 Comparison curves between predicted values and actual values of different models
由表3、表4 和图3 可知,对于全部特征变量输入,标准BP 神经网络预测模型的井底风温绝对误差最大为0.77 ℃,相对误差最大为2.67%,平均绝对误差为0.347 3 ℃,平均相对误差为1.25%;GA 优化后的BP 神经网络预测模型的井底风温绝对误差最大为1.12 ℃,相对误差最大为3.86%,平均绝对误差为0.2703 ℃,平均相对误差为0.97%。对于特征变量筛选输入,标准BP 神经网络预测模型的井底风温绝对误差最大为1.88 ℃,相对误差最大为6.50%,平均绝对误差为0.650 1 ℃,平均相对误差为2.33%;GA 优化后的BP 神经网络预测模型的井底风温绝对误差最大为1.74 ℃,相对误差最大为6.01%,平均绝对误差为0.615 1 ℃,平均相对误差为2.21%。全部特征变量输入和特征变量筛选输入的BP 神经网络预测模型均能够获得满意的预测结果,GA 优化后的BP 神经网络预测模型多数数据的绝对误差和相对误差、平均绝对误差、平均相对误差均小于标准BP 神经网络预测模型,表明在淋水井筒风温预测中GA-BP 神经网络预测模型具有更好的预测效果,优化BP 神经网络参数能够提高淋水井筒风温预测精度。
1)结合皮尔逊相关系数、GA 和BP 神经网络,建立了基于特征变量筛选输入的淋水井筒风温GABP 神经网络预测模型。
2)基于全部特征变量输入与特征变量筛选输入条件下,标准BP 神经网络淋水井筒风温预测模型和GA-BP 神经网络淋水井筒风温预测模型均具有较好的预测效果,淋水井筒风温GA-BP 神经网络预测模型预测精度高于标准BP 神经网络预测模型。
3)基于特征变量筛选输入的标准BP 神经网络淋水井筒风温预测模型和GA-BP 神经网络淋水井筒风温预测模型既保持了较高的预测精度,又降低了建模特征变量维度,提高了模型预测效率。