胡 翩,陈孝杨,牛经纬,华红梅
(安徽理工大学地球与环境学院,安徽淮南 232001)
工业固体废物数量巨大、种类繁多,被认为是一种可再生利用的资源[1,2],但现阶段对固体废物处理方式较为简单,尚未形成全面的绿色循环的资源化平台.工业固废的资源化和降污减排潜力巨大[3],能够助力于生态文明建设.因此,精准预测未来固体废物产生量可为固体废物管理工作提供基础数据支撑.
目前,固体废物产量预测方面,国内外学者已积累丰富的成果.探究固废产量变化趋势方法主要分为两类:数理统计学方法[4]和空间计量学方法[5].前者能够从微观的角度反映一般固体废物产生量变化的本质和发展规律,后者则是研究空间交互作用和空间依存的结构性问题.多数学者使用的数理统计学方法主要包括时间序列分析[6]、回归分析[7],研究区域通常被划分为国家、省、市、县级四个尺度.时间序列分析方法体现了历史固废产量自身之间的关联性,形式较为单一;回归分析方法能够建立固废产量与区域社会经济发展之间的联系,结合地方发展特色综合分析固废产量变化趋势,常用回归分析方法为灰色关联分析方法.常用固体废物产量预测模型有灰色模型[8,9]和多元线性回归模型[10].由于基础模型通常精度不高,贾积身等[11]将智能优化算法用于改进分数阶灰色模型,预测了深圳市生活垃圾产量;Liu 等[12]人将BP 神经网络算法与多元线性回归模型结合,预测了中国工业固废产量,算法精度可靠.灰色预测被认为不适用于长时间序列预测,而多元回归模型受限于影响因素的多样性.因此,支持向量模型[13]和人工神经网络模型[14]等开始被引入固体废物数量预测研究,虽然它们均呈现高精度特征,但与支持向量模型相比,人工神经网络模型的性能更加突出[15].综合多个变量系统特点,人工神经网络模型依靠其强大的容错能力和描述复杂关系的优势已被证明适用于固体废物产量预测.
上述研究较为全面预测了区域固体废物产量变化趋势,但这种变化具有区域发展间的不平衡性.因此,围绕省域范围选取适合地方发展特色的社会经济特征,探究其与固体废物产量之间的关系且准确预测未来固体废物产量,对地方未来多元化发展具有重要意义.本文结合前人研究成果[16-18]以安徽省为示例,采用灰色关联分析方法,以多维度视角分析影响固体废物产量变化的相关特征,并利用麻雀算法优化BP 神经网络,构建符合区域发展特色的固体废物预测模型,预测未来省域尺度的工业固体废物的产量,以期为开发高效综合资源化利用平台以及政府部门决策提供科学的依据.
灰色关联分析方法是衡量两个变量之间关联程度的一种方法,常常被用于研究固体废物产量与影响因素关系[19].本文采用灰色关联度衡量社会经济指标与工业固废产量之间的关系,具体计算式如下:
其中,x0为xi(i为特征编号,且i=1,2,…,n)的参照序列;k为数据组标号,且k=1,2,…,m;ρ为灰色关联分析分辨系数,取值为0.5.
麻雀集体觅食时,被分为发现者、加入者和侦察者,分工合作以及时调整自己的觅食位置,提高捕食率.[20]发现者主要负责寻找食物并提供觅食方向、区域,加入者主要负责获取食物,侦察者主要负责发出危险信号以保障种群安全.[21]危险靠近时,种群会去其它安全区域进行觅食.
发现者位置更新规则如下:
其中,t为当前迭代数,i代表第几只麻雀,j为取值范围为[1,d]的整数;Nmax为最大迭代次数,表示第i只麻雀在第j维度中的位置信息;α是一个取值范围为(0,1]的随机数,且服从正态分布;L为元素全为1 的1×d 的矩阵;R2表示取值范围为[0,1]的预警值,ST表示取值范围为[0.5,1]的安全值.当R2 加入者位置更新规则如下: 侦察者的初始位置随机产生,变换规则如下: BP 神经网络具有优良的多维函数映射能力,能够用于探究工业固体废物产生量和相关影响因素的关系.BP神经网络能够通过不停矫正模型参数以获得最小误差,通常被分为输入层、输出层、隐含层[22],可以很好的描述变量间的非线性关系,因此,它被作为一种常用预测工具.BP 神经网络算法的计算公式如下: 其中,xi为输入值,yk为输出值,f1和f2是两层(输入-隐含、隐含-输出)之间的激活函数,wij和wjk是两层(输入-隐含、隐含-输出)之间的权值. 运用灰色关联分析方法,将输入特征指标进行降维,获取关键特征,可明晰影响工业固废产量相关重要指标.将关键特征指标作为BP 神经网络的输入,将工业固废产量作为输出,同时采用麻雀算法寻找最优权值、阙值,进行训练,训练好的模型可用于预测未来工业固废产量变化趋势. SSA-BP 神经网络模型流程如图1 所示. 图1 SSA-BP 预测模型流程图 安徽省位于中国华东长江三角洲地区,总面积14.01万km2,作为全国社会经济发展最快的省份之一[23],工业固废产量骤增,2021 年工业固废产量达到14771.81 万t.围绕经济、人口、科技、产业结构、能源供求关系等要素与安徽省工业固废产量构成的复杂系统预测问题,选取了R&D 内部支出、能源生产总量、生产总值、第二产业贡献率、人均生产总值、工业生产总值、能源消费量、常住人口、财政支出9 个相关特征数据进行分析.本研究数据均来源于《1998—2022 年安徽省统计年鉴》、《安徽省十四五国民经济发展规划》.工业固废产量为一般固废产量与危险废物产量的总量. 按照灰色关联度计算步骤,基于MATLAB 软件计算了9 项指标的灰色关联度系数,将它进行如图2 所示的排序.安徽省各影响因素与工业固废产量的灰色关联度系数从大到小排序为R&D 内部支出(0.8669)>能源生产总量(0.8355)>生产总值(0.8291)>第二产业贡献率(0.7487)>人均生产总值(0.7380)>工业生产总值(0.7087)>能源消费量(0.7009)>常住人口(0.6691)>财政支出(0.5659).其中,R&D 内部支出、能源生产总量、生产总值与工业固废产量之间的灰色关联度均大于0.8,携带较多有效信息,属于高度关联,表明科技水平、经济发展、能源供给对工业固废产量的影响显著;第二产业贡献率、人均生产总值、工业生产总值、能源消费量与工业固废产量之间的关联度系数均在0.7~0.8 范围内,表明经济建设、产业结构、工业化发展、能源需求不是影响工业固废产量增长的典型特征;常住人口、财政支出与工业固废产量之间的关联度系数均小于0.7,属于低关联度,这表明经济建设、人口发展对工业固废产量影响较小.因此选取影响程度较高的R&D 内部支出、能源生产总量、生产总值3 个指标作为影响安徽省工业固废产量的典型特征. 图2 灰色关联系数图 根据灰色关联度的分析结果,选取R&D 内部支出、能源生产总量、生产总值作为回归模型的输入.同步考虑固体废物产量自身影响,将R&D 内部支出、能源生产总量、生产总值和历年固废产量作为模型输入.研究表明,固体废物产生量变化具有时序性[24],靠近目标年份产量携带信息量较大.因此,选择目标年份的前两年固废产量作为模型的输入.综上所述,SSA-BP 模型输入指标分别为R&D 内部支出、能源生产总量、生产总值和近两年固废产量,模型示意图如图3 所示. 图3 SSA-BP 预测模型示意图 图4 安徽省2022—2035 年工业固废产量预测情况 在确定隐含层节点数的过程中,常常选择常用值或依据经验判断.本研究采用麻雀搜索算法对BP 神经网络隐含层数进行寻优,能有效解决该模型容陷入局部最优解和收敛速度慢的问题[25],提高模型预测精度.经测试,确定BP 神经网络的激活函数为tansig,训练次数为1000次,最佳隐含层数为19,学习速率为0.01,发现者比例设置为0.7,剩下的为加入者,同时意识到危险的麻雀的比重设置为0.2,安全值为0.6. 将模型相同训练集和测试集数据应用于不同的机器学习回归模型中,其中包括BP 神经网络、支持向量机(SVR)回归、随机森林(RF)回归、Adaboost 回归、梯度提升树(GBDT)回归、ExtraTrees 回归、CatBoost 回归、K 近邻(KNN)回归、XGboost 回归、线性回归(梯度下降法)、决策树回归模型.计算各模型的MAE、MAPE、R2三项指标以进行精度对比,对比结果如表1 所示.SSA-BP 模型的MAE、MAPE、R2值分别为375.81、0.04、0.99,均高于其他机器学习回归模型.这表明SSA-BP 回归模型的精度更高、性能更好,可用于安徽省未来工业固废产量预测. 表1 多模型精度对比情况 根据精度检验可知,采用SSA-BP 模型对安徽省未来工业固废产量进行预测具有科学性、合理性.因此,本研究设置不同发展情景对安徽省工业固废的产生量进行预测,情景设置情况如表2 所示.依据R&D 内部支出、能源生产总量、生产总值的1998—2021 年数据计算出最低、平均、最高增长率,为保证数据的合理性,分别剔除了差异较大的增长率进行计算.另外,根据安徽省“十四五”规划标明的各项指标增长情况设置了一种规划情景. 表2 预测情景设置 通过四种情景设置,计算出2022—2035 年R&D 内部支出、能源生产总量、生产总值,作为模型输入,再将预测出的固废产量数据作为模型的下一次输入,以此类推,预测出2022—2035 年安徽省工业固废产量(如图1 所示).低速增长情境下,工业固废产量整体呈上升趋势,2022—2025 年产生量分别为15871.87、15335.92、15340.50、15961.13 万t,2025 年前略有下降,整体年均增长率为2.03%,2030 和2035 年产量分别为16828.85、18254.36 万t;平均增长情境下,工业固废产量整体呈上升趋势,2022—2025 年产生量分别为17202.80、17794.43、18747.10、20756.59 万t,整体年均增长率为5.14%,2030 和2035 年产量分别为25714.50、29510.98 万t;高速增长情境下,工业固废产量整体呈上升趋势,2022—2025 年产生量分别为18003.40、19563.25、21398.08、23543.15 万t,整体年均增长率为6.56%,2034 年达到峰值为32919.58 万t,2030 和2035 年产量分别为28466.48、30831.54 万t;规划增长情境下,工业固废产量整体呈上升趋势,2022—2025 年产生量分别为16556.14、16247.85、16529.00、17689.52 万t,整体年均增长率为3.85%,2030 和2035 年产量分别为21049.72、24040.74万t. 工业发展一定程度上需要继续依赖于能源、资源的大量使用[26],工业固废自身作为一种可再利用的资源,其产生量与能源需求紧密联系,在安徽省能源供需平衡和科技水平没有明显改善时,未来安徽省的工业固废产量持续增长的趋势难以改变.而工业固废作为一种具有降污减排能力的资源,安徽省亟须加强科技创新及应用转化,提升工业固废资源化能力,完善工业固废综合治理体系,发展工业固废循环利用模型,集成高效绿色循环平台. 为提高在预测固体废物产生量时BP 神经网络模型精度,通过灰色关系分析方法及麻雀搜索算法,提升模型性能.同时以安徽省数据为示例验证模型效果,得到结论如下: (1)灰色关联分析中,R&D 内部支出、能源生产总量、生产总值、灰色关联度分别为0.8669、0.8355、0.8291,均高于其他社会经济特征,其携带有效信息高.这意味着安徽省工业固废产量变化与该地区科技发展水平、能源供求关系、经济发展情况联系密切. (2)SSA-BP 模型的MAE、MAPE、R2值分别为375.81、0.04、0.99,均高于其他机器学习回归模型.这表明SSABP 回归模型的精度更高、性能更好,可用于省域尺度未来工业固废产量预测. (3)2022—2025 年,不同情境下,工业固废产量变化区间分别为15871.87~18003.4、15335.92~19563.25、15340.5~21398.08、15961.13~23543.15 万t;2030 年,不同情境下的工业固废产量变化区间为16828.85~28466.48 万t;2035 年,不同情境下的工业固废产量变化区间为18254.36~30831.54万t.总体来看,安徽省未来工业固废产量呈现不断增长的趋势.1.3 BP 神经网络
1.4 预测模型
2 安徽省工业固废产量影响因素的确定
2.1 指标确定
2.2 影响因素的筛选
3 模型构建及预测
3.1 SSA-BP 模型构建
3.2 精度验证
3.3 安徽省未来工业固废产量预测
4 结论