刘 伟 李国清 侯 杰 王 浩 陈连韫 范纯超
(1.北京科技大学土木与资源工程学院,北京 100083;2.金属矿山高效开采与安全教育部重点实验室,北京 100083;3.山东黄金集团有限公司,山东 济南 250102)
矿山企业采购备件的种类多、数量大、资金占用率高,同时备件采购量受众多因素影响,存在较大的不确定性,因此,科学估计备件采购量对于矿山企业生产与经营至关重要。现代矿山企业备件采购具有精细化、动态化、信息化等特征。矿山采购备件的种类复杂、需求量差异性较大,针对各类备件的需求特点制定更为精细化的采购策略,有助于提高备件采购的科学性。随着生产任务量与作业条件的变化,矿山企业对备件的需求量处于动态变化之中,采购量应因时、按需而定,否则易出现因采购量过大导致库存积压和因采购量不足导致供不应求等问题[1-3]。现阶段,我国矿山普遍建设了备件采购管理系统,实现了对备件采购、运输、仓储的管理,提升了企业备件的信息化管理水平与效率[4-7]。系统经过长时间的应用,积累了海量备件采购数据,大数据分析技术为数据的深度利用与潜在知识挖掘提供了新的途径,运用大数据分析结果指导企业备件采购则更为科学可靠。因此,通过构建科学的数据分析模型,以实现矿山备件采购量的科学决策是我国矿山企业亟待解决的现实问题。
目前在理论研究方面,不少学者结合了ABC分类思想,开展了以决策树、随机森林、支持向量机、聚类分析、人工神经网络等算法等为代表的各类备件分类方法研究,考虑了备件分类的各影响因素,取得了比传统分类方法更全面、更准确的分类效果[8-13]。有关备件消耗量的预测研究,常见的有基于时间序列的传统预测方法,如指数平滑法、差分整合移动平均自回归模型(Autoregressive Integrated Moving Average Model,ARIMA)、先知模型(Prophet)等,以及基于神经网络的预测方法,如长短期记忆人工神经网络(Long Short-Term Memory,LSTM)等[14-18]。在实际应用方面,随着智能矿山建设的推进,我国矿山企业普遍建立了物资备件管理系统,完成了对备件采购、运输、仓储等流程从单一人工管理到信息化集成管理的转变,积累了海量的备件采购、运输、存储方面的数据。例如神东煤炭集团公司[19]在长期应用物资备件管理系统的过程中,发现存在设备故障率高、备件储备计划准确性差、采购周期长和积压浪费等问题,并进行了相应的库存策略调整,提高了库存周转率与管理水平。
综上所述,现阶段的理论研究偏向于对备件分类与消耗预测在算法上的优化,未将备件分类与备件消耗预测进行整合,根据备件分类结果选择相应的备件消耗预测策略,实现有针对性地优化。另外,在实际应用方面,对海量数据的深层次挖掘程度还处在初级阶段,多以简单的统计分析为主,未能对科学采购提供足够的正向反馈与决策支持。为此,本研究利用大数据分析方法构建了一套体系完整的矿山备件采购预测模型,形成了基于大数据分析的矿山备件采购优化思路,并采用山东某地下黄金矿山备件管理数据进行模型验证,为实现矿山备件的科学采购管理提供数据支持。
矿山企业的备件管理系统实现了备件采购业务的信息化管理,具体流程如图1所示。矿山各级生产单位根据生产计划与设备状况,统计本单位的备件需求,提交至矿山采购部门。采购部门结合汇总的需求、实时库存信息与历史领料记录,制定采购计划并向外部供应商下达采购订单。备件供应商在收到订单后,向矿山组织供货,并由矿山备件库存管理部门进行备件入库、库存盘点、出库记录等工作。
图1 矿山备件采购流程Fig.1 Procurement process of mine spare parts
系统应用不仅提高了业务处理效率,在长期的采购过程中,在各个关键节点均积累了大量关于备件需求量、采购时间、采购金额、库存量、备件领用量等数据,充分利用历史数据智能制定采购策略,是优化备件采购管理的重要途径之一。矿山企业作为备件需求方和采购方,需充分考虑各类备件的现有库存量和未来一段时间的需求量,针对不同类别的备件制定差异化采购策略,避免主观因素带来的认知偏差,进而提高矿山备件采购的科学性与准确性。
经过对矿山物资备件采购流程的梳理与物资备件管理系统的使用和调研,获取了部分矿山备件采购相关数据,经过分析主要表现出以下特征:
(1)产生节点多。在备件采购及管理的全流程中,从企业内部的各级生产单位、物资装备部与库存管理部门到企业外部供应商的各个节点都会产生相应的数据,共同构成了备件数据的来源。
(2)涉及维度广。备件的属性涉及多个维度,包括备件自身属性如名称、归属设备、规格等,备件采购及管理流程属性如采购数量、采购价格、采购周期、采购供应商、库存量、领用时间、领用量等,构成了庞大的数据维度。
(3)增长速度快。矿山企业生产任务重,使用的设备及相应备件种类多,更新迭代速度快,加之备件属性维度广、产生节点多,导致备件数据增长速度快、动态性强。
结合矿山备件采购流程中存在的问题与矿山备件数据的主要特征,利用大数据分析技术构建备件采购预测模型,实现对矿山备件采购的预测与优化,以适应矿山企业备件需求动态变化的特点,进而制定科学合理的备件采购计划,实现采购成本控制与备件合理储备。备件采购预测模型逻辑架构如图2所示。
图2 备件采购预测模型逻辑架构Fig.2 Logical framework of prediction model for spare parts procurement
(1)数据预处理。按照数据清洗、数据变换、数据归约等步骤,完成对数据缺失、数据异常、数据维度过多等问题的处理,实现对矿山备件数据的预处理,为后续模型构建及验证奠定基础。
(2)备件智能分类。为弥补传统ABC分类法基于价值进行分类,忽略了其他因素导致分类结果不科学的不足,综合考虑备件的采购价格、采购周期与消耗速度,运用K-means聚类模型对备件进行分类并分析其特点,为备件消耗预测提供分类依据。
(3)备件消耗预测。基于备件分类结果,制定相应的预测策略,分别应用LSTM神经网络与Prophet模型进行备件消耗预测,并结合两种模型的优点构建组合预测模型,提高预测的准确性和稳定性,为制定采购计划提供数据支持。
受矿山企业备件种类、价格、供应商、需求量等方面的影响,其采购成本与周期具有较大差异,为此进行备件分类是首要工作,而人为对备件进行分类不仅工作量大而且容易受主观因素影响,导致分类不准确。采用聚类算法,根据备件的属性因素进行聚类分析,得到较为合理、科学的备件分类准则,可以为后续的备件消耗预测及备件采购提供思路。K-means聚类算法是一种广泛使用的无监督式机器学习技术,能够从样本数据中发掘出隐藏的联系和结构,可用于隐含规律的发掘。其优点是收敛速度快、聚类效果好、可解释度强,尤其适合大数据集的应用。
对备件分类的影响因素进行综合分析后,本研究选择以采购价格、消耗速度、采购周期作为备件聚类的属性维度。
(1)采购价格。表示备件的经济属性,单个备件的采购价格越高,同等条件下产生的采购资金占用越多,对矿山带来的资金流动压力越大。
(2)消耗速度。表示备件的消耗快慢程度,消耗速度越快,需要进行的采购次数越频繁或单次采购的数量越多,同等条件下产生的资金消耗和库存空间占用越多。
(3)采购周期。表示备件采购难易程度,采购周期越长,发生供货延迟的概率越大,对生产造成的不良影响也越大,需要提前进行采购来防止该现象发生。
将上述3个属性作为备件的维度,即每个备件作为一个三维向量并随机选取向量作为聚类中心,通过计算所有向量与各聚类中心的欧式距离,将每个向量赋给最近的簇,使得每一个向量到其对应聚类中心的欧式距离之和最短,即备件属性越接近从而完成备件分类。
根据备件的不同属性组合,共有8种备件类型,分别为高价格、快消耗长、周期备件,高价格、慢消耗、长周期备件,高价格、快消耗、短周期备件,高价格、慢消耗、短周期备件,低价格、快消耗、长周期备件,低价格、快消耗、短周期备件,低价格、慢消耗、长周期备件,低价格、慢消耗、短周期备件。
面对各类备件不同的数据变化趋势特点,采用单个预测模型难以达到理想的预测效果。因此使用组合预测模型,将不同预测模型的预测结果进行加权组合,使之包含更全面的时序数据和动态信息,解决单个预测模型在某些时间或状态存在较大偏差的问题,有效提高整体预测精度。Prophet模型在时间序列数据预测方面,能较为出色地适应数据的节日效应和变化趋势点,而LSTM神经网络在学习和挖掘长期历史数据中隐藏的非线性和非周期性等特征存在较大的优势。通过将两者相结合进行组合预测,以Prophet模型拟合数据的节日效应和变化趋势点,以LSTM神经网络学习长期历史数据的趋势特征,最后采用误差倒数法,即通过对平均相对误差小的模型赋予较大的权重,使组合模型的平均相对误差趋于减小,将两个单一模型进行组合得到更准确的预测值。
定义LSTM-Prophet组合模型为
式中,P(t)为组合预测模型的预测结果;ω1、ω2分别为Prophet模型与LSTM神经网络模型的权重;y(t)为Prophet模型预测结果;l(t)为LSTM神经网络模型预测结果;ε1和ε2分别为Prophet模型与LSTM神经网络模型预测结果与实际值的平均相对误差。
建模过程如图3所示。
图3 组合预测模型架构Fig.3 Structure of combined forecasting model
针对不同备件类型属性特点,消耗预测策略如下:
(1)高价格、快消耗、长周期备件。存在资金占用、库存不足、供货延迟风险,需要对采购数量与采购时间进行精准控制,即同时对采购数量与采购时间进行预测。
(2)高价格、慢消耗、长周期备件。存在资金占用、供货延迟风险,但消耗速度慢,需要对采购时间进行重点预测。
(3)高价格、快消耗、短周期备件。存在资金占用、库存不足风险,但采购周期短,需要对采购数量进行重点预测。
(4)高价格、慢消耗、短周期备件。存在资金占用风险,但消耗速度慢、采购周期短,无需预测,可选择“零库存”模式,需要时进行临时采购。
(5)低价格、快消耗、长周期备件。存在库存不足、供货延迟风险,但采购价格低,需要对采购数量与时间进行预测,并保持较高数量库存。
(6)低价格、快消耗、短周期备件。存在库存不足风险,但采购价格低、采购周期短,需要对采购数量进行预测,并保持少量库存。
(7)低价格、慢消耗、长周期备件。存在供货延迟风险,但采购价格低、消耗速度慢,需要对采购时间进行预测,并保持少量库存。
(8)低价格、慢消耗、短周期备件。风险较低,可选择“零库存”模式,需要时进行临时采购。
山东某黄金地下矿山正在积极推进数字矿山建设,目前大数据中心与数据标准体系建设已经完成,实现了各系统数据的汇集,为后续的大数据分析奠定了良好的基础。通过该矿山物资备件管理系统,获取了该矿山部分备件的原始数据,主要包括备件编码、名称、对应设备、采购单、备件入库单、备件领用单等,如表1所示,部分物资备件采购记录数据见表2。经过数据清理、数据变换、数据归约后,应用备件采购预测模型进行验证。数据处理结果见表3。
表1 主要原始数据Table 1 Main original data
表2 物资备件采购单部分数据Table 2 Partial data of “MATERIAL_PURCHASE”
表3 数据预处理结果Table 3 Results of data preprocessing
山东黄金某矿山使用的备件多达6 760类,本研究以备件采购价格、年平均消耗量、采购周期作为备件的属性维度进行K-means聚类分析。通过对初始聚类中心与聚类数量的寻优,当聚类簇数为4时,聚类效果最优,如图4、图5及表4所示。
图4 K-means聚类散点图Fig.4 Scatter p lot of K-means clustering
图5 K-means聚类雷达图Fig.5 Radar chart of K-means clustering
表4 备件分类结果Table 4 Classification results of spare parts
如图5所示,应用K-means聚类模型,将备件划分为4类,各类备件的分类界限较为明显,存在少量的离群点,整体达到了预期分类效果。各类备件的属性如表4所示,备件种类1、备件种类2分别为3 036类、2 541类,属于低价格、慢消耗、短周期备件,占比最高;备件种类3共1 111类,属于低价格、快消耗、短周期备件,占比次之;备件种类4仅72类,属于高价格、慢消耗、长周期备件,占比最少。
针对备件分类结果中4类备件的特点,选择对应的消耗预测策略,即备件种类1、备件种类2因风险较低,可选择“零库存”模式,无需进行预测;备件种类3消耗速度快,针对其消耗量进行预测;备件种类4采购周期长,针对其消耗时间进行预测。
分别以某高价格、慢消耗、长周期备件“发动机总成”与某低价格、快消耗、短周期备件“钎尾”为例,进行备件消耗预测,其基本属性见表5。高价格、慢消耗、长周期备件的采购时间预测效果如图6所示,低价格、快消耗、短周期备件的消耗量预测效果如图7所示,两者预测效果评价见表6、表7。
表5 备件基本属性Table 5 Basic characters of spare parts
图6 “发动机总成”采购时间预测效果Fig.6 Prediction results of“engine assembly”procurement time
图7 “钎尾”消耗量预测效果Fig.7 Prediction results of“shank adapters”consumption
表6 “发动机总成”采购时间预测结果评价Table 6 Evaluation of prediction results of "engine assembly" procurement time
表7 “钎尾”消耗量预测结果评价Table 7 Evaluation of prediction results of "shank adapters" consumption
由上述分析可知:针对不同属性特点的备件选择相应的预测策略,分别选取某高价格、慢消耗、长周期备件“发动机总成”与某低价格、快消耗、短周期备件“钎尾”进行采购时间预测与采购数量预测,得到了较为精确的预测效果,可为制定采购计划提供数据支持。
(1)运用大数据分析技术对矿山企业备件采购过程中产生的海量历史数据进行深入挖掘,通过构建矿山备件采购预测模型,实现了备件智能化分类与消耗量预测,为制定备件采购策略提供了科学指导,有助于降低企业备件库存量及资金占用量。
(2)基于K-means算法构建的备件智能分类模型,从采购价格、消耗速度、采购周期等多个维度对矿山备件进行无监督式聚类分析,实现了矿山备件的智能化、精细化分类,解决了ABC分类法基于单一属性进行分类导致分类结果不科学的问题。
(3)基于Prophet-LSTM算法构建的备件消耗组合预测模型,综合考虑了备件消耗的长效性、周期性和趋势性等特征,解决了单个预测模型易出现较大偏差的问题,针对不同类型备件制定了差异性预测策略,有效提高了预测的全面性和精确度。
(4)以“备件智能分类—备件消耗预测”为核心框架的矿山备件采购预测模型,符合矿山采购管理的普遍性特征,对于其他地下金属矿山制定备件采购策略具有重要的借鉴意义。但是具备海量的采购历史数据是建立大数据分析模型的基础,并需要根据矿山具体备件情况进行个性化设置。