王丹玥,王 艾,王雪媛
(1.中国运载火箭技术研究院物流中心,北京100076;2.北京科技大学,北京100083;3.北京林业大学,北京100083)
2016-04-24,首个“中国航天日”习近平作出重要指示,“探索浩瀚宇宙,发展航天事业,建设航天强国,是我们不懈追求的航天梦”。航天作为服务经济社会发展的重要手段,60年来,中国长征系列运载火箭,形成了较为完备的运载火箭型谱,广泛涉及海洋维权、交通运输、教育医疗、城市建设等经济社会发展的各个领域,2017年共发射运载火箭18次。随着发射需求的增加以及研制任务的紧迫,物资供应的及时性以及生产成本的控制问题被摆在了突出的位置。
金属物资作为型号物资采购中较重要的一部分,很大程度上影响着型号用物资供应,目前金属物资管理分为通用料管理与非通用料管理,金属物资通用料指面向多型号、质量性能稳定、物资交付周期可控、存货损失风险小、使用频率高的物资。而目前金属物资通用料管理存在以下问题:缺乏准确判定金属物资通用料的规则,导致在识别通用料的过程中易掺杂管理者主观印象,影响识别的准确性;通用料的管理没有实现动态管理,通用料清单内的金属物资没有准入及准出机制,没有与金属物资采购规律建立强关联。
本文通过数据挖掘手段识别金属物资通用料在采购供应方面显示出的“数据”特征,建立合理且符合实际业务的金属物资通用料分类器,提出合理的金属物资通用料识别及确定方法,为后续通用料的实际管理决策提供理论支撑并提升管理水平。
航天型号用金属物资通用采购业务流程如图1所示,其中需求申请为用户通过系统提交至采购计划员,采购业务流程的开始即为新采购需求申请的提交。
图1 金属物资采购流程图
与非金属物资通用料采用“一单一采”方式进行采购不同,金属物资通用料系统有“补充订货量”和“再订货点”的属性,当金属物资通用料的现存量低于再订货点时,计划员可直接通过自制请购单的方式提交新的采购需求。
目前按照物资类别、型号规格、技术条件等统计,物流中心现采购的金属物资共有4384项,而被定义为通用料的金属物资共有486项,占金属物资总数的11.1%,按照金属物资分类统计,其中各类金属物资内的通用料项数如表1所示。经统计,金属物资近3年平均采购额约为2.9亿元,通用料物资采购额约占总采购额的12.6%。
表1 各类金属物资内通用料项数统计表
ERP系统包含金属物资基本属性和采购属性,基本属性包含存货名称、规格、型(牌)号、质量等级、技术条件、物资状态、尺寸等;采购属性包含需求数量、到货周期、实出数量、销售成本、需求单位等205个属性。
根据ERP系统内的数据显示,2015年至今系统内共保存了31万余条采购数据,共用业务数据表30余个,数据规模及数据量满足使用数据挖掘手段的要求。由系统导出的采购原始数据基本包含了需要用于识别金属物资通用料特征的所有信息,但还存在如下问题:数据量大,导致业务数据表处理难度较大;较多业务数据表存在构成表内每条数据唯一标识的属性较多的问题,难以快速建立数据仓库以便进行分析数据;数据中某些属值缺失或存在无效值(不符合实际,如负值)。
通过对ERP系统原始数据的清洗与整理,将金属物资采购业务数据分为物资描述类数据、物资数量类数据、采购流程内周期类数据、方差类、财务类数据以及物资应用类数据六大类数据。
金属物资通用料的特征将按照原始通用料定义中的条件信息,即“面向多型号,质量性能稳定,物资交付周期可控,存货损失风险小,使用频率高”,在六大类数据中提取关键字段如需求数量、用户单位等,剔除非关键字段如采购员、库位信息等属性后,通过统计分析的方法识别出金属通用料物资的特征重新对通用料物资进行定义,并完成构建分类器的工作,从而确定新的金属物资通用料清单。
将200余个金属物资属性进行关键属性识别提取、综合计算后,将满足通用料特征识别的23个关键属性分别分类汇总,具体分类情况及其相关属性的数据字典如表2所示。
表2 金属物资关键属性数据字典
对关键属性数据进行统计分析处理后,选用2015年与2016年的采购数据作为训练集,并主要使用两种方式进行金属物资通用料特征识别工作。
数据分布对比分析法:通过绘制柱状曲线图分析通用料与非通用料属性数据的显示出的差异程度来判断该类属性信息是否为通用料重点特征。
帕累托分析法:依据“关键的少数和次要的多数”原理,将影响判断是否为通用料的众多影响因素按其对重点特征的影响程度大小用直方图顺序排列,从而确定金属物资通用料的重点特征。
3.2.1 数据分布对比分析法
物资需求申请类属性中的“型号工程种数”,采用数据分布对比分析法进行通用料的特征识别,通用料“型号工程种数”数值分布和非通用料“型号工程种数”数值分布如图2和图3所示。
图2 通用料“型号工程种数”分布图
图3 非通用料“型号工程种数”分布图
通用料应用的型号工程种数平均值为10.21,说明每一种通用料大约应用于10种型号工程,85%的型号工程种数集中在[1,20]区间内。
非通用料的型号工程种数平均值为3.08,说明每一种非通用料大约应用于3种型号工程,91%的工程种数集中在[1,8]区间内。
若某金属物资应用于少于8种的型号工程,则为非通用料的比例较大;若该金属物资应用于多余20种的型号工程,则为通用料的比例极大。
综上所述,通用料的型号工程种数与非通用料型号工程种数差异较大,因此可将“型号工程种数”作为通用料的重点特征之一。
3.2.2 帕累托分析法
由于物资需求申请类属性中的“领用总频次”字段数据区间为[0,13716],范围较大,使用数据分布对比分析法效果不明显,此类数据选择帕累托分析法,“领用总频次”帕累托分析如图4所示。
图4 “领用总频次”帕累托分析图
根据图4可知,钢棒类通金属物资用料在“领用总频次”数据上显示为占比最多,与实际业务中钢棒类金属物资通用料项数占总通用料物资项数58%的情况较为相符,所以“领用总频次”类数据判断效果较好,可作为重点特征之一进行考虑。
在讨论了23个业务属性后,最后确定通用料重点特征共有7个,分别为型号工程种数、领用总频次、实出数量、请购次数、领用总频次方差、需求单位个数、月份数量。
分类问题的本质是当给定这样一个数据集后,要求训练出(或建立)一个模型,当出现一组新的特征向量时,可以预测(或判断)拥有这样一组特征向量的对象应当属于哪个类别。
由于C4.5算法的分类规则易于理解、准确率较高,所以选择基于C4.5算法构建金属物资通用料分类器,对金属物资通用料进行分类筛选,并使用确定的通用料物资重点属性作为分类器的分类标签,将2015-01-01—2017-12-31的金属物资通用料的采购数据作为训练集,决策树结果如图5所示。经验证,此决策树判别的准确率为89.8%。
由该决策树生成的四条判定规则如下:当型号工程种数小于等于5时,此物料为非通用料;当型号工程种数大于5、月份数量小于等于16时,此物料为非通用料;当型号工程种数大于5且小于等于31、月份数量大于16、请购次数小于等于7时,此物料为非通用料;当型号工程种数大于31、月份数量大于16时,此物料为通用料;当型号工程种数大于5且小于等于31、月份数量大于16、请购次数大于7时,此物料为通用料。
图5 金属物资分类决策树
在金属4384项物资中,按原来的分类,其中通用料项数为486,非通用料项数为3898。通过本研究工作,利用2017年至今的采购数据,对金属物资重新分类后,得到的结果如下:新生成的通用料清单金属物资通用料总数为496;在新生成的496个金属物资通用料中,211个是稳定通用料,即原本是通用料,经新判定评价体系判定后仍是通用料;在新生成的496个金属物资通用料中,新准入通用料285个,即原本不是通用料,经新的判定评价体系判定后成为通用料;准出通用料为275个,即原本是通用料,经新的判定体系判定其成为非通用料。
其中275个物资由通用料变为非通用料的原因主要如下:37项物资其型号工程种数值为空,即无相应的型号使用记录;59项物资的领用月份数量为空,即仅一年来没有领用记录;179项物资的三年请购次数为空,即仅一年来没有用户单位发起需求申请记录。
本次研究提出了一种能够更合理、更准确的识别型号用金属物资通用料的方案,实现了金属物资通用料的动态管理,提升了通用料的采购效率及管理水平,避免了通用料判定的主观性,给出了金属通用料的动态管理模式。研究成果未来可以动态调整补充订货量、再订货点等管理参数,提升了金属物资采购管理水平。
目前军工企业的物资采购主要为计划导向而非市场导向,而计划具有不确定性和突发性,在管理方面存在较大的难度。所以依靠数据挖掘技术分析历史采购数据,更加科学地掌握采购规律才是未来军工企业采购领域的主要研究方向。