武 婧,杨存丽
(中国核电工程有限公司,北京 100840)
阀门在核电用设备中不属于重要设备,但却是核电站安全运行不可或缺的关键附件。在实际阀门采购合同执行过程中,阀门采购管理往往依靠管理决策人员个人经验,难以适应目前核电建设项目精细化管理的要求。因此,建立一个合适的核电阀门采购管理的模型,对阀门设备采购合同进行合理、系统、科学的管理,对整个核电项目建设都有着十分积极的作用。
设备采购管理正好符合“大数据”应用的两个特点:有大量的数据存储、缺少定量的评估模型。本文以核电阀门合同执行的过程作为研究对象,建立一套合适的计算规则,对后续合同的执行起到提高效率、规避风险的作用。
在核电阀门合同执行过中,越来越多的管理手段不断引进,最终的目的是找到一个最有效的、最符合设备采购管理的工具。通过分析合同执行的工作量与合同的关键因素之间的关系,找出影响合同执行工作量的关键因素,如表1所示。
表1 影响合同执行工作量的关键因素
根据不同建模角度划分,建模的方式可以分为基于理论的方法和基于数据的方法。
基于理论的方法是以建模对象的已知理论为基础,运用该方法时,建模对象的因果关系需要由公式来表达。在基于理论的建模中,建模者必须知道关于系统的先验信息,比如模型结构,模型变量等等。
基于数据的方法则正好相反,该方法是从数据中得到分析结果。因此,建立合同执行的关键因素与合同执行任务量之间的预测模型,必须基于数据的建模方法。
目前基于数据的主流建模方法就是数据挖掘。数据挖掘是从大量的数据中发现知识,总结知识。而数据挖掘的方法按照使用者参与程度可以分为他组织数据挖掘和自组织数据挖掘。自组织数据挖掘的模型生成以及数据约简、预处理和模型检验都是在自适应地生成的。自组织数据挖掘是依靠系统内部的相互作用来实现“知识发现”,对使用者基本没有要求。
采用数据挖掘的方法进行研究时,应该选用自组织的数据挖掘方法,将合同执行关键因素作为输入变量,将合同执行的工作量构成作为输出变量,让系统进行自发的数据选择和处理,建模和学习,找出模型结果[1-2]。
3.3.1 分组数据处理算法
设系统的m个输入变量为x1,…,xm,输出为y,最终模型如式(1),称为系统的“完全实现”。
一般情况,任意的非线性的函数f可展开成x的Volterra级数,如式(2):
将式(2)变成离散型多项式,成为多变量非线性多项式,如式(3):
式中:xi为x(t-iπ)是x(t)的i步滞后;ai为各项实系数,i=0,1,…,N。这就是把x(t)和自身的慢变化过程看成是一个多变量输入组,简称K-G多项式。
如果多项式阶次增加到10,那么参数的总数将达10万多个。为了估计这10万个参数,需要解高阶方程组,数值计算难度很大。
为了解决计算问题,考虑由任意两个输入变量构成函数。如式(4):
在第一层用输入、输出数据拟合得到部分实现,用上一层的输入,生成下一层的部分实现。见式(5):
每一层保留一部分好的部分实现,舍去一部分坏的部分实现,直到找出近似程度满意的部分实现为止,最后就以这个最优的部分实现作为完全实现。
3.3.2 运用GMDH方法建立模型
本文选取阀门设备合同执行的关键因素,同时获取合同的实际执行中的单项工作任务量。假设每一个合同执行项目经理完成这些工作的效率是一致的,单项工作任务量主要由具体完成的工作数量来体现。以文件管理工作量(G1)为例:
输入的合同执行关键因素X1,X2,X3,X4,X5,X6,X7,X8,X9,输出为文件管理工作量为X10-G1。得出模型的结果如下:
输入值中的主要相关因子2个,分别是:X5-K5—项目堆型—(71%);X8-K8—设计固化程度—(29%)。
说明文件管理工作量主要是与项目堆型及设计固化程度相关。模型的拟合效果图如图1所示。
本文将一种自组织的数据挖掘方法(GMDH)用于合同执行工作量的分析。通过分析,证明使用GMDH方法来研究分析合同关系信息与合同执行工作量之间的关系是客观、有效的。通过建立合同关键因素与单项工作量之间的定量关系模型,对后续项目合同执行中人力资源的分配及重要工作的风险管理都有重要的指导意义。