装备维修管理费单装标准制定方法研究

2022-02-16 09:54王维杰
运筹与管理 2022年1期
关键词:离群类别聚类

肖 斌, 刘 畅,, 伍 洁, 王维杰

(1.海军工程大学 管理工程与装备经济系,湖北 武汉 430033; 2.武警第二机动总队,福建 福州 350200; 3.91922部队,海南 三亚 572016)

0 引言

装备维修标准计领经费作为装备维修管理费的重要组成部分,是各级部队履行装备日常维修保障职能的主要经费来源[1]。目前我军装备维修管理费计领标准主要分为三个部分:单装标准、单位标准和补助标准。其中单装标准是领报装备日常维护保养经费的主要依据,它涉及类目最多、数据最复杂、制定难度最大,并且对确定的某种装备而言,不同类型的单位必须实行同样的单装标准,具有一定的独立性。我军以往历次单装标准的制定都是采用邀请专家会议商讨、最终由机关决策的形式,主要依靠机关和专家的管理经验,形式较为简单,受人为因素的影响较大。为适应我军现代化建设步伐,加强装备维修经费标准化管理,装备维修管理费单装标准急需大范围调整,如何科学合理制定装备维修管理费单装标准,提高标准的适用性、有效性,成为当前部队装备维修经费管理中亟需解决的难题。

目前关于经费标准制定问题,大部分专家学者主要集中于经费标准体系建设或标准经费管理模式的研究上,对标准制定方法的研究较少。文献[2]针对水电费、取暖费等后勤经费标准的制定,提出采取单位历年消耗数据纵向分析和同类型单位同年度消耗数据横向分析相结合的方法,综合不同地区物价因素来确定标准。文献[3]总结了经费标准制定的五个步骤,指出了经费数据对经费标准制定的重要意义。

尽管当前针对经费标准制定问题存在着一些解决思路,但是研究成果较为笼统泛化,缺乏具体详细的论述,并且提出的方法不能较好满足部队改革对单装标准调整的新要求。鉴于此,本文以满足部队实际需求为出发点,采用聚类为主要分析工具,对原始数据分析处理,并引入期望标准和满意度函数,最终为单装标准的制定提供定量分析的新思路。

1 聚类分析

聚类分析是根据对象的相似程度,对其进行分类的一种多元统计分析方法,是在没有先验知识的前提下将对象分成若干个类别,起源于分类学[4],最早由美国学者Macqueen提出[5],目前在许多领域都有应用,它的一般作用是通过挖掘数据中的深层次信息,概括每一类的特点,以便做出相应的决策。例如,在商业领域,公司通过研究不同客户对同类商品的不同消费特点,将客户细分,对不同类客户制定不同的营销组合,从而增加商品的销量。

考虑到一般的聚类方法受离群点的影响较大,针对离群点,本文使用二次聚类的方式对数据进行聚类分析,在初次聚类时找出离群点。如果一个对象不强属于任何簇,则该对象是属于聚类的离群点[6]。通过诊断离群点,删除噪声信息,保留有用信息,提高第二次聚类时的数据质量。

本文中聚类的主要作用是:(1)诊断离群点,提高原始数据的质量;(2)合并对单装标准需求相似单位的原始数据,降低数据复杂度,简化数据规模。

2 期望标准与满意度函数

为量化单位对标准的实际需求,本文从单位角度出发,引入期望标准与满意度函数的概念,并假定单位有稳定的和条理清楚的偏好,能客观真实的反映其真实需求。

(1)

积分,得满意度函数:

(2)

函数图像如图1所示:

满意度u越大,表示单装标准越符合单位需求。

3 单装标准制定步骤及模型

本文的主要思路是利用聚类分析整合同类单位对同一装备的期望标准,降低数据复杂度,再依据满意度函数,求得各类单位对单装标准组合的满意度大小,力争在满足经费约束的条件下使总的满意度最大化。

基本步骤如下:

步骤1聚类

假设需要制定标准的装备类别总数为m,收集单位原始数据后,以单位为聚类对象,分装备依次将单位聚成k个类别。对任一装备p,若实际列装装备p的单位总数为n,选择的对象变量数为t,则聚类的对象矩阵为:

之后选择对象间的相似程度算法,比较不同对象间的相似程度划分出相应的类别。

类别数k可以通过比较不同的k值对应的平均轮廓值大小来确定,平均轮廓值越大,类之间的区分越明显[8]。而聚类一方面要求类之间有明显的区分,另一方面要求类别数越大越好,满足这两个条件的类别数较为合适。平均轮廓值S(i)定义为:

(3)

其中,a是第i个对象与同类其他对象的平均距离,b是第i个对象与不同类的类内各对象的平均距离。

步骤2离群点诊断

离群点是数据集中行为异常的少量数据对象,既有可能是噪声信息也有可能是有用信息。关于离群点诊断,许多专家学者都有相关研究[9~12],本文采取在初次聚类的基础上,计算各对象的离群因子筛选出离群点的方式。离群因子e定义为各对象与各类聚类中心距离的加权平均值。假设数据集为D,分成k类{D1,…,Dk},di为第i个对象xi与各类聚类中心的距离,第i个对象xi的离群因子为:

(4)

计算所有对象离群因子的平均值和标准差,参照统计学知识,满足条件ei≥μe+βσe(1≤β≤2)的对象判定为离群点,对离群点做进一步分析,以确定是保留还是剔除。重复步骤1,对处理后的数据集做二次聚类,将单位分成若干个类。

步骤3单一装备的标准满意度计算

经过前期聚类,各单位已被分成若干个类别,此时,同类单位对单装标准的需求程度相对接近,可以用同一个满意度函数来描述其满意度变化。考虑到拥有装备数目更多的单位维修经验更丰富,在整合期望标准时赋予其更高的权重,以类内各单位期望标准的加权平均作为同类单位的期望标准,并以此构建满意度函数。

(5)

依据公式(2)求得同类单位对单装标准bp的满意度ui。

接下来,对各类单位满意度进行整合,计算所有列装有装备p的单位对单装标准bp的整体满意度u(bp)。在计算整体满意度时,赋予列装装备p较多的某类单位更高的权重。若单位类别数为k,类内单位列装装备数占总数的比例为dpi,则各类单位对装备p单装标准bp的整体满意度为:

(6)

步骤4模型构建

对m种装备按照上述步骤依次求单位的满意度,对任一装备p的单装标准bp,都有相应的单位满意度值。若各装备的重要程度分别为ω1、ω2、…、ωm,单位对m种装备单装标准组合[b1,b2,…,bm]的满意度U计算如下:

U=ω1u(b1)+ω2u(b2)+…+ωm(bm)

(7)

考虑经费总量约束,形成约束函数。若原有标准水平下的各装备单装标准经费总量为S0,经费的限制比例为θ,各装备实际列装总数分别为c1、c2、…、cm,则最终确定的单装标准组合必须满足:

(8)

步骤5粒子群算法求解

经过前期的处理,问题变为在约束条件下寻求目标函数的最优解,本文选用较为常见的粒子群算法求解[13],满足约束条件,且单位满意度U最大的单装标准组合即为理论参考值。

4 实例分析

本文选取单位测算的单装标准及单位装备实力作为对象变量,将单位聚类,以测算标准为变量使得同类单位中测算标准相对接近,使标准整合成为可能,而装备实力的加入,对细化单位类别、提高标准制定的准确性有促进作用。现选取三种装备进行单装标准制定,分别为装备1、装备2、装备3,装备的重要程度分别为ω1、ω2、ω3。

部分单位测算数据展示如下(已做Z-score标准化处理,保留两位小数):

表1 部分原始数据

关于装备1,实际列装该装备的单位总数n1=27,令k∈[2,10],计算不同值对应的平均轮廓值,并以类别数为横坐标,平均轮廓值为纵坐标,绘制折线图,如图2所示。

观察图2可知,在类别数取3时平均轮廓值最大,且类别数大小适中,因此,类别数取3较为合适。对原始数据聚类,并计算各单位离群因子大小,此时,离群因子的均值为1.4163,标准差为0.76844。令β=1,则阈值为(保留两位小数)E=μe+βσe=2.18。比较阈值与各单位离群因子,属于离群点的单位有单位4、7、8、24、25。

进一步分析表明,单位4、7、8是因为列装装备数明显高于其他单位,导致离群因子较大,其测算标准应予以重视,仍然保留,而单位24、25是由于测算标准明显高于其他单位,其数据会对测算标准产生较大不利影响,因此予以剔除。

对处理后的数据集重新标准化后做二次聚类,聚类结果如表2所示:

表2 各类单位基本情况(装备1)

观察上表,各类单位中第1类单位测算标准偏高,第2类单位所含单位数较多,第3类单位列装装备数较多。

同理,关于装备2、装备3,各类单位装备实力所占比例以及期望标准大小如下:

表3 各类单位基本情况(装备2)

表4 各类单位基本情况(装备3)

参考专家意见将三种装备的重要程度定为ω1=0.2,ω2=0.3,ω3=0.5。依据公式(7)求得单位对单装标准组合的满意度。查询历史数据,三种装备的原有标准水平分别为4000、3000、1500。

运用粒子群算法寻找三种装备的单装标准组合的最优解,当限制比例分别取1.2、1.5、1.8时,计算结果如下所示(保留两位小数):

表5 计算结果

从实验结果可以看出,当限制比例较小时增加标准经费总量,适当降低重要程度较小的装备1的单装标准的上升幅度,提高重要程度较大的装备2、3的单装标准的上升幅度,可以获得更高的满意度;当限制比例较大时增加标准经费总量,重要程度较大的装备的单装标准并没有大幅增加,均衡提高各装备的单装标准可以获得最大的满意度。

5 结论

单装标准的好坏直接影响装备维修管理费的保障效益以及装备维修管理工作的有效性。本文采用聚类分析的方法,通过引入期望标准和单位满意度函数,构建了适用于单装标准制定的定量分析方法,最后通过实例分析,验证了该方法的可行性。研究结果证明,该方法适用于大规模数据的分析处理,扩展性良好,同时可以有针对性地根据装备重要程度规划单装标准组合,为目前以定性分析为主的单装标准制定工作提供了新思路。但本文提出的方法还存在几点不足:一是由于涉及数据较为敏感,聚类时选用的指标变量较少,导致聚类结果较为单一;二是对单位的分析过于理想,受各种因素影响,单位实际测算结果不一定真实可靠。以上不足将在下一步研究中做出改进。

猜你喜欢
离群类别聚类
一种基于邻域粒度熵的离群点检测算法
离群动态性数据情报侦查方法研究
一起去图书馆吧
基于K-means聚类的车-地无线通信场强研究
一种相似度剪枝的离群点检测算法
基于高斯混合聚类的阵列干涉SAR三维成像
候鸟
西夏刻本中小装饰的类别及流变
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法