林名驰,王成宇*,2,唐政
1 海军工程大学 管理工程与装备经济系, 湖北 武汉 430033
2 中国人民解放军92690部队, 海南 三亚 572000
维修费用是舰船全寿命周期费用的重要组成部分[1-2],随着科技发展与舰船复杂程度的不断提高,其在全寿命周期费用中的占比也随之增加。在舰船维修费用中,计划维修费用的占比最高。在全面建设世界一流海军的背景下,舰船的用、修矛盾不断凸显,维修制度改革刻不容缓,随之而来的舰船维修费用计划制定与拨付原则调整也逐渐提上日程,因此,精准预测舰船的计划维修费用具有重要的意义。
舰船计划维修费用的预测方法很多,例如工程法[3]、专家估算法[4]等传统方法,其中工程法需要大量的维修费用数据积累,实施难度较高;专家估算法即基于专家意见进行维修费用估算,其主观性较强的特点限制了应用效果。目前,神经网络[5]、灰色预测[6]和支持向量机[7]等新型的费用预测方法逐渐在该领域得以应用,此类方法在预测精度方面具有较大的优势,但模型构建过程却较为繁琐,且神经网络方法易陷入局部最优解的困境,而支持向量机方法则易出现过拟合的问题,最终将导致模型的预测效果不稳定。
案例推理(case-based reasoning,CBR)作为人工智能领域的一种新兴理论[8],可以通过判定目标案例与已有源案例的相似程度进行检索,并基于一定原则对检索案例进行修正与调整,最终得到目标案例的预测值。CBR的推理过程不需要大量的维修费用数据支持,所有计算均基于舰船特征属性值,可以保证推理过程的客观性;同时,不需要构建复杂的模型,从而避免了模型适应性的问题。
因此,本文拟提出基于CBR的舰船计划维修费用预测方法,首先采用特征向量对案例进行表示,然后采用基于加权欧氏距离的K 近邻(Knearest neighbor,KNN)算法进行案例检索,同时结合粗糙集理论确定特征属性的权重分配,最后将结合各目标案例与相似案例的相似度对预测值进行修正,并基于整体相似度来判定是否将新案例加入已有案例库中,从而提高舰船计划维修费用的预测精度。
CBR是基于类比的推理,即通过目标案例与源案例的相似性匹配进行问题求解,其分析过程由4个阶段组成:案例表示、案例检索、案例重用和案例更新。当遇到一个新问题时,可以在存储历史问题解决经验的案例库中查找与新问题相似的案例,并将相似案例的解决方法进行一定的调整,从而作为新问题的解决方案;同时,该新问题也将随后纳入案例库中[9]。
案例表示即对案例库中源案例主要特征的描述,其目的是对不同案例进行区分,以便后续案例的检索操作。常见的案例表示方法包括特征向量表示法、类别−案例表示法和动态存储表示法等,由于计划维修费用与舰船特征参数之间具有较强的相关性,且各特征参数相对独立,符合特征向量表示法的应用特点,故本文将采用舰船的主要特征参数作为特征属性,并由多个特征属性组成的特征向量及其对应的维修费用来表示案例。首先,设定舰船的计划维修费用案例i,其特征向量Ai为舰船的主要特征参数,例如建造经费、空载排水量、舰长、最大航速、主机数量、人员编制等参数,该类参数在不同舰船之间的区分效果较好,宜作为特征属性;然后,设定解向量Bi作为舰船计划维修费用值,其中
式中:ai1,ai2,···,ai6为 特征向量Ai的特征参数,其中i为案例编号;bi为 解向量Bi对应的维修费用值。由此,采用<Ai,Bi>即可对某一特定案例进行表示。
案例检索是CBR的重要环节,即通过特定的检索方法在案例库中搜索与目标案例相似度较高的源案例。目前,常用的检索方法包括KNN算法、归纳索引法等,其中KNN算法可以与领域知识有效融合,其操作较为简便且应用效果较好[10],因此,本文拟采用KNN算法进行相似案例检索。
KNN算法通过计算目标案例与案例库中各源案例特征属性的相似度来进行案例检索,常用的相似度度量方法包括欧氏距离、皮尔逊相关系数、余弦相似度等。鉴于舰船各特征属性对计划维修费用的影响程度不同,所以本文将采用加权欧氏距离进行相似度度量,并引入权重系数来表征各特征属性的重要程度。目标案例与源案例的相似度S(Ai,A0)为
其中,欧氏距离D(aij,a0j)的计算公式为
式中:Ai为源案例,其中i为案例库中各源案例的编号;A0为目标案例;ωi为权重系数,用于表征各特征属性对舰船计划维修费用的影响程度;aij为第i个源案例的第j个特征属性值,其中j为特征属性编号;a0j为目标案例的第j个特征属性值;maxj和minj分别为第j个特征属性的最大值和最小值。
采用式(4)计算欧氏距离时,需对特征属性的差值进行归一化处理以符合相似度计算原则。在计算得到相似度之后,即可根据相似度从高到低对源案例进行排序,并设置案例的检索个数k值,从而得到与目标案例最为相似的k个源案例,即相似案例。
为了得到科学合理的权重分配,本文拟将粗糙集理论中属性重要度的概念引入权重系数ωi的计算中。对于一个决策系统,不同的条件属性对决策属性的支持程度(即条件属性的重要度[11])也有所不同。表征属性重要度的启发式信息很多,例如支持度、依赖度、互信息等,各种形式的属性重要度本质差别较小,本文将选取支持度来计算属性重要度。
根据粗糙集理论,将案例库中的各特征属性视为条件属性集C,将舰船计划维修费用视为决策属性集D,条件属性集C对决策属性集D的支持度γC(D) 为[12]
式中:POSC(D)为条件属性与决策属性的正区域;U为论域,其表示条件属性对决策属性的支持程度或分类能力。
所谓单个条件属性对决策属性的支持度,即去掉该属性之后条件属性对决策属性支持程度或分类能力的变化,其计算公式为
式中:sig(a,C;D)为条件属性a的属性重要度;γC−a(D)为决策属性D对条件属性集C–a的依赖度。sig(a,C;D)越大,则说明在条件属性集C中,单个条件属性a对决策属性的影响越大,a越重要;反之,a越不重要。
粗糙集理论的最显著特点是整个计算过程均由数据驱动,可以保持权重系数的客观性和合理性,且该理论易于理解,操作简单。
由于相似案例与目标案例通常存在差异性,所以不能直接采用相似案例的维修费用作为目标案例的预测值,而是需对相似案例进行调整与修正,即案例重用。由上文可知,目标案例与相似案例之间的相似度表征了二者主要特征属性之间的相似程度,而案例中舰船的主要特征属性与计划维修费用之间具有较强的相关性,故本文考虑将该相似度用于相似案例的维修费用预测。根据k个相似案例的维修费用来计算目标案例维修费用的过程,实际上可以视为多组预测结果的组合,为此,本文将引入组合预测的思想,其中等权组合的预测效果相对较好[13]。首先,对各相似案例调整后的维修费用进行求和,然后等权平均,即可得到目标案例修正之后的维修费用预测值计算公式如下:
式中:S(Al,A0)为 目标案例A0与 相似案例Al之间的相似度,其中相似案例编号l=1,2,···,k(k为相似案例的最大编号);bl为相似案例的费用值。
得到目标案例的预测值之后,目标案例的特征属性向量与其维修费用将共同组成一组新的向量序偶。通过将新案例更新至案例库中进行扩充,将有利于后续推理工作的长期开展。然而,案例库的更新应符合一定规则,若新案例与案例库中已有案例的相似度很高,则该案例对提高检索效率的意义较小,甚至可能导致库中相似案例过多而降低检索效率,故在本阶段需开展相似度判定。
将目标案例的维修费用加入特征向量中,即可与各特征属性共同组成新的特征向量Cm:
式中:am1,am2,…,am6为 特征向量Cm的特征参数;bm1为 修正之后的维修费用值,m为经过更新之后的案例编号。
基于新的特征向量并结合式(3)和式(4),即可计算新案例与各相似案例的整体相似度。整体相似度将维修费用纳入了计算范围,可以更全面地反映新案例与已有案例的相似程度。由于已检索到的k个相似案例在案例库中与目标案例的相似度最高,所以仅需对目标案例和这k个相似案例进行判定即可:若整体相似度的均值高于原相似度,则不对案例库进行更新;反之,则将新案例增加至案例库。
本文拟采用美军舰船计划维修费用数据[14]对所提方法进行验证,其构建的案例库包含180组案例(费用均已折算到同一年),从中随机选取6组作为测试案例,如表1所示。
首先,根据粗糙集理论计算各特征向量的权重系数;然后,将表1中的6组测试案例分别作为目标案例,根据式(3)和式(4)分别计算其与案例库中源案例的相似度并进行检索;最后,设置k=3,根据式(7)计算各目标案例的预测值。同时,利用SPSS软件中的工具包,将特征属性设为自变量,维修费用设为因变量,分别采用线性回归预测法和径向基函数(radial basis function,RBF)神经网络法对6组测试案例的维修费用进行预测,这2种方法和本文方法的预测结果与实船维修费用的相对误差如表2所示。
表1 测试案例特征属性及维修费用Table1 Test case feature attributes and maintenance cost
表2 预测结果对比Table2 Comparison of prediction results
由表2可以看出,针对6组测试案例,本文方法所得预测结果与实船费用值的平均相对误差为8.7%,而线性回归预测法和RBF神经网络法的平均相对误差分别为10.4%和10.2%,由此可见,本文所提方法的预测精度更高。
在舰船维修制度改革的趋势下,针对维修费用计划制定与拨付原则提出的新要求,同时结合已有维修费用预测方法的不足,本文提出了一种基于CBR的舰船计划维修费用预测方法。该方法不需要建立复杂的数学模型和大量的维修费用数据采集,主要基于已有案例进行预测,具有较高的适用性和准确性。然而,CBR方法的准确性取决于案例库的数据量,丰富、典型的案例库可以为处理复杂的舰船计划维修费用预测问题提供有力的数据支撑,所以典型案例的甄别与积累尤为重要。同时,对于某些重要的舰船特征属性的定量表示问题、检索过程的优化问题等,还需在后续工作中开展进一步研究。