基于灰色关联理论的实例检索与匹配*

2014-06-29 10:18胡玉兰刘红军
组合机床与自动化加工技术 2014年9期
关键词:库中关联度实例

郝 博,宋 阳,胡玉兰,刘红军

(沈阳理工大学a.机械工程学院;b.信息科学与工程学院,沈阳 110159)

0 引言

由于复杂机械产品具有多层次结构特征,设计知识不易总结、难以用规则表达,因而采用基于规则推理的方法对于复杂机械产品是行不通的。基于实例推理是在基于规则推理的基础上发展起来的。基于实例推理的核心思想是将过去的实例存入实例库中,对需要设计的产品,根据其特征属性,按照相似度从实例库中找到最匹配的实例,经修改后,成为能解决当前问题的新方案,将新方案作为新的实例存入到实例库中[1]。基于实例推理解决了基于规则推理中专家获取知识的“瓶颈”。然而如何准确、迅速地在实例库中找到与设计问题最匹配的实例,是基于实例推理能否有效运用的关键。数理统计方法中的相关分析法、回归分析法等都可以应用其中,但是存在一些局限性。因为这些方法都要求大量的数据或要求样本具有典型的概率分布,而且计算量也较大,有时在实际工作中应用起来会很困难。灰色系统理论中的关联度分析方法则克服了上述数理统计方法的不足,它对样本量的大小没有严格要求,不需要典型的分布规律,计算简单方便易行,而且分析的结果一般与定性分析相吻合,因而实用性很强[2]。

本文以数控机床的主轴为例,将一些已经投入使用的主轴实例存入实例库,利用灰色关联分析法计算设计问题与实例间的相似度,从而找到与设计问题相似的5 个实例参与实例修改,为了使实例修改的结果更加贴近设计问题,同时采用其他相似度算法验证所得结果的准确性。

1 实例的表达与描述

完整、准确地表示实例是进行实例匹配的重要前提,表达的方式与内容直接影响实例匹配的准确度与精确度。设在实例库中有m个实例,每个实例有n个特征属性[3],实例在实例库中的表示如表1所示。

表1 实例表示形式

每个实例都有唯一的实例编号,它是实例库的主关键字。

2 实例的检索与匹配

2.1 向量的表示

在复杂机械产品的实例匹配中应用灰色关联分析法,将问题特征属性向量作为参考数列,实例库中的实例特征属性向量作为比较数列,对两者进行相似度的计算,得到设计问题与实例间的相似度[4]。

设问题特征属性向量为X0,实例特征属性向量构成实例特征属性矩阵X。如下所示:

其中,Xi =(xi(1),xi(2),…,xi(n))T,i=0,1,2,…,m。Xi表示实例编号为i的实例,xi(k)表示第i个实例的第k个特征属性的量值。

2.2 实例检索与匹配算法

2.2.1 规一化处理

由于实例的不同特征属性值具有不同的量纲,在计算时不仅会增加计算的难度,而且会对计算结果产生一定的影响,所以要对向量X0与矩阵X 中的分量xi(k) 进行规一化处理。本文采用的规一化方法为:将每一个分量相应的扩大或者缩小10 的倍数,使得所有分量都具有相同的数量级[5]。

2.2.2 实例检索与匹配算法

灰色关联理论的应用比较广泛,在灰色系统中其理论比较成熟。基本原理是通过对统计序列几何关系的比较来分清系统中多种因素间的关联程度,序列曲线的几何形状越接近,则表示两者的关联度越大[6]。

具体计算方法如下[7]:

步骤一:计算灰色关联系数。

式(3)中,ε =0.5。βk为实例特征属性k的权重值实例特征属性的权重是指该特征属性在整个实例中的相对重要程度。变异系数法是各个特征属性向量的标准差与平均数的比值,是一种客观赋权的方法,避免了主观因素的影响,所以本文利用变异系数法确定权重向量ω[8]。

经计算得到灰色关联系数矩阵:

步骤二:因为灰色关联系数的取值范围为0 到1 之间,而距离的取值范围为0 到无穷大,所以需要将灰色关联系数矩阵中的值进行转换,便于后面数值的计算。

步骤三:用欧几里德距离计算相似度,采用以下公式进行转换:

经过验证,式(3)~式(7)均满足灰色关联理论四公理。

通过计算可以得到设计问题与实例库中实例之间的灰色关联度。根据具体情况设定一个阈值,只有当某一实例的灰色关联度大于该阈值时,才认为设计问题与这一实例相似。如果所有实例的灰色关联度都低于这一阈值,则采取某种算法对灰色关联度较高的实例进行修改,然后进行实例评价,直到找到灰色关联度大于阈值的实例。

3 实例验证

利用实例库中的11 个已经开发成功的数控机床的实例验证本文提出的方法。

本文中的复杂机械产品为数控机床,这里以数控机床的主轴为例,数控机床的其它部分类似。在实例库中主轴的实例表达形式见表。

表2 主轴实例的表达形式

设计问题特征属性向量X0=(0.004 2400 37 230 76),对向量X0做规一化处理,例如对回转精度做规一化处理时,取0.001* mm 为单位,那么x0( 1) =4。对于其它的数值以同样的方法进行规一化,这样,通过对向量中的数值适当的扩大或者缩小10 的倍数,使向量中不同的特征属性值具有相同的数量级。规一化处理后,设计问题特征属性向量变为X0=(4 2.4 3.7 2.3 7.6)。对实例特征属性矩阵做相同的规一化处理。

利用实例库中的11 个实例的数值计算实例特征属性的权重,得到权重向量ω = (0.3695 0.1391 0.2133 0.1235 0.1546)。

利用灰色关联度的公式计算设计问题与各个实例间的相似度见表3。

表3 设计问题与各个实例之间的相似度

表格中Xi表示在实例库中实例编号为i的实例。设定阈值为0.95,故需要进行实例修改,实例修改需要从实例库中选择5 个实例,从计算结果可以看出,选取5 个实例编号分别是1、2、3、4、5 的实例。

为了验证利用加权灰色关联度公式计算出的结果有效且准确,下面分别利用传统灰色关联算法、基于海明(Hamming)距离的以及基于欧拉(Euler)距离的最近邻相似度算法和统计学中的相关分析计算设计问题与实例的相似度。

利用传统的灰色关联分析法计算设计问题与实例间的灰色关联度,由于仅提取11 个实例中的5 个关联度较高的实例参与后续的实例修改,所以表4 仅列出5 个关联度较高的实例的计算结果。

表4 设计问题与实例之间的相似度

从计算结果可以看出,选取编号为1、2、3、4、5 的实例参与实例修改。

利用文献[9]提出的基于海明(Hamming)距离的以及基于欧拉(Euler)距离的最近邻相似度算法计算设计问题与实例间的关联度,提取5 个关联度较高的实例,见表5,表6。

表5 基于海明距离的相似度算法的结果

表6 基于欧拉距离的相似度算法的结果

综合两种算法的结果,选取编号为1、2、3、4、5 的实例参与实例修改。

利用SPSS 软件计算实例库中11 个实例与设计问题的相关系数[10],得到的结果如表7 所示。

表7 设计问题与实例间的相关系数

表7 中列出了相关系数较高的前5 个实例。从表7 可以看出,相关分析的结果与前面几种算法的结果大体上相同,与设计问题相关系数较高的都是实例编号为1、2、3、4、5 的实例,但是在相关系数的排序上却有很大的不同。进行相关分析时,要求有大量的数据,并且要求样本服从某一种典型概率分布,各因素数据与系统特征数据之间呈线性关系且各因素之间彼此无关。这很有可能是导致结果出现偏差的主要原因。

综上所述,选用实例编号为1、2、3、4、5 的实例参与实例修改。

4 结论

运用灰色关联分析方法进行复杂机械产品的实例检索与匹配,计算简单方便,使得设计问题能够很快的找到实例库中的相似实例,计算所得到的结果与最近邻的相似度算法等的分析结果几乎一致,所以此方法是可行的,并且为实例的检索与匹配提供了借鉴,为产品的顺利开发奠定了坚实的基础,提高了基于实例推理的复杂机械产品的应用效率。

[1]杜伟明.基于实例推理的齿轮减速机三维CAD 设计系统与实现[D].成都:电子科技大学,2012.

[2]吕翠美,吴泽宁,胡彩虹.用水结构变化主要驱动力因子灰色关联度分析[J].节水灌溉,2008(2):39 -45.

[3]贺晓,刘景宁,李淑霞.基于灰色关联理论的案例推理在故障智能诊断系统中的应用[J].中国机械工程,2004,15(22):2022 -2026.

[4]邵民智. 灰色关联分析法在项目敏感性分析中的应用[J].上海工程技术大学学报,1998,12(4):36 -39.

[5]严波. 基于实例推理的车床主轴部件智能CAD 系统的研究[D]. 沈阳:东北大学,2010.

[6]邓聚龙.灰色系统理论教程[M].武汉:华中理工大学出版社,1990.

[7]汪明天,刘夫云,黄美发.基于加权灰关联的产品配置相似实例检索算法研究[J]. 计算机应用研究,2009,26(11):4084 -4086.

[8]赵宏,马立彦,贾青.基于变异系数法的灰色关联分析模型及其应用[J].黑龙江水利科技,2007,35(2):26 -27.

[9]崔凯.基于CBR 的发动机智能设计的研究[D].济南:山东大学,2012.

[10]欧亚波,李泽琴.地下水水质评价中相关性分析方法的应用[J].广东微量元素科学,2007,14(8):18 -22.

猜你喜欢
库中关联度实例
英语专业学士学位论文摘要的元话语特征研究
街头的人
功能强大的滤镜库
中国制造业产业关联度分析
中国制造业产业关联度分析
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
从今天开始
完形填空Ⅱ
完形填空Ⅰ
广义区间灰数关联度模型