基于向量夹角余弦的夹具案例检索方法研究∗

2021-03-22 09:12支含绪张胜文
计算机与数字工程 2021年2期
关键词:余弦夹具工序

支含绪 张胜文,2

(1.江苏科技大学机械工程学院 镇江 212003)(2.江苏科技大学江苏省船海机械装备先进制造重点实验室 镇江 212003)

1 引言

随着制造业和计算机技术的发展,对夹具的设计效率提出了更高的要求,夹具的质量和设计效率往往是制约产品生产周期和快速打开市场的关键环节[1~2]。在计算机辅助设计系统中,大部分新工件的夹具设计可以基于夹具案例库中已设计好的夹具进行修改重用[3~4]。如今,许多企业已经积累了大量的夹具案例,但是企业并没有有效机制对相似夹具案例进行检索。目前常用的夹具案例检索方法是关键字检索法和特征编码匹配法[5]。当积累了海量的夹具案例后,即使通过关键字检索,仍然会检索出大量关键字相同的夹具案例,可见关键字检索法存在很大的局限性。对于特征编码匹配法来说,其编码过程过于繁琐,不利于夹具设计自动化和智能化。高博等[6]建立了夹具本体模型,通过语义关系与夹具案例建立映射,形成一个夹具案例的树状语义结构,通过对设计要求的语义进行相似性度量,以此检索和分析夹具结构。上述方法都只聚焦了数字型特征变量的相似度计算,忽略了对字符型文本特征变量的处理,如加工阶段、定位方式等夹具设计的重要因素,使得夹具案例的检索准确率大打折扣。

由于缺乏准确有效的夹具案例检索方法,因此造成了企业夹具案例的复用率低下,使得企业在夹具智能化设计的道路上举步维艰。本文综合考虑夹具设计过程中所涉及的因素,采用了合适的字符型文本信息预处理方法,并提出了基于向量夹角余弦的夹具案例检索方法,可以大幅提高企业夹具案例的检索效率和夹具案例的复用率,减少企业在夹具研发设计上的成本。

2 工序模型特征信息描述

在夹具设计过程中,需要考虑诸多的设计因素,本文采用常用的三类夹具设计因素:形状特征信息、形位特征信息和工艺特征信息[7]。如图1 所示,形状特征信息是指几何体的形状尺寸信息,如几何体的长、宽、高、直径等;形位特征信息是指几何体之间的空间位置关系信息,如中心距、偏移距离等拓扑信息;工艺特征信息是指工件在加工过程中所需的信息,如加工方式、加工阶段、定位方式和加工面类型等。本文对工序模型从上述描述的三个角度进行特征信息定义,为后续计算夹具案例的相似度做铺垫。

图1 工序模型特征信息结构

3 基于向量夹角余弦的夹具案例检索方法

3.1 向量夹角余弦的数学模型

余弦距离,也叫做余弦相似度[8],它是用向量空间中两个向量的夹角余弦值来度量两个个体之间的差异程度,向量间的夹角越接近0°,则余弦值越接近1,两向量就越相似。图2 表示了向量x→、y→在3 维空间中的位置关系。当向量x→、y→的分量在数值上越接近,即二者间的夹角θ 越小时,向量x→和y→就越相近,也就越相似。根据3 维空间中的余弦夹角计算方法,将其推广到n维空间内。

图2 向量在3维空间中的几何表示

两个n 维向量的对应分量在数值上越接近或对应成比例,两个向量的夹角余弦值就越大,二者就越接近,向量表示的个体就越相似。

3.2 字符型文本信息的预处理

夹具案例的相似度,可看作工序模型在多维空间中的距离,距离越小,向量夹角越小,那么夹具案例就越相似。在上述工序模型的特征信息描述中,包含了数字型尺寸信息和字符型文本信息,目前在计算夹具案例的相似度时,算法能够有效处理数字型尺寸信息,但是对于字符型文本信息却难以计算其夹角余弦值。因而此类字符型文本信息需要经过预处理之后,才能参与相似度计算[9~10]。大多学者对于这类字符型文本信息采用统一的预处理方式——标签编码(Label Encoding),该编码方式是把n 种字符型文本信息映射为0 到n-1 之间的整数,以此计算文本值之间的夹角余弦值。如图3(a)所示,加工阶段特征信息包含四个字符型文本值,从加工精度上看,它们存在先后顺序关系。通过标签编码依次将这四个文本值编码为0、1、2、3,光整加工相对于粗加工的距离比半精加工相对于粗加工的距离要长,编码后仍然存在先后顺序关系。但该方法并不适用于处理无序字符型文本信息,如图3(b)所示,加工方式特征信息中包含四个文本值,无论从哪个角度看,这四个文本值之间不存在大小顺序关系。如果通过标签编码将它们编码为0、1、2、3,那么数值之间就存在了大小顺序关系,因而这种无序字符型文本信息并不适合通过标签编码的方式进行编码。

图3 标签编码预处理字符型文本信息

本文针对该类文本信息采用另一种信息预处理方式——独热编码(One-Hot Encoding)。独热编码[11]又称为一位有效编码,采用N位状态寄存器来对N个状态进行编码,每个状态都有独立的寄存器位,并且在任意时候只有一位有效。独热编码是将无序字符型文本值映射为二进制数值,除了当前文本值所对应的状态为1外,其余状态均为0。如表1所示,样本S1表示三面定位时的编码值;样本S2表示一面一孔定位时的编码值;样本S3表示两V 型块定位的编码值。

表1 独热编码预处理无序字符型文本信息

通过独热编码对无序字符型文本信息编码后,计算样本S2相对于样本S1的距离l1为与样本S3相对于样本S1的距离l2为距离相等。无序字符型文本信息经过独热编码处理后,彼此距离相同,没有产生大小顺序关系,弥补了上述标签编码的不足。因此,在夹具案例相似度计算过程中,本文除了使用标签编码对有序字符型文本信息进行预处理外,还使用独热编码对无序字符型文本信息进行预处理,使之更符合逻辑和算法要求。

3.3 相似夹具案例推理策略

为了提高企业夹具资源的复用率,越来越多的学者开始关注夹具案例的检索方法[12~13]。零件间的相似性并不能只通过关键字来判断,而应从零件的特征出发,基于特征要素判断零件的相似性[14~15]。根据企业现状,已有的夹具案例都有其工序模型与之对应。因而本文综合考虑工序模型的特征要素,通过基于向量夹角余弦的夹具案例检索方法,从夹具案例库中检索相似的工序模型,进而得到相似的夹具案例。

1)工序模型的特征信息表示

获取待设计夹具工序模型F1的特征信息集合。由于特征信息集合的扁平化结构,不能完整地表达出不同特征对夹具设计的影响程度不同。因此根据特征的组成结构,将工序模型的特征信息集合划分为多个特征元组,每个特征元组由多个特征参数构成。待设计夹具工序模型的信息集合表示如图4 所示。夹具案例中的工序模型F2的特征信息集合表示如图5 所示。根据图4 所示,把F1映射为一个n 维向量。根据图5 所示,把F2映射为一个m维的向量,向量表示如下:

其中,Ep表示待设计夹具工序模型F1的第i 个特征元组的第p 个参数;E′q 表示夹具案例中工序模型F2的第i个特征元组的第q个参数。

图4 待设计夹具工序模型F1 的特征信息集合

图5 夹具案例中工序模型F2 的特征信息集合

2)夹具案例的相似度计算

由于工序模型的不同特征对夹具设计的影响不同,因此本文在计算相似度时引入了权重信息。权重知识库由特征元组的权重系数值组成,权重系数是采用专家评价和样本案例测试调优的方式获得。从权重知识库中导入工序模型F1中特征元组的权重系数w ,利用权重系数w 和向量内积夹角余弦值,计算待设计夹具工序模型F1特征信息集合与夹具案例中工序模型F2特征信息集合之间的相似度P ,相似度值P 的计算公式如下:

其中,wi表示特征信息集合中特征元组的权重系数。

为相似度计算方法设置阈值Q ,阈值可根据用户实际需求进行调整。当相似度值P 大于阈值Q 时,该夹具案例即为待设计夹具工序模型的相似夹具案例。反之,夹具案例与待设计夹具工序模型不相似。

4 算例分析

按照上述方法,以船用柴油机关键件连杆为例,基于相似度对新连杆的工序模型G0(如图6 所示)进行相似夹具案例检索。该工序模型的特征信息模版中已定义好了相关的特征信息。设夹具案例库中有两个夹具案例,其中连杆工序模型G1、G2同样也定义了上述的特征信息模版。

图6 新连杆G0的工序模型

新连杆G0工序模型的特征信息集合和夹具案例中的连杆G1、G2工序模型的特征信息集合可映射成3个特征向量,特征向量的构成如图7所示。

图7 工序模型G0、G1、G2的向量表示

新连杆G0工序模型特征元组分别与夹具案例中连杆G1、G2工序模型所对应的特征元组进行夹角余弦值计算。从权重知识库中导入G0工序模型特征元组的权重系数。根据特征权值和夹角余弦值,计算G0与夹具案例中G1、G2之间的整体相似度,特征元组间的夹角余弦值和相似度结果如表2所示。

表2 夹角余弦计算结果和整体相似度结果

据比较可得,G0与G1的相似度高于G0与G2的相似度,因而G1所对应的夹具案例可作为新连杆G0夹具设计的模版,用户可对其结构进行修改,使之符合G0的夹具设计要求。该相似度结果表明了基于向量的夹角余弦算法可以有效地计算出夹具案例之间的差异值,为夹具案例的检索提供了有效的手段。

基于上述方法,结合UG 平台开发了基于向量夹角余弦的夹具案例检索功能,如图8 所示。首先,获取工序模型的特征信息集合,并对特征信息进行编码预处理。再从权重知识库中导入相关特征元组的权重系数,如图8(a)所示。以夹具案例库中的相似夹具案例为目标,通过向量夹角余弦算法计算新连杆工序模型和夹具案例中连杆工序模型之间的相似度。如图8(b)所示,筛选出超过阈值Q的夹具案例,并显示在系统界面中,供用户做夹具重用参考。

图8 相似夹具案例检索结果界面

5 结语

本文依据夹具设计行业中的实际需求,将基于向量夹角余弦的相似性案例检索技术应用于夹具设计过程,能够很好地解决夹具设计因素中字符型文本信息预处理的问题和相似夹具案例检索的难题,大幅提高了夹具案例重用率以及夹具设计效率,在一定程度上实现了夹具智能设计,为后续夹具结构变型设计奠定了基础,同时也为广义上的产品案例相似性检索提供了一种新的思路。

猜你喜欢
余弦夹具工序
某内花键等速传动轴八功能测试夹具设计
基于FWSJ 算法对分支工序位置变动的产线平衡研究
修铁链
浅谈夹具领域如何提高检索效率
椭圆余弦波的位移法分析
减少无效工序提高作业效能的认识与方法
机床夹具及工件定位方法要求
两个含余弦函数的三角母不等式及其推论
实施正、余弦函数代换破解一类代数问题
电缆行业成本核算中原材料损耗算法分析