王体春,华 洋,秦家祺
(南京航空航天大学 机电学院,江苏 南京 210016)
大型复杂产品方案设计是一项复杂的、创造性的系统工程,特别是对于设计理论不完善的复杂产品方案设计,往往需要基于一定领域理论基础和大量实践经验相结合的方式进行设计方案配置[1-2]。在复杂产品方案配置设计的过程中,不仅需要对静态性的、结构性的、过程性的等表层知识进行处理,更加需要对潜隐性的、关联性的等深层知识进行有效的处理,才能够有效地解决配置过程中各种复杂的设计问题,这些潜隐性的、关联性的设计知识往往会导致设计矛盾问题的出现,使得复杂产品设计推理过程变得繁琐和效率较低,难以获得有效的产品设计理想解[3-4]。蕴含性是复杂产品方案设计可拓关联特性中的关键特性,特别是对于含有多层次、多属性的复杂设计信息,其设计信息的蕴含性往往表征着复杂系统内部属性的关联特性。对设计信息蕴含性的有效挖掘能够更好地揭示复杂系统设计过程中存在的潜在的、隐性的、多层级的关联关系,并通过频繁模式的形式进行表现,更加有利于后续设计信息的重用,从而增强复杂系统设计的可拓推理能力,提升复杂系统设计的效率和竞争力[5-7]。本体论使得知识工程中深层次知识建模清晰化、精细化、准确化和标准化,这促进了对产品设计过程中深层次设计知识的获取、组织和捕捉能力,使得知识推理、共享、重用和集成成为可能[8-10]。但是,目前本体论只能提供领域术语的一个自然语言或类自然语言的定义库,形式化程度不高,在处理具有隐性的、关联性的设计约束与限制问题、设计矛盾问题等方面还存在一定的局限性,影响了本体技术在知识工程领域的深入应用,因此,在形式化、标准化和规范化的本体构建、本体推理、本体重用等方面还有很大的研究空间[11-13]。而可拓学以基元理论和可拓数学为支柱,用形式化工具和数学模型相融合的方式解决设计问题,并在这个基础上发展新的计算方法、模型和技术,更智能化和形式化地解决复杂系统设计过程中深层知识的存储、表示和处理问题,把知识工程中的知识向更形式化、更深入、更本质的方向推进[14-16]。将可拓学和本体论进行融合,通过建立形式化、标准化和智能化程度更高的可拓本体来表征深层次的本质知识,将更有利于复杂产品设计的智能化推理实现。目前,关于可拓本体的研究较为少见,还处于初步的研究阶段。杨国为教授[17]对可拓本体的定义和性质进行了初步的探讨,并给出了一些具有建议性的可拓本体和可拓本体应用的研究工作方向。李卫华教授[18]将本体论与可拓理论相结合,探讨了其在可拓策略生成系统的应用。但可以看出,关于可拓本体的研究才刚刚起步,并且集中在对可拓本体的概念和性质分析,而对于如何基于可拓本体概念进行可拓推理和可拓挖掘则涉及较少,特别是在处理复杂产品设计过程中存在的设计关联和设计约束问题方面,还有待进一步地深入探讨。为此,本文将在已有研究成果的基础上,通过对复杂产品方案设计本体概念进行拓展,将可拓理论[19-21]、本体论和智能推理算法相融合,提出一种基于可拓本体蕴含系的复杂产品可拓设计模型,以期为复杂产品方案设计的智能化、快速化提供支持。
对于复杂系统设计而言,由于其设计过程和设计信息的复杂性,为了能够有效地表征其设计过程中的可拓关系和可拓特性,对已有本体概念进行拓展,给出可拓本体模型 OE。
其中, CE、SEo、SEc、 AEo、 AEc、 XE、TE、 FE、CAE分别表示设计对象的可拓本体概念、层次关系集、可拓关系集、概念属性集、可拓关系属性集、公理集、可拓约束与变换集、函数集和实例集。
可拓本体概念可通过基元系统或者基元模型进行表述。由于产品方案设计中涉及到的设计知识、设计信息以及设计问题较为繁多,并且设计的层级性也较为复杂,产品方案设计需要由多个基元模型通过基元的运算或复合进行有效的组合才能实现对设计过程的表达,由此则形成描述设计过程的基元系统。针对复杂产品系统设计,根据公理化设计理论框架,可将其设计过程分为需求域、功能域、结构域和工艺域等4个部分。考虑到设计对象的可拓关系,并且由于物元、事元、关系元等均是基元的一种形式,再者由于复杂产品方案设计的复杂性,为了表述的统一,在此均采用基元的形式进行广义表述,则其广义基元模型一般可表述为
其中, N 为可拓本体概念基元名称;C 为可拓本体概念基元特征;V 为可拓本体概念基元特征量值。
复杂系统设计的可拓本体概念的基元模型可以看成是由物元或物元系统、事元、关系元、复合元组成的一个广义基元系统,即一个广义的基元模型往往是由多个物元、事元、关系元以及复合元组合,因此,式(2)又可以表示为
其中, RE为可拓本体概念的物元或物元系统, IE为可拓本体概念的事元, GE为可拓本体概念的关系元,M为可拓本体概念的复合元。
蕴含性是可拓本体概念中重要的可拓特性之一,是对设计对象可拓关系的表征。对可拓本体概念蕴含性进行形式化、模型化表述,清晰地映射出其逻辑关系,能有效地提升复杂设计问题求解的可拓推理能力。产品方案设计涉及到的设计论域、设计类型以及设计状态等是具有多样性的,所以产品方案设计对象基元模型的蕴含性从形式上可以分为论域蕴含、名称蕴含、特征蕴含、量值蕴含、特征元蕴含、关联函数蕴含等多种形式。但从产品方案设计的过程性来看,设计对象之间的蕴含性主要体现为产品方案设计不同设计域之间的因果蕴含形式,如设计对象论域之间可能存在的蕴含性、设计域之间以及设计域内的设计对象间的蕴含性等。所以,根据可拓本体的基元建模,可将上述的设计对象的蕴含性分别表示为⇒Ω(JE|OE)、⇒N(JE|OE)、⇒C(JE|OE)、⇒V(JE|OE)、⇒CV(JE|OE) 、⇒K(JE|OE)。
可拓本体概念蕴含性不仅包含多种蕴含形式,而且在不同蕴含形式下往往也具有不同的映射关系以及相对应的蕴含程度。可拓本体概念间的蕴含程度可用关联函数H(x)表征,假设根据领域知识设定可拓本体概念关联度阈值为Ψ(H),若满足H(x)≥Ψ(H),则称之为强蕴含,表明前者的变化会对后者产生明显的影响,则将其保留为蕴含系的频繁模式,在对后者进行设计的过程中需要充分考虑前者的作用。若满足H(x)<Ψ(H),则称之为弱蕴含,表明前者的变化对后者的影响不明显,则不将其保留为蕴含系的频繁模式,在对后者进行设计的过程中可以弱化或者忽略前者的作用。本文论述的蕴含程度主要侧重表述设计对象基元的关联程度,表征若设计对象基元A发生则会导致设计对象基元B发生的概率,即设计对象基元A的出现将会导致设计对象基元B出现的可能性。
可拓本体概念蕴含性的映射关系一般可划分为单蕴含、一对多蕴含、多对一蕴含、多对多蕴含等4种类型。
可拓本体概念单蕴含表示在蕴含系中的可拓本体概念之间具有一一对应的蕴含关系,即
可拓本体概念一对多蕴含表示在蕴含系中的父可拓本体概念与多个子可拓本体概念之间存在对应的蕴含关系,即
可拓本体概念多对一蕴含表示在蕴含系中的多个父可拓本体概念与子可拓本体概念之间存在对应的蕴含关系,即
可拓本体概念多对多蕴含表示在蕴含系中的多个父可拓本体概念与子可拓本体概念之间存在对应的蕴含关系,即
基于上述4种蕴含类型进行可拓变换,则可以获得新的可拓知识,对其进行知识可拓推理,则实现设计对象蕴含系的可拓重用,从而为复杂系统的可拓设计提供支持。这里包含2个方面的关键内容,一是进行基于约束蕴含的可拓变换,即基于设计对象蕴含性的可拓变换都是在一定约束条件下进行,并获得新的蕴含关系形成新的蕴含系,以单蕴含形式为例,其过程表示为
其中, T 表示对基元实施的可拓变换,l表示实施可拓变换的条件约束。
二是对蕴含系的可拓重用,蕴含系中的蕴含性即频繁模式一般都可以表示成if-then形式,由此,对if进行可拓匹配,则实现对then的可拓重用,这部分内容在3.3节中论述。
若记蕴含标记为⇒X ∈{⇒Ω,⇒N,⇒C,⇒CV,⇒V,⇒K},则对应的蕴含系可以表示如图1所示。
在复杂系统的设计过程中,由于设计需求的多样性以及设计制约因素的复杂性,单一的设计类别往往无法满足设计要求,这就导致复杂系统设计一般具有多种设计类别的形式。复杂系统设计类别一般需要基于领域专家对领域设计知识进行搜集、整理、归纳分析,并基于一定的领域设计标准进行聚类或者分类处理而生成。假设第s 个设计类别记为DCs,则复杂系统设计类别集表示为DC
诚然,不同的设计类别下会包含有相应的设计特征,对其进行基元建模,则形成对应的可拓本体的特征集C
图1 可拓本体概念蕴含系示意图Fig.1 Implication system of extension ontology
其中,Cp表示可拓本体的第p个特征。
基于领域知识确定设计类别集D C 后,则可以进行可拓本体蕴含系的信息量计算分析。假定 SA是设计类别集DC下样本集合,N A表示样本数,其中DCs对应的样本数为NAs,则存在构建蕴含系的信息量I(NA1,···,NAs,···,NAn)表示为
若Cp具有h个不同的特征量值{V1(Cp),V2(Cp),···,Vh(Cp)},样本集合S A中对应的Cp量值为Vi(Cp),1 ≤i ≤h的数据样本记为SAi(Cp),则针对Cp可将 SA划分成 h个子集{SA1(Cp),SA2(Cp),···,SAh(Cp)}。设NAis为子集SAi(Cp)中设计类别DCs所包含的样本数,则对于量值为Vi(Cp)的Cp的信息期望值I(NAi1,···,NAis,···,NAin)为
则基于Cp建立蕴含系的信息熵E(Cp)表示为
基于 Cp建立蕴含系的信息增益Gain(Cp)表示为
如果存在
则Ck作为当前层级蕴含系的父级节点。
将第一次获得的当前层级蕴含系的父级节点Ck作为蕴含系的根级节点,并对余下的可拓本体特征集表示C 中的可拓本体特征进行上述类似的计算分析处理,则获得蕴含系每一层级的可拓本体特征节点。可以看出,在复杂系统蕴含系构建的过程中,父级节点和子级节点则是对应的可拓本体特征,叶级节点则对应相应的设计类别。父级节点和子级节点的关联关系则是两者之间可能的频繁模式,如果父级节点和子级节点之间的关联关系满足支持度和置信度的要求,则说明父级节点和子级节点之间的关联关系正是需要挖掘的频繁模式,即两者存在蕴含关系。获得所有节点的蕴含关系,则形成了如图1所示的复杂系统设计的蕴含系,在蕴含系的基础上则可以进行频繁模式的挖掘。作者在1.3节中论述了蕴含关系的4种形式,即单蕴含、一对多蕴含、多对一蕴含、多对多蕴含等4种类型。可以看出,单蕴含模式、一对多蕴含模式、多对一蕴含模式均是多对多蕴含模式的特殊形式,由此,本文只给出多对多蕴含模式的挖掘过程,其他蕴含模式的挖掘均是多对多蕴含模式挖掘的个例化,在此不再重复论述。
形如(JE1|OE)∧···∧(JEx|OE)···∧(JEn|OE)⇒(JEi1|OE)∧···∧(JEix|OE)···∧(JEin|OE)的多对多蕴含模式挖掘过程实现如下:
Step 1 从当前蕴含系的根节点遍历蕴含系,获得蕴含系层级数 K,并形成当前蕴含系层级的堆栈。
Step 2 若(JE1|OE)∧···∧(JEx|OE)···∧(JEn|OE)⇒(JEi1|OE)∧···∧(JEix|OE)···∧(JEin|OE)蕴含式的上位因素个数为n,下位因素个数为m ,并将所有的上位因素和下位因素分别作为一个节点单元,获得蕴含系第k|(1 ≤k ≤(K−n−m+1))层级的节点数 Mk,并形成该蕴含系父级节点的堆栈。
Step 3 获得蕴含系第i|(1 ≤i ≤Mk)个父级节点的子级节点数Ni(k),并形成蕴含系子级节点的堆栈。
Step 4 在子级节点堆栈中,依次对子级节点j|(1 ≤j ≤Ni(k))进行频繁模式获取,若满足支持度和置信度阈值的要求,则建立蕴含关系。
Step 5 判断是否遍历子级节点堆栈,若是,执行Step 6,否则,执行Step 4。
Step 6 在父级节点堆栈中,依次对父级节点i|(1 ≤i ≤M)进行频繁模式获取,若满足支持度和置信度阈值的要求,则建立蕴含关系。
Step 7 判断是否遍历父级节点堆栈,若是,执行Step 8,否则,执行Step 6。
Step 8 将指针指向层级堆栈,并将子级节点作为新的父级节点,判断是否存在k ≤(K −n−m+1),若是,重复Step 2~Step 7,否则,执行Step 9。
Step 9 建立频繁模式集,蕴含系挖掘结束。
基于上述蕴含系的挖掘分析过程,获得面向设计重用的频繁模式以及相应的蕴含形式,而且一般可将设计类别作为蕴含系的节点。由此,通过对设计对象进行可拓聚类分析,判断出其所属的设计类别,然后再基于设计类别所属的蕴含关系即频繁模式进行下位节点的匹配,则可获得设计对象所重用的设计特征,基于这些设计特征进行设计案例的检索分析,进而获得满足设计需求的最佳重用对象。
其中,
则设计对象 DP与设计类别DCi关于主题特征Cp的可拓聚类分析关联度Ki(Cp)为
若主题特征 Cp的权重为wp,则获得综合可拓聚类分析关联度Ki(C),即
若满足
则说明当前设计对象归属于设计类别l。
若满足
其中, Q 表示设计案例的个数。则说明第s个设计案例DEs与当前设计对象DP最为接近,由此可将其作为设计重用对象,并对其进行可拓适应性设计,从而获得相应的设计方案。
综上所述,通过对设计对象进行可拓本体建模,根据领域知识生成对应的设计类别,通过建立设计对象的信息量计算模型建立复杂系统设计的蕴含系,对该蕴含系进行频繁模式的挖掘获得相应的蕴含关系,然后基于当前设计对象的设计需求进行领域设计类别的可拓聚类分析,获得当前设计对象所归属的设计类别,并在设计类别对应的频繁模式中进行可拓本体特征的匹配,获得与当前设计对象设计需求最相符的设计重用对象,进而进行后续的方案设计。基于可拓本体蕴含系的可拓重用算法实现框架如图2所示。
图2 基于可拓本体蕴含系的可拓重用算法实现框架Fig.2 Extension reuse algorithm based on implication system of extension ontology
基于水轮机产品设计领域知识,选择水头特性、功率特性和负荷变化特性作为水轮机选型方案的设计方向,通过对已有设计实例进行样本数据采集,可建立水轮机选型方案设计的蕴含系。表1给出了水轮机选型方案设计部分相关设计实例样本数据。
表1 水轮机选型方案设计实例样本数据Table 1 Sample data of turbine type selection scheme design
基于文中2.2节给出的可拓本体蕴含系的信息量计算模型,可以获得可拓本体蕴含系根级节点的信息量和信息增益,结果如表2所示。
表2 蕴含系根级节点信息量和信息增益Table 2 Information quantity and information gain of root level nodes in implication system
可以看出,水头 H的信息增益最大,因此可以将其作为蕴含系的根级节点。同理,采用文中2.2节给出的可拓本体蕴含系的信息量计算模型,计算获得以水头 H作为根级节点的蕴含系的子级节点信息量和信息增益,如表3所示。
表3 蕴含系子级节点信息量和信息增益Table 3 Information quantity and information gain of the child nodes of implication system
从表2中可以看出,有多个子级节点的信息增益是相等的,说明在同一父级节点下它们具有相同的层级关系。由此,根据上述各级节点的信息增益计算结果,结合文中2.3论述的基于信息模型的可拓本体蕴含系构建与挖掘模型,建立水轮机选型方案设计蕴含系,并由此获得相应的蕴含关系,如表4所示。
表4 水轮机选型方案设计的蕴含关系Table 4 Implication relationship of turbine type selection scheme design
表5 选型方案设计实例Table 5 Design example of type selection scheme
表5中JY、BS、TSQ-1、ET、LJX和GHY为不同水电站的标识代号。
根据文中3.2节和3.3节给出的基于可拓本体蕴含系的可拓重用模型与算法,可获得相应的可拓重用度,计算结果如表6所示。
表6 选型方案设计可拓重用度Table 6 Extension reuse degree of type selection scheme design
采用均权处理,则可获得关联度序列为K(C)={−0.893,0.025,−0.340,−0.376,−0.072,0.045},可以看出,设计对象与水电站GHY最相似,因而可将水电站GHY的模型转轮HLA384作为该设计对象的重用转轮对象。结合当前设计对象的其他需求参数对该重用转轮进行改进设计,建立面向水轮机选型方案设计可拓本体概念的基元模型,即
在获得上述设计对象的选型设计方案的基础上,将相关性能参数转换为结构设计参数,则可以进行后续的结构方案设计,进而获得相应的水轮机结构设计方案。通过文中给出的基于可拓本体蕴含系的产品方案可拓设计模型,则可以获得满足设计要求的设计对象,但由于设计对象可能并不能完全与设计需求一致,则需要结合水轮机设计专业知识对设计对象进行可拓变换分析,以使其更好地满足设计需求。限于篇幅,本文对相应的可拓变换分析不再进行赘述。
本文对复杂产品方案可拓设计模式进行了分析,提出了一种基于可拓本体蕴含系的复杂产品可拓设计模型。对复杂产品方案可拓设计过程中的可拓本体模型建立、可拓本体蕴含系构建、基于可拓本体蕴含系的设计蕴含关系挖掘模型以及基于可拓本体蕴含系的可拓重用算法等关键内容进行了深入的研究,并结合具体的设计案例对文中的模型和算法实现过程进行了说明和分析,应用结果表明了本文所给出的模型和算法的有效性和可行性。本文的研究重点在于对复杂产品方案设计过程中可拓关系、可拓推理、可拓重用的应用。这对于提升复杂产品方案设计可拓推理能力和产品方案快速配置设计具有很好的支持,为复杂产品方案设计的顺利实施提供一种新的解决途径。