陈 亮,陈博文,刘晓敏,窦 昊
(福州大学机械工程及自动化学院,福建 福州 350108)
仿生是一种将自然界的生物信息应用于工程和技术领域的方法,在产品创新设计方面具有广阔的应用前景。目前,针对仿生创新设计的研究主要集中在生物信息获取和知识模型建立、生物知识向工程设计转化、协同创新设计以及仿生创新设计工具的开发等方面。
在生物信息获取和知识模型建立方面:Shu等人[1]结合自然语言知识,将生物信息转化为语言概率问题进行求解;Cheong等人[2]开发了一种基于功能基的工程—生物文本映射方法,以进行知识映射;袁雪青等人[3]从生物形态的角度出发,采用灰色关联聚类分析构建了基于用户期望的意象驱动生物模型库;陈航等人[4]从构建面向微生物领域的知识库出发,通过构建知识词典的方式来构建生物知识检索系统。
在生物知识向工程设计转化方面:任露泉等人[5]提出了生物耦合概念,基于对特定生物原型的观察,分析了生物耦合生成的机理和规律,并将其应用于产品设计;Sartori等人[6]运用SAPPhIRE模型完成了多个生物模型向技术系统的转化;刘伟等人[7]结合类比原理和TRIZ(Teoriya Resheniya Izobreatatelskikh Za-datch,发明问题解决理论),提出了基于TRIZ的类比源设计求解过程模型;黄水平等人[8]基于对产品功能原理设计和生物基因进化方面类比结果的相似性分析,引入产品功能特征基因概念,构建了一种基于TRIZ与基因进化理论的产品集成创新设计过程模型。
在协同创新设计方面:杨育等人[9]提出了运用二元语义分析来集结各主体多粒度评价语言信息的方法,并以满意度最大为优化目标建立了多主体冲突协调模型;邢永刚等人[10]针对耦合系统的优化问题,将协同进化算法中的分解、协作思想与多学科设计优化方法中的分解、协同思想结合,提出了一种协同进化多学科设计优化算法,以提高耦合系统的适应性;Goel等人[11]针对生物启发设计开发了基于知识的CAD(computer aided design,计算机辅助设计)系统,通过提供生物系统的功能模型,将搜索到的结果以多种形式呈现给用户。
在仿生创新工具方面:Chakrabarti等人[12]研发了基于因果关系模型的IDEA-INSPPhIRE软件,通过因果关系描述语言来获取不同层次关系上的产品设计生物策略;Vandevenne等人[13]构建了生物数据库,可供设计人员查找设计相关的生物知识,以产生创新想法;Vincent等人[14]基于TRIZ开发了一款包含生物效应的BioTRIZ软件,方便设计人员查找仿生创新设计问题相关的生物解;Kozaki等人[15]基于产品与生物特征关键词开发了Biomimetics Hozo软件,可通过词义挖掘检索相应的生物知识;Kim等人[16]构建的Bionic MIR是一个通过结构化的产品特征检索并抓取在线生物信息的系统,利用潜在语义匹配方式产生对应的生物文本。
综上,尽管目前许多方法均可以完成产品与生物原型之间的映射,但是由于这些方法过多依靠人为介入进行知识检索,使得在有海量生物知识数据的情况下检索效率低下,在生物知识较少的情况下设计人员易陷入思维局限,难以生成较好的方案。考虑到基于用户需求进行仿生产品创新设计可以有效提高设计的可靠性,减少设计的不确定性和降低设计成本[17],但基于用户需求的分析具有模糊性,且生成的方案依赖于大量已有知识储备[18],笔者拟提出一种结合网络生物文本的创新设计方法,该方法包含基于QFD(quality function deployment,质量功能展开)理论的多学科需求映射(multi-disciplinary requirement map-ping,MDRM)、基于神经网络的生物知识表示方法以及基于词空间相似度和图相似度的产品设计关键词到生物文本的模糊映射方法,同时结合了海量生物文本数据和基于用户需求进行产品设计的优点。
为实现工程产品与生物文本信息之间的相互映射,需分别采用规范的方法来表述工程产品和生物文本的相关信息。本文将利用MDRM方法对基于用户需求的工程产品的功能、原理、行为和结构等要素进行表述,同时对从网络环境中获取的自然语言文本进行规范化存储。
基于QFD理论中的质量屋工具构建MDRM方法:先对工程产品的设计要素及生物文本信息进行规范化表达,再将用户需求转化为功能、原理、行为、结构四个方面的设计指标,结合质量屋工具,生成一系列产品设计关键词。MDRM方法的应用流程如图1所示,具体为:首先,通过分析用户需求来提炼关键信息,按照用户需求分配各项需求的权重并确定相应的指标;然后,从功能、原理、行为、结构四个方面对各项指标进行分类并分别构建质量屋;最后,设置评分阈值以筛除分数过低的指标,得到最终用于检索的关键词集合。
图1 多学科需求映射方法应用流程Fig.1 Application flow of MDRM method
在MDRM方法中,基于用户需求分配的各指标的权重为:
式中:Su为功能、原理、行为、结构指标的评分向量;RT为用户需求向量的转置向量;Cu为功能、原理、行为、结构指标的权重系数。
用于检索的关键词集合W为:
式中:wk为关键词;cwk为关键词wk对应的检索分数;t为用于筛除分数过低指标的评分阈值。
利用互联网获取大量生物文本,通过文本清洗剔除文本中无意义的语句和单词,并用神经网络模型以及合适的语料训练文本词性标注模型,并对每个单词进行词性标注,以“主语+谓语”的二元组方式表示语句信息,最后将二元组表示的生物文本信息导入MySQL数据库中。
网络生物文本规范化表示与信息提取的整体流程如图2所示。首先,分析各大生物站点页面代码并提取有效文本信息,对文本进行单词词干提取,并对其中出现频数过低的单词进行统一编码,得到一系列规范表示的生物文本信息;然后,使用Conll2000语料以及由Embedding+BiLSTM+CRF层组成的神经网络模型进行文本词性标注训练,预测规范表示的生物文本信息,并对文本语句中的主语关键词以及谓语关键词进行标注,由此得到一系列二元组文本。二元组文本中的主语关键词和谓语关键词用顶点表示,逻辑关联用相连边表示,以图的形式存储。
图2 网络生物文本的规范化表示与信息提取Fig.2 Normalized expression and information extraction of internet biological texts
针对利用MDRM方法得到的一系列产品设计关键词和爬取得到的海量网络生物文本信息及相应的二元组文本信息,需通过一种映射模式来构建两者的关系。基于此,提出一种基于词空间相似度和图相似度的由产品设计关键词到网络生物文本的模糊映射模式,以及由生物二元组文本映射到产品设计方案的方法。
对于一批给定的语料,其含有n个不同的单词。将n个不同的单词映射为从1到n的索引编码,则语料中位置i处的单词用向量可以表示为di=[di1di2…dij…din]T,假设位于语料中位置i处的单词wi对应的索引编码为j,则dij=1,其余位置处为0。以用上述方式表示的词向量作为Word2Vec模型的输入和输出,并根据神经网络模型中的隐层分配低维向量的权重,得到词嵌入向量。基于Word2Vec模型,工程产品与生物原型相关的一系列文本词被嵌入到同一个空间域中,通过计算词向量间的空间余弦距离来判断不同文本词之间的相似度:若相似度为1,则表示2个单词完全相同;若相似度为-1,则表示2个单词完全不同。
对于某一原始关键词,通过设定相似度阈值可将其扩展成一系列语义相近的词。当用户进行某关键词检索时,在MySQL数据库的二元组文本图中寻找由式(2)得到的所有匹配顶点,得到与原始关键词相连的顶点,并选出与原始关键词有共同相邻顶点的语义相近词,将其作为有效检索关键词。设主语关键词用Ks表示,谓语关键词用Ko表示。如图3所示,设某一原始主语关键词为Ks1,通过计算空间余弦距离得到数据库中其他词与该关键词的相似度,并通过设置相似度阈值v来得到一系列语义相近词Ks1、Ks2、Ks3和Ks4,通过检索二元组文本图,得到与原始主语关键词Ks1有共同相邻顶点的语义相近词为Ko1和Ko2,则有效关键词为Ks1、Ks2和Ks4。通过TF-IDF(term fre-quency-inverse document frequency,词频-逆向文档频率)编码对各有效关键词在每篇文本中出现的次数进行评分统计,分数最高的生物文本即为该关键词的映射目标。
图3 二元组文本图匹配示例Fig.3 Matching example of two-tuple text graph
生物文本按照映射得分从高到低依次排列,优先从得分最高的生物文本对应的一系列二元组文本中寻找包含检索关键词的二元组对。若所匹配的关键词为主语关键词,则二元组文本中的谓语关键词为工程产品根据该检索关键词映射得到的生物原型的策略;若所匹配的关键词为谓语关键词,则二元组文本中的主语关键词为工程产品根据该检索关键词映射得到的生物原型的动作。若最终得到的产品不满足用户需求,则选择得分第二高的生物文本进行同样操作,以此类推。从生物文本到工程产品的映射流程如图4所示,由检索结果得到工程产品设计方案后,根据当前产品设计方案是否满足设计需求来决定是否重新进行检索。
基于上文提出的用户需求映射网络生物文本的创新设计方法,开发相应的应用程序,并以管式空气加热器创新设计为例验证该方法的可行性。
管式空气加热器利用不锈钢电加热管对内腔气体进行加热,该加热器具有结构简单、不受生产工艺流程限制的优点。然而,现有管式空气加热器的余热利用率不理想且热效率低,因此有必要对其结构进行优化。图5所示为现有管式空气加热器的结构。从用户角度来看,对管式空气加热器的需求为提高余热利用率、增加发热量及增强环保性。对各项需求进行权重分配,得到需求向量R=[0.4 0.4 0.2]T。
如图6所示,根据各项需求的权重,分别从功能、原理、行为和结构四个方面确定与需求相关的指标。鉴于数据库中的生物文本信息为英文语句,为正确匹配关键词,在应用程序中输入的指标需用英文表示。对于管式空气加热器,通过分析得到其功能指标为加热(heating),原理指标为电导率(conductivity)、热(thermal),行为指标为传播(spread),结构指标为电热管(pipe)、腔壳(cover)。根据经验分配各项指标的权重系数,可得:
图4 从生物文本到工程产品的映射流程Fig.4 Mapping flow from biological text to engineering product
图5 管式空气加热器结构示意图Fig.5 Structure diagram of tubular type air heater
根据式(1)计算得到各项指标的评分向量:
由所得结果可知,加热(heating)、电导率(con-ductivity)、热(thermal)所对应的指标的权重得分远高于其他指标,则选定评分阈值t=1.6,确定检索关键词为加热(heating)、电导率(conductivity)和热(ther-mal)。
图6 生物文本检索程序操作流程Fig.6 Operation process of biological text indexing program
根据MDRM方法得到3个检索关键词后,通过调整检索模糊度来设定相似关键词的覆盖范围。当检索模糊度设为0时,表明仅在文本中匹配当前选定的3个关键词。本文设定的检索模糊度为5,点击搜索,匹配得到一系列可用于管式空气加热器仿生设计的参照生物以及相应的匹配得分。单击某一种生物,可查看该生物的文本信息和逐句提取生物文本语句。单击某一条语句,可以查看语句中的一系列二元组,并列出与检索关键词匹配的二元组元素、对应相似度以及作为映射策略的二元组中的另一个元素。图7所示为适用于管式空气加热器仿生设计的生物文本检索结果。由检索结果可以看出,斑眼冢雉(Mallee-fowl)和美利奴羊(Merino sheep)的检索得分明显高于其他匹配项,因此选用斑眼冢雉和美利奴羊作为管式空气加热器设计方案生成的参照生物。
图7 适用于管式空气加热器仿生设计的生物文本检索结果Fig.7 Searching results of biological texts for bionic design of tubular type air heater
对于图7所示的2篇生物文本,逐句查看语句中二元组的匹配相似度,分别提取2篇生物文本中相似度最高的句子:1)“In autumn,to keep warm,he cov-ers layers in the evening to retain the heat”;2)“Gener-ally a dense coat of underhairs,as in the wool of a sheep,is particularly effective in temperature control,because hundreds of tiny air pockets become trapped among the hairs and keep an insulating layer between animal and climate”。根据二元组对应的映射结果,分别生成在气体入口和出口添加带孔隔离板(斑眼冢雉映射方案)以及在上下壁处设置凹坑结构(美利奴羊映射方案)的2种设计方案,如图8所示。
图8 管式空气加热器仿生设计方案Fig.8 Bionic design schemes of tubular type air heater
令由斑眼冢雉映射得到的在气体入口和出口添加带孔隔离板方案为方案1,由美利奴羊映射得到的在上下壁处设置凹坑结构的方案为方案2,结合图5所示的原方案,对3种管式空气加热器进行仿真模拟,观察其加热情况。在Fluent软件中,统一设置Laminar求解模型:入口风速为8.33×10-6m/s,入口温度为-20℃,入口为velocity,出口为outflow,求解方式为Green-Gauss Cell Based。表1所示为3种管式空气加热器在不同放热量下的加热效果对比。由表1可以看出,相比于原管式空气加热器,方案1对应的管式空气加热器的加热性能明显提升;方案2对应的管式空气加热器的加热性能略有减弱。因此选用方案1作为最终设计方案。
本文提出的用户需求映射网络生物文本的创新设计方法可以系统地指导设计人员完成不同产品的仿生设计,由于这种方法是基于网络环境获取生物文本信息并采取文本模糊匹配和评分机制,可以同时保证索引文本的数量和质量。二元组的方案映射机制一方面可引导设计人员生成设计方案,另一方面又能发挥设计人员的主观能动性。基于本文所提方法生成的产品设计方案并不唯一,设计人员可以横向对比几种不同设计方案以得出最佳设计方案,从而避免单一设计方案效果不理想的缺陷。从管式空气加热器创新设计实例可以看出,本文提出的创新设计方法可使产品设计更具有目标性,同时具有较高的设计效率。后续将进一步研究网络生物文本知识转化率的提高方法以及多种语言的适配问题。
表1 不同管式空气加热器的加热效果对比Table 1 Comparison of heating effect of different tu-bular type air heaters