基于双向长短期记忆网络的纺纱工艺重用知识图谱构建

2024-12-09 00:00胡胜张溪刘登基高冰冰赵小惠
丝绸 2024年12期

摘要: 针对获取碎片化纺纱工艺信息导致的生产效率低下、资源浪费及决策失误等问题,文章提出了一种基于双向长短期记忆网络的纺纱工艺重用知识图谱构建方法。首先,自上而下定义纺纱工艺相关概念、术语和关系,完成对知识图谱模式层的构建;其次,根据模式层规则来构建数据层,采用双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)模型捕捉输入序列的上下文信息作为条件随机场(Conditional Random Fields,CRF)的输入,对标签序列进行建模标注以提取关键知识信息,并通过词向量模型(Word2Vec)来计算纺纱相关的文本数据之间的相似度来实现知识融合,从而提升分词准确率;最后通过Neo4j图数据库存储抽取到的纺纱工艺知识,并可视化展示原料、工艺等复杂关系网络,可帮助纺织企业优化生产、提升决策效率。实例分析结果表明,该知识抽取方法具有较高的召回率(88.7%)、准确率(89.9%)和F1值(89.3%),优于BiLSTM-CRF和LSTM-CRF模型,抽取效果有了显著提升。

关键词: 知识图谱;纺纱工艺知识;双向长短期记忆网络;知识抽取;知识融合;实体关系

中图分类号: TS111.9; TH165.4

文献标志码: A

文章编号: 10017003(2024)12期数0052起始页码09篇页数

DOI: 10.3969/j.issn.1001-7003.2024.12期数.005(篇序)

在纺织工艺领域,随着轻工业数据信息化的快速发展,纺纱智能生产系统积累了大量数据,但数据冗余且知识关联性弱,限制了其有效应用[1-3。当前系统虽重视数据检索,却缺乏对工艺知识深层关联、理解和推理的充分挖掘[4,导致在面对复杂工艺问题时难以快速提炼有价值信息,进而影响决策效率和准确性。因此,构建一种能够深度挖掘纺织工艺知识、强化知识关联并实现高效管理的方法显得尤为重要。

强化知识关联对于提升各行业工艺水平及生产效率而言,具有至关重要的作用[5。当前,研究正聚焦于如何高效地将企业内部的零散工艺信息整合为标准化的结构化知识,并积极探索其便捷的应用方式[6。而知识图谱作为一种新兴的知识表示与管理技术,正展现出其在促进知识复用与共享方面的巨大潜力,其涵盖了金融风险预测[7、医疗人员管理8、社会科学9等多个领域。知识图谱在生产及其制造领域也进行了拓展,Cai等[10针对旋转机械故障诊断精度受特征条件限制问题,提出知识图谱驱动的诊断新方法。李秀玲等[11针对复杂、多样的工艺知识,将语义分析技术引入到知识图谱中。吴秀丽等[12利用知识图谱技术构建退役机电产品全生命周期统一数据模型,优化多源数据管理,增强逆向物流信息追溯力。段阳等[13针对离散的金属刀削加工数据问题,采用了基于等价实体判别的数据融合算法,建立了金属切削加工知识图谱。周彬[14提出图匹配卷积网络模型,构建航天薄壁件加工质量知识图谱,整合资源,提升加工效率和精度。路松峰等[15针对数控设备数据问题,构建基于知识图谱的信息模型,抽取并融合数据,生成加工知识图谱以提升效率。Li等[16提出级联模型,结合随机森林分类与知识推理,构建电力故障诊断知识图谱,克服传统方法局限。Ko等[17提出结合机器学习与知识图谱的增材制造法,利用新数据生成共享设计规则知识。Zhou等[18针对给定的订单插入任务无法快速做出资源分配问题,提出了车间资源知识图谱模型来集成加工车间的工程语义信息。聂同攀等[19针对飞机电源故障应对难题,提出构建电源系统故障诊断知识图谱,实现智慧搜索、推荐与智能问答,提升故障应对效率。Wen等[20针对制

造过程知识重用难,提出构建过程知识图谱方法,整合并优化知识共享与复用。Pu等[21针对铁路线形优化复杂,知识非结构化且应用碎片化,提出了首个铁路线形优化知识图谱建模方法,以整合知识并促进更新。Sarazin等[22构建飞机运维知识图谱专家系统,整合多源异构信息,提升异常检测与故障诊断效率。

综上可以看出,知识图谱作为现代知识管理的利器,擅长构建复杂知识体系的结构化表达,已跨足多个行业。然而,在纺织行业特别是纺纱工艺领域,知识图谱的应用仍处于探索阶段。面对纺纱工艺知识的碎片化、高冗余度和弱关联性,亟须一种新型的技术手段来整合这些数据信息,以实现知识的重用和高效管理。因此,本文提出了一种基于双向长短期记忆网络的纺纱工艺重用知识图谱构建方法,旨在通过深度学习技术提取关键工艺知识,实现纺纱工艺知识的系统化、结构化和智能化管理。具体方法为:首先,定义纺纱过程的核心概

念与术语关系,构建知识图谱模式层。随后,利用BiLSTM-CRF模型精准标注纺纱工艺标签,借助Word2Vec和余弦相似度算法整合知识。最后,将整合数据存储在关系型数据库中,形成知识图谱数据层,以增强知识的可重用性。

1 纺纱过程知识图谱建模框架

本文所提出的基于双向长短期记忆网络的纺纱工艺重用知识图谱构建框架如图1所示,具体内容如下:1) 模式层构建。该阶段主要任务是定义纺织领域知识体系,确定工艺相关概念、术语和关系,良好的模式层可指导构建数据层。2) 数据层构建。该阶段主要任务是填充概念的实例和对应属性,本文通过构建的BiLSTM-CRF模型对文本标签序列进行标注以抽取关键知识信息,采用Word2Vec模型计算纺纱工艺知识属性的相似度,以实现知识融合并将融合后的知识数据有序地存储到关系型数据库来构建数据层。

2 纺纱工艺知识图谱模式层构建

知识图谱的模式层构成了其概念框架和逻辑基石,为数据层设定了明确的规范和约束。在构建过程中,通常采用自上而下的方法,首先确定高层次的抽象概念,然后逐步细化至具体的实体、属性和它们之间的关系。这一层次化的构建方式确保了知识图谱的完整性和逻辑一致性。本文在纺织领域专家的帮助下对纺纱方面的文本内容进行详细分析,提炼出纺织领域里有意义的概念类型与相关的属性,以及概念之间关系,从而形成领域知识体系。纺纱领域文本之间的关系,本文采用头实体、尾实体、关系进行串联。

头实体:指的是在关系中的起始实体。头实体是纺纱工艺中涉及的某个具体步骤、概念或实体。如在“纺纱过程中需要进行牵伸”这个三元组中,“纺纱过程”就是头实体。

关系:描述头实体和尾实体之间的联系或属性。关系是纺纱工艺中不同步骤之间的顺序关系、操作关系,或者是实体之间的属性关系等。以“牵伸”为例,它描述了纺纱过程中纤维被拉伸以改善其结构和性质的操作。

尾实体:指在关系中的结束实体,通常是头实体通过关系所指向的目标。尾实体是一个结果、状态或者另一个相关步骤。如在“纺纱过程中需要进行牵伸以得到优质的纱线”这个三元组中,“优质的纱线”就是尾实体,它是牵伸操作所期望达到的结果。实际上,工艺知识图谱的构建涉及集成来自多个数据来源的信息,不同数据源的信息被映射成图的节点,构建了一个丰富的关联网络。纺纱工艺知识本体与知识图谱映射原理如图2所示,其映射关系可能包括各种连接、依赖、影响等关系。

由图2可知,构建纺纱工艺知识的模式层时,首先确立了“纺纱”作为核心顶层概念,它是整个知识体系的基础和出发点。随后,围绕这一顶层概念,构建“纺纱工艺知识本体”,这一层次详细描述了纺纱工艺中涉及的多个关键领域,包括纤维类型、原料、工序等,以及它们之间的相互作用和关系。通过这样的构建,能够系统地表示纺纱工艺中的知识结构和内在联系。进一步地,利用映射关系将“纺纱工艺知识本体”与“纺纱工艺知识库”相连,实现了知识本体与知识库之间的有效关联。在模式层中,“纺纱、纤维类型、工序”等头实体通过“包括、特征”等关系与“原料、聚酯纤维、聚酯纤维纱线”等尾实体紧密相连,这些具体的实体和关系共同体现了纺纱工艺知识的复杂性和专业性,为后续的知识图谱构建和应用提供了坚实的基础。

3 工艺知识图谱数据层构建

纺纱工艺知识图谱数据层构建主要在模式层概念的基础上进行知识抽取和知识融合。知识抽取从纺纱工艺数据源中提取实体、属性和关系,为数据层提供基础;知识融合通过词向量处理识别文本语义相似度,确保数据层的一致性和完整性。首先对纺纱工艺知识文本进行数据标注构成训练数据集,接着使用深度学习算法对纺纱工艺文本进行实体及关系抽取,构建出三元组并存入图数据库中,从而完成知识图谱数据层的构建。

3.1 基于BiLSTM-CRF的纺纱工艺知识抽取

纺纱数据庞大且碎片化,难以直接从海量的信息库中快速获取有价值的信息。因此采用知识抽取技术,将原始的、非结构化的纺纱数据转化为结构化、可理解的知识单元。这些知识单元包括实体(如纱线类型、纺纱设备等)、属性(如纱线强度、纤维长度等),以及它们之间的关系。通过这一过程,构建出一个全面反映纺纱工艺全貌和细节的知识图谱。同时,纺纱工艺知识文本富含专业术语和复杂流程,具有时序和上下文依赖性。BiLSTM是RNN的扩展,能同时处理序列的前向与后向信息。通过双向RNN层,它结合前后文信息,增强了对纺纱工艺等复杂序列数据的理解能力。BiLSTM特征在于其双向性,捕捉全局上下文;以及长期依赖性,通过LSTM的“门”机制解决长序列问题,提升纺纱数据预测准确性。此外,CRF作为强大的序列标注模型,可以在给定观察序列的条件下预测最可能的标签序列。在纺纱工艺知识抽取中,CRF能够识别实体及其关系,优化整个句子的标签序列预测,减少错误传播,提高准确性。因此,本文采用BiLSTM-CRF算法对纺纱工艺进行知识抽取。

纺纱工艺知识抽取可划分为三大环节:首先,文本被转化为蕴含上下文信息的字向量,这些向量捕捉语句中每个字的语义和上下文关联。接着,这些字向量被输入到BiLSTM模块中,该模块通过双向编码方式,考虑文本的前后文信息,为每个可能的标签输出预测分数值。最后,CRF模块对这些预测分数进行解码,通过训练过程学习得到标签之间的转移概率和相应的约束条件,从而得出最终的预测标注序列。基于BiLSTM-CRF纺纱工艺知识抽取模型框架如图3所示。

图3中,W1,W2,…,Wn为词向量,输入语句都被转换为可编码的词向量形式;w1,w2,w3,…为词向量经过CRF层的标签序列概率;B表示实体的首字符,O表示不属于任何已定义的实体,I表示实体的内部字符。

由图3可知,原始输入语句,如“纺纱工艺中的工艺特征有:开清棉”,首先这些语句会被转换为向量W1,W2,…,Wn,随后这些向量会被送入BiLSTM的3、4层进行上下文特征的学习。通过这种方式,模型能够充分捕捉语句中的上下文信息,为后续的任务提供有力的特征表示。随后,将向量传递给BiLSTM层进行上下文特征的学习,确保模型能够深入捕获语句中的上下文信息。BiLSTM结合了前向LSTM和后向LSTM,将原本顺序输入的序列转化为两个方向的输入,可以使得网络能够同时获得前向和后向的信息,从而更精准地捕捉长距离的双向语义依赖。CRF层会接收BiLSTM层输出的每个时间步长的隐藏状态,并计算所有可能的标签序列的概率。它通过学习标签之间的转移概率,来确定最可能的标签序列。最终,CRF层会输出一个最优的标签序列,即BIO标注结果。最终输出的信息为:工序、特征、开清棉。

3.2 基于Word2Vec的纺纱工艺知识融合

在纺纱工艺知识图谱的构建过程中,抽取到的文本信息往往包含大量相同或语义相似的数据。这些信息可能来自不同的数据源,或者是在处理过程中产生的重复或冗余内容,因此需要对这些相同或语义相似的文本信息进行知识融合。即采用知识融合技术整合来自不同来源的相同或相似信息,形成一个统一且无冗余的知识表示。而Word2Vec算法能够将纺纱工艺知识文本中的词汇转化为稠密的向量表示,这些向量能够捕捉到词汇之间的语义关系。相比于传统的基于词袋模型的表示方法,Word2Vec算法生成的词向量包含了丰富的语义信息,有助于更准确地表示和理解纺纱工艺知识中的专业术语和复杂流程。因此,本文采用Word2Vec算法,对纺纱工艺进行知识融合。

通过BiLSTM-CRF模型抽取到纺纱工艺知识后,利用Word2Vec算法将词汇映射到向量空间,以捕捉语义关系。这些词向量用于分析纺纱工艺中的实体相似性和差异性,以发现潜在关系。基于Word2Vec算法实体知识融合过程如图4所示。

基于Word2Vec模型的实体知识融合过程步骤如下:

1) 首先逐个取出BiLSTM-CRF模型得到的实体抽取结果:实体1、实体2、实体3。对于每个实体,检查其是否为首个遇到的独立实体。如果是,则新建一个聚类,并将该实体作为该聚类的首个成员。如果不是首个聚类,则进入相似度处理的步骤。

2) 对于不是首个聚类的实体,进行分词处理,将其拆分为单独的词或子词单元。随后,利用Word2Vec模型为每个词获取一个向量表示。这些向量用来捕捉词的语义信息,PfleXNZ+Q9mqJez9PTUik22xmLJXcprmturWWLoZnCA=使得语义上相近的词在向量空间中的位置也相近。根据得到的词向量创建两个矩阵。第一个矩阵是句子长度(即词的个数)乘以词汇表长度的零矩阵,记录每个词是否出现在句子中。第二个矩阵是词汇表长度乘以词向量维度的矩阵,其中每一行是词汇表中对应词的Word2Vec向量。通过第一个矩阵和第二个矩阵的乘法运算,得到一个句子长度乘以词向量维度的矩阵。这个矩阵的每一行就对应句子中每个词的Word2Vec向量表示,即实现了将句子中的每个单词映射到Word2Vec向量空间中。

3) 接下来通过得到的属性的向量,使用余弦相似度来比较不同实体之间的相似程度。如果两个实体的相似度大于设定的阈值,则将它们归入已有的聚类中;否则,保持它们作为独立的实体或考虑创建新的聚类。其中,余弦相似度是通过计算两个向量的夹角来衡量它们之间的相似程度。余弦相似度的公式如下:

S(A1,B2)=a1·b2a1b2(1)

式中:S表示余弦相似度,A1和B1分别是两个属性的向量表示,·表示向量的点积,·表示向量的范数。

相似度的取值范围在-1~1,值越接近1表示两个属性越相似,值越接近-1表示两个属性越不相似。

3.3 模型评价指标

为了测试模型性能的优劣,本文采用精确率P、召回率R和F1分数值这三项评价指标来评估模型性能。其中,准确率越高,模型识别非目标实体越准确;召回率越高,模型捕捉目标实体越高效;F1值提升,则模型在平衡准确与召回上的稳健性增强。计算方法如下:

P/%=TPTP+FP×100(2)

R/%=TPTP+FN×100(3)

F1/%=2P×RP+R×100(4)

式中:TP表示模型正确预测目标实体的数量,FP表示模型错误预测非目标实体的数量,FN表示模型未能识别实体的数量。

4 案例分析

为了验证所提基于知识图谱的纺纱工艺知识重用的有效性,本文选取《纺纱技术》和《纺纱工艺学》著作为实验数据的核心来源。该纺纱工艺知识涉及工序、纤维类型、纺纱质量控制、纱线应用四方面的知识。纺纱工艺知识选取的训练数据为789,对纺纱工艺知识文本数据的定义以句子的最大长度为80个字符进行BIO标注,将标注后的数据划分为67%的训练集和33%的测试集,并对模型进行训练与测试。

4.1 模式层构建

本文纺纱工艺知识包括工序、纤维类型、纺纱质量控制、纱线应用等四个方面的知识,对各个数据信息进行实体关系间抽取,可获得对应的本体规则,用来构建知识图谱的模式层,如图5所示。

由图5可知,纺纱工艺的知识体系被划分为几个核心领域:纤维类型(如聚酯纤维、腈纶等)、纺纱工序(包含开清棉、梳棉、井条等工序)、纺纱质量控制,以及纱线应用(涵盖医疗器械、建筑材料、服装等领域)。这些领域通过特征、工序、工艺参数等节点相互连接,形成完整的纺纱工艺知识网络,为后续构建数据层提供了知识框架。

4.2 数据层构建

本文的实验主要运行环境为:Windows10操作系统,处理器AMD Ryzen 5 2500U,64位操作系统,Python 3.6,编程平台Pycharm 2021.2,基于Keras、TensorFlow神经网络框架搭建模型,部分BiLSTM-CRF-Word2Vec模型参数如表1所示。

通过BiLSTM-CRF-Word2Vec模型,采用BIO标注法将纺纱工艺文本序列中的每个字标注为B、I或O标签,以此明确界定和分类实体的起始、内部和非实体部分,确保头部、中间和尾部标签的一致性和准确性。

根据BiLSTM-CRF模型得到的标注结果,随后采用Word2Vec模型,对此进行聚类相似度计算。其初始化的主要参数有:vector_size=150,window=5,min_count=1。其中,vector_siz为词向量的维度,window为训练词向量时考虑的上下文窗口大小,min_count为在构建词汇表时忽略词频低于1的单词。

根据纺纱工艺知识中不同词语在语义上的相似性和差异性,由式(1)得出粗纱与细纱的相似度为0.018 540 392,并条与并合的相似度为0.932 756 781。由此可知,相似的词语在向量空间中会聚集在一起,形成聚类;而差异较大的词语则会分布在不同的区域。这种空间分布直观地展示了纺纱工艺知识中词语之间的内在联系。在数据层构建中,需要将原始的纺纱工艺知识文本转换为计算机能够理解和处理的数值形式。通过词向量的转换将词语转换为高维空间中的向量,进而构建出包含丰富语义信息的纺纱工艺知识数据集。为评估本文构建的BiLSTM-CRF-Word2Vec模型在纺纱工艺领域实体抽取任务上的效能,分别与LSTM-CRF及BiLSTM-CRF模型进行对比实验,结果如图6所示。其中P、R、F1数值来源均由式(2~4)得到。

由图6可知,相对于LSTM-CRF和BiLSTM-CRF,BiLSTM-CRF-Word2Vec的准确率分别提高了0.8%~3.4%,召回率提高了2.4%~7.8%,F1得分值提高了1.6%~5.6%。这主要源于LSTM-CRF和BiLSTM-CRF模型在捕捉文本深层语义信息及处理标签依赖关系和实体边界识别时的局限性。具体来说,LSTM-CRF模型在处理长序列时可能难捕捉长期的依赖关系,而BiLSTM-CRF模型虽然通过双向LSTM结构解决了这个问题,但在语义信息的捕捉方面仍有不足。相比之下,BiLSTM-CRF-Word2Vec模型通过结合Word2Vec技术、BiLSTM结构和CRF层,在多个方面表现出显著优势。Word2Vec技术能够将文本中的每个词转换为固定维度的向量表示,这些向量富含语义信息,使得模型能够更深入地理解文本内容。BiLSTM结构允许模型同时考虑输入序列的前后上下文信息,从而更准确地捕捉实体边界和判断实体类型。而CRF层则进一步优化了序列标注过程,提高了模型在处理标签依赖关系时的准确性。因此,BiLSTM-CRF-Word2Vec模型通过引入Word2Vec技术,有效弥补了LSTM-CRF和BiLSTM-CRF模型在语义信息捕捉和标签依赖关系处理方面的不足,从而显著提升了模型在实体抽取等NLP任务中的性能。

4.3 纺纱工艺知识图谱可视化

在完成数据验证后,解析并提取数据中的关键实体及其之间的关系。鉴于数据量适中,本文选择利用Neo4j图数据库的Cypher语言结合LOAD CSV功能来高效存储这些数据。在数据准备阶段,首先将纺纱领域的知识图谱模式层(包括实体类型和关系类型)定义清晰,并将这些定义映射到实际的数据层上,如图5所示。随后,解析得到的实体节点和它们之间的关系数据分别整理成CSV文件格式,并存放在Neo4j图数据库的import文件夹内。接下来,利用Cypher的LOAD CSV功能,编写相应的Cypher语句来批量导入节点(Node)和关系(Relationship)。这些Cypher语句会根据CSV文件中的数据内容,在Neo4j图数据库中创建相应的节点和边,从而构建起纺纱领域的知识图谱。通过Neo4j的可视化功能,能够直观地展示纺纱工艺知识图谱,如图7所示,其中蓝色节点代表纺纱工艺的各类实体,而边则用于表示这些实体之间的不同关系类型。

由图7可见,知识图谱可视化能够清晰地展示纺纱工艺中各个环节之间的关系,将原料、设备、操作过程、质量控制等要素之间的相互作用和影响以直观、图形化的方式呈现在工艺人员面前。这种方式使得工艺人员能够更快速地理解和把握纺纱工艺的整体框架和细节,从而有助于提升对工艺的全面认识。并通过对知识图谱的深入分析,工艺人员能够更好地把握工艺流程中的关键节点和潜在风险,为工艺优化和改进提供有力的支持。因此,知识图谱可视化不仅增强了工艺人员对纺纱工艺的理解,还为他们提供了有效的决策依据,从而推动纺纱工艺的持续优化和发展。

5 结 论

针对加工工艺的选择往往依赖人工经验,而人工经验是一种主观经验,具有精确性不足、难以复用等问题,本文提出了一种基于知识图谱的纺纱工艺知识重用方法,并得出以下结论。

1) 本文通过构建BiLSTM-CRF模型对纺纱文本序列信息进行序列标注,显著提升了识别和标注文本中关键信息的准确性。这一模型的引入,不仅解决了传统方法在处理复杂文本结构时的不足,而且为深入理解纺纱文本内容提供了强有力的工具。通过BiLSTM-CRF模型,能够更精准地捕捉文本中的上下文信息和序列特征,从而更准确地标注出纺纱文本中的术语、概念和关键信息。

2) 接着利用Word2Vec模型计算标注后的纺纱文本数据的相似度,实现了对不同纺纱术语和概念之间关联性的量化评估。这iGvCUeTvzmz6JLELpfQbvjoVPsz2wJMTvhcjt1zVktA=一方法不仅简化了知识关联性的分析过程,而且通过具体的数值度量,使得纺纱知识之间的关联性变得更为直观和易于理解。通过Word2Vec模型,能够快速发现纺纱术语之间的潜在联系,揭示不同概念之间的内在关联,从而有助于全面地理解和把握纺纱领域的知识体系。

在后续研究中,将进一步深化对纺纱工艺知识图谱重用方法的研究,重点探索更加灵活且通用的实体与关系标注方法及训练模型。特别是针对语料中存在的复杂多重叠关系提取难题,将开发更为精准高效的解决方案。同时,鉴于网络数据的日新月异,知识图谱的实时更新与补充显得尤为重要。为此,需充分利用知识融合与知识推理等先进技术,推动知识图谱的自动化更新与升级,确保其始终与最新的纺纱工艺知识保持同步。

参考文献:

[1]潘王蕾, 何瑛. 基于个性化推荐的服装知识图谱构建[J]. 服装学报, 2022, 7(3): 275-282.

PAN W L, HE Y. Construction of clothing knowledge graph based on personalized recommendation[J]. Journal of Clothing Research, 2022, 7(3): 275-282.

[2]HU S, ZHANG G, ZHAO X H, et al. A method for yarn quality fluctuation prediction based on multi-correlation parameter feature subspace mechanism in spinning process[J]. Journal of Engineered Fibers and Fabrics, 2022, 10(3): 176.

[3]胡胜, 李文, 赵小惠, 等. 基于特征空间变换的纺纱过程多关联参数质量波动异常检测[J]. 计算机集成制造系统, 2023, 29(7): 2224-2232.

HU S, LI W, ZHAO X H, et al. Quality fluctuation abnormal detection og multi related parameters in spining process based on feature space transformation[J]. Computer Integrated Manufacturing Systems, 2023, 29(7): 2224-2232.

[4]XIAO Y Z, ZHENG S, SHI J C, et al.Knowledge graph-based manufacturing process planning: A state-of-the-art review[J]. Journal of Manufacturing Systems, 2023(70): 417-435.

[5]CHHIM P, CHINNAM R B, SADAWI N. Product design and manufacturing process based ontology for manufacturing knowledge reuse[J]. Journal of Intelligent Manufacturing, 2019, 30: 905-916.

[6]ZHENG P, XIA L Q, LI C X, et al. Towards Self-X cognitive manufacturing network: An industrial knowledge graph-based multi-agent reinforcement learning approach[J]. Journal of Manufacturing Systems, 2021(61): 16-26.

[7]RONY M, AYUSH D, PIYUSH D, et al. Knowledge graph driven credit risk assessment for micro, small and medium-sized enterprises[J]. International Journal of Production Research, 2024, 62(12): 4273-4289.

[8]KHALID M M, MADAN K, MAZE A, et al. Automated domainn-specific healthcare knowledge graph curation framework: Subarachnoid hemorrhage as phenotype[J]. Expert Systems with Applications, 2020(145): 113120.

[9]ABU S B, ALSAWALQAH H, ELSHQEIRAT B, et al. Toward a knowledge-based personalised recommender system for mobile app development[J]. Journal of Universal Computer Science, 2021, 27(2): 208-229.

[10]CAI T, JIANG Z Y, WU H, et al. Research on knowledge graph-driven equipment fault diagnosis method for intelligent manufacturing[J]. The International Journal of Advanced Manufacturing Technology, 2024, 130(9/10): 4649-4662.

[11]李秀玲, 张树生, 黄瑞, 等. 面向工艺重用的工艺知识图谱构建方法[J]. 西北工业大学学报, 2019, 37(6): 1174-1183.

LI X L, ZHANG S S, HUANG R, et al. Process knowledge graph construction method for process reuse[J]. Journal of Northwestern Polytechnical University, 2019, 37(6): 1174-1183.

[12]吴秀丽, 马隆洲, 向东, 等. 面向退役机电产品全生命周期的知识图谱统一建模方法研究[J]. 机械工程学报, 2023, 59(7): 52-67.

WU X L, MA L Z, XIANG D, et al. Research on unified modeling method of knowledge graph for the whole life cycle of retired mechanical and electrical products[J]. Journal of Mechanical Engineering, 2023, 59(7): 52-67.

[13]段阳, 侯力, 冷松. 金属切削加工知识图谱构建及应用[J]. 吉林大学学报(工学版), 2021, 51(1): 122-133.

DUAN Y, HOU L, LENG S. Construction and application of knowledge graph for metal cutting processing[J]. Journal of Jilin University (Engineering and Technology Edition), 2021, 51(1): 122-133.

[14]周彬. 航天薄壁件加工质量的知识图谱建模与因果推理研究[D]. 上海: 东华大学, 2022.

ZHOU B. Knowledge Graph Modeling and Causal Reasoning for Machining Quality of Aerospace Thin-Walled Parts[D]. Shanghai: Donghua University, 2022.

[15]路松峰, 李祎明, 屠向阳, 等. 基于知识图谱的数控装备信息模型建模方法[J]. 华中科技大学学报(自然科学版), 2022, 50(6): 39-47.

LU S F, LI Y M, TU X Y, et al. Modeling method of numerical control equipment information model based on knowledge graph[J]. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2022, 50(6): 39-47.

[16]LI C, WANG B. A knowledge graph method towards power system fault diagnosis and classification[J]. Electronics, 2023, 12(23): 4808-4822.

[17]KO H, WITHERELL P, LU Y, et al. Machine learning and knowledge graph based design rule construction for additive manufacturing[J]. Additive Manufacturing, 2020(37): 101620.

[18]ZHOU B, BAO J S, LI J, et al. A novel knowledge graph based optimization approach for resource allocation in discrete manufacturing workshops[J]. Robotics and Computer-Integrated Manufacturing, 2021, 71: 102160-102179.

[19]聂同攀, 曾继炎, 程玉杰, 等. 面向飞机电源系统故障诊断的知识图谱构建技术及应用[J]. 航空学报, 2022, 43(8): 46-62.

NIE T P, ZENG J Y, CHENG Y J, et al. Knowledge graph construction technology and its application in aircraft power system fault diagnosis[J]. Acta Aeronautica et Astronautica Sinica, 2022, 43(8): 46-62.

[20]WEN P H, MA Y, WANG R Q. Systematic knowledge modeling and extraction methods for manufacturing process planning based on knowledge graph[J]. Advanced Engineering Informatics, 2023(58): 102172.

[21]PU H, HU T, SONG T R, et al. Modeling and application of a customized knowledge graph for railway alignment optimization[J]. Expert Systems with Applications, 2024(244): 122999.

[22]SARAZIN A, BASCANS J, SCIAU J B, et al. Expert system dedicated to condition-based maintenance based on a knowledge graph approach: Application to an aeronautic system[J]. Expert Systems with Applications, 2021(186): 115767.

Construction of a knowledge graph for reusable spinning processes based onbidirectional long short-term memory networks

ZHANG Chi, WANG Xiangrong

HU Sheng, ZHANG Xi, LIU Dengji, GAO Bingbing, ZHAO Xiaohui

(School of Mechanical and Electrical Engineering, Xi’an Polytechnic University, Xi’an 710048, China)

Abstract: Textile spinning process knowledge is a vital technical heritage in the textile industry, and its systematic organization and efficient reuse are crucial for driving industrial technological innovation and preserving cultural diversity. However, spinning process knowledge is often scattered across various documents, practical experiences, and master-apprentice transmissions, exhibiting a high degree of fragmentation and unstructuredness, and posing significant challenges to knowledge integration, retrieval, and application. With the rapid development of the textile industry, the updating and iteration of spinning process knowledge have accelerated, rendering traditional manual recording and inheritance methods inadequate for meeting the demands of modern industries for efficient and precise knowledge management. Particularly when dealing with complex and varied spinning processes, traditional methods often fail to fully capture process details, leading to information loss or distortion during transmission, thereby affecting the integrity and accuracy of spinning process knowledge. To address this challenge, research on the reuse of spinning process knowledge based on knowledge graphs has emerged. As a structured knowledge representation method, knowledge graphs can formally describe entities, attributes, and relationships within spinning process knowledge, forming an interconnected knowledge network. By constructing a spinning process knowledge graph, systematic organization, standardized expression, and intelligent management of spinning process knowledge can be achieved, so as to provide textile practitioners with a comprehensive, accurate, and easily understandable knowledge resource platform.

To address issues such as low production efficiency, resource waste, and decision-making errors caused by fragmented spinning process information, a method for constructing a spinning process reuse knowledge graph based on a bidirectional long short-term memory network (BiLSTM) was proposed. Firstly, spinning process-related concepts, terminologies, and relationships were defined top-down to complete the construction of the knowledge graph’s schema layer. Secondly, the data layer was constructed according to the schema layer rules. The BiLSTM model was employed to capture contextual information from the input sequence, which serves as input for the Conditional Random Fields (CRF) model to model and annotate tag sequences for extracting key knowledge information. Furthermore, the Word2Vec model was utilized to calculate the similarity between textile-related text data, facilitating knowledge fusion and enhancing tokenization accuracy. Finally, the extracted spinning process knowledge was stored in a Neo4j graph database and visually presented, showcasing complex relationships among raw materials, processes, etc., aiding textile enterprises in optimizing production and enhancing decision-making efficiency. This paper integrates the BiLSTM and CRF models, leveraging BiLSTM’s contextual capture capabilities and CRF’s sequence labeling advantages to achieve precise extraction of key knowledge information from spinning process texts. Additionally, the introduction of a word embedding model for knowledge fusion and the utilization of Word2Vec to calculate text similarity promote the effective knowledge integration and improve the accuracy of tokenization and entity recognition. The results of case studies indicate that the proposed knowledge extraction method achieves high recall (88.7%), precision (89.9%), and F1 score (89.3%), significantly outperforming the BiLSTM-CRF and LSTM-CRF models. This demonstrates the method’s remarkable effectiveness in spinning process knowledge extraction, effectively enhancing production and decision-making efficiency in textile enterprises.

In the future, further optimization and refinement of this method will be undertaken, and more advanced natural language processing and knowledge graph construction technologies will be explored to further enhance the accuracy and efficiency of spinning process knowledge extraction. Additionally, strengthened cooperation with textile enterprises will facilitate the application of this method in actual production, so as to generate greater economic and social benefits for enterprises.

Key words: knowledge graph; spinning process knowledge; bidirectional long short-term memory networks; knowledge extraction; knowledge fusion; entity relationship