纺织工程领域本体模型构建

2020-04-23 09:35陈刚胡蓉
中国管理信息化 2020年3期
关键词:工程咨询知识库本体

陈刚 胡蓉

[摘    要] 为了满足纺织行业中不同类型企业对于纺织专业知识不同广度和深度的需求,提升企业知识获取、存储和应用水平,采用七步法构建纺织领域本体。基于所构建的领域本体,可形成系统性知识平台,为用户提供层次结构清晰、逻辑关系明确的专业知识数据库。本体的模块化和可扩展性特点可以针对不同用户提供个性化的知识管理解决方案。以纺织工程咨询企业为用户所构建的纺织工程领域本体设置了工艺、劳动对象、产业、产业经济、地域、工程、技术经济、案例和设备9个模块,可以有效提高咨询工作效率和质量,同时也可为工程咨询智能化奠定技术基础。

[关键词] 本体;纺织;工程咨询;知识库

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 03. 069

[中图分类号] TP391    [文献标识码]  A      [文章编号]  1673 - 0194(2020)03- 0167- 05

0      前    言

本体起源于哲学范畴,研究的基本问题是“什么可以被定义为存在”、“事物是什么”等。客观存在有不同的表现形式,为了区别某个存在而不是其他,可以定义一个集合来描述这个存在,这就是本体。领域本体是本体的一个类型,是指特定领域的本体,包含了该领域特定的概念。本体可以很好解决知识共享和复用的问题。因此,生物医学、农业、化工、教育等很多领域都建立了领域本体。

构建领域本体应该遵循以下基本原则:①明确性。本体应该有效表达研究领域的定义,并且這个定义应该是客观的。②一致性。本体的定义或公理应当是符合逻辑的。如果通过本体自身定义的逻辑推导出的结果产生自相矛盾的情况,则说明本体在一致性方面存在问题。③可扩展性。所构建的本体应该具有良好的扩展性。④最小偏差。本体应该建立在普遍具有的知识理解层面,避免本体在不同应用场景使用中造成的在知识理解方面的偏差,以促进知识共享。⑤控制本体规模。所建立的本体涉及的内容不应盲目扩张,满足需要即可。

根据本体应用领域和本体的类型不同,构建方法也不同。IDEF5法、骨架法和TOVE法适用于企业本体构建。对于领域本体,七步法是较为成熟的方法,也是本体构建的基本方法之一。七步法包含的步骤分别是:确定领域的本体、检索可供利用的现有本体、枚举领域的重要概念、定义类和类的层级体系、定义类的属性、定义属性的分面(Facets)以及建立实例。针对纺织工程领域专业知识服务与咨询的需要,采用七步法构建纺织工程领域本体,用于解决知识体系可视化、提高知识获取效率和应用水平,为搭建纺织工程咨询知识平台提供技术支撑。同时,可供出版企业为特定领域用户提供个性化知识管理服务。

1      纺织工程领域本体构建

1.1   确定本体的领域

本文所建立的是纺织工程领域本体。在这个领域中,具体的范围是纺织工程咨询智库建设所需的知识。该本体的用户是纺织工程咨询企业。领域本体内容覆盖纺织工程咨询业务过程中涉及的知识,包括纺织、经济、城市规划和公用工程等。

1.2   检索可供利用的现有本体

通过互联网检索本体库:DBpedia、Protégé本体库等,没有发现与纺织工程咨询相关的领域本体,该领域本体的建设基本处于空白阶段。

1.3   枚举领域的重要概念

根据纺织工程咨询业务内容和特点,将纺织工程咨询领域划分为工艺、劳动对象、设备、工程、产业经济、技术经济、地域、产业和案例9个子领域。其中7个主要的概念及其逻辑关系见图1。

一般情况下,工程咨询工作是以市场为起点,产业环境为基础。这些内容可列为产业经济范畴。然后明确生产什么产品、以什么为原料。这就决定了需要采用什么工艺。接下来明确采用什么设备,这些设备对车间面积、能源消耗等工程方面有什么要求。在以上内容都确定之后,需要进行技术经济评价。

产品和原料在产业链中可以是相对的概念。一个物品可以是上一个工序的产品,也可以是下一个工序的原料。例如白坯布既是上一个工序——纺纱的产品,又是下一个工序——印染的原料。“类”应该有明确、清晰的边界,这是“类”划分的依据。因此在划分子领域时,将“原料”和“产品”统一定义为“劳动对象”,不能将“原料”和“产品”作为独立的子领域划分。

1.4   定义类和类的层级体系

采用自顶向下的方式定义类的级别,把工艺、产品和设备等每个子领域列出的概念逐层分解。由于子领域有多种分类方式,为了保证领域本体模型各概念间的协同性,应尽可能做到分类方式统一。例如工艺的分类方式是哪一种,与工艺对应的设备也采用与工艺一致的分类方式。

工艺的分类是纺织工程领域本体的核心内容之一。工艺的分类有多种方法,既可以采用横向的分类方式,也可以采用纵向的分类方式。纺织行业常用的工艺分类方法如图2所示。

这种工艺的分类方式与现有行业协会管理相对应。但这种分类方法分类的缺陷在于维度不一致,有按产品分例如“服装工艺”,也有按工序划分例如“印染工艺”。而且,家用纺织品是纺织三大终端应用领域之一,但家用纺织品却没有直接对应的工艺。有些工艺之间存在交叉现象,例如毛纺工艺中的半精纺会用到棉纺的梳棉工艺。除此之外,当“印染工艺”作为一类工艺存在,如果按照传统的工艺分类方式,棉纺工艺、毛纺工艺以及针织工艺等都会与印染工艺存在交叉现象,因为上述工艺都会涉及印染生产环节。因此,本文按照工序对工艺进行分类,采用横向的分类方式。调整后的工艺分类见图3。

图3所展示的分类方法特点在于并不指定产品,如是生产服装还是家用纺织品;也不指定原料种类,如是棉纺还是毛纺。这种分类方式体现在某个工艺可以跨产业。例如纤维梳理工艺无论在棉纺产业还是毛纺产业都会被使用。这种分类方法具有更广泛的适应性。例如清梳联工艺是把开松、清花和梳理联合在一起的相对较新的工艺。采用以工序分类的方式,在本体中定义这一工艺时只需把开松、清花和梳理三个概念以恰当的关系设置即可。

纺织工程领域本体模型中共设置了9个模块,即工艺、劳动对象、产业、产业经济、地域、工程、技术经济、案例和设备。对于工艺的子类前文已描述。劳动对象的子类包括整个纺织产业链各环节加工对象以及加工后的产品。产业的子类按照产品、原料和工艺三个维度划分。按产品分类包括服装产业、床上用品产业和毛巾产业等类别。按原料分类包括丝绸产业、羊毛产业和涤纶产业等类别。按工艺分类包括纺纱产业、织造产业和染色产业等。产业经济包括产业集群、国际贸易和行业统计子类别。地域包括国家、省和市等子类别。案例包括产业规划、园区规划和可行性研究报告3个子类。9个模块进一步细分后,形成51个二级类及更多的三级、四级和五级类。纺织工程领域本体模型以知识图谱的形式展现,如图4所示。

图4是在软件中用图的形式展示本体结构。知识可视化的方式是多种多样的,在建立本体模型后,可以用其他软件展示更加丰富的知识图谱内容,实现知识可视化。

1.5   定义类的属性

在七步法中,定义类的属性有两个层面:一是类本身的属性,包括内在属性和外在属性;二是类之间的关系。

在定义类的属性过程中,子类共同的属性无须分别定义,只需将这个属性定义在父类中,子类会自动继承父类的属性。例如“气流纺纱线”和“环锭纺纱线”是“纱线”的子类。将“支数是”定义为“纱线”的属性后,“气流纺纱线”和“环锭纺纱线”都自动继承“支数是”这个属性。

在纺织工程咨询领域,数据是非常重要的基础,几乎所有分析以及方案的制定都离不开数据。在产业经济中,数据在供应端主要体现在分国别、分地区、分产品等维度的产量、进出口量等;在消费端主要体现在消费量、消费额等指标。在产品中,数据体现在产品的成分、规格等指标。在工艺中,数据体现为工艺参数。鉴于数据的重要性,对本体中数据属性的定義是本体构建的关键环节。

根据对纺织工程咨询领域知识内容的抽象,将关系分为时间、空间和逻辑关系。时间关系主要体现在工艺生产在时间上的先后关系。空间关系体现在有位置属性的类别中。纺织工程领域本体模型定义的对象属性共有25个,类与类之间的关系涵盖在对象属性中。定义关系和定义类是相互促进的,两者可以互相查漏补缺、迭代优化。本文构建的纺织工程领域本体模型具有的主要关系见表1。

增加同义词的属性是为了解决相同概念有不同表达方式的问题。通过同义词的属性标注,可以进一步丰富概念的语义标注,为提高检索效率提供技术基础。例如对转杯纺的同义标注见图5。

1.6   定义属性的分面(Facets)

属性的分面包含取值的类型、取值范围、值的数量等相关的特征。定义属性的分面需要根据每个属性所要表达的语义内容逐一定义。属性用于标注不同的类时,其分面的取值可以是不同的。下面以“产品是”为例介绍对象属性分面的定义。

“产品是”属于对象属性,定义属性的分面需要确定取值的约束类型。常用的约束类型有5个:存在、唯一、最小基数值、最大基数值和确切基数值。此处的约束类型可以和E-R模型中两个实体之间的关系联系起来。E-R模型中有三种关系:一对一(1:1)、一对多(1:n)和多对多(m:n)。其中一对一的关系,在属性分面中可以用“唯一”这一约束类型定义;对于一对多的关系,在属性分面中可以用“存在”这一约束类型定义。

例如定义“喷气织机”这个类与“机织布”的关系时,由于喷气织机生产的机织布不是唯一的,有多个种类,因此在这个情况下,对“产品是”的约束条件为“存在(Some)”。在软件的效果展示见图6。

1.7   建立实例

建立实例是本体构建七步法的最后一步。实例是某个类的个体。例如高浴比间歇染色机是一类设备,某生产厂家生产的一台这个类别的设备就是一个实例。如果把类在关系型数据库中建立一张表,一个实例可以理解为表中的一条记录。

在某些本体构建软件中,可以实现对新定义的实例自动归类的功能。前提条件是对类的属性首先定义值的类型和值的范围,即定义规则。例如首先定义好高浴比染色机的浴比大于等于8这个规则,当出现符合条件的实例时,实例会被自动添加到高浴比染色机这一类中。

2      结论与展望

纺织工程咨询领域本体力求涵盖企业工作过程涉及的所有知识,分为9个模块。模型中的纺织工艺和纺织产业及其产品的归纳和分类是重点。对于纺织工艺的分类,扬弃了传统的分类方法,以多维度划分工艺。对于产品,也采用多维度的分类方法。这对于准确高效定义现实中具体问题,发现新的工艺或产品组合具有重要意义。

在本体构建技术方面,随着本体构建技术的发展,将会有更加完善的本体构建自动或半自动技术出现,这将大幅提高本体构建的效率。尽管目前在自动提取概念和关系方面,存在噪音数据多,仍需要人工二次干预,但自动化或半自动化技术仍然是本体构建主要的研究方向之一。

在本体应用方面,工程咨询领域本体与人工智能进一步结合具有广阔的研究前景。本体概念被信息技术吸纳以来,人工智能一直是本体重要应用领域。但应用程度在不同行业之间存在着较大差异。基于本体的纺织工程咨询智能辅助系统可以帮助咨询工程师从某些烦琐的工作过程中解放出来,提高工程咨询的效率和质量。

主要参考文献

[1]Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993,5(2):199-220.

[2]杨春媛,李满生,朱云平.生物医学领域本体的构建、评估与应用[J].中国科学:生命科学, 2013(3):223-239.

[3]谢能付,王文生.农业知识本体构建方法[J].农业网络信息, 2007(8):12-16.

[4]张安超,韩娜.化工领域本体的构建与应用[J].出版科学, 2017, 25(5):88-91.

[5]马捷,刘小乐,黄岚,等.教育领域本体构建研究[J].情报理论与实践,2012, 5(7):104-108.

[6]杜小勇,马文峰,武文娟.学科领域本体的构建与进化——以经济学领域本体为例[J]. 现代图书情报技术, 2007, 2(3):7-12.

[7]Gruber T R.Toward Principles for the Design of Ontologies Used for Knowledge Sharing[J].International Journal of Human-Computer Studies, 1995, 43(5-6):907-928.

[8]Newell S,Robertson M, Scarbrough H, et al.Managing Knowledge Work and Innovation[M].2nd Edition.Baingtoke,UK:Palgrave MacMillan,2009.

[9]梅自强.纺织辞典[M].北京:中国纺织出版社, 2007.

猜你喜欢
工程咨询知识库本体
Abstracts and Key Words
对姜夔自度曲音乐本体的现代解读
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
公路工程咨询的开展实践与问题研究论述
高速公路信息系统维护知识库的建立和应用
《我应该感到自豪才对》的本体性教学内容及启示
基于Drupal发布学者知识库关联数据的研究
跨层次视角下项目社会资本对知识转移的影响
Care about the virtue moral education
位置与方向测试题