纪 钢,刘芳芳,司洞洞
(重庆理工大学计算机科学与工程学院,重庆 400054)
在工业生产中,材料在不同环境下的腐蚀行为及腐蚀数据是新产品研发和基础设施工程建设中耐久性设计的重要信息资源,由于材料种类繁多、腐蚀过程与环境因素关联紧密,在材料腐蚀数据及环境因素数据不断积累下,对于材料腐蚀数据库的组成,腐蚀数据处理及检索应用中,如何表述材料腐蚀数据的基本特征及组成方式就显得尤为重要。另外,在材料腐蚀数据处理中,不同时期对材料腐蚀特征采用的记录方式不同,导致不同的材料腐蚀应用系统之间的记录数据标准不一致,使得材料腐蚀领域各应用系统之间数据不能交换与共享,给材料腐蚀数据的应用及专家决策系统的实施带来严重的影响。随着材料腐蚀试验研究的广泛深入,所获得的信息量呈指数增长,其相关信息也变得更加复杂。如何有效的进行数据组织及表示各数据之间的层次关系,是材料腐蚀特征基础数据需要重点解决的问题[1]。目前,在许多应用领域中,已使用元数据的概念来描述基础数据信息,元数据是数字信息组织和处理的基本工具,它们为各种形态的数字化信息单元和资源集合提供规范、普遍的描述基准和方法。由于信息量的急剧增加,信息之间关联的复杂性,使得传统数据表述方式已远远不能满足材料腐蚀特征处理、查询的需要。本体为基于领域知识的共享和推理提供了坚实的基础,从而利用本体来指导数据的构建来保证语义上的一致性。针对材料腐蚀领域元数据异构问题,利用本体知识在材料腐蚀特征元数据层次上建立一种对不同系统的元数据之间进行语义映射的方案,以实现异构数据源的互操作。所以,有必要在本体方式下,表述材料腐蚀特征元数据的组成。
材料腐蚀即材料在不同环境中,受环境因素的种种影响,其表面会出现锈蚀、裂纹、鼓泡等腐蚀特征,这些腐蚀现象从一定程度上反映了材料的抗环境腐蚀性能,是材料腐蚀学科中分析和评价材料对环境适应性的一个重要信息。材料腐蚀数据处理就是对现实材料的试验、产品设计、信息管理和日常活动要产生或处理大量数据所进行的工作。在材料进行环境腐蚀试验中,直接获取的是材料腐蚀原始数据。其中包括各种材料外观腐蚀数据、力学性能数据以及环境因素数据等,这些原始数据中一定关联着材料腐蚀的试验地点、试验环境、试验方式、应用对象等各种信息。为了准确处理材料腐蚀特征与材料腐蚀试验状况、环境参数、各种信息之间的关联度等情况,在材料腐蚀特征组成方式中,就需要如何表述好材料腐蚀特征基本实体及属性。
元数据(Metadata)就是数据之数据或描述原始数据的独立数据。元数据在表述中应该是用尽可能少而精的数据反映对象尽可能多而全的信息。元数据的作用就是元数据是数字信息组织和处理的基本工具,它们为各种形态的数字化信息单元和资源集合提供规范、普遍的描述基准和方法[2]。在基于元数据的信息组织中,对于材料腐蚀特征信息来说,其材料腐蚀元数据可定义为:
“材料腐蚀元数据是一种用来描述材料腐蚀特征基本数字化信息资源,用于表述材料腐蚀特征、环境因素信息资源、环境试验方式、环境试验地点等基本特征及其相互关系,从而确保这些数字化信息资源能够被计算机及其数据库系统自动辨析、分解、提取和分析归纳。”
从材料腐蚀元数据的定义来看,基于元数据的信息组织主要用于实现两个功能:一是较为准确地描述材料腐蚀信息资源的原始数据信息内容;二是能够实现腐蚀信息资源的发现、共享,即实现信息语义的定位、自动辨析、分解、提取等功能,将繁杂信息资源的无序状态变为有序状态。所以,在材料腐蚀特征元数据表述中,根据材料产生的腐蚀特征有所不同,材料产生腐蚀的环境及试验方式也不同,可表述为实体类元数据及属性数据元素元数据。
(1)实体类元数据。①腐蚀材料:材料在服役期间所用的材料类型;②腐蚀特征:材料在服役期间的腐蚀特征现象;③图像特征:材料在服役期间的材料外观腐蚀图像信息;④ 材料试验:考核材料腐蚀所进行的各种试验;⑤环境因素:对材料腐蚀所影响的环境因素;⑥腐蚀环境:材料腐蚀试验所处的环境。
(2)属性数据元素元数据。①材料类别:腐蚀材料所具备的材料类型,主要有金属材料、涂层材料、镀层材料等类别;② 腐蚀特征类别:材料在服役期间所表现的腐蚀特征现象,主要有锈点、裂纹、鼓泡、剥落、斑点、粉化等特征类别;③腐蚀特征分布:材料腐蚀特征整体表述形式,如点状、块状、网状等腐蚀特征;④ 外观腐蚀图像特征:利用图像记录材料的腐蚀过程,主要通过颜色、纹理、形状来表述材料外观腐蚀特征;⑤腐蚀特征文本描述:用文字对腐蚀的材料进行描述;⑥ 试验方式:材料在何种条件下进行试验,主要有自然暴露试验、人工加速试验、模拟仿真试验;⑦试验地点:材料在何地点进行的腐蚀试验,主要有重庆江津、海南万宁、漠河、甘肃敦煌、西藏拉萨等试验站;⑧腐蚀环境:材料腐蚀试验所处的环境,主要有大气腐蚀、海洋腐蚀、微生物腐蚀、土壤腐蚀和高温腐蚀等环境;⑨ 环境因素:材料腐蚀所进行的环境因素,主要包括气象因素:温度、湿度、紫外线,介质因素:SO2、粉尘等;⑩试验周期:材料试验所用时间:主要包括试验开始时间、试验结束时间、检测周期时间;○11腐蚀特征大小:材料腐蚀特征量化信息,主要包括腐蚀面积、直径大小、腐蚀特征点个数;○12 腐蚀图像颜色等级:腐蚀图像颜色,用红、绿、蓝色表示,即RGB(0 ~255,0 ~255,0 ~255);○13腐蚀特征等级:对材料外观腐蚀特征等级的评定,主要包括1~10级。
本体是共享概念模型明确的形式化规范说明,定义包含4层含义:概念模型(Conceptualization)、明确(Explicit)、形式化(Formal)和共享(Share),其中,“概念模型”是指通过确定现象的相关概念对现实世界中的现象进行抽象建模;“明确”是指概念及其之间的关系都被明确定义;“形式化”是指本体应该是机器可读的;“共享”是指本体中反映的知识是其使用者共同认可的。典型的本体一般由概念集合、描述概念特征的属性、概念之间的关系、概念和属性之间的约束组成,它表示了静态的领域知识,因此一个本体可认为是一种描述某个领域的概念模式。本体是一种技术,它可以在许多涉及知识表示与共享的环境下应用。
对于材料腐蚀所涉及的本体是一种领域本体,需以材料腐蚀领域方面的特点及认知作为基础背景,进行领域本体的构建,对材料腐蚀领域内的信息进行一致性地描述,建立概念之间的层次结构和相互关系,为获取信息与共享信息提供互操作机制。在材料腐蚀领域中,对于涂层腐蚀材料及金属腐蚀材料为处理对象。其构建材料腐蚀领域本体如图1所示,为有向无环图(directed acyclic graph,DAG)表示。
图1 材料腐蚀领域本体模型
“本体是共享概念模型的明确的形式化规范说明”,对本体进行组织分类,本体的基本建模元语主要包括5个部分:
(1)类(classes)或概念(concepts):指客观存在的任何事物,如行为、任务、功能等。本体中的类往往具有层次关系。
(2)关系(relations):领域中概念间的联系和交流,如子类关系(SubClassof)、部分关系(Part-of)、非交关系(DisjoinWith)等。
(3)函数(functions):是一种特殊关系,表示多个元素只能唯一确定一个元素的特殊关系。
(4)公理(Axiom):表示在领域内得到共识的永真式断言,用来约束概念的属性,概念之间关系。
(5)实例(instances):用来表示属于某个概念的个体。
本体描述的是概念及其关系,如果对材料腐蚀特征其本体应包括材料类和描述类。材料腐蚀特征类层次结构是基于各层次的Wordnet名词产生的,可构建一个材料腐蚀类层次结构(如金属材料、涂层材料),如图1所示,叶子节点表示本体中不同语义范畴和实例。描述类分为低层特征描述和高层语义描述[4]。
在材料腐蚀试验中,材料种类繁多,环境试验各不相同,从材料种类的差异性、材料在不同的环境下腐蚀程度不一致性、以及材料用途的多样性,从而在材料腐蚀试验中将产生大量不同种类的元数据,这些数据具有数据量大,层次结构复杂,与环境关联紧密的特点。另外,从20世纪90年代起,各个材料腐蚀信息资源越来越多地被数字化,且这些数字化信息的载体、类型和格式在信息的共享上,就可能存在着较大的差异,同时元数据的应用使资源有了基本的微观结构,但是元数据并不能完全解决信息系统的语义异构问题,包括资源采用不同元数据方案所造成的微观结构的异构问题以及资源对象之间存在的复杂的关联关系,这就需要在元数据之上再建立基于本体的材料腐蚀元数据模型来灵活地实现信息系统之间的互操作[5]。
本体将对象或者概念划分为若干类,每一类还可以划分成子类,类和子类都可以具有属性,类或子类的具体体现是其实例,本体的对象关系远比元数据复杂对象类之间可能是层次关系,可能是组合关系,还可能是复杂的逻辑关系,所以,元数据展示的关系是树形的,那么本体展示的关系则是网状的。建立基于本体的元数据模型,可以将元数据中实体类的含义、类间的关系更加明确地表达出来[6-8]。针对材料腐蚀特征元数据的特点,基于本体的元数据模型构建为一个六元组,记作:
其中:
(1)T是术语集,T中主要包括概念术语(用C表示)和概念属性术语(用A表示),记为T={C,A}。比如{腐蚀材料,试验方式,试验地点,试验周期,锈蚀,鼓泡,颜色等}
(2)X是实例集,实体类概念术语的对象的集合。∀s⊂X,∃C,且C⊂T,s=<Name,C>表示实例s是属于C这个实体类。比如<钢铁,金属材料>,<感光涂层材料,涂层材料>,<江津试验站,试验地点>,<海南试验站,试验地点>等。
(3)Td表示术语定义集,用构造符号来实现多个术语定义一个术语的集合。{腐蚀材料≡材料∩∃有腐蚀,文本描述≡试验方式∩实验地点∩实验日期,金属腐蚀材料⊆有锈蚀,涂层腐蚀材料⊆有锈蚀∪有鼓泡,实验方式≡库内暴露∪户外暴露,实验地点≡江津∪海南∪敦煌,锈蚀⊆颜色∩面积∩形状,江津试验站⊆湿度∩温度∩SO2∩粉尘,敦煌⊆温度∩紫外线,海南⊆湿度∩温度∩紫外线∩Na+},
(4)R 表示实体类概念术语的属性声明集,∀p∈P,∃c⊂T,p=<name,c>,name(p)表示 p的命名词汇,c表示属性p所属的实体类。材料腐蚀元数据模型中有:<剥落面积,剥落>,<占总面积百分比,剥落>,<有锈蚀,金属腐蚀材料>等。
(5)L来描述约束集,描述类术语之间的关系。主要表现为3种:等价关系(≡),包含关系(⊆),非交关系(⊄)。{鼓泡⊄锈蚀,有鼓泡⊆有腐蚀等}
(6)Tc术语注释集,用自然语言对本体中的术语进行描述。∀tc∈Tc,∃c⊂T,tc=<name,comment>,name(c)为概念的名称,comment(c)表示对概念c的解释。比如材料腐蚀本体中面积解释为:<面积,根据腐蚀图像计算材料腐蚀面积占材料百分比>。
利用本体理论建立材料腐蚀领域的元数据模型。在以其他材料腐蚀模型建立方式下,模型具有较好的通用型与扩展性,能有效的解决材料腐蚀领域元数据的多元化问题。此外模型能反映材料腐蚀领域语义的层次与非层次关系,描述了实体类,属性与实例之间的映射,可以更加明确地表达出材料腐蚀领域元数据中术语之间的关系。
[1]纪钢,张建勋.基于图像检索技术的材料腐蚀原值监测系统[J].重庆建筑大学学报,2005(4):125-128
[2]王亚宁,齐玉东,程继红.基于本体的军用元数据模型研究[J].计算机技术与发展,2011,21(4):227-230
[3]STUDER R,BENJAMINS V R,FENSEL D.Knowledge engineering,principles and methods[J].Data and Knowledge,2008(4):220-225
[4]纪钢,张菲.基于本体的材料腐蚀特征信息检索模型及应用技术研究[J].重庆理工大学学报,2010(2):23-24
[5]王洪伟,吴家春,蒋馥.基于本体的元数据模型及 DAML表示[J].情报学报,2004,23(2):131-136
[6]王继东,张瑜,李娜.基于本体的语义检索技术研究与实现[J].计算机技术与发展,1998,25(22):161-197
[7]刘震,邓苏,罗雪山.面向对等网信息语义共享的元数据模型框架研究[J].计算机科学,2006,33(1):10-13
[8]黄宏斌,邓苏,马丽丽.面向语义的元数据模型及OWL表示[J].计算机工程与科学,2007,29(11):105-109