基于实体数据模型的棉纺工艺知识表示

2010-08-28 02:30杨建国吕志军
天津工业大学学报 2010年3期
关键词:关系数据库数据模型关联

李 华,杨建国,项 前,吕志军

(东华大学 机械工程学院,上海 201620)

基于实体数据模型的棉纺工艺知识表示

李 华,杨建国,项 前,吕志军

(东华大学 机械工程学院,上海 201620)

为解决棉纺行业产品工艺设计对知识的快速响应问题,在研究和分析现有多种知识表达方法及其优缺点的基础上,提出了利于程序实现的基于实体数据模型的关系数据库知识建模方法,分析了数据实体间的概念属性、关联和约束,完成了由关系模型向实体数据模型的转换.最后,将该知识建模方法应用于棉纺行业产品工艺设计中,并通过原型系统的实现验证了该方法的可行性和有效性,辅助工艺人员缩短了产品工艺设计周期,利于同行业产品工艺设计知识的共享和重用,提高了知识的可维护性和可扩展性.

知识表达;关系数据模型;实体数据模型;棉纺工艺

随着知识经济全球化趋势的加强和信息网络时代的到来,纺织行业迫切需要加快技术进步,推进产业升级,加快企业信息化建设步伐[1],以适应个性化、小批量、多品种、快交货的市场需求.纺织工业设计是一个继承与重用设计知识的过程,对知识的依赖性很强,而纺织行业作为劳动密集型的传统老工业,工艺知识体系复杂庞大,包括企业长期积累下来的经验数据、试验数据以及手册信息、决策知识和模型数据等等.由于棉纺行业普遍存在着加工工序繁多、工艺复杂且经验性很强,工艺设计方法工作量大、工艺更改频繁等特征[2-3],使得工艺设计知识在表达和存储上尚未形成统一的表述和规范,知识的可移植性和可维护性差.在调研中也发现目前许多中小型棉纺企业信息化程度低,工艺知识的存储和管理都仍停留在传统的手工运作上,难以实现工艺设计中对知识的快速检索和重用以及产品加工过程中对工艺设计知识的高效反馈.为了满足企业对工艺知识最大程度上的共享与重用,以及人们对信息存储越来越多的趋向于动态性、实时性和交互性的要求,本文研究了基于实体数据模型的棉纺工艺设计知识关系数据库建模方法,对涉及产品全生命周期的各种复杂工艺知识资源进行重组和管理,以期实现对知识的有效挖掘和快速检索,缩短产品工艺设计周期,提高产品工艺设计的智能化水平和企业信息化水平,利于企业内知识共享与创新.

1 知识表示方法研究

知识表示是知识工程的关键技术之一,也是人工智能的重要研究领域.人工智能问题的求解是以知识为基础的,知识表示是研究如何将已获取的客观世界的实体、关系等以最恰当的方式转换成计算机语言可以识别和处理的符号和形式.目前国内外学者已对多种知识表示的方法进行了研究和应用,一般传统的基于人工智能的知识表示方法主要有谓词、语义网络、框架、产生式规则等,下面列出了目前工程应用中常见的知识表示方式及其优缺点[4-5].

(1)谓词逻辑表示法.利用逻辑公式推理描述对象、性质、状况和关系,它是人工智能领域中使用最早和最广泛的知识表示方法之一.谓词逻辑适合表示事物的状态、属性、概念等事实性知识以及事物间确定的因果关系,但是不能表示不确定性知识,推理效率很低.

(2)产生式规则.用“IF A THEN B”的产生式规则形式来表示事物或知识的因果关系,适应于经验型领域,知识的因果关系明确,自然灵活,便于理解,推理过程清晰,但是效率低,易造成规则冲突或组合爆炸.

(3)语义网络.一种采用网络形式表达人类知识的方法,包括有向图、节点、关系等,适应于依据明确分类进行推理的领域和处理事物的状态、性质、动作间关系的场合,自然直接,体现了联想的思维过程,但无法保证推论的严格性和有效性.

(4)框架.把某一事件或对象的所有知识贮存在一起的数据结构形式,框架表示事物对象组成,槽表示事物属性,适用于知识具有较强层次的领域和表达事物属性具有继承性的场合,由浅入深,由表及里,但多重继承易产生歧义.

(5)面向对象.将客观世界抽象为实体对象,相似实体抽象为较高层次的实体,实体之间以某种方式发生联系.面向对象具有天然的层次性和结构性,对象的定义有良好的兼容性和灵活性,易扩展和维护,但由于过多的依赖继承,使得程序实现需要一定的软件技术支持环境,理论和技术尚不成熟,有待继续完善.

(6)关系模型.关系模型是用二维表形式表示实体和实体间联系的数据模型.它建立在严格的数学概念基础上,也是相对较成熟的数据建模方法,具有数据结构简单灵活,易操作、易理解和易维护的优点,可以很方便的设计数据实体、实体属性和实体间关联约束,也便于程序的实现和数据访问;但是数据类型的表达能力较差,不能直接支持复杂数据类型,而且在处理大量的表和复杂连接运算时,查询功能较差.

(7)基于本体.本体是对领域实体存在本质的抽象,强调实体间的关联,并通过多种知识表示元素将这些关联表达和反映出来.构建本体的目的是为了实现某种程度知识的共享和重用,目前在知识表示研究领域应用较多,但是基于本体的数据存储尚存在问题,而且将本体应用于一定数据模型,在语义描述上也存在很大的冲突和冗余,可能会带来巨大的性能代价,难于进行快速有效的知识推理.

知识表示对于问题能否求解和是否便于程序实现有重大影响,知识结构的正确表示很关键,所以要选择和设计一种实用的表达模式.考虑的因素包括(但不限于):①能否准确有效的表达;②表达规则是否简单,便于理解和应用;③便于知识扩展和维护;④便于知识访问和程序实现;⑤支持自上而下、逐步求精的设计原则;⑥尽量符合人类普遍的思维形式[5].

2 构建棉纺工艺设计知识模型

2.1 棉纺工艺设计知识获取和分类

棉纺工艺知识所涉及到的知识量和信息量相当庞大,其存在形式也是多样化的,贯穿于产品全生命周期之中,从产品调研、工艺设计、产品加工,质量预测和控制,都离不开工艺知识.棉纺行业生产工序繁多,工艺路线多变,品种翻改频繁,工艺计算复杂,经验性知识占主导,目前在同行业同领域之间尚缺乏对工艺知识的规范化统一描述和组织.通过对该领域工艺设计知识的分析、过滤和剔除,将工艺知识分为以下模块进行描述[6].

(1)定义性知识:定义性知识相当于知识表示中对确定性知识的概念化和直观化的描述,便于理解和操作.这类知识广泛存在于工艺设计知识库中,例如工艺设计中对各项工艺参数“捻度”、“钳口”、“马达盘”等的自定义命名,是具有明确前提和结论的知识.

(2)事实性知识:事实性知识是从实际生产中得来的在工艺设计过程中不可主观轻易变更的知识,例如加工棉质产品的工艺流程必须要经过梳棉工序,这就是一个事实性知识.

(3)规则性知识:规则性知识是专家经验性知识的积累,是经过实践证明是正确的、且易于表述和易于用程序化语言来描述的知识.这类知识较容易转化为计算机系统可实现的知识,例如工艺设计过程中的工艺计算公式和推理得到的恒定知识结果都属于规则性知识.

(4)过程性知识:过程性知识是指把相关的公式和推理有序组织在一起形成整体性较强的知识,是定义性知识和规则性知识的集成,例如根据工艺设计的输入参数通过推理得到各项输出参数的过程就属于过程性知识.

基于本文作者对棉纺领域工艺设计知识需求的调研和分析,获取了该领域工艺知识某种程度上的概念化术语和逻辑关系,并通过E-R图描述了棉纺行业工艺设计知识结构,如图1所示.E-R图中将各类定义性和事实性知识描述为实体,将规则性和过程性知识描述为实体间的关联.

图1 棉纺工艺知识E-R模型Fig.1 E-R model of cotton process knowledge

2.2 基于关系数据库的棉纺工艺设计知识表达

由于棉纺工艺知识的理论性、经验性、不确定性以及工艺数据的动态性,使得对工艺知识的识别、存储和管理,迄今都很难用简单的数学模型进行理论分析与决策[3].基于棉纺行业工艺知识的特殊性和复杂性,本文研究了基于关系数据模型的工艺知识表达方式,相比于其他关系模型,关系数据库有着对知识描述更加直观、易于用户理解、易维护、结构关系层次清晰、易于开发人员在Web平台下对知识的快速检索和访问等优点,使得关系数据模型在一定程度上便于程序的实现和知识的共享.

关系模型建立在严格的数学概念基础上,并且严格遵从一定的规范和规则约束.关系模型中数据逻辑结构是若干的二维表,每张二维表由行和列组成,行和列的设计都应满足一定程度的范式,关系模型中包括以下概念术语[7]:

(1)关系(Relation):一个关系通常对应一张表;

(2)元组(Tuple):表中一行代表一个元组;

(3)属性(Attribute):表中一列代表一个属性;

(4)主外键(PK/FK):主键确保表中属性列可唯一标识一个元组,外键保证数据的完整性和一致性;

(5)域(Domain):表中属性列的取值范围;

(6)分量:元组中的一个属性值;

(7)关系模式:对关系的描述一般表示为关系名(属性1,属性2,…,属性n).

在关系模型理解的基础上,本文利用SQL 2008关系数据库来构建棉纺工艺设计知识存储模型,将关系数据库的设计分解为两部分数据,一部分是元数据,也称为模式,包括关系(表)名、关系的属性、主外键约束;另一部分是数据粒度,包括元组、域和属性值.通过这两部分实现关系数据库中实体和实体间关联的设计.为了实现对棉纺行业复杂工艺知识的准确表达和识别,表1给出了棉纺工艺知识数据库的部分关系模式元数据结构,描述了各类实体概念、属性及其逻辑关系,包括机台表、工序表、各机台工艺项目表以及知识管理信息表等.

表1 棉纺工艺知识关系模型Tab.1 Spinning process knowledge relation model

该关系模型在表和表字段命名上分别遵从了关系数据库设计的一定命名规范,并结合了各种易于思维理解和计算机语言易识别的知识定义和描述,将工艺知识按概念类别分别重组和统一命名,提取共性的工艺设计知识组成一类实体,个性存在的工艺知识独立为单个实体,一定程度上有效避免了知识概念划分上的二义性和冗余性,如“设备”+“_Para”构成一类表,代表所有设备上机工艺参数的知识;“T”(Total缩写)或“M”(Management缩写)代表总工艺设计和分工艺设计的知识管理信息记录;“Q”(Quality缩写)+“各大工序名称”构成一类表,代表产品质量指标信息;“设备”+“_KB”+“自定义参数名”构成一类表,代表过程性推理知识等.

各知识表之间不是独立存在的个体,而是受关系主外键约束的一组关联表的集合.各关系表在关系模型中称之为实体,实体与实体之间存在关联.一般情况下,一个关系的主键包含一个属性,则这样的关系表示一个实体;对于一个关系的主键包含一个以上的属性,所有属性又都是关系的外键,这样的关系就对应着实体间的一个关联;对于一个关系中既存在主键列也存在外键列的情况,外键列可以和其他实体产生关联,也可以在关系内部主键列和外键列形成自引用的关系,这种联系相当于实体内部继承的关系.如表1中,“设备”+“_KB”+“自定义”的一类关系中主键列ID只包含一个属性,不与其他表发生关联,代表一个独立的实体;“设备”+“_Para”这类表中的属性列M_PlanningID既是关系的主键又是关系的外键,则这类表和关系M_Planning之间存在引用关系;Machine和Procedure关系中即存在主键列ID,也存在外键列ProcedureID和PID,关系Machine中外键列ProcedureID表示实体Machine和Procedure之间存在引用关系,关系Procedure中外键列PID和其主键列ID在关系内部形成父子关联,即自引用关系.

为了提升对模型的数据访问和查询性能,实现Web客户端界面的快速响应,在关系数据库中特别添加了一些中间关联表,以降低知识查询的负荷,提高程序运行的性能,如表1中的工艺项目中间关联表“Param”和“InOut”表.同时,关系模型中适当应用了索引、存储过程、视图和函数等,使用存储过程在于其执行速度快,效率高,易维护,可降低网络通信量[4],适应企业规则运算的多变性,一般和函数一起使用.在本文所构建的关系模型中主要利用存储过程和函数定义表和表字段的扩展属性,以实现Web可视化界面;使用索引提高了对知识数据的快速检索,可缩短产品工艺设计的周期;视图是关系数据库中的虚表,视图中所包括的数据列和数据行全部来源于关系数据库中的基表,利用视图,可使众多的复合查询代码变的简单易懂.

3 关系模型到实体数据模型的映射

实体数据模型(EDM)是ADO.NET实体框架的核心,它是一种将应用程序数据定义为多组实体和关系的设计规范,包括逻辑层、映射层和概念层[8].从关系模型到实体数据模型的映射实质上就是从数据逻辑存储层到概念设计层的映射,从而使开发人员能够针对概念性实体数据模型,便于进行ORM(对象关系映射)封装,利用ADO.NET实体框架提供的对象服务和数据访问引擎等组件实现类的访问,便于程序实现,同时可减少开发代码量和代码维护工作量.图2所示为关系模型到实体数据模型的映射.

图2 概念实体数据模型Fig.2 Conceptual entity data model

在图2中可以看到,它将关系数据库中的关系对象转换成实体对象(Entity),数据表属性字段转换为标量属性(Property),实体间关系则转换为关联属性(Association),实体间的主外键约束转换为导航属性(Navigation),每个独立存在的实体称之为一个实体集,让数据库的(E/R)模型完全转换成对象模型.

4 在棉纺行业的应用实例

本文所研究的棉纺工艺知识关系数据库建模方法是基于.NET Framework 3.5 SP1中ADO.NET实体框架技术,通过利用VS2008开发环境和SQL 2008工具,完成了棉纺工艺知识关系数据模型到概念实体数据模型的映射,并采用C++面向对象编程语言实现了棉纺行业复杂工艺知识的Web应用,其具体实现过程如图3所示.

图3 工艺知识Web系统实现过程Fig.3 Web system realization process

目前,该智能工艺设计原型系统已在多家纺织行业推广和应用,在实践中切实提高了工艺知识的可移植性和可维护性,同时缩短了产品工艺设计周期,极大地提高了工艺发布效率和企业信息化水平,在同行业之间逐步形成了工艺知识的范式描述和表达,实现了企业内部知识的共享和重用.图4为工艺设计知识客户端应用界面.

图4 工艺设计客户端界应用界面Fig.4 Client application interface based on EDM

5 结束语

棉纺行业是一个知识相对密集和复杂的传统工业领域,在长期的生产实践中形成了大量的工艺经验和实验数据,传统的单一形式的对工艺知识的手工存储和管理已不能满足工艺设计的需求,基于棉纺行业的特殊性和复杂性,更加需要由专门用于知识管理的工艺系统来满足工艺设计人员对知识的需求.本文在研究国内外现阶段多种知识表达方式的基础上,从实际应用和可行性的角度提出了针对棉纺行业的基于实体数据模型的关系数据库建模方法.该方法便于将关系模型中的实体、属性、关联、约束以及存储过程、函数等映射为概念实体数据模型,方便开发人员利用.采用NET开发环境中最新开发技术和最新数据访问技术对实体对象进行操作,同时也便于基于Web的智能工艺设计平台的实现.

基于实体数据模型的关系数据库知识建模方法目前在很大程度上解决了棉纺行业长期以来的知识获取和知识管理瓶颈问题,克服了纺织行业数据建模的困难,提高了解决实际问题的能力.关系数据建模在知识的表示上虽具有灵活性和结构简单等优点,但也有其自身的不足和缺陷.例如,对于特殊复杂知识的数据类型表达能力差,以及对于处理大量的数据实体及其关联过多的复合查询性能较差等问题都需要进一步研究.随着知识表达方式的深入探索和研究,基于关系模型的多种表达方式相结合的混合知识表示方式也是有待研究的一个方向.

[1]王晓红.加速信息化建设,改造传统纺织企业[J].天津工业大学学报,2002,21(3):37-39.

[2]吕志军,项 前,殷祥刚,等.基于案例的纺织工艺知识重用技术研究[J].计算机工程与应用,2005,41(14):218-220.

[3]杨开英,胡迎九.基于框架与规则相结合的棉纺工艺专家系统知识库的设计[J].微计算机应用,2004,25(6):735.

[4] 徐宝祥,叶培华.知识表示的方法研究 [J].情报科学,2007,25(5):691-693.

[5]吕志军,项 前,殷祥刚,等.知识表达及其在毛纺织工艺设计中的应用[J].纺织学报,2005,26(6):116-118.

[6]杨红飞,饶锡新.再制造工艺知识分类与管理[J].装备制造技术,2008(3):69.

[7]周其乐.浅谈关系型数据库[J].科技资讯,2009(4):15.

[8]LERMAN Julia.Programming Entity Framework[M].New York:O′Reilly Media Inc,2009:19-24.

Cotton textile process knowledge representation based on entity data model

LI Hua,YANG Jian-guo,XIANG Qian,LU¨Zhi-jun
(College of Mechanical Engineering,Donghua University,Shanghai 201620,China)

To resolve the knowledge rapid response of cotton process design,the advantages and disadvantages of various existing knowledge representation methods are studied and analyzed,a relational database modeling which benefits program implementation based on entity data model(EDM)is proposed,the attributes,associations and constraints of entities are analysed,the conversion from the relational model to the entity data model is completed.Finally,the knowledge modeling method is applied to the product process design of cotton spinning industry,the feasibility and effectiveness is verified by the realization of prototype systems,which assisted process designers to shorten the product process design cycle.Furthermore,it′s much better for designers to share and reuse product process design knowledge,extensibility and maintainability of knowledge is improved.

knowledge representation;relational data model;entity data model;cotton textile process

book=3,ebook=105

TP315;TS105

A

1671-024X(2010)03-0029-05

2010-01-08 基金项目:国家科技支撑计划项目基金资助(2006BAF01A44);上海市重点学科建设基金资助(B602)

李 华(1984—),女,硕士研究生.

杨建国(1951—),男,教授,博士生导师.E-mail:jgyangm@mail.dhu.edu.cn

猜你喜欢
关系数据库数据模型关联
关系数据库在高炉数据采集系统中的应用
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
“一带一路”递进,关联民生更紧
面板数据模型截面相关检验方法综述
奇趣搭配
智趣
财政支出效率与产业结构:要素积累与流动——基于DEA 和省级面板数据模型的实证研究
基于索引结构的关系数据库关键词检索
一种基于数据图划分的关系数据库关键词检索方法
基于数据模型的编程应用