刘超 耿凡凡
(1.安徽经济管理学院信息技术中心,合肥 230059;2.安徽农业大学信息与计算机学院,合肥 230036)
农产品供应链是指以农产品为对象,围绕农产品核心企业,通过信息流、物流和资金流实现农产品的生产、加工和销售,从而将农户和农业生产基地、农产品收购商、加工商、零售商、消费者连成一体的功能网链[1]。我国目前农业信息化水平滞后,整个农产品供应链的信息和知识共享程度不高,供应链中的部分节点出现“牛鞭效应”现象,对农产品的计划、生产与销售造成严重影响。对农产品供应链知识进行有效地表示并搭建知识共享平台,可以有效地解决农产品供应链的信息和知识共享问题。
本次研究主要展开基于本体的农产品供应链领域知识表示和建模工作。首先,搜集整理农产品供应链领域相关知识,确定农产品供应链领域内概念及概念间关系,搭建农产品供应链领域本体框架;其次,通过本体编辑工具Protégé 4.3定义农产品供应链本体的概念、属性、实例和公理,并基于OWL2语言生成形式化的农产品供应链本体,在语义和知识层面上表示农产品供应链领域知识;最后,通过描述逻辑理论和相似度算法对本体进行推理、检测、评价和优化,从而保证所构建农产品供应链领域本体的质量。农产品供应链本体的构建是农产品供应链领域知识的语义表示,其意义是农产品供应链领域知识的共享和复用。
本体通过对概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系,用于很好地解决知识表示、知识组织以及知识共享等问题[2]。按照联合国粮农组织(FAO)的定义,农业本体是一个包含农业术语及其定义以及术语间规范关系说明的体系[3]。构建概念清晰、逻辑结构合理的农业领域本体,有助于语义网站对多种语言的农业资源进行描述并把它们联系起来,增加其功能性与相关性。
本次研究首先通过搜集整理农产品供应链领域知识,梳理农产品供应链领域中的概念及概念间的关系;然后通过本体编辑工具 Protégé 4.3[4],利用本体形式化语言OWL2构建农产品供应链本体,并基于描述逻辑的方法对形式化的农产品供应链本体进行推理检测;最后评价构建好的农产品供应链本体,并对其进行优化。
从文献、书刊、网络媒体等相关途径获取农产品供应链知识,然后梳理农产品供应链领域中所涵盖的词汇、术语等内容,从而确定领域内共同认可的概念,并详细整理出概念间分类和非分类关系以及概念的属性、相应的实例等,最终完成农产品供应链知识整理,搭建农产品供应链本体框架,继而定义农产品供应链本体的类、属性、实例、公理等。
我国农产品供应链分类繁多,目前多数是通过供应链的复杂度、供应链节点企业集中程度、供应链的可靠度和优化目标等方面对其分类。例如供应链复杂度分类中的线性农业供应链,各节点间只通过上下游的节点参与到链中,彼此之间除了相邻节点外没有其他联系,形式比较单一。这样分类概念并不明确,不适合本体概念的分类体系。在此以农产品流通环节为分类标准,对农产品供应链概念进行分类,将农产品供应链知识分为农产品种类、产前供应环节、消费环节、产中生产环节、产后加工环节和销售流通环节。
本体中类被用来表示一些拥有某一共同特征个体的集合,通过定义父子类、兄弟类、等价类、互斥类等关系完善概念分类关系,以保证领域概念知识的完整性和准确性。
农产品供应链本体将农产品产前供应环节、产中生产环节、产后加工环节、销售流通环节、消费环节等定义为顶层类,再分别设置子类或实例,如流通渠道与产地批发市场为父子类,产地批发市场与销地批发市场为兄弟类。图1所示为农产品供应链本体类示例。
图1 农产品供应链本体类示例
本体属性包括对象属性和数据属性。其中对象属性是关联2个实例的纽带,表示概念与概念之间的非分类关系,具有反逆性、对称性、传递性等约束条件,它的定义域和值域分别来自确定关联的2个类。本课题定义农产品供应链产前供应环节、产中生产环节、产后加工环节、销售流通环节、消费环节等为关联的类,即对象属性设置为“is_part_of”“flow_to”“produce_from”等,其中“product_hierarchy”属性设置有子属性。
数据属性是用于描述实例本身的特性,用基本数据类型来表示。它的定义域是用于限定该属性为某个类特有的数据属性,而值域则包括布尔型、浮点型、字符型等数据类型。本次研究中数据属性定义为“funding”“level”“information”等属性。图 2 所示为农产品供应链本体对象属性和数据属性。
图2 农产品供应链本体对象属性和数据属性
本体实例是类的组成部分,具有原子性这一特性。创建实例需要充分列举出各子类所包含的成员,并分别设置其对象属性和数据属性,标记每个实例的具体特性以及实例与实例之间存在的客观联系。本体定义中需要清楚区分领域知识的实例(instanceof)关系和子类(subclassof)关系。
农产品供应链本体实例主要集中于农产品种类、销售流通环节和消费环节这几个概念中。本课题定义肉牛、鸡蛋等作为农产品种类的实例,以某一农产品为实例,描述该农产品在整个农产品供应链中经历的所有环节;在消费环节中物流配送服务商这一概念则将顺丰快递、天天快递等公司作为实例。
公理规则阐述了概念和概念间的关系,使得本体逻辑性更加严谨,便于本体逻辑冲突检测及知识推理。创建公理规则的目的是加强本体形式化语言的表达能力,扩展本体知识表示水平,增强概念的“语义”性。本体公理主要包括类的公理、属性公理、实例公理、约束公理、自定义规则等。
类的公理中“disjointclasses”“subclassof”“equivalentclasses”分别表示互斥类、父子类、等价类,完善了概念之间的分类关系。本体在构建类的同时定义类的三大公理,如图3所示,物流配送服务商的互斥类为消费者服务部门等,等价类为第三方物流企业等中间商,父类为消费环节等。属性公理包括属性定义域值域的限定以及对称性、传递性等约束。如农产品供应链本体属性“produced_from”定义域为农产品,值域为产中生产环节;属性“produce”定义域为产中生产环节,值域为农产品,且与“produced_from”互为逆属性。实例公理则指本体实例的声明,如相同实例、不同实例等约束限制。
约束公理分为值约束和基数约束,主要用来表示定义类的充要条件。值约束包括“all values from(∀)”“some values from(∃)”,用于限制属性的值域。如果属性的形容词限制是“只有”或“只存在”,则添加“all values from”即“only”约束,若属性的形容词限制是有些或存在,则添加“some”约束。基数约束包括“max cardinality(≤)”“min cardinality(≥)”“exact cardinality(=)”,用于限制属性取值的个数。本体公理既可以通过图形化添加约束关系来定义,也可以通过约束规则的描述来定义。
图3 农产品供应链本体公理
目前,领域本体以手工构建为主,存在工作量大、过程繁复等问题,为此需要本体推理来检测逻辑冲突以及推理隐含知识。本体推理是以描述逻辑为基础,运用推理规则检测本体的知识框架和形式化表达,确定是否存在不一致性等冲突,并能基于提供的领域知识推理得到其中蕴含的信息。本文选择FaCT++推理机对农产品供应链本体进行逻辑推理检测[5]。若检测出存在逻辑或实例冲突,则根据提示进行改正直至不再提示错误。
经过FaCT++推理机的运行,农产品供应链本体中存在不一致性,推理机对本体中不一致性给出错误提示。定义物流配送服务商为消费环节的子类,其等价类是第三方物流等中间商,而第三方物流等中间商却被错误定义为消费渠道的子类,因此,农产品供应链本体发生了逻辑冲突。通过推理机的运行及修改,将第三方物流等中间商重新定义为流通渠道的子类,继续对农产品供应链本体进行推理检测,直至最终结果显示出农产品供应链本体没有逻辑冲突和实例冲突。
本体在特定领域或特定环境的性能和适用性,是影响本体是否能在语义网中被广泛应用的重要因素,而单纯靠人类手工构建的本体,无法保证领域本体的严谨性和科学性。因此,针对领域本体构建过程中可能出现的缺乏科学依据、构建过于简单、脱离实际等问题,需要对领域本体进行评价。领域本体的结构相当复杂,本体评价主要集中在概念评价、概念间关系评价上。
概念评价主要是针对概念完整性及概念准确性进行评价。通过计算本体概念的准确率和召回率完成对农产品供应链本体概念的有效性评价,其评价结果如表1所示。
表1 农产品供应链本体概念评价结果
概念间关系评价主要包含关系准确性评价、关系一致性评价和关系简洁性评价。本文评价概念间关系采用的算法是语义相似度算法。该方法首先利用语义相似度计算公式计算概念的相似度:
式中,D(c1,c2)表示两概念间的公共父节点深度,L(c1,c2)表示两概念间的路径长度。根据相似度值与所设阈值ε的结果进行比较:S(c1,c2)≥ε,表示符合相应性质;S(c1,c2)<ε,表示不满足,并指出错误类型。判断所构建本体概念间关系是否满足一致性、准确性、简洁性,从而完成对农产品供应链本体概念间关系的评价,并得出评价结果(表2)。
表2 农产品供应链本体关系评价一览表
由表2看出,关系一致性检测结果显示为0例错误,关系准确性检测结果显示为2例错误,关系简洁性检测结果显示为1例错误,据此对提示的错误进行了修正。
根据本体概念评价及关系评价所得结果进行综合分析,可判定农产品供应链领域本体建模效果良好,领域知识表示达到原有目标,可以实现知识的共享和重用。
本体作为知识表示的基本工具,基于其知识共享、复用、服务等优势在语义网、知识工程等领域发挥着重要作用。通过整理农产品供应链领域知识信息,探讨农产品供应链本体构建过程,完成农产品供应链知识的表示和推理,实现了农产品供应链领域知识的共享和复用。然而,手工构建领域本体费力耗时、易出现倾向性错误,因此下一步将尝试利用机器学习、自然语言处理等技术自动或半自动构建本体,以提高知识的表示和推理准确性和实效性,更好地开展农产品供应链知识服务。
[1]薛丽柯,姚雨辰,姜方桃.我国农产品供应链存在的问题及对策[J].当代经济,2014(1):76-77.
[2]Gruber T.R.Atranslation Approach to Portable Ontology Specifications[G]//Technical Report,KSL 92-71.Stanford:Knowledge System Laboratory,1993.
[3]钱平,郑业鲁.农业本体论研究与应用[M].北京:中国农业科学技术出版社,2006:50-62.
[4]Knublauch H,Fergerson R W,Noy N F,et al.The Protégé OWL Plugin:An Open Development Environment for Semantic Web Applications[G].Lecture Notes in Computer Science,2004:229-243.
[5]Tsarkov D,Horrocks I.FaCT++Description Logic Reasoner:System Description[G].Lecture Notes in Computer Science,2006:292-297.