郭 旺,杜 江,雷 婕
(西安工业大学机电工程学院,西安 710021)
在当今智能制造不断深入开展的时代背景下,基于Web打破学科领域、组织边界实现对技术资源的实时共享和高效准确重用已成为产品研发的基本态势[1]。这就导致了如何实现对即有数字化技术资源的准确识别和重用问题。通过对数字技术资源在产品研发领域的利用现状和技术发展趋势的分析,如何实现技术资源的数据协同已成为技术资源数字化应用研究的最新趋势和关键问题[2]。分布环境下,实现技术资源数据协同的关键是如何基于Web实现技术资源所封装异类、异构技术数据的按需动态跨平台共享和深度集成。此问题需要从技术资源的“数字化建设、存储和知识管理”三方面综合考虑解决。目前,针对数字化技术资源的存储、管理问题研究所形成的以“云平台、云服务”等为代表的技术手段虽然可有效满足当前产品分布、离散研发环境和过程条件下对于数字化技术资源从文档层面高效共享、重用的需求[3]。但因目前依托数字化文档所建设的数字化工程技术资源在数据内容构成和形式上普遍存在不一致、不规范等问题,导致基于目前的技术手段仍不能针对现有数字化工程技术资源实现高效数据共享和重用[4]。针对国标和工程技术手册中以数据表为代表的这类基础性工程技术资源,此问题则表现更为突出。该问题从根本上是由于国内针对基础性工程技术资源的数字化建设长期缺乏深入系统研究所导致的[5]。这显然需要从提高数据重用性、协同性角度开展关于工程技术资源的数字化建设理论和方法的基础性研究工作来加以解决。
基于此认识,本文以机械工程领域国标、手册中最具代表性的技术数据表这类基础性工程技术资源为对象,开展了面向数据协同的数字化技术资源建设理论方法的研究,不仅可从技术数据“建设、存储、管理”一体化的角度为现有工程技术资源的数字化建设升级形成可借鉴的思想理念和方法,而且可以为工业强基战略在我国企业产品研发过程中得以更加深入有效的落实从基础性工程技术资源层面提供有效的保障措施[6]。
目前,工程数据表作为一类基础性的技术资源主要是通过对传统纸质版国标、手册中数据表的图像采集来实现资源的数字化建设。相关技术数据表被转化为图像记录在pdf文档。这样的数字化资源建设方式虽然可以为技术资源的共享提供良好支持,但由于其仅仅是标准或手册中数据表的简单复制,所封装技术数据的内容和质量与原表一样。针对数据的高效检索、调用存在解析检索困难、无法直接调用等不足。究其原因,就在于国标、手册中的工程数据表在自身表结构和内容上存在如表1所示的内容和存储、管理层面的一系列问题。
表1中所分析的管理和存储调用层次的问题在实际中表现十分明显,文中不再分析。而内容层面的问题相对复杂,具体可通过图1~4节选自国标或手册pdf文件的数据表得到说明。从图1所示的表可看出不同工艺的粗糙度数据置于一起的数据堆叠问题以及“横纵双表头、嵌套表头、字段重复、数据表头(粗糙度Ra)、表数据取值为索引与真值不同(*,×)、数据缺失(表内空白格)”等内容和格式方面的问题。从图2所示的表中可以看到“1.5~2”这样的数据取值模糊和类似R1这样的含义抽象等问题。从图3所示表中则可看到不同类型的材料物理性质数据面向应用的配伍关系不明确或搭配不清楚的问题。从图4所示的表中则可以看到数据按行匹配关系存在一对多和多对多的匹配关系不明确问题。
图1 不同铸造工艺的零件表面粗糙度表
图2 管材弯曲方法的技术数据表
图3 模具材料工程数据库的技术数据表
图4 碳素工具钢的化学成分和力学性能表节选(GBT1298-1986)
表1 基于文档所封装的传统技术数据表作为数字化技术资源所存在的问题
实际中,上述问题往往因表不同而差异化的同时存在。因此很难编制程序实现对这些问题的一致解决,从而导致目前基于电子文档所建立的工程数据表资源中所封装的技术数据难于通过计算机进行一致有效的检索和重用[7]。究其原因,根本在于未能面向资源所封装数据的应用需求从资源的建设、记录和管理一体化集成的角度综合考虑资源的建设问题。这显然需要打破现有观念、方法束缚,针对国标手册中的技术数据表研究新的数字化资源建设理论和方法来加以解决。
要保证国标手册中传统工程数据表的数据可依托计算机高效、准确重用,对于其数字化资源的建设显然应基于系统思想以及信息理论从资源相关数据的数字化“建、存、管”一体化角度综合考虑加以开展。工程数据表的数字化资源建设不仅要在数据的“共建、共享、有序、关联、演进”等角度符合信息论的基本规律,而且还要在资源数据的内容、结构、内外关系等方面符合“整体性、有序性、层次性、开放性”的系统论思想。据此,本文提出工程数据表数字化资源建设的数据协同目标。该目标有两层含义:其一是表内数据内容明确关系稳定可按需一致关联检索、调用;其二是表间数据可按需实现动态一致关联、重组与整合。
在以数据协同为目标从数据“建、存、管”一体化角度综合考虑措施建设数字化资源的思想下,为避免工程数据表数字化资源建设过程中上述问题的重复发生,其数字化资源建设应秉承“模块化、规范化、场景化”3条基本原则。此3条原则各自的含义及其对于解决表1中问题的作用如表2所示。由表可知,模块化主要针对工程数据表的数据构成和关系而形成。此原则可保证所建设的数字化表资源中的数据项构成明确且相互关系稳定一致。这就可为从数据层面实现资源的规范化建设和管理提供良好前提和保证。显然,模块化原则是以数据协同为目标开展工程数据表数字化资源建设所应遵循的首要原则。
表2 工程数据表数字化资源建设的基本原则
规范化则是针对数字化工程数据表资源的数据形式、内容以及数据在取值上的匹配关系而提出的。规范化通过表中各项数据标识符号的唯一性以及各项数据在取值上的确定性、全面性和格式上的通用性加以体现。基于该原则可以保证所建设数字化表资源中的数据能通过程序实现一致、高效的检索和调用。
场景化是针对工程数据表的知识管理问题所形成的数字化资源建设原则。它要求按表及其数据的外部应用特征进一步实现数字化表资源的应用属性与其数据之间匹配关系的明确化。
综合上述面向数据协同的工程数据表数字化资源建设思想和原则,对于国标和手册中工程数据表的数字化资源建设可分两步骤开展:步骤1,基于原则1、2将传统工程数据表改造为支持数据协同的模块化规范化的数字化工程数据表资源;步骤2,实现数字化工程数据表资源应用知识的描述,针对改造好的工程数据表基于原则3进行应用知识的描述。显然,实际中此两步骤需要通过对工程数据表的模块化、规范化重建方法和应用知识描述方法的研究加以落实。
依据上述针对工程数据表所分析的数字化资源建设思想、原则和步骤,下面就针对图1~4中存在问题的表具体说明基于本文所提出的思想、原则重构可支持数据协同的具有模块化、规范化特征的数字化工程数据表的方法。
图1中表主要存在堆叠粗糙度数据问题,粗糙度数据作为表头、表数据按行不匹配和表数据值与真值不一致的问题。首先基于模块化思想解决数据堆叠问题。将原表其分为4张表,原图中沙型类下的“×”数据和“*”数据各一张表,金属型类下的“×”数据和“*”数据各一张表。此拆分同时减少了原表嵌套表头问题的复杂性。拆分后关于“×”数据和“*”数据的两表在数据内容和构成上各具一致性。此处仅以图1中砂型类下的“×”数据通过表3所示的规范表来说明解决该表嵌套表头、数据表头问题的解决结果和方法。
表3 砂型类采用特殊工艺措施的零件表面粗糙度
针对图2的表中所存在的数据取值范围模糊问题,可通过数据按取值范围拆分为上、下界数据项的方法而实现问题的解决,拆分结果如表4所示。
表4 反变形槽的尺寸
针对图3存在的数据配伍关系不明确、搭配不清楚问题,可基于模块化、规范化原则将原表拆分构建成关于表面性能的硬度数据表和关于机械性能的强度数据表分别如表5~6所示。
表5 球墨铸铁的硬度
表6 球墨铸铁的机械性能
针对于图4的表中存在的数据叠加、嵌套表头、数据取值模糊、数据多对一配伍关系的表数据问题,在基于模块化原则按数据自身及应用特点将叠加表格分别化学成分和热处理硬度两张表的基础上,可基于规范化原则,采用上述类似的方法解决嵌套表头和数据按范围取值的问题。对于数据一对多的问题可以通过按对应关系拆分不变的数据加以解决。最终拆分构建结果如表7~8所示。
表7 碳素工具钢的化学成分
表8 碳素工具钢的退火硬度
综合上述的方法可知,本文对于目前国标和手册数字化文档中工程数据表的数字化资源建设从根本遵循着提升技术数据的信息确定性原则。实际中,通过对上述表3~8中所示方法的组合,可以构建出符合数据协同目标的模块化规范化数据表,消除表数据在结构关系和内容上的不确定性,使所建立的表数据具有如下符合软件操作处理的属性:(1)针对不同表,同一数据在数据名称和内容上具有一致性;(2)表内数据是一一对应的;(3)表数据可基于通用软件和工具一致记录存储。实际中,在基于上述理论方法可以实现对工程数据表数字化资源的规范化建设,为从知识管理层面进一步解决数字化资源的管理问题奠定基础。
实际中,工程数据表的应用知识在本质上就是表及其数据与实际问题及其属性之间的关联匹配关系。在基于上述方法实现工程数据表数字化资源模块化规范化建设的基础上,表自身稳定明确的数据内容和明确的数据匹配关系为表及其数据应用知识的描述奠定了良好的基础。可以将表及其所含的各项数据项分别看作独立的对象,进而可针对在不同应用场景下求解工程问题所利用的表,从问题与表及其数据之间的关联关系入手基于本体理论通过定义如下包含五元组的应用知识本体来实现对工程数据表应用知识的描述。
上述应用知识本体定义中:T为工程数据数字化表资源对象的集合,它通过“表名、表文件、表文件类型”等属性可一致性的记录工程数据表的信息;Q为利用表数据解决的问题的集合,它基于“问题名称、类型、技术领域、技术要求”等属性而一直记录问题信息;D为求解问题所用到的表数据对象集合,它通过数据项名称和标识符号一致记录求解问题所用到的数据对象信息;R为求解问题的表之间关系的集合,分为“组合、先序、后序、匹配”等类型;A为求解问题的数据与表之间关系的集合,分为“从属、包含”两种基本关系。虽然实际中,针对国标手册中的工程数据表的应用十分广泛复杂,但本体的动态可扩展性可以保证基于本文所定义的应用知识本体通过对其属性的动态扩充而能够适应各种工程数据表应用知识的描述需求[8]。
依据上述所定义的工程数据表应用知识本体,实际中,可以针对工程数据表的实际应用情况,通过构造应用知识本体实例而实现对所建设的工程数据表数字化资源自身及其数据与实际应用情况之间匹配、关联关系的全面、一致性描述和记录。进而可基于OWL语言构建对应的工程数据表应用知识库实现对其应用场景信息的动态记录和管理。这就可从资源建设、存储、管理一体化的角度实现数据协同的数字化资源建设目标。
面对传统工程数据表这类技术数据资源依托电子文档开展数字化资源建设的现状及其在应用中所存在的不足,本文首先分析了基于数字化文档所建设的传统数字化技术资源,面向实际应用需求在“内容、存储、管理”三个层面中所存在的问题。提出了以数据协同为目标从数据“建、存、管”一体化角度综合开展工程数据表数字化资源建设的思想及其实现的理论原则、步骤和方法[9]。从数字化资源建设层面给出了解决目前基于电子档所建立的工程数据表数字化资源中所存在主要问题。本文研究的方法可以为技术资源的数字化建设提供可供推广借鉴的思路。基于本文的研究工作,后续可以针对数字化技术资源的储存和知识管理问题开展进一步深入的研究。