, ,
信息社会及信息化战争条件下,装备系统日益复杂,伴随产生大量种类繁多的技术资料,装备维修保障人员常常迷失于浩瀚的技术信息资源中。因此,装备维修信息保障至关重要,对装备维修保障信息资源进行组织与管理能大大提高装备维修效率和质量、提高装备保障能力和战备能力。卫生设备种类多样,结构复杂精密,使用场合常常是恶劣的战场环境,因此更需要卫生设备维修保障及时、可靠和准确。为使卫生设备技术资料管理更加有序,技术资料检索方便,展示多样化,促进卫生设备保障活动有效开展,我们进行了维修保障信息的核心元数据研究。交互式电子技术手册(IETM)技术是装备维修保障信息数字化、知识化的研究热点之一[1]。装备IETM系统中集成了装备全寿命周期过程中产生的所有技术信息,并以最优方式组织信息,减少冗余,最终在电子设备上显示供维修人员交互阅读与操作[2]。目前,IETM技术主要应用于飞机、船舶、导弹等大型复杂装备中,在卫生设备中鲜有应用[3]。IETM系统中集成了海量、多样的技术信息,如何对这些维修保障信息进行有效规范的组织、管理、检索与利用,如何保证在异构系统间进行数据交换和共享,是研究卫生设备IETM系统的基础问题。目前,国内外并没有发现有关卫生设备IETM系统中维修保障信息的元数据研究。国外S1000D规范中的数据模块(Data Module,DM)的元数据是一个通用的规范,元素复杂,存在诸多弊端。
信息描述是信息组织的前提和基础,因此选择一种有效的信息描述机制对装备技术信息进行组织是非常重要的。合理规范的元数据体系能充分反映复杂数据信息的本质属性,减少冗余,能反映数据对象之间的关联,较好地解决技术信息资源描述、组织、发现、管理、利用、交换和共享等问题。本文在研究卫生设备维修保障及维修保障信息的特点、DC元数据和S1000D规范的基础上,探讨如何对卫生设备维修保障信息元数据进行描述,尝试构建卫生设备IETM系统中维修保障信息的核心元数据。
建立卫生设备IETM维修保障信息元数据体系,首先要明确卫生设备IETM系统中维修保障信息的分类和构成,了解维修保障及维修保障信息的特点,并将其转化为数字信息,然后在此基础上建立卫生设备IETM系统中维修保障信息核心元数据。
广义的装备维修保障信息定义是装备全系统、全寿命过程中产生的并与装备维修保障密切相关的各类事物状态与特征的反映[4]。卫生设备IETM系统中维修保障信息主要包括卫生设备全寿命过程中从装备分析、设计、制造到使用、维修保障、退役各阶段所产生的所有技术信息,既包含了设备各系统、部件的结构、功能、工作原理、性能指标、原理图、电路图和零部件图,也包含设备及各系统、部件的使用操作信息,以及装备维护保养、修理、故障隔离、检测等信息。
卫生设备维修保障信息数量巨大,种类繁多,按照不同划分标准可有不同的分类方式。按照装备维修保障信息来源可分为装备论证阶段信息、研制阶段信息、生产阶段信息、使用阶段信息,按照装备维修保障信息格式可分为文本信息、多媒体信息、图形信息、混合信息,按照装备维修保障信息结构化程度可分为结构化数据和半结构化数据,按照装备维修保障信息所放映内容可分为装备设计信息、装备使用信息、装备维修信息、装备保养信息、装备故障信息等信息。
卫生设备维修保障信息与一般图书、文献信息不同,具有自身的独特性。卫生设备维修保障信息所描述和反映的不同装备物理实体结构存在着系统与系统、系统与部件、部件与零件等紧密的实体结构关系,因此依靠这种装备物理实体结构关系组织维修保障信息,能够揭示不同维修保障信息之间的关联关系,提高信息的重用性、利用率和检索粒度,帮助维修人员快速找到所需技术信息。
S1000D国际规范是一个关于技术资料数字化的规范,是目前IETM领域影响力较大、使用较普遍的规范。S1000D国际规范起源于欧洲,经过不断的发展,最终成为由欧洲和美国的相关航空航天协会团体共同制定发布的技术出版物标准规范,涵盖了技术信息和出版物的生成、存储、管理、交换和更新[5]。其最大特点和优势就是采用数据模块的方式组织维修保障信息,利用面向对象的IETM信息结构将装备的所有维修保障信息分解为一个个的信息单元,链接到装备的各个物理实体单元,最后通过数据模块的多种组合来满足不同用户的信息需求,极大地降低了数据的冗余度,提高了数据的重用性,也通过装备物理实体结构关系反映了保障信息的关联关系。同时,DM使用中性格式存储数据,可实现数据的交换和共享,实现基于单一数据源的维修保障信息的管理,降低技术手册编制、出版、使用和维护的时间。装备维修保障信息的这种非线性结构DM组织方法实现了美军CALS战略“一次生成,多次使用”的目标。
S1000D规范根据装备保障信息功能的不同,分为描述类、程序类、故障类、维护计划类和图解零部件类等多种类型数据模块,不同类型数据模块具有不同的Schema结构。
简单地说,元数据就是“关于数据的数据”,是对数字信息资源内容、状态空间、时间等特征和属性的结构化描述,在网络化、数字化的信息组织和信息服务中发挥着数据管理、数据定位、数据检索发现、数据使用、数据交换的作用。元数据按照功能可分为管理型、描述性、技术型、使用型和保存型元数据(AnneJ.Gilliland—swetland)。每种元数据的结构格式具体通过内容结构、句法结构和语义结构来完整定义,内容结构主要是对元数据的构成元素进行定义,句法结构定义其格式结构以及描述方式,语义结构是对元数据元素语义的描述方式进行定义[6]。
卫生设备IETM系统中集合了装备维修保障所需的信息集。与其他一般的数字信息集相比,装备维修保障信息所描述和反映的不同装备物理实体结构存在着系统与系统、系统与部件、部件与零件等紧密的实体结构关系。依赖这种装备物理实体结构关系,元数据的应用能够更好地对卫生设备IETM系统中维修保障信息进行组织与关系揭示。元数据在卫生设备IETM系统中对信息资源组织的作用包括资源描述、信息检索、资源选择与评估、数据交换与共享。
2.2.1 资源描述
信息资源描述是元数据最基本的功能,包括对信息资源内容、关联关系、位置、载体、创作者、创作单位、权限、日期、范围的描述。在卫生设备IETM系统中,元数据能够对维修保障信息进行详细、全面的描述。其中,维修保障信息元数据体系中的“数据模块编码”元素可反映出所描述信息资源存在的物理实体结构关系(系统与系统、系统与部件、部件与部件),具有一定的语义性,从而为维修保障用户展现所需资源的更多语义信息,更好地为用户提供信息服务和保障。
2.2.2 信息检索
元数据对信息资源的特征和属性进行详细、全面的描述,从而缩小检索范围,同时提供多维度、多层次的检索途径,提高检索效率和查准率。卫生装备IETM系统中的维修保障信息包括文本、图像、音频、视频多媒体等格式不同的信息。目前IETM系统中的检索方式主要是适合文本信息的全文检索,而对于图像、音视频等多媒体格式的非文本信息不能有效检索利用。通过维修保障信息元数据体系可以抽取非文本信息中的重要信息加以描述与组织,如对视频、图像的格式、标题、部件名、描述主题进行描述与组织,能够实现对非文本信息的检索利用[7]。
2.2.3 资源选择与评估
维修保障信息数量巨大,种类繁多。如何从检索结果中进一步筛选出能满足用户需求、有价值的信息,可以借助元数据所提供的对资源概括性的描述性信息对信息资源质量进行评估与选择,不必逐一去浏览信息对象,可极大提高对资源的利用效率。
2.2.4 数据交换与共享
不同厂商研制的IETM系统缺乏统一的数据标准、数据接口、程序接口,导致数据形式不统一,形成信息孤岛。元数据以及元数据互操作体系能够解决信息流通不畅的状况,促进不同部队卫生设备IETM系统中维修保障信息的交换与共享。
最初提出都柏林核心元数据(DC元数据)的主要目的是解决网络信息资源检索效率和查准率低的现实问题。随着“都柏林核心元数据计划”(DCMI)及其成员的研究和推动,目前DC元数据形成了以元数据术语词表为核心,包括元素集、限定词、编码标准、DCMI类型词表、控制词、模型、工作文件等一系列、一整套的方法体系和标准规范,已经成为全球最有影响力的元数据格式之一。
由于DCMI坚持国际化、独立性和开放性的理念不断推进DC元数据的研究和发展,以及DC元数据自身的易用性、可扩展性、简单性等原则,使DC元数据能够成为很多国家的正式标准,被各领域广泛采用。因此,在制定卫生设备IETM系统中维修保障信息元数据体系时可以借鉴DC元数据。
数据模块(DM)是S1000D国际规范的核心概念之一。DM以SGML或XML格式组织和存储技术信息,是技术出版物中最小的自包含并且完整表达装备某部分完整信息的信息单元,不可分割,具有原子性[8]。数据模块都包括“标识与状态”和“内容”两部分,数据模块的结构如图1所示。“标识与状态部分”是数据模块的元数据,其作用是方便在公共源数据数据库(CSDB)中对DM进行管理、检索、适用性控制管理和质量控制过程管理等。DM元数据中
图1 数据模块的结构
通过以上对IETM国际规范S1000D的研究,发现S1000D国际规范对数据模块元数据的定义非常详细和全面,包括较多的元素、子元素以及属性。这是因为S1000D国际规范作为一个通用规范,适用领域广泛,涵盖了军民以及海陆空所有的装备[9]。因此,如果把S1000D国际规范规定的DM元数据全部应用于卫生设备IETM系统DM中,将导致元数据元素繁杂、效率低下、事倍功半,存在诸多弊端。本文分析研究了我国卫生设备维修保障信息的特点,以及DC元数据和S1000D国际规范中数据模块元数据。在此基础上,创建了更符合我国国情和军情的卫生设备IETM系统中的核心元数据体系。
设定卫生设备IETM系统中数据模块核心元数据共15个元素,包括必须元素7个,可选元素8个,其中“数据模块编码”“版本号”共同构成DM的唯一标识。通过核心元数据以及必选元素和可选元素的设定,可以降低用户的进入门槛,用户根据实际情况选择合适的元素描述DM以及DM中的维修保障信息,不必再去实现复杂的
4.1.1 数据模块编码
卫生设备维修保障信息在IETM系统中以数据模块的形式组织和存储于公共源数据库(CSDB)中,编码的作用是建立数据模块结构化、标准化的标识符,以实现在CSDB中对数据模块的检索和管理。同时,也可以通过数据模块编码建立卫生设备维修保障信息之间的关联关系。由于卫生设备种类复杂多样,本文采用柔性编码方法满足卫生装备多样性和发展的要求。数据模块编码可以分解为硬件/系统标识、信息类型两大部分。
硬件/系统标识主要用来标识装备系统,通过实体层级结构体现数据模块(即维修保障信息)的隶属、层次关系。该部分分为4个码段,第一个码段是型号识别码
信息类型包括信息码
4.1.2 版本号
描述DM的版本信息,取值范围“001-999”。
4.1.3 数据模块标题
概述DM的内容和信息,包含子元素“技术名
4.1.4 安全级别
描述DM的保密等级,包括公开、内部、秘密、机密、绝密5个等级,依次用01、02、03、04、05标识。
4.1.5 创作者
描述创作DM的单位,包括属性“企业编码”和子元素“企业名称”。
4.1.6 质量保证
描述DM的质量验证状态,包括3个子元素“未验证
4.1.7 业务规则引用
业务规则定义了元素、属性以及取值范围,“业务规则引用”描述了该DM参考引用的业务规则DM。
4.1.8 发布日期
可选元素,描述DM的发布日期,格式为“YYYY-MM-DD”。
4.1.9 语言
可选元素,描述编写DM所使用的语言,其属性“语言
4.1.10 责任单位
可选元素,描述DM的出版发布单位,包括属性“企业编码”和子元素“企业名称”。
4.1.11 数据限制
可选元素,描述DM在使用、存储和传输过程中的约束限制,包括的子元素有“数据配发”“出口控制”“存储处理”“销毁权限”“公开权限”“数据替换”和“版权”等元素。
4.1.12 适用性
可选元素,描述DM中的信息所使用的情形。
4.1.13 技术等级
可选元素,描述操作该DM中所含维修保障活动时对技术人员的相关要求,“初级”用“1”标识,“中级”用“2”标志,“高级”用“3”标识,也可使用“4-99”进行等级自定义。
4.1.14 更新原因
可选元素,描述DM更新的原因。
4.1.15 备注
可选元素,描述DM的其他备注信息,如DM使用、发布等情况。
以某型卫生设备维修保障信息为例,说明卫生设备维修保障信息的元数据描述方法。采用XML技术描述某型卫生设备中除颤监护仪的技术参数数据,其数据模块元数据如下:
Xml version="1.0" encoding="gb2312" standalone="no"?>
……
……
本文建立了卫生设备IETM系统中维修保障信息的核心元数据体系,并通过某型卫生设备实例验证了DM核心元数据的适用性。该元数据描述方法能够规范卫生设备维修保障信息的描述,提高对IETM系统中维修保障信息的检索、管理效率,促进数据共享。同时,由于卫生设备种类的多样性和维修保障活动的复杂性,需进一步完善该DM核心元数据体系,从而更全面、更准确地描述卫生设备IETM系统中的维修保障信息。