基于IETM技术的数据要求分析

2011-09-18 02:46胡梁勇
航空标准化与质量 2011年5期
关键词:文档编码装备

胡梁勇

(装甲兵工程学院,北京 100072)

信息化条件下,传统的纸型技术手册已不能满足大型复杂武器装备对信息的需求,随之产生的交互式电子技术手册(Interactive Electronic Technical Manual,简称IETM)代替了纸型手册,成为信息化战争条件下武器装备的新一代维修辅助工具,是一种数字化信息系统,它在编制、修改、存储、运输、使用和管理等方面有纸质技术手册无可比拟的优点,降低了装备保障费用,提高了维修效率[1]。

IETM产品的制作离不开标准,IETM创作平台也需要依据成熟的相关标准来指导自身的开发。实践证明,IETM至少要在两个方面制定规范:一是,有关IETM显示系统方面的规范;二是,创建IETM数据库方面的规范。本文研究的重点就是与IETM显示系统方面的有关的通用性要求。

本文以IETM创作平台研究为背景,建议采用欧洲的S1000D作为开发标准,在开发出的基于S1000D标准的IETM创作平台的基础上,详细探讨了基于S1000D的IETM数据要求分析。引入S1000D标准构建数据库和开发IETM创作平台,可以实现技术信息模块化的组织与管理。

1 IETM可修改数据库规范

MIL–D–87269A《可修改数据库规范》是美国防部在MIL–D–87269的基础上修订而成的,于1995年10月颁布。它是创建IETM数据库以及使用SGML进行标记信息的标准。它定义了IETM数据库结构和元素命名规则,以及政府和承包商信息的交换格式。它的目在于提供标准化的技术信息组织方式,并建议使用SGML语言描述数据模型,以便更好地将IETM所要显示的技术信息遵循一定的规律存储到数据库中。

MIL–D–87269A将IETM数据模型划分为两个层次(见图1):通用信息层和特定内容层。通用信息层有文本、表格、图形、音频、视频等通用元素组成,这些通用元素都有其标准的组成方式;特定内容层由描述信息、任务信息、故障信息、零件信息等信息模型组成,特定内容层中的信息模型由通用层中的通用元素以特定方式组合而成,并根据武器装备的组成结构来组织技术信息。

MIL–D–87269A中的数据模型的优点是层次分明、结构简单、易于组织技术信息、提高了数据的共享性;其缺点是没有对技术信息进行专业性的划分,如可将技术信息划分为操作信息、故障诊断信息、维修信息等信息。可见信息分类缺乏针对性将导致技术信息分类的不规范,影响数据的共享和互操作。

图1 MIL-D-87269A数据模型两层结构

2 S1000D下IETM公共源数据库构建分析

目前比较流行的是S1000D标准,它是由欧洲航空航天和国防工业协会(ASD)和美国航空航天工业协会(AIA)共同制订的一个采用公共源数据库来采办和编著技术出版物的国际标准[3],可用于飞机、轮船、陆地车辆等民品和军事装备,规范采用ISO、CALS和W3C标准,信息以中立格式组织,使用模型概念,其通用性很强,被欧美工业界诸多项目采用。

2.1 IETM数据模块与CSDB

S1000D的一个重要特征是为IETM的制作提供了一个开放系统表述方法,以数据模块(Data Module,DM)组织技术信息,以公共源数据库(Common Source Data Base,CSDB)管理信息对象。

数据模块作为S1000D标准的另一核心概念,逻辑上,一个数据模块是一个自我包含、包含装备一部分完整信息的数据单元,不可分割,具有原子性;物理上,它是一个ASCII码文件,它以SGML或XML格式组织数据,并有相应的文档类型定义(DTD)来约束和验证数据文件中的标记。各个数据模块之间使用数据模块编号(DMC)相互区分,可以利用此编号管理整个产品的数据模块。

数据模块是S1000D标准中核心的信息对象,标准中推荐用中性格式(SGML或XML)描述数据模块。IETM中以数据模块来组织信息,以CSDB来管理信息对象。所以,公共源数据库实现架构的确定要以数据模块的存储、管理的便利性决定。

2.2 基于CSDB的IETM描述方案

装备保障IETM与其它电子出版物一样,在数据格式上也需要实行标准化,以满足装备保障领域技术信息的互用性和长期有效性,这就需要采用统一数据描述语言即所说的标记语言。伴随着信息化社会的飞速发展,SGML、HTML、XML3种标记语言技术先后应运而生,各具特点,对于IETM的信息数据组织、管理有极大的应用前景,由于XML语言的突出特点,下面主要对该语言进行分析。

XML(Extensible Markup Language)是W3C在1996年底提出的国际标准。它也源自SGML,它保留了SGML80%的功能,使复杂程度降低了20%。XML可以看作是SGML的一个子集,它不但保留了SGML的强大功能、降低了SGML的复杂程度,也使XML具有强大伸缩性与灵活性。它作为一种元标记语言,允许用户在DTD文档中根据需要定义特定的标记及属性,从而使XML文件的结构可以复杂到任意程度。目前的XML已经被设计得非常易于使用,并且与SGML和HTML保持了很强的可互操作性。与SGML相比,XML具有更强的灵活性;而与HTML相比,XML能够支持更多的数据类型。XML有下面几大要素:Schema(模式)或DTD,XSL(Extensible Stylesheet Language,可扩展样式语言)和XLL(Extensible Link Language,可扩展链接语言)等。所以XML具有良好的数据存储格式、可扩展性、高度结构化、便于网络传输等优点。其具体优点表现如下。

2.2.1 良好的可扩展性

在具体的实际应用中,不同的行业会有不同的标准、不同的特殊要求,要想定义一套各行各业能够普遍应用的标记是不现实的。而XML允许各种不同的专业(如化学、音乐、数学等)开发与自己的特定领域相关的标记语言。这就使得该领域中的人们可以交换数据和信息,不用考虑接受端的人是否有特定软件来创建数据。

2.2.2 可以轻松实现数据在Web上发布

由于XML是一个开放的基于文本的格式,它可以不做任何修改和HTML一样使用HTTP协议进行传送,不需要对现在的网络做任何改变。

2.2.3 有利于信息的集成

由于不同的数据库间的兼容性问题,要在多种不同的数据库中搜索信息,就必须了解各种数据库的数据格式,这无疑是非常困难的。使用XML可以将不同来源的结构化数据很容易地组织到一起。应用软件可以在中间层服务器上对来自于后端数据库和其他应用数据进行集成。最后,数据以XML格式发送到客户端或是在其他服务器做进一步的处理。

2.2.4 内容与形式分离

XML中信息的显示方式已经从信息本身中抽取出来,放在了样式表(StyleSheet)中。这样做便于信息表现方式的修改,便于数据的搜索,也使得XML具有良好的自描述性,能够描述信息本身的含义甚至它们之间的关系。通过对以上数据描述格式及标记语言的阐述和比较,根据IETM数据模型要求具有层次性、关联性等特点,采用SGML和XML格式描述技术信息能更好的反映技术数据的树型层次结构,是比较可行的方案。但XML优点更显著,它能更容易实现IETM的可互操作性,同时降低开发难度等,可见IETM数据最佳描述语言应为XML。资料表明当前的IETM开发已经开始着手使用XML,在今后发展中XML必将成为IETM中的标准标记语言。这同样说明S1000D的先进性和对新技术的支持以及我们选择S1000D标准的正确性。

IETM创作平台包含创作、管理、发布3个子系统,IETM技术信息包括装备定义数据和装备保障数据,存储在CSDB中,以“数据模块”形式组织技术信息,用公共源数据库管理所有信息对象。以S1000D标准指导开发IETM,建议用XML语言来描述IETM数据。

2.3 基于CSDB的IETM数据存储

XML是IETM的最佳数据描述语言,它将成为IETM发展的标准标记语言。对XML数据进行有效的存储与管理,构建其存储传递的技术方案。按照数据存储系统的不同,XML数据存储大致可分为3种方案:直接以XML文本文件方式存储;开发XML原生数据库;XML在关系型数据库存储。

XML文本文件格式存储XML是最简单的,但对数据的处理能力非常有限。在文本文件中要进行数据查询、更新等操作,效率极为低下。所以要实现对XML的数据查询、更新等数据管理功能,一般不考虑直接以文本文件的方式存储。

原生XML数据库是专门为存储和处理XML文档而设计的,它内部是以XML文档的格式存储数据,即对整个XML文件一起进行物理存储。这种数据库以XML文档为存储单元,维持原有XML文档的数据结构和相关的元数据,只能通过XML特有的相关技术对数据进行存储。

从严格的意义上来说,XML本身不是数据库,XML仅仅意味着XML文档。因为尽管一个XML文档包含数据,但是如果不通过其他的软件来进行数据处理的话,它本身只不过是一个文本文件。所以XML本身不能和数据库挂上钩,但是加上一些其他的辅助工具,我们可以把整个XML看成是一个数据库系统,XML文本本身可以看成是数据库中的数据,DTD或者Schemas可以看成是数据库模式,XQuery可以看成是数据库查询语言,因此在原生XML数据库中存取整个XML文档,只需做物理指针的连接而不是逻辑连接,效率比较高。SAX或DOM可以看成是数据库处理工具等。但它需要完善数据库所必须的一些功能,比如有效的存储组织、索引结构、安全性、事务处理、数据完整性、触发器、多用户处理机制等。同时大多数原生XML数据库只能以XML文档的形式返回数据,当某些应用需要其它格式数据时,必须先对XML文档进行解析,增加了很大的开销。

XML存入关系数据库,基本数据存储单位是XML文档中的数据,主要是通过增加一个映射层来管理XML数据的存储,它是XML与数据库之间转换的桥梁。数据首先要与一个明确的格式相匹配,符合要求的才能根据预先定义好的规则映射到数据库中,但可能会损失一部分元数据和最初的文档结构。同时可以从现有的数据库中动态生成XML页面,但不能保证与当初存入的原始页面完全符合。但这种策略可以同时发挥关系数据库和XML文档的优越性。

综上所述,XML文本文件格式存储虽然简单,但对数据的处理能力非常有限。原生XML数据库存储方法保留了文档的原始结构和XML原有的优点,存储简单,但信息的格式、内容相对繁杂,建立索引庞大复杂,同时缺乏对数据有效的存储组织、索引结构、安全性、事务处理、数据完整性、触发器、多用户处理机制等。而把XML存入关系数据库方法将XML文档的数据进行重新组织,存储相对规范,有利于信息在电子商务等方面的应用,这样我们可以通过指定的DTD规范化XML文档,并利用数据库技术中成熟的统计、并发事务处理等技术,克服了XML文档直接存储和原生XML数据库的缺点。所以建议采用第3种方案,将XML数据存入关系数据库,充分利用关系数据库的优越性,同时也发挥XML的优越性。

2.4 基于CSDB的IETM数据模块编码

对于装备的维修而言,故障是装备功能丧失的外在表现。要排除故障就需要我们通过更正物理结构来保证功能的恢复。从功能到结构是需要一个转换。IETM作为技术信息的载体,它要反映这两个方面的内容:一是装备的结构信息;二是恢复装备的功能而采取的活动描述。并且二者有相关关系的相互对应。让装备的使用人员或者是保障人员能够利用技术手册来知晓装备的功能与结构的关系。

数据模块的结构是基于内容组织和划分的。所以,技术手册要以某种装备保障活动的主题进行构建。数据模块作为IETM中能自我包含的最小信息单元,就要将装备的结构信息和活动信息一起表达。为了实现这种要求,S1000D对数据模块进行编码时,考虑了装备的硬件标识及装备保障活动的信息类型。通过对数据模块编码的选择,就可以组成某一类型的技术手册。数据模块的编码结构如图2所示。

硬件部件的编码包括3部分:第一部分是装备的名称。它需要一个统一的机构进行管理,使用前要经过该机构的惟一性注册,以保证在整个行业中不发生冲突。第二部分是系统标准编码。它反映的是装备的结构。一个装备中可能有多种实现某一功能的系统。比如在某型飞机上可以有多种类型的导航雷达。为区分这些有相同功能的系统,可以在系统标准编码前面增加一个系统区分码,这个编码存在时要与系统标准编码一起使用。第三部分零件分解编码及其变量是对系统标准码中后一位的说明,也就是零件的装备保障活动解释。

编码的信息类型部分包括两部分:第一部分是信息类型编码及其变量,按照装备保障活动的顺序进行排列标记:功能描述、操作要点、保养方法、检测手段、故障报告、诊断程序、故障定位、部件组装、修复件存储、混合主题。这个顺序内容是建立在系统标准编码有效分解的基础上的,对于不必要的分解,不应该标记信息码。第二部分是条目定位编码,说明的是该数据模块描述的硬件是否与父系统有无物理上的联接。

图2 数据模块的编码结构示意图

3 结论及启示

通过比较MIL–D–87269A和S1000D两个规范的数据要求,分析出S1000D更适合指导现阶段开发IETM的数据标准。在我国还没有自己的IETM数据标准规范,应该在借鉴国际上通用成熟的标准基础上,立足本国国情,尽力开发出适合国情和能与国际接轨的IETM数据要求标准,服务于我国的IETM发展和武器装备信息化建设。

由于复杂装备技术保障难度增大和信息技术的快速发展,S1000D标准数据要求还要在实践中结合实际情况,不断加以调整和完善。

[1] 徐宗昌.保障性工程[M].北京:兵器工业出版社,2002.8.

[2] 杜晓明等.集成化的交互式电子技术手册[D].“推进高新技术发展与应用,提高装备与设备维修保障能力”研讨会论文,2005.5.

[3] 陈信钦等.交互式电子技术手册应用与发展展望[J].现代防御技术,2003.3.

[4] Eric L.Jorgensen.DoD Classes of Electronic Technical Manuals,1994.

[5] 顾秀君等.制作交互式电子技术手册标准化要求[J].江苏船舶,2004.5.

[6] 章引平.CALS与标准化[J].航空标准化与质量,2001.5.

[7] ASD S1000D International Speci fi cation for Technical Publications Utilizing A Common Source Data Base(V2.1&V2.2&V2.3&3.0)[S].2004.2/2005.1/2007.2/2007.07.

猜你喜欢
文档编码装备
这些精锐与装备驰援泸定
浅谈Matlab与Word文档的应用接口
港警新装备
生活中的编码
有人一声不吭向你扔了个文档
《全元诗》未编码疑难字考辨十五则
防晒装备折起来
子带编码在图像压缩编码中的应用
Genome and healthcare
Word文档 高效分合有高招