王艳+王志华
【摘要】 各信息系统在试验过程中产生大量数据,得不到统一管理,通过数据共享与数据交换系统来解决各信息系统之间的共享数据一致性、及时更新、信息交互与共享、数据安全等问题,可避免各系统之间重复采集数据、数据冗余、共享数据更新不同步、数据不准确、信息沟通不畅、数据格式不统一等问题。
【关键词】 数据共享 数据交换 主数据
一、引言
中心承担的任务配套信息系统建设成果显著,涵盖了场景监测、目标识别与定位、信息传输、信息处理、信息显示等领域,增强了信息获取手段,丰富了信息获取量和种类,同时也带来了各类信息共享、交换和综合利用的需求。已建的多个信息系统采用不同的硬件、软件技术和体系结构进行构建,各信息系统的数据采用独立存储方式,传统的对数据直接进行访问和存储的数据交互方式已经不能满足数据共享和交换的需求,为了更好地利用这些来之不易的数据,从中挖掘、分析隐性数据规律,本文提出了一种数据共享与交换系统的设计思路,以主数据管理为切入点、面向服务的体系结构(SOA)思想为总纲,在不改变现有系统的基础上实现跨平台数据访问,实现各类信息系统的数据统一和共享,为数据复盘、数据综合利用提供方法借鉴。
二、概念分析及关键技术
1、主数据管理。主数据是用以表述试验核心内容的信息,比如个体身份信息、装备身份信息、个体位置信息、轨迹信息、监测信息等,是具有高数据价值、存在于多个异构的信息系统中并且可以在数据处理系统内部跨越各个不同的模块被重复利用的数据。主数据管理通过对现有的系统进行升级改造或新建系统来同步各信息系统的最新数据。主数据管理仅从字面理解它的重点在于管理,并不创建新的数据,而是通过描述一组技术、协议和解决方案,保证所有信息系统创建并维护数据的相关性、一致性、精确性及完整性,保证能够有效地在各个系统中管理存储的数据。
2、SOA技术。SOA,面向服务的体系结构,是一种开发的方法论,在本质上是一种策略、是一种通过整合服务来解决系统集成的思想,是传统的面相对象的模型的替代。它将应用程序的不同功能单元通过单元之间定义良好的接口和契约联系起来,其中接口是采用中立的方式进行定义的,独立于实现功能单元的硬件平台、操作系统和编程语言,使得构建在各种这样的系统中的功能单元可以以一种统一和通用的方式进行交互。
三、系统设计
3.1系统概述
主数据被各信息系统所使用,需保持为内部惟一的、共用的核心数据版本。建设数据共享与数据交换系统,实现各个信息系统的主数据管理、主数据共享与交换,提供标准的数据处理及存储服务,是解决共享与交换问题的关键,是推动和实现资源整合和应用的必要基础设施。系统关系如图1所示,系统逻辑结构如图2所示。
3.2系统架构
3.2.1系统总体架构
根据软件工程的总体需求,系统建设时应按照统一的技术标准搭建一个通用的信息化基础架构,令现有信息模型及数据流程具备良好的集成、共享和协作能力,以灵活快速的方式适应将来日益复杂的需求,因此,需建立一套统一的应用数据规范与系统集成规范。
3.2.2系统应用架构
(1)系统主要职责。实现各个应用子系统的主数据管理,实现主数据的提取、共享与交换,提供灵活的数据接口,提供统一的标准化的数据处理及存储服务。
(2)系统功能需求。数据共享与数据交换系统的功能如图3所示。
(3)系统性能需求。对于简单的实时数据交换,数据交换系统的业务从接受请求到处理完成需控制在1秒内完成。数据交换系统稳定性相对较高,连续请求处理无故障应达到10万次以上。支持至少10个对实时或批量的主数据交换业务请求予以响应,拥有大并发量处理机制,具备实时与批量数据的均衡调度。对大数据包的处理,記录量在1万条左右,完成交换从接受请求到处理完成的时间控制在3分钟以内。
3.2.3系统技术架构
采用面向服务的体系结构即SOA,通过Web Service技术,搭建数据交换技术平台,实现面向服务架构的综合数据交换业务,从而为跨平台和跨系统的数据资源整合、数据共享、数据交换提供接入、转换和流程监控等基础服务。实现高效数据库实时复制。
3.3系统主要功能设计3.3.1主数据管理功能
主数据管理(MDM,Master Data Management)主要关注于研究、分类和访问平台内的重要数据,为数据共享与交换平台提供统一的数据标准、数据视图和数据服务等,同时能够实现数据提取、数据管理、数据利用以及数据存储等。
(1)数据源管理。主数据分布在多个不同的系统,以及单个数据表、文档和桌面数据库等,数据源管理通过对上述主数据数据源的管理来实现主数据的获取,同时可获取主数据所在的系统、数据存储介质(结构化/非结构化)等信息。(2)统一的数据编码格式。系统提供统一的标准数据编码格式供所有应用子系统进行参考,并在数据获取时进行数据编码格式检验以及标准数据编码格式转换。(3)数据质量管理。持续性的数据质量下降是对数据管理永久的威胁,数据质量管理必须遵循完全性、符合性、一致性、准确性、重复性、完整性的原则制定数据质量改善计划,通过标准化、验证、纠正和增强主数据,从而实现对数据的清洗和解析。(4)数据维护。用来实现对主数据的导入、导出及对主数据的维护和管理。(5)数据审核。通过采取定期或不定期的方式,完成对主数据质量的评审,从而保证主数据的高质量和准确性,包括定期审核和不定期审核两部分。(6)数据监控。通过智能化的消息监控和日志进行分析,从而保证数据获取与提供的过程平顺与稳健。监控管理可以取代人工的监控管理工作,能快捷准确地发现问题并支持多种警示手段。包括数据量监控、服务过程监控、服务应用监控、数据存储状态监控等。(7)数据共享交换。很多情形下存在同一数据由多个系统来产生和维护的情况,因而在主数据管理过程中,会形成共享数据。数据共享与数据交换通过分发整合后的主数据,以确保在相互集成的信息系统中主数据的质量。(8)数据报表。数据报告是通过统计主数据,自动生成各种数据的统计报表。常见的报告内容包括:1、主数据的使用频度与提供效率统计,可分析出数据的重要性与数据提供的效率;2、主数据获取的错误率统计,可专项分析出某主数据获取时常见的问题,并进行针对性调整;3、核心主数据增量统计,可专项分析出数据异动,并进行确认,从而监控异常的数据变动。(9)业务流程整。主要通过工作流引擎来实现流程管理,工作流引擎作为应用系统的一部分,为workflow提供对各应用系统有决定作用的、并根据角色分工和条件的不同决定的信息传送路由、内容级别等。(10)主数据存储。主数据存储阶段流程如图5所示。
3.3.2数据交换功能
(1)管理控制台。Web管理控制台是基于RIA技术而开发的Web服务应用。提供了完整的系统管理、开发和控制页面。能够部署在Tomcat、WebSphere、Weblogic等多种应用服务器。
(2)系统服务。1、组件服务。组件服务是一个业务流程定义的数据交换,提供了基本的功能组件服务,包括ETL引擎、传输、错误处理、监测、元数据提取和其他系统组件。ETL引擎负责ETL过程映射模板定义,实现数据提取、转换、清洗、加载等功能的实现。在跨地域分布式环境数据交换过程,通过传输模块将被提取的每个数据源的数据发送到指定的目的地。2、任务引擎服务。控制和监测系统任务运行,提供数据上传,加载任何自定义的数据迁移、交换任务控制、监控和管理功能。3、BPEL引擎服务。提供BPEL引擎的管理控制、任务中BPEL流程的执行监控等功能,并封装BPEL产品引擎功能的服务。
3.3.3数据分析功能
数据分析平台利用在数据交换平台处理好的数据进行数据的深度利用,利用数据仓库技术实现数据资源的综合利用。
结束语:本文通过对SOA基础框架中核心技术的研究,提出了基于SOA思想的数据共享与数据交换系统构想。系统是根据各分散的信息系统建设现状为基础,以向指挥中心和决策系统提供数据共享与交换平台且以数据支持为目的的架构,通过ESB,Web Service等技术实现应用层面的决策数据在不同子系统间的互联互通、信息共享。
参 考 文 献
[1]喻坚,韩燕波.面向服务的计算[M].北京:清华大学出版社,2011.
[2]胡德华,SOA之道:思想、技术、过程与实践[M].上海交通大学出版社,2011.
[3]刘炳林,构建最高可用Oracle数据库系统:Oracle 11gR2 RAC管理、维护与性能优化[M].上机械工业出版社,2012.