张曲苗
(大庆油田有限责任公司井下作业分公司,黑龙江 大庆 163000)
网格是网络技术发展的主要方向之一,在实现不同资源共享方面可以起到至关重要的作用,可以为客户提供“即连即用”服务。网格计算具备一体化优势,可以很好地实现资源共享。网络中的信息和资源孤岛可以借助网格技术消除。文章从框架设计、实现方案方面就企业应用系统集成进行了探究,以期实现企业管理中的数据融合、共享以及信息联动效果。
企业应用集成(Enterprise Application Integration,EAI)指通过把企业所有必需的异构功能实体连接起来,进行跨界的信息和控制流的传输,在这种情况下,企业就可以成为一个协调的整体,其生产和运营效果会得到显著提升。企业应用系统集成的层次是多方面的,最终集成为一个系统。目前,基于消息的中间件方式是运用比较广泛的集成技术,IBM 的MQ Series和微软的MSMQ 都运用了这种集成技术,这一技术在各种系统间借助一个消息中间件实现交互。因为不同制造商的产品很难实现兼容,而且要提前定制消息中间件,导致系统的运行效率较低,整个开发过程需要较长的时间。而网格技术可以有效克服上述问题,为企业应用系统的集成提供一个新视角。
开放网格服务体系结构(Open Grid Services Architecture,OGSA)是Web 依托网格技术提供服务的体系,这一体系是建立在网格服务基础设施(Open Grid Service Infrastructure,OGSI)上的,这也是一种分布系统的创新。企业借助OGSA 建立并运行的各种管理都可以充分整合在一起,并形成了通知机制,使得各种应用之间的互操作和共享成为现实,满足了大型企业系统管理的各种要求。
OGSA 是基于网格技术企业应用集成的基本框架。在OGSA 中,所有的一切都被抽象地认为是为了服务,一切程序和设备都是如此,网格的使用是借助统一的标准接口来实施的。Globus Toolkit 和Web Service 是OGSA 的 两大技术支撑,Globus Toolkit 属于操作系统,Web Service 是访问网络应用时普遍采用的标准框架。技术人员可以使用Globus 联盟推出的Globus Toolkit 4 建立网格平台,在平台上设立网格门户,数据中心,证书颁发机构(Certificate Authority,CA)服务器,通用描述、发现以及整合(Universal Description,Discovery,and Integration,UDDI)服务器。网格门户是融合各应用系统的数据以后,可以用来查询统计数据的界面。数据中心服务器提取出各个应用系统中需要交互的数据,在该中心中使用统一的格式存放,属于备份数据。CA 服务器不仅可以签订合同、公布数字证书,而且可以对证书的有效性进行验证,没有数字证书的授权,在网格中的任何活动的身份和权限都是非法的。UDDI服务器主要是用来提供匹配服务的,这些服务的内容包括从注册到发挥作用的全过程,而且网格服务不经注册是不能实施的。把Web Service 配置到应用系统端和数据中心,利用Web Service 对系统数据库实施操作,就可以运用原系统进行信息联动以及数据共享和融合。
用户通过客户端上的Web 浏览器访问网格门户,这样可以掌握系统中的所有信息。用户在注册了自己的账户之后,一旦获得了授权,就可以对自己的数据和信息进行处置,并利用系统的交互功能分享这些信息和数据。当用户申请网格服务时,网格接口就可以把用户的需求转化为XML 文件,再通过任务分析模块把工作流程自动设计出来。在流程的不同阶段,可查询本系统中的网格服务是否存在。这些网格服务被查到后,通过表格的形式调出,进而开始服务,服务结果往往储存在Cache中。客户端用户通过网格门户可以得到这些服务结果,如果无法查找到这些服务,则出现错误信息自动退回。网格服务与注册技术是密切相关的,每个服务器节点的Web Service 注册应当按照UDDI 标准来完成,把自己所有可以提供的服务进行注册登记。集成方案的体系结构由服务封装层、服务管理和发现层、服务接口层、应用层四个层次构成,由下层向上层提供服务。服务封装层负责提取元数据,在统一格式的前提下,把这些数据封装起来,通过服务管理和发现层进行注册和对外发布,还可进行服务监控以及服务调度优化组合。在服务接口层,可描述和翻译用户任务,对任务进行分析。应用层主要为集成系统和用户的交互界面。
需要交互的数据应在数据中心备份,并及时更新对数据中心的数据。从应用系统的逻辑功能来看,本机数据难以实现与Web Service 的交互,Web Service 的定时执行成为实现维护功能的重要手段。数据更新会形成大量的数据流动,所以数据更新的频率不能太高。为了不让数据大规模更新,通常会在应用系统数据库中建立数据索引,同时构建专门的缓冲池,更改的数据在缓冲池内储存。在维护应用系统中的数据时,必须通过Web Service 借助数据索引筛选出那些更新过的数据,然后把他们传输到数据中心,在这一过程中,要随时刷新数据索引,再将需要联动的数据项写入缓冲池,并观察合适的时机,用这些数据替换应用系统数据库中的数据,这样系统内就会随时保存有用数据。部署在应用系统端的Web Service 会对缓冲池中的数据定时查看,及时用数据中心缓冲池中的数据替换应用系统中的数据,并进行数据更新,向操作人员发出通知,操作人员接到这些通知以后,按照指令操作系统。
网格应用的关键是网格服务。在企业集成系统中,每一个应用系统都需进行封装并存储,并通过Web 服务描述语言(Web Services Description Language,WSDL)描述服务。针对用户需求,所有的网格节点都可以提供相应的服务,各个节点的服务效果并不完全相同,甚至存在较大的差别。对此,要尽可能选择有效的服务,提高网格计算的效能。服务质量(Quality of Service,QoS)体现为满足用户需求的能力。QoS 可以从多个角度来分析,包括服务的准确性和有效性,也包括服务的安全性和规范性。QoS 会对网格服务产生极大的影响,对此,应选取子模块来进行构建服务,通过调用数据集成中的服务质量评估子系统,量化评价不同节点的各项服务,保证度量的统一性。要基于节点提供的服务质量属性矩阵和用户定义的服务质量权值向量来对每个节点可提供的服务质量进行综合评价,得到服务质量综合治理办法,再择优选择节点。在多个节点中,应选择服务效果好的节点提供用户服务,以此提升集成系统整体服务质量。
网格环境中的应用系统多种多样,各应用系统在数据库系统、操作系统和硬件方面都有所不同。数据库又有着独立的设计,这就会使得不同数据语义之间的差异十分明显。通过集成系统,在一个被理解的文档中集成了多种数据源,而不同系统数据源的异构性主要是通过可扩展标记语言(Extensible Markup Language,XML)来进行消除,通过模式元数据对模式信息进行定义,包括字段和数据库的描述信息,如精度、单位、属性以及数据约束等。可通过XML Schema 文档或文档类型定义(Document Type Definition,DTD)文档来处理XML 文档。如果是Html 文档以及没有定义模式信息的其他文本文档需要增添模式信息,可通过包装程序的设计来完成,对结构化的数据进行抽取。通过定位元数据定义导航信息,对于数据源位置的获取可通过查询谓词、统一资源定位系统(Uniform Resource Locator,URL)、URL+文件名、数据库名+导航算法、数据库名等实现。可利用XML 文档采用简单对象访问协议(Simple Object Access Protocol,SOAP)和Web 服务描述语言WSDL 来消除各组件间的异构性,从而形成统一的数据库系统。
某油田采取上述的技术和方法成功集成了14 个应用系统,包括不同的数据库技术、不同的运行环境、不同开发时期等多种应用系统,在企业内部形成了一个数据网络平台,简化了管理流程,极大提升了管理效率。当前,这种应用集成只适用于比较小的范围,还需要加大研究力度,做好组合优化、服务的相似性理解以及控制网络流量等,以提升系统的可靠性和稳定性。此外,信息服务只是停留在Grid 服务和Web 服务方面,未覆盖非结构化信息服务,在后续的发展过程中,非结构化信息提取技术将是一个新的研究方向。