张学雷
(安徽省环境信息中心,合肥 230079)
随着社会进步、科技发展,环境保护工作与公众的关系越来越紧密,对国家及社会的意义越加重大,同时随着环境信息化的进一步发展,大量环境数据的产生为数据的保存和分发方式提出了全新的要求,需要采取一种全新的方式来统一数据存储标准、数据分发方式、实现数据安全。
环境监测是环境保护的基础工作,目前环境监测已实现全自动、信息化,对环境质量和污染源排放进行有效的监控已经成为环境管理科学化的重要标志之一。随着科技的发展、信息的进步、电子化的发展,自动化监测管理与环境监控数据库的建设越来越重要[1]。
数据整合的概念在业界比较混乱,比如系统整合、应用整合、主机整合、存储整合、数据库整合、数据大集中等等。为了便于规划,以整合手段作为实现标准,系统整合主要有三个方面,其一为物理整合,即将多设备整合而为一部或较少几部更大型(或性能更强)的设备,实现统一管理和快速反应;其二为逻辑整合,即通过系统管理软件等手段对物理上分散的设备资源和数据资源进行虚拟化的集中管理;其三是应用整合,主要有服务器整合、存储整合、数据库整合和数据整合等形式。
目前全省已经具备省到市SDH 2M专网,主要用于内部办公系统、公文传输、污染源在线监测、视频会议的使用,同时国家在建一套省—市—县三级环境统计专网,为全省的数据大集中做好了网络基础。
省在线监控平台采用ORACLE数据库平台,由两台IBM小机组成,磁盘阵列存储相应数据,ORACLE数据库平台数据处理能力能够满足大部分业务需求,随着环保在线业务的不断增加,数据量的海量发展,对大量并发数据处理的需求更加迫切[2]。
环保整体数据机房中含有大批量旧服务器,其安全性和可靠性已经不能够保证,需要进行服务器的整合。
本次所要解决的问题,是有步骤地实现物理整合、逻辑整合及应用整合。具体的实现体现在三个方面:
(1)利用VMWARE的数据中心虚拟化产品实现服务器整合;
(2)存储资源整合,统一使用IP存储器及备份恢复系统软件来实现全省数据集中备份与异地备份;
(3)数据库整合,根据业务情况将公共业务与专用业务集中在两套数据库系统之中,以便于管理与实现。
信息系统应用的目的是支持业务系统高效、有序的运行,是为一定的业务目的而进行设计、开发和应用的。业务系统的有效整合是实现数据大集中的关键。
要摈弃一般业务系统单独占用单一服务器硬件设施的情况,如何使IT体系结构适应本行业的需求和发展,显得十分重要。一个单位的IT体系结构,关键取决于其IT系统的规模、应用范围和性质,以及其所面临的社会大环境。
同时须考虑企业各应用之间的一体化的问题,即如何从A部门获取信息,并将其与B部门获取的数据一同处理,以获得反映系统整个运行状况的信息,使高层管理者控制现在、把握未来,使其有效地管理各个部门和整个系统。
应用的一体化一直在推动着服务器的合并,即服务器的整合,服务器整合主要分为四个步骤实施:即集中放置、物理合并、数据整合、应用整合。
集中放置:安徽省环保厅信息中心通过新建中心机房将所有的服务器统一配置在一个主机房、一个辅助机房内,机房内采购结构化布线系统,采用机房环境监控系统、持续供电系统,保证物理安全性与可靠性。
物理整合:用几个容量大、功能强的服务器通过安装虚拟化软件vSphere4.1,使之成为统一集群,用以替换一些较小的服务器,性能按需配置。
虚拟化是数据整合第一阶段—物理整合的一大关键,当下的 x86 计算机硬件是专为运行单个操作系统和单个应用程序而设计的,因此大部分计算机远未得到充分利用。借助虚拟化,可以在单台物理机上运行多个虚拟机,每个虚拟机都可以在多个环境之间共享同一台物理机的资源。不同的虚拟机可以在同一台物理机上运行不同的操作系统以及多个应用程序。
以往新增一个业务系统,都是购买一台裸服务器,然后安装上操作系统,然后再在其上部署应用软件。通过虚拟化后,这一整套资源统称为虚拟机,就是将物理服务器、操作系统,及其应用程序 “打包”为一个或多个文件—可移动的虚拟机(VM)。
虚拟化前:
每台主机一个操作系统;
软件硬件紧密地结合 ;
在同一主机上运行多个应用程序通常会遭遇冲突;
系统的资源利用率低;
硬件成本高昂而且不够灵活。
虚拟化后:
打破了操作系统和硬件的互相倚赖;
通过封装到虚拟机的技术, 管理操作系统和应用程序为单一的个体;
强大的安全和故障隔离;
虚拟机是独立于硬件的, 它们能在任何硬件上运行。
省厅使用的是VMware的ESX4.1平台,采用的是裸金属架构(相对应的为寄存架构),虚拟化具有四大特点:分区——在单一物理服务器上同时运行多个虚拟机;封装——整个虚拟机都保存在文件中,而且可以通过移动和复制这些文件的方式来移动和复制该虚拟机;隔离——在同一服务器上的虚拟机之间相互隔离;相对应硬件独立——无须修改即可在任何服务器上运行虚拟机[4]。
图1 虚拟化示意图(Virtualization figure)
以上这些特点为省厅后期的信息化建设提供了极大的便利,其具备的VMOTION功能、DRS功能、HA功能、VCB功能又满足了高效性及安全性的要求。
逻辑整合:服务器的集中和物理合并,改善了服务器的结构,数据整合则集中于把现有的大量数据库进行物理合并,整合到一处的数据可被多台服务器存取,数据整合从逻辑上讲是在服务器集中和物理合并之后的数据。实现方式是采用IP SAN架构将大多数基本业务系统的数据库整合到同一个企业版SQL 2005中,将关键业务数据整合到ORACLE 10G中[3]。
当前省厅信息中心多数数据库平台主要是基本WINDOWS下的SQL 2005标准或企业版,由于业务系统众多,有面对业务内网的平台,也有面对公网的业务平台,在这里,实现SQL Server数据库迁移主要利用以下三种方法[5]。
对于数据库跟应用系统在同一台主机之上,数据分散较大的情况,采用第一种方法:exp/imp:这是最常用、最简单的方法,一般是基于应用的owner级做导出导入。
第二种方法,将重新利用两台性能较好的机器安装SQL 2005企业,将当前的SQL盘阵直接从旧有机器挂载在新机器上,同时实现双机功能。 这种情况下,数据文件、控制文件、日志文件、spfile都在存储上(一般情况下是裸设备),可以直接把存储挂到新机器上,然后在新机器上启动数据库。
还有一种rman迁移方法,rman比较适合于跨文件系统的迁移,如同平台下的不同文件系统,当前不涉及。
应用整合:应用整合是服务器整合策略上最综合的一步,应用整合包括把各程序应用和数据从不同的类型的服务器上移植到一个单一的服务器上。但由于担心应用程序的冲突,目前采用虚拟化的方式为每一业务系统单独建立操作系统,共用硬件服务器集群,随时可以实现迁移工作,节省硬件资源。
数据集中:通过利用当前的DS4800存储柜实现对基于ORACLE 数据库的数据集中存储,使用当前的DS4300存储柜实现对基于SQL的数据库的数据集中存储,使用IP SAN统一作为虚拟化平台的存储柜,后期将使用一套备份存储柜对以上三个存储体系进行备份,一套备份存储柜对全省的业务数据进行备份。
图2 整合平台架构图
图3 平台拓扑图
Oracle使用自身强大的群集技术,用两台IBM小机P560Q组成数据库集群,一并负载数据库海量数据,为污染源自动监控系统、空气质量、地表水提供强大的硬件支撑,形成关键业务系统平台;Sql server 2005企业版采用两台IBMX3850X5服务器组成集群,为环保门户、环保办公、环保公文等提供保障,形成基本业务系统平台;六台X3850 M2安装vSphere,形成集群,共用IP SAN为集群共享存储。
操作系统:AIX、WINDOWS 2003 SERVER 中文标准版、WINDOWS 2003 SERVER 中文企业版、REDHAT LINUX、WINDOWS 2008 SERVER 中文标准版。
数据库:Oracle 10G、SQL SERVER 2005 企业版。
备份软件:爱数存储柜、系统备份、文件备份、数据库备份。
业务软件:环境监测平台、公文传输平台、门户及OA办公平台等。
采用成熟的VMWARE数据中心虚拟化技术进行服务器整合,可以减少单位硬件的投入,只需增加服务器相应性能配件即可。减少硬件意味着可以使硬件和运营成本降低 50%,并使能源成本降低 80%。
业务应用系统进行虚拟化,关键数据平台、基本数据平台独立双机群集使用,保证可靠性、可管理性和性能稳定性,为更好的进行数据读写、数据查询提供支撑。
通过数据中心部署备份存储存储柜,通过单一WEB界面实现数据备份、恢复、容灾,实现了对ORACLE、SQL、文件、系统的可靠备份,保证了数据安全性。内置的虚拟介质池功能,使设备具有容量与处理性能呈线性增长的特性,可满足大规模的备份需求。通过本地备份存储柜、异地备份存储柜、市级备份存储柜的融合,实现了关键数据互备、关键数据异地数据容灾,有效地解决因地震、水灾、火灾、盗窃等事故可能造成的公司数据丢失的问题。
安徽省环境信息中心目前已经实现了服务器集中和服务器整合两个阶段,初步实现了数据整合及应用整合,后期将通过业务迁移、硬件更新、备份存储柜的使用来实现完全的数据整合和应用整合,并形成完整的省级环保业务数据集中平台。
形成统一的数据集中平台后将会为下一步的信息化发展打好良好基础,新业务的上线可以很便利地融入到当前系统中,同时会有一个统一的标准来进行约束,不需要进行孤岛式建设,同时可以对数据进行统一的备份和恢复,实现了系统和数据的安全性。
[1] 徐光.环境在线监测监控管理与发布系统[J].中国环境监测, 2006,(8):22-32.
[2] 张维明.数据仓库原理与应用[M].北京:电子工业出版社,2002:57-63.
[3] 陈秀英.大型ORACLE数据库系统的优化设计方案[J] .舰船科学技术,2009,(2):33-34.
[4] 胡嘉玺.虚拟智慧——VMware vSphere运维实录[M].清华大学出版社.
[5] 杨志强.SQL Server数据库管理、升级与转移[M].电子工业出版社.