黄岁锋
摘 要:对核电工程项目来说,数据库承载着整个施工过程的数据,数据库系统是否安全、稳定也直接影响现场施工管理工作,因此,建立高可用性集群数据库系统,是保护系统能够持续稳定不间断运行的基础,经过需求分析和市场调研,本文将利用Oracle自带的RAC 来构建一套2节点集群系统来保障系统的稳定运行,实现系统故障的自动转移。
关键词:集群;SAN;Oracle RAC;RAID5
1、集群系统概述
集群系统由多台(至少二台)相互独立的、通过高速网络互连的服务器组成,像一个单独集成的计算机资源一样协同完成特定任务的系统,任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。
2、集群系统研究与部署
2.1 集群系统体系结构
本文将采用Oracle11gRAC构架和主/备机本地冗灾的方式构建2节点集群数据库系统;数据库由两台服务器通过心跳线构成,每个节点有二块网卡,一块接入公网,与SAN网络存储的连接使用光纤跳线;这样可以避免一台服务器出现故障时也不会影响其正常工作;从软件组件上讲,集群由2台服务器组成,每台服务器有自已的监听器,用于监听自已的网络端口,每台服务器有自已的Oracle RAC服务,用于数据库的集群访问;每台服务器有自已的集群就绪服务,用于集群管理;所有的服务器通过自已的操作系统访问共享SAN网络存储设备,共享存储设备的存储机制使用裸设备、集群文件系统、自动存储管理、当客户端访问时,由上而下依次调用相应的软件;总体拓撲如图1:
2.2集群系统平台选择
Oracle数据库是目前全球公认最成熟与稳定的数据库平台,也是大型数据中心以及核心业务系统的首选数据库平台,本文将采用Oracle11gR2企业版作为技术标准、Oracle RAC 作为集群软件进行研究。其相关产品及套件见下表:
2.3集群数据库系统软件组成
在搭建数据库集群系统中,分别采用两个软件和组件,主要为Oracle数据库软件和Oracle ClusterWare软件以及elxocm和iscsi组件;从逻辑结构上讲,集群数据中的每台服务器有一个实例,每台服务器上的实例都对应到同一个数据库,其服务器使用已有网络访问存储系统。
2.4集群数据库系统规与配置
2.4.1数据库集群存储机制
ClusterWare软件、ORACLE软件采用NTFS存储机制;Voting Disk、OCR、 RAC数据库、恢复文件(Recovery File)采用RAW DEVICE存储机制。
2.4.2集群系统支撑平台规划
集群数据库支撑平台采用Windows Server 2008 R2 64位体系结构的网络操作系统,配置两个公有IP,两个虚拟IP,两个私有IP。其中公有、虚拟IP在DNS中注册;专用在主机文件中注册。
2.5 存储区域网络(SAN)
SAN实际上是一种独立于TCP/IP网络之外的专用网络;通过光纤交换机、光纤通道将应用服务器、数据库服务器、磁盘阵列连接起来,形成数据传输的高速网络环境;由于SAN提供了一种与现有LAN连接的简易方法,并且支持广泛使用的IP协议,不受SCSI存储结构的布局限制,允许任何服务器连接到任何存储阵列,这样不管数据置放在那里,服务器都可直接存取所需的数据。
2.6心跳检测机制
心跳检测机制是定时发送一个自定义的心跳包让对方知道是否存在故障,以确保连接的有效性的机制;本文将采用TCP/ IP方式设置心跳;通过TCP/ IP 等方式在两台集群数据库服务器之间保持周期性信号握手, 用来互相侦测对方的工作状态;如果监视器连续没有收到的心跳信号到了一定数目, 集群系统即开始启用系统故障恢复功能, 将IP地址切换到另一台数据库服务器上并启动相应服务。因此心跳线在保证集群系统正常工作中起着非常重要作用。
3、总结
通过对集群系统研究与应用,虽然能给信息系统安全稳定运行提供有力保障,可以实现系统自动故障转移,多节负载均衡;但是由于采用Oracle自身的集群技术,只能对Oracle数据库进行故障切换;成本较高;因此,需要在虚拟化环境建立集群系统,然后通过HA、DRS、快照等技术实现故障切换和资源的动态负载,确保系统始终处理最佳状态;从而节省成本。
参考文献:
[1](美).罗尼,Oracle Database11G. 北京.清华大学出版社.2010..
[2]孙立威.张晓莉.王淑江,精通WindowsServer2008系统管理与群集. 北京.中国铁道出版社.2010.
[3] Thomas Kyte,Oracle Database 9i/10g/11g编程艺术:深入数据库体系结构(第2版)北京:人民邮电出版社,2011.
[4] 百度文库.http://www.baidu.com;