动态性能分析银行系统容错机器上的可用性研究

2015-03-16 10:44张春瑞李世昕李红梅南小萍
电脑知识与技术 2015年1期
关键词:回归分析

张春瑞 李世昕 李红梅 南小萍

摘要:为了验证某商业银行的管理类信息系统在国产高端容错计算机系统上高可用性、可靠性,并且保证管理类信息系统能够在国产高端容错计算机系统上平稳迁移、平稳运行并最终替代原有进口服务器,将分别对管理类信息系统采用VV&A过程的动态性能分析方法(回归分析法、TIC系数法)进行全面性的分析验证。

关键词: 动态性能分析;回归分析;TIC系统法;分析验证

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)01-0172-04

Dynamic Performance Analysis of Banks in the Fault-tolerant Computer of Usability Research

ZHANG Chun-rui,LI Shi-xin,LI Hong-mei,NAN Xiao-ping

(Construction Bank Xinjiang branch of China, Urumqi 830002, China)

Abstract: In order to verify a management information system of commercial Banks in the domestic high-end fault-tolerant computer system on high availability, reliability, and ensure that management information system can smooth on the domestic high-end fault-tolerant computer system migration, smooth running and eventually replace the original import server, respectively for management information system adopts the dynamic performance of VV&A process analysis method (regression analysis, TIC coefficient method) to carry on the comprehensive analysis of the validation.

Key words: the dynamic performance analysis; regression analysis; TIC system method; analysis to verify

随着信息化应用程度的提高,关键业务可靠的信息服务已经成为国家经济和社会安全运行的基础。长期以来国内高端服务器领域被国外厂商垄断,对国家构成了威胁。浪潮天梭K1的问世实现了高端信息系统领域的突破,对我国服务器产业在高端市场发挥重要的作用。

金融行业作为我国信息化前沿的关键核心行业,能够成功引入国产高端服务器,对于带动产业链的快速发展,实现技术、经济和安全三位一体的目标,意义重大。

为了测试国产高端容错计算机和操作系统的高效、稳定和可靠性,以及对金融各个应用领域需求的满足程度,加快国产高端容错计算机在金融等关键行业的推广,将研究领域扩张到采用了B/S架构、MVC三层设计架构、J2EE,ORACLE,HP-UNIX、red Hat Linux、WEBLOGIC中间件产品,并且包含有银行基础统计报表、营销统计分析、业绩评价等典型业务和具备一定规模数据量(全量5T、每日增量10G)的具有典型示范效應的某商业银行管理类信息系统。

本文将按照首先对国产高端容错计算机进行APACHE、WEBLOGIC兼容性测试,其次在现有管理类信息系统整体迁移至国产高端容错计算机的整个过程中依次对管理类信息系统分别在国产高端容错计算机上应用部署的单域环境、同构集群环境、异构集群环境上对系统进行可用性的分析和迁移的总结。

1 问题分析及解决方案

商业银行管理类信息系统从原有IBM PC服务器向国产高端容错计算机进行应用迁移是属于跨异构平台迁移可能会造成跨平台的移植改造,由于系统版本存在差异、前后逻辑的一致性、问题追溯等因素将使系统迁移变得异常困难,而且同时考虑到应用的可靠性、高可用性、性能和资源使用效率,银行业信息系统安全稳定的严格要求等方面的因素以及部署的复杂体系架构及现有的高可用系统设计就更增加了应用迁移的难度和风险。根据上述问题,结合应用系统总结出问题。

1.1 总推分系统与分行系统同一实例,相互影响

由于目前总推分系统与分行系统在同一实例不同用户下,这样导致了某一系统在升级时会影响到另一系统正常运行,同样会对后续的应用灵活部署以及高可用性研究验证带来不小的阻碍。为了保证后续全量数据迁移、增量数据同步的准确性与独立性,则对数据库进行剥离至另一个数据库中以及修改由于调整数据库后应用配置。

1.2 中间件版本差异造成无法整合优化

管理类信息系统中电子化平台所包含的现有部分逻辑子系统由于中间件版本不同造成无法将逻辑子系统进行整合优化。为了保证电子化平台能够灵活部署、方便维护,将对电子化平台下的所有应用系统部署至同一中间件版本。在应用系统升级部署验证过程中将采用动态性能分析方法中的TIC系数法 进行升级部署验证。

1.3 开发平台版本差异导致应用无法整合优化

由于系统开发时间不同,因此系统开发所使用的SUP开发平台版本也不同。这样导致后续无法将逻辑子系统进行整合优化,相应的后续也就无法对应用系统进行灵活部署以及无法全面进行高可用性研究验证。因此需要对应用系统进行SUP开发平台升级,在系统进行SUP开发平台升级过程中根据不同版本SUP开发平台的特点以及之间的关联性,采用了不修改业务功能、升级jar包与配置文件的方式。

在WEBLOGIC中间件升级至国产高端容错计算机结合最好的WEBLOGIC10.3.6版本部署的过程中出现应用逻辑子系统无法启动的问题,解决办法:将WEBLOGIC10.3.6安装目录中的weblogic.jar包拷贝到应用系统中的lib下;在WEBLOGIC10.3.6版本上新建的域会出现运行缓慢的问题,相应的解决办法:

编辑$JAVA_HOME/jre/security/java.security

将securerandom.source=file:/dev/urandom

修改为securerandom.sourcefile:/dev/./urandom

在应用系统SUP1升级至SUP2开发平台的过程中经常会出现jar包冲突问题,解决办法:将SUP1中起冲突的jar删除或者对个别冲突类进行方法重写;标签属性问题,解决办法:将标签更改为符合SUP2框架的要求,对于缺失的进行自建便签进行补充;应用升级后在WEBLOGIC服务器上部署不成功,解决办法:查找web.xml文件错误并修改,同时应用程序中的lib目录中不能包含服务器类提供的jar包。

2 测试

2.1 测试环境及配置

由于几乎在国产高端容错计算机上部署应用没有相应的成功案例进行借鉴参考,因此在进行具体部署设计时将采用VV&A过程方法对管理类信息系统进行详细全面的考虑实现环节中可能存在的风险,将对生产系统的影响降到最低。同时,在部署的应用环境中对系统采用动态性能分析方法中的回归分析法、TIC系数法进行应用系统的高可用性验证。

2.2 测试结果与分析

2.2.1 Apache测试方案

1) 手工测试

A、安装配置好apache。

B、使用Apache自带工具AB(apache benchmark)进行测试,在#/usr/local/apache/bin下执行如下命令:./ab —c 1000 —n 1000http://IP/index.jsp

2) 采用Loadrunner工具进行压力测试

① 安装Apache后,直接使用Apache默认设置,进行各类压力测试的场景测试。

② 安照web容量,修改Apache配置文件httpd.conf文件,再进行各类压力测试的场景进行测试。

③ 压力测试(超极限测试),ab测试与siege测试。

④ 最后进行增量测试。

2.2.2 WebLogic验证测试方案

检验WebLogic集群环境

1) WebLogic主机必须使用永久的静态IP地址。

2) 集群中的所有WebLogic服务器必须位于同一个局域网,并且必须IP广播能到达。

3) 集群中的所有WebLogic服务器必须使用相同的版本,本次采用WebLogic 10g。

在国产服务器上部署管理系统的J2EE应用程序

为了方便管理,需要在此步骤中将管理服务器与被管理服务器放在不同的目录下。按照分步实施的策略,我们会选取各类具有代表性的管理类J2EE应用程序进行部署。其关键点如下:

1) 环境变量的配置:管理服务器上的startWebLogic.sh中与被管理服务器上的startManagedWebLogic.sh中的CLASSPATH环境变量的配置。

2) 接着进行应用程序的发布:主要包括JDBC配置、数据源配置、JNDI屬性配置、程序发布等操作。

2.2.3 数据库验证测试方案

1) 检验安装oracle 10g RAC。

2) 检验客户端连接使用的TNS描述是否正确,请具体查看Oracle客户端names.ora文件中的配置。rac,为的连接代表整个集群,客户端连接时会使用节点1、2中的任意一个,有在多个连接的情况下会将各个连接均衡的分布到两个节点上,。在节点出现故障时,会尝试切换到另外一个节点,延迟为2秒,尝试30多次直至与另外一个节点的连接成功建立。rac1,rac2的连接代表节点1和节点2,连接到这两者时,实际上是连接到指定的节点,与单机方式的数据库连接类似(没有故障保护)负载均衡和集群的性能提高。

3) 运行环境检测,进行如下操作:

① 检查所有节点所有服务均已正确启动:用Oracle用户登陆到RAC的任何一台服务器上,运行crs_stat —t命令。

② 检查TNS配置,:用Oracle用户在任何一台服务器上使用tnsping命令。

③ 检查连接,:用Oracle用户在任何一台服务器器上使用sqlplus命令分别连接数据库。

在验证的过程中主要采用手动安装配置是否成功以及安装成功情况下对软件产品进行压力测试的兼容性验证。

APACHE与WEBLOGIC的安装部署和配置,以及APACHE与WEBLOGIC基本功能测试和其对应用平台的支持,硬件和测试过程表现正常。所以APACHE与WEBLOGIC在该国产主机服务器上安装部署,满足当前的业务需求。

在单域环境应用系统中,虽然在多轮测试结果中出现部分错误,但与应用与国产服务器无关,因此可以得出单域部署能够成功安装部署,并且能够正常运行;管理类信息系统的全部功能均能够正常运行并且业务逻辑正常。

同构集群环境应用系统验证将对VV&A过程工作中的全部执行流程来进行高可用性验证,同样回归测试将一直在同构集群环境中进行多轮测试。

同构集群环境应用系统的测试与单域环境中测试出的结果数据基本一致,因此可以得出同构集群部署能够成功安装部署,并且能够正常运行;管理类信息系统的全部功能均能够正常运行并且业务逻辑正常。

异构集群环境将主要对应用系统进行压力、性能以及稳定性方面进行全面的验证测试,在压力以及性能压力的测试下虽然应用系统的功能执行成功的状态有所下降,但基本上都维持在95%以上,在稳定性方面验证的过程中也偶尔会出现应用系统出现访问慢、或者是执行有错误,但是基本上是由于网络出现问题或者访问量已经基本上达到要求的上限造成的。通过上述的测试结果可以得出国产高端容错计算机异构集群环境下的应用系统能够正常运行并且处理业务运行正常。

3 结束语

采用VV&A过程的动态性能分析方法对国产高端容错计算机管理类应用系统(包括综合数据管理、员工绩效考核、网点业绩评价、统一报表平台在内的4个应用平台6大类、40多个应用子系统,近6000多张数据库表;涉及报表以及各类WEB应用程序4000多个)进行的全面测试验证可以进一步验证国产高端容错计算机和操作系统在高效、稳定和可靠性能够满足金融行业不同应用领域的需求,并且现有管理类信息系统能够平稳迁移、平稳运行。该文中的研究方法也同时对于金融行业其它应用系统向国产高端容错计算机的迁移具有指导和借鉴的作用。

参考文献:

[1] 王立超,杨懿,邹云,等.离散Weibull分布下实现系统可用度的最小波动[J].控制理论与应用,2010(5).

[2] 张沙清.不确定环境下模具制造多项目动态调度建模与仿真[D].广州:广东工业大学,2011.

[3] 周跃峰.CANOpen协议在双模冗余网络管理中的应用研究[J].工业控制计算机,2010(8).

[4] 田峰,丁文锐,李红光,等.一种无人机飞行控制管理软件回归测试方法[J].北京航空航天大学学报,2011(5).

[5] 朱連芳.ForCES路由器控制件的可用性模型研究[D].杭州:浙江工商大学,2011.

[6] Superdome H P.Mainframe class availability at one-eighth the total cost of ownership (TCO)-Business white paper[EB/O.].http://www.hp.com: Hewlett-Packard Development Company.

[7] 彭强.复杂系统远程智能故障诊断技术研究[D].南京:南京理工大学,2004.

[8] 沈路,贺小明.基于知识的故障诊断专家系统研究[C]//设备监测与诊断技术及其应用——第十二届全国设备监测与诊断学术会议论文集.2005.

[9] 季会媛,孟亚,孙权,等.一种容错系统可靠性分析方法[J].计算机工程与科学,2001(5)

[10] 谭天乐.基于粗糙集的过程建模、控制与故障诊断[D].杭州:浙江大学,2003.

猜你喜欢
回归分析
社会保障支出与GDP之间的关系研究
我国城镇居民消费水平影响因素实证研究
基于CGSS2003数据关于住房影响因素的报告
基于CGSS2003数据关于住房影响因素的报告
溶血标本对生化检验的准确性干扰及纠正性回归分析
中国经济发展状况与大学生就业情况的相关性研究
北京市旅游产业与经济增长的实证分析
城乡居民医疗费用的相关性与回归分析
基于变形监测的金安桥水电站坝体稳定性分析
森林碳汇影响因素的计量模型研究