企业信息系统运行维护管理办法

2019-04-16 10:27张琦
科学与技术 2019年15期
关键词:运行维护信息系统故障

张琦

摘要:随着我国经济的不断发展,企业科学管理水平的提高,企业管理信息化越来越受到企业的重视。企业信息系统投运后就进入系统运行维护阶段,保障企业计算机信息系统安全、可靠、高效运行是系统维护的首要任务和目标,同时还需优化信息系统,使系统能够不断改善和提高,以便充分发挥企业信息系统的作用,更好的为企业提供务,提升企业科学管理水平,提高工作效率。本文主要在平时运维过程的经验基础上分析企业信息系统运行维护管理的方法。

关键词:信息系统;运行维护;故障;管理

企业信息化建设涉及到整个企业的经营管理系统,企业ERP(企业资源计划)系统、OA办公自动化系统等先进的管理系统都进入企业并成为企业重要的综合管理系统。在企业信息系统投入正常运行之后,做好企业信息系统的日常维护和管理工作,确保企业的信息系统正常运行,是为企业带来更多经济效益的重要举措。企业信息系统运行维护管理主要体现在日常运行维护和故障管理两方面。

1 系统日常运行维护管理

企业信息系统投入使用以后,日常运行的维护工作是非常重要的,确保企业计算机信息系统正常安全运行是系统维护的首要任务和目标。

1.1 巡检与监控管理

制定信息系统巡检计划,定期对服务器、数据库、中间件、应用系统等进行巡检,及时发现存在的各种安全隐患;通过监控系统,实时监测服务器、数据库、中间件、会话数等,及时了解系统当前运行状态。其主要包括:监控系统的安全状况,发现不良侵入立即采取措施予以制止;检查系统日志和各种告警信息,根据分析结果提出解决方案;监控各应用系统间接口运行情况,对发现的异常数据要及时处理;对数据库中垃圾数据的定时清理,及对历史数据的及时迁移,优化系统性能;检查系统进程是否正常;检查磁盘的空间占用率;检查CPU、内存的使用情况;检查群集软件运行情况等。

1.2 软硬件启停作业

信息系统启停操作是为了使信息系统适应环境和各种其他因素的变化,及时地进行重启、升级、更新补丁,保证系统正常的工作,满足系统用户对系统的要求。首先必须了解系统环境搭建过程,整理软硬件清单、相关作业指导书,这能更好地指导系统的维护过程。在系统部署阶段,能更好地规划系统软硬件配置,如搭建集群、主备等双机模式,避免信息系统于单机环境运行;在停机前必须保护好现有数据,做好备份;在升级更新前还需做好旧应用软件备份,如出现新版本不能稳定运行时能第一时间恢复系统。

1.3 权限管理与数据处理

用户变更应用系统权限、处理业务数据时,需用户所在部门审查和业务管理部门审批后交由系统管理员确认,进行增删改操作。用户权限分配须遵循最小权限原则,用户口令长度应满足密码复杂性要求,用户账号的命名规则应规范管理;进行业务数据的变更操作前需做好备份工作,并在有人监护的情况下严格按照作业指导书开展工作。

2 系统故障管理

故障管理是计算机信息系统维护当中的复杂过程,应当将故障维护作为出发点,积极采取综合性措施,确保计算进信息系统得以正常运行,发挥其应有作用。信息系统发生故障后,信息系统管理员应组织相关人员对故障进行处理,需从网络、服务器、接口、数据库、应用等多方面定位问题。一般结合监控分析系统的实时告警信息,可以很快地分析出故障的影响范围和问题原因。无论大小的故障,都应该及时地记录故障的发生时间、故障的现象、故障发生时的工作环境、处理的方法、处理的结果、处理人员、善后措施、原因分析等,形成故障处理分析报告,这对于信息系统的运维具有重要的意义。

2.1 数据库故障

表空间不足、归档日志空间占满是一般常见的故障,数据库备份恢复操作是极少出现,所以这里重点介绍常见的故障处理方法。表空间不足也就是指在非自动扩展设备上建立的表空间的使用率接近或等于100%,数据自身已经不能再处理任何增加空间的SQL语句。当表空间不足出现时,我们一般可以通过ORACLE自身的日志或者前端提示的错误信息进行快速定位,通过扩充表空间的设备文件进行故障的排除。归档日志空间占满大多是由于大批量数据变动引起归档日志空间被占满而造成数据库没有响应,登录对应的实例数据库时会报无法登陆,等待日志空间回收;解决此类问题的办法就是备份归档日志,然后删除归档日志空间的归档日志文件。

2.2 应用服务器故障

当出现服务器不响应新的请求、请求超时、请求处理的时间长等,这可能是应用服务器挂起故障。例如内存溢出,即当JVM最大的内存数无法满足应用逻辑处理的需求,系统就会报内存溢出(OutOfMemoryError)错误,从而挂起应用服务,这一般需直接重启应用服务来解决问题。一般来说,服务器挂起之后可能会崩溃,这需马上进行线程监控,查看每个线程在特定时刻正在执行什么操作的信息,是否存在死锁或大量请求等,通过kill -3那些影响性能的进程。对于应用服务器故障,我们平时应注重对SQL语句优化、weblogic配置调整、JVM配置优化、扩充应用服务器内存和CPU等系统性能优化,能有效降低故障发生次数。

3 結束语

针对企业信息系统所开展的运行维护管理的工作核心在于:依托于网络、服务器、软硬件平台、应用软件等相关技术支持,确保系统安全、可靠运行。在运维过程中,需注重日常的巡检和监控,规范信息系统运行维护的流程,及时定位故障源并解决,提高系统可用性。

参考文献

[1]葛世伦.信息系统运行与维护[M].北京:电子工业出版社,2012.

(作者单位:黑龙江烟草工业有限责任公司绥化卷烟厂)

猜你喜欢
运行维护信息系统故障
GE LOGIQ P5 彩超故障维修2例
数控机床故障检测与维修
基于信息系统的计量标准管理
基于项目化+翻转的物流信息系统课堂教学设计与实践
大数据的中低压配网故障智能诊断
汽车出了故障
信息系统管理在社会中的应用
消弧线圈在电力系统中的运行探讨
试析配电电缆的运行维护与故障检修
配网自动化实用化模式建设及系统运行