一种SAP系统状态评价方法

2016-03-22 11:20:52江苏省电力公司信息通信分公司冯曙明黄高攀
电子世界 2016年1期

江苏省电力公司信息通信分公司 李 林 冯曙明 黄高攀



一种SAP系统状态评价方法

江苏省电力公司信息通信分公司李林冯曙明黄高攀

【摘要】为使对SAP系统状态的评估更加合理,评价分析SAP系统当前性能,本文采用了一种动态权重的方法,结合加权平均算法,可以通过SAP系统的各项指标,较为合理地评估系统状态。验证结果表明,这种方法能够突出具体指标对系统整体指标的影响。从而正确的评估系统当前状态,为SAP系统运维提供决策支持。

【关键词】系统评估;SAP;动态权重

在SAP系统运维工作中,往往由于对系统状态的不正确或不及时判断,导致可能发生系统性事故。如用户反映通过SAP接口发送的数据,接受系统没有接收到数据。经Basis查看发现系统接口不通了,当我们发现时,其实系统已经有很多接口错误信息反映了接口拥堵的情况。如果我们能够提前主动检测到系统存在接口拥堵的情况,那么就可以及时地发现问题,解决问题,从而避免大量的数据补救措施;再如我们发现用户无法登陆SAP系统的情况,经过调查发现SM51的系统DIA进程都被占满了,经basis处理掉一些不必要的进程后,才得以让用户重新登陆系统,同样如果提前对系统进程空闲状态进行合理评估,以了解整个系统当前的状态,则可以很好的规避此类问题的发生。因此建立SAP系统的实时状态评估尤其显得重要。

目前我们对SAP系统状态的评估通常采用特定指标值和权重,进行加权平均,得到SAP系统的当前状态。但实际过程中,这种方法并不能真实反映系统的当前状态,例如我们选取系统进程指标与系统内存指标作为例子,根据静态权重的评估方法,当某个指标的值较大,(此处以百分制分为例,零分表示对系统危险度无贡献,一百分表示对系统危险程度最大。)系统总体指标得分仍然不高,而实际情况是,这两个指标中任何一个指标得分过高,都会影响到系统整体指标,因此利用这种静态权重,显然不适合这种场景下的SAP系统状态评估。以下提出基于动态权重与静态权重相结合的方法,确定指标的综合权重。进而合理评估单个指标的偏离程度,对整体指标的影响。

1 静态权重的确定

这里对每个单项指标的得分,企业可以根据自身的实际情况,采用适合的算法进行运算。如企业有条件可以收集数据进行线性回归或者非线性回归,得到单项指标的回归方程,或者通过专家判断、判定表、判定矩阵等方法,获取的评估值。在对每项指标评分时,所使用的分制必须一样,如百分制,或者十分制。总之,

2 动态权重的确定

由于SAP系统的特殊性。按照静态权重算法,不足以反映单个指标对系统整体的影响,因此引入单个指标的权重的重新分配,来加强其权重。权重的重新分配是各项指标应用于实时环境中时所表现出的对整体指标的拉升或者削弱,以客观反映系统的当前状态。

我们对所有指标的得分进行排序,获取超过静态加权均值的指标(具有一定危险性的指标)重新评估其权重,以使其权重得到加强。以下公式r为该指标的获得提升的权重比例。

这样系统经过动态权重重新分配后的得分为:

3 实例验证

某公司SAP系统作为支撑其信息化的核心信息系统,其系统安全与稳定及其重要,为保持系统稳定,实时监控系统状态,提前发现问题,解决问题,避免重大损失,运维人员利用以上方法,选取了SAP系统7项指标作为评估基础,来对系统状态进行实时评估。选取监控的指标包括以下几个:

(1)监控系统的进程数,包括系统所有实例已用进程数量和总数量(SM51),指标值为“运行数/总数”。

(2)监控SAP内存使用情况,监控每台服务器的内存使用情况(ST02),计算内存使用率,指标值为“已使用/总数”。

(3)监控SAP LOGON分组的可登陆状态(SMLG),展示Load Distribution的相关信息包括服务响应时间、在线用户、会话步骤信息。

(4)监视系统的锁资源(SM12),展示系统中表锁定的个数,以衡量系统锁资源是否充足。

(5)监控系统的更新状态(SM13),以反映系统当前更新进程是否出现大批量错误。

(6)监控TRFC状态(sm58),以获取当前系统RFC的性能情况,防止接口堵塞或错误过多,影响系统整体性能。

(7)监控系统dump数据(ST22),评估系统dump是否在合理水平,以防止出现大量的Dump信息而应用用户使用。

以上每个指标根据其对系统整体的影响程度,对其分配了静态权重,并且记录了某一时刻每个指标的得分(表1)。

表1

从表1可以看出依据加权平均算法,系统得分为25分,表示系统状态良好。而实际情况是系统的假脱机进程已经超过危险线,可能存在进程不足的情况,不能为新的用户分配处理进程。同样,系统响应时间指标也超标,说明系统可能存在一些资源过度使用,或者是系统通讯、IO之类的问题,此时系统已经存在安全隐患了。依据本文所描述的方法,对权限进行重新分配,得到新的权重(表2):

表2

表2中对系统响应状态指标的权重进行了加强,依据此表得到的系统评估得分为85.94,充分反映了系统的整体状态并不好,此时将此信息反馈到运维人员,运维人员依据与此明细表可知道具体哪个指标出了问题,可以提前对此指标进行优化处理,以防患于未然。

4 总结

本研究引入对静态权重重新分配的方法,通过综合权重来合理评估系统各项指标对系统整体状态的影响。通过实例验证,说明了单个指标的偏离对系统整体指标的影响。这种偏离越严重,影响的权重越大。

本方法中涉及对单个指标得分的计算方法,因每个企业的管理水平及管理要求不一样,文中未做详细说明。另外对指标偏离度与提升权重比例之间的方程也未做详细说明,企业可以根据实际管理需要进行方程规定。总之,对于一些综合考虑时重要性不易凸显的指标来说,采用权重重评估的方法,将对其产生强化效应,从而将危险表现出来,在一定程度上有利于危害提早预告,可见将指标值与均值的偏离情况考虑进权重确定中,能更准确地确定各指标的重要程度,更准确地反应系统的整体状态。

李林(1984-),男,供职于江苏电力信息技术有限公司,研究方向: 从事软件开发。

作者简介: