陈超
摘要:SAP ERP系统是大型制造业广泛采用的企业资源计划管理软件。随着企业发展,不断增长的数据量给系统上线后的运行维护带来了重重问题。对系统进行数据归档能减少在线数据量,达到提升运行效率并降低数据管理成本的目的。通过首钢京唐公司数据归档的实例说明,本文所提出的采用索引数据库的数据归档方法,与标准数据归档相比,对数据空间的释放量有了明显提升。
关键词:SAP ERP系统 数据归档
中图分类号:TP319 文献标识码:A 文章编号:1007-9416(2016)07-0088-02
Abstract:SAP ERP system is widely used in large-scale manufacturing as enterprise resource planning management software. With the development of enterprises, the growing data has caused many problems for the system operation and maintenance. Data archiving of the system can reduce the amount of online data, in order to improve operation efficiency and reduce the cost of data management. Through the examples of Shougang Jingtang data archiving, the release amount of spatial data has improved significantly compared to the index database data archiving method using with standard data archiving.
Key Words:SAP; ERP system; Data archiving
ERP(企业资源计划系统),是指在信息技术基础上,以系统化的管理思想,为企业决策层及员工提供决策运行手段的管理平台。企业资源计划也是实施企业流程再造的重要工具之一,是大型制造业普遍使用的公司资源管理系统。世界500强企业中有80%的企业都在用ERP软件作为其决策的工具和管理日常工作流程。SAP公司的ERP软件,以其功能强大、开放性强、设计思路与流程严谨牢居着全球ERP软件之首。
企业成功实施了SAP ERP系统,仅是"万里长征"走完了第一步。系统进入稳定运行阶段,企业对SAP系统的依赖随着时间的推移而不断加强;企业内部、外部环境不断发生变更,并且随着连接的外围系统增加、系统边界范围的扩展,系统的复杂度和数据量也在不断的提升。由于数据库越来越大,对于管理和使用都是一个大的问题,如何让ERP系统在上线后保证运行效率和运行稳定性,是日常运行维护工作的重点。数据归档的目的就是为了尽可能减少系统在线数据,降低系统数据库数据量,控制数据增长,从而提高系统性能,减少后续备份设备和存储设备投资,是解决上述问题的一种可靠、成熟的技术手段。
1 SAP ERP系统数据归档概述
1.1 SAP ERP系统数据归档的定义及目的
SAP ERP的数据管理策略包括:数据避免,数据汇总,数据删除和数据归档。其中,数据避免和数据汇总基于数据分析,对无效数据相关配置进行取消修改,达到避免无效数据产生的目的;数据删除主要针对部分系统数据表和自定义数据表建立生命周期管理策略,定期执行清理;数据归档则主要应用于业务数据和主数据归档及其查询。
数据库是结构化的数据集合,“数据归档的核心是标识数据库中非活动数据,然后将非活动数据从中央数据库中分离出来存储,至更廉价的存储设备[1]”。SAP ERP系统的数据归档,就是通过数据分析定义数据库中的非活动数据,按照制定的归档策略将非活动数据从数据库中转移到归档文件中,然后将非活动数据从在线数据中删除。在ERP系统数据归档时,由于是真实遵循生成原件的方式而产生的电子文件,所以可视为原件的忠实复件,与原件具有相同的效力[2]。
数据归档的目的,主要有三个方面:
一是降低ERP系统数据库在线数据,最大程度的提高系统性能。通过减少在线数据提高系统的功能程序和报表程序的响应速度,缩短系统同步及备份时间,缩短系统升级等操作的停机时间。
二是减少数据的管理成本。通过归档降低系统数据的整体增长速度,减少后续备份设备和存储设备投资,减少数据的运行和维护管理成本。
三是建立ERP系统长期的归档策略。保证系统数据库的数据空间长期达到相对稳定状态,提升系统的稳定性。
1.2 SAP ERP系统数据归档的步骤及方法
(1) 进行数据分析,明确归档范围。通过分析数据库表大小和增长速率,结合业务、法律法规和审计方面的需求,明确归档范围及归档对象。
(2) 制定数据归档策略。通过对归档对象进行业务分析和技术分析,明确归档对象间的业务依存关系、归档范围、归档方式及数据保留期限等,制定数据归档的策略。
(3) 进行系统测试。进行归档范围相关程序的系统测试,并解决标准程序和自开发程序在查询归档数据时出现的性能问题。
(4) 执行归档操作及数据库重组。完成配置等请求的系统传输,并按照AOP执行生产系统的数据归档操作,进行数据库重组充分释放空间。
2 在数据归档中采用索引服务器的新方法
传统方案中的索引是全部存放在SAP数据库的,以自建表实现,这在很大程上占用了数据库的空间,并且后期随着更多信息结构的创建,其数据量也会迅速增加。下图1为标准归档功能中索引的架构。
索引服务器的架构是通过DBCO在SAP系统进行配置从而与外部Oralce数据库集成的一种方式,处理索引数据时更加灵活,更加可靠。对于已归档的数据来说,数据访问的瓶颈主要在于读取数据文件,尤其是大数据量的时候,循环读取归档文件,其性能极为低下,甚至程序运行时可能出现内存不足或运行超时的错误。因此,索引服务器可以解决这个问题。架构如图2。
从长远影响来看,当数据访问时(尤其是自开发报表),为了加快查询速度,会考虑增加字段,即添加索引。这在后期的维护中又为ERP系统数据库的空间剧增埋下长期隐患,也违背了减少数据量的初衷,更影响了归档的实际效果。当比较常用或访问频率相对较高的字段信息放到索引服务器数据库后,会明显提升历史数据的访问效率,使得读取归档文件的频率降低,在程序开发时可以优先考虑访问索引服务器。同样,读取已归档数据的需求解决后,标准的信息结构索引表也就无需填充太多的数据,其所占用SAP的硬盘空间也大幅的减少。
3 实例研究
首钢京唐公司SAP ERP系统上线运行几年后,随着公司产线陆续投产,系统业务也变得复杂和多样化。ERP系统中采购、质量、设备、生产、销售和财务数据也在不断增加并且数据的增长速度在不断加快,大量过时的及冗余的历史数据严重影响着ERP系统的性能。一般公司在ERP系统上线3-5年后,数据的增长方向已经明确,就开始进行归档处理。截至归档项目启动前,京唐公司的ERP系统数据库占用量已经达到约3T。根据以往项目经验和财务凭证的审计要求,保留最近2年的系统数据。根据影响程度和范围,围绕数据量大和增长速度快的表数据,结合使用频繁,数据库响应时间慢的功能评估,确定了财务、生产、设备、销售模块相关的25个归档对象。
首钢京唐公司的SAP ERP数据归档采用了索引服务器的新方法,通过实例证明,该方法不仅大幅提升了数据库空间的释放量,提升了系统性能,而且保证了数据的读取效率。
应用了索引服务器,使得大量的信息结构索引转移到SAP系统之外的数据库成为可能,极大地节省了SAP系统的数据库空间。通过对归档对象所对应数据表的分析,可归档的数据量约为1.3T,按照标准归档方法的经验压缩比,可释放的空间约为900G。采用了索引服务器的新方法后,数据库释放空间1.07T。相比标准归档方法,多释放了近200G的空间。对比杨波在文章[3]中所提到的应用标准归档方法数据库容量减少30%的案例,数据库空间的释放量有了明显的提升。
数据归档后,对在线数据查询性能无影响,部分事务代码的查询性能有了明显提升。如MB5B对过账日期的库存查询,响应速度提升近一倍;月结过程中运行物料分类账的单层处理原来需要2.5个小时以上,归档后运行时间减少为1个多小时,响应速度比原来提高近一倍。
在归档数据读取效率方面,根据标准逻辑,取归档数据会先从SAP的信息结构索引表中读取条件数据和文档ID以及偏移量,然后根据文档ID和偏移量去读取对应的数据文件,再经过数据筛选处理,得到所需的数据。而直接从索引服务器取数,主要整理好查询条件,再通过封装的功能便可直接取出数据,可以称之为一步到位。经过测试,从归档索引服务器取数的时间与从数据库取数速度相当,比读取数据文件的速度要快得多。
4 结语
SAP ERP系统的数据归档通过对非活动数据进行归档,降低了系统的在线数据,达到了提升系统性能,减少数据管理成本和建立长期归档策略的目的。通过实践表明,本文所提出的采用索引数据库的方法,不仅大幅增加了数据归档后数据库空间的释放量,而且提升了系统性能,保证了数据的读取效率。
参考文献
[1]沈立强.高校信息系统数据归档研究[J].中山大学学报:自然科学版,2009,48(S1):215-219.
[2]云霄.基于ERP系统结构化数据归档技术方案研究[J].北京档案,2014(7):34-36.
[3]杨波.SAP 数据归档在工程机械企业中的应用-记广西柳工机械股份有限公司SAP 数据归档项目[J].机械设计与制造工程,2013,42(9):68-72.