电子文件数字管理系统在电力企业中的应用及提升研究

2017-04-15 16:47程东生俞雯静黄伟
数字技术与应用 2016年12期
关键词:电子文件电力企业

程东生++俞雯静++黄伟

摘要:近几年来,随着电力企业的快速发展,电子文件数量急剧增长,价值不断显现,对其实行有效管理的要求日益迫切。本文结合电力企业的业务特性,从统一的集成服务、大数据大并发支撑改造、业务功能完善三个方面介绍了电子文件数字管理系统在电力企业中的应用完善,对电子文件系统在电力企业应用中的提升及在其他行业的推广应用具有重要指导意义。

关键词:电子文件 电力企业 数字管理系统 深化应用

中图分类号:TP3 文献标识码:A 文章编号:1007-9416(2016)12-0122-02

Abstract:This paper, combined with the business characteristics of electric power enterprises, introduced the application and improvement of electronic file system in electric power enterprise from three aspects of the unified integrated services, big data and concurrency ,and business perfect function improvement,has important guiding significance to promote the application in the electric power enterprise in electronic file system and Application in other industries.

Key Words: Digital records;Electric power enterprise;Information systems; Deep application

引言

电子文件是信息时代公司各项生产经营管理活动的重要记录,是核心的信息资源[1][2],电力企业电子文件管理系统研发与应用具有重大意义。

本文结合电力企业的业务特性,从统一的集成服务、大数据大并发支撑改造、业务功能完善三个方面介绍了电子文件系统在电力企业中的应用完善,有助于指导电子文件系统在电力企业应用中的提升,以及在其他行业的推广应用。

1 统一的集成服务

电力企业电子文件系统的统一集成服务包括数据抓取、结构化转非结构化、缓冲池、数据封装、容错机制等几个方面。

1.1 数据抓取服务

数据抓取服务是平台需提供捕获面向公司各类基于不同技术开发平台所开发的业务应用系统所管理的电子文件服务。主要包括,捕获基于ERP(如SAP成熟套装软件)、Ariba(如电子商务系统)、SoTower(如综合管理系统)、PI3000(如生产管理系统)、Java App(如能效管理平台等)开发的业务应用系统所管理的电子文件,文件捕获服务为电子文件管理提供数据源,电子文件管理系统可以针对各业务系统定义捕获规则,自动抓取对应的数据信息。

1.2 结构化数据转非结构化数据

结构化数据转非结构化数据在各业务系统中实现的方式差异性可能比较大,但整个结构化数据转换处理的过程基本相同,只是采用的具体实现技术有所差异。如图1所示。

1.3 缓冲池

缓冲池主要是用来存储待推送或推送失败的电子文件的相关信息,包括:电子文件元数据经封装后形成的XML文件;文档内容为结构化数据,经封装后形成的XML文件;非结构化格式的电子文件文档;电子文件及文档的描述信息。

为适应电子文件数据信息缓存的要求,缓冲池采用“数据库+文件目录”的方式来实现。数据库存储电子文件及文档的描述信息,文件目录存储封装后形成的XML文件和非结构化格式的电子文档。

1.4 数据封装

将转换好的非结构化文件和元数据信息一起进行封装,并传入电子文件管理系统。

数据封装对于元数据信息,基于W3C标准,采用dom4j技术实现将抽取到的元数据信息封装为XML文件;同时将非结构化文件的描述信息(唯一ID、大小、版本等)写入XML信息;将XML和非结构化文件一起封装为信息包。

1.5 容错机制

日志处理:各业务系统需要建立完整的日志机制,对业务过程中的各种操作信息进行详细记录。需要记录的日志至少包括:数据抓取日志、结构化数据转非结构化数据日志、电子文件推送日志、已推送成功和失败的电子文件日志等。日志记录的信息需要包括操作的详细信息、操作时间等,日志信息的维护由各业务系统自行决定。

错误处理:各业务系统需要建立完整的错误处理机制,对各业务过程中产生的错误进行处理,如结构化数据转非结构化数据出错、电子文件推送失败错误等。错误处理方式主要有两种:(1)不需要人工干预的错误处理;(2)需要人工干预的错误处理。

對于不是因数据的问题而产生的错误,需要能够调整配置,由系统自动进行重新处理。如电子文件推送失败后,要能设定下次自动重新推送的时间、允许重新推送的次数等。

对于因数据问题而产生的错误,需要能够及时通知维护人员,由维护人员及时对数据进行处理,数据处理完成后由系统重新进行处理。如推送的电子文件的元数据不符合要求,需要维护人员对元数据信息进行处理,处理完成后系统自动重新进行推送。

2 系统大数据、大并发支撑改造

由于系统在虚拟化的平台下进行迁移,会对电子文件系统的功能实现方式和底层结构带来影响[3],因此电子文件管理系统需要做相应的改造工作,其主要改造工作思路如下:

首先,需进行虚拟化技术研究,对电子文件管理系统涉及的基于j2ee架构应用、链路虚拟化等进行研究,并找出适合电力企业电子文件管理系统的合理技术路线[4]。

其次,需对基于内网的应用服务器性能提升进行研究,为解决高并发和高负载采用的ngnix技术的应用研究。

同时,对数据应用灾备、多节点服务支撑(weblogic)等高可用技术进行咨询研究,确保改造方案适应电子文件管理系统的大并发、大数据的利用。

最后,对包括服务器、存储、内部链路、网络和IO等进行重新设计优化,确保从硬件资源上面适应电子文件管理系统的要求。

电力企业电子文件系统大数据、大并发支撑改造主要体现在以下几个方面:

集成接口虚拟化:随着接入系统和电子文件类型的增多,集成接口压力较大,需要改造为支持虚拟化环境,可以自动根据时间段、压力等进行分配。

数据展现虚拟化:支持虚拟化视图展示,主要涉及到捕获登记、分类整理、鉴定处置等模块。

缓存资源虚拟化:支持虚拟化环境的多个来源。

智能整理虚拟化:支持虚拟化环境中同时进行任务分配整理,主要涉及到自动分类、自动鉴定、自动捕获等。

容错机制虚拟化:支持虚拟化环境下的容错信息的合并展示。

存储利用虚拟化:支持随非结构化数据管理平台的变化而变化。

3 电子文件业务功能完善提升

电力企业电子文件系统业务功能完善提升包括专题管理、捕获服务优化、捕获登记、自动分类、批量移交、统计分析、基础服务优化等几个方面。

3.1 专题管理

专题维护:管理员可以从本单位或全部数据中定义不同的专题,并可以录入专题名称、创建人、应用范围、展示模板等信息,并能进行维护。采用专题可以更好的利用电子文件的数据资源,提升电子文件的利用服务水平。专题维护的主要功能包括:添加、编辑、删除。

专题梳理:根据定义好的专题信息,设置自动规则或人工自动关联数据,实现跨单位、跨业务系统等的数据自动抓取和查询,并定义关联数据的展示顺序、显示字段等。专题梳理的主要功能包括:查询、设置规则、手工加入、顺序设置、显示字段、在线发布、取消发布。

专题展示:系统固定几种专题的展示模板,可以对视频、音频、文档类文件等进行展示;并可以根据不同的专业,显示不同的业务系统、管控点、表单等,可自定义图形化展示方式、统计图形,便于更好的展示专题内容。专题展示的主要功能包括:模板定制、树形结构定制、图形定制。

文件关联:文件关联功能是由管理员设定数据的自动关联规则或人工设置关联关系,用户查看数据的时候自动显示相关联的文件信息,提高用户的利用范围,提升用户体验。文件关联的主要功能包括:手工关联、自动关联、多层关联。

3.2 捕获服务优化

结构化数据定版:结构化数据定版服务在各业务系统中实现的方式差异性可能比较大,但整个结构化数据转换处理的过程基本相同,只是采用的具体实现技术有所差异。

待转换数据可以从数据库或XML中直接抽取,由转换程序应用对应的转换模版形成所需的非结构化格式文件;也可以从数据库中抽取数据按照规范封装为XML格式的文件,提交给转换程序应用对应的转换模版形成所需的非结构化格式文件。电子文件的转换模版要能支持可配置,以便进行转换模版的扩展变化。

电子文件推送:电子文件推送的时机需要能够进行配置,以便根据需要设置不同的服务运行时间。每个电子文件的推送,无论其最终推送成功或失败,都需要对所推送电子文件的信息进行记录。如果推送成功,需要在缓冲池信息表中记录电子文件及文档推送成功的信息;如果推送失败,需要在缓冲池信息表中记录电子文件及文档推送失败的信息,并将文档留存在缓冲池中。

3.3 捕获登记

在前期的捕获登记的基础上,实现各业务系统数据的统一抓取、统一转换;扩大捕获范围,对业务系统中产生的相关流程、日志信息进行捕获,实现电子文件的全程管理。

3.4 自动分类

自动分类服务是针对捕获过来的电子文件,从来源、元数据类型、元数据内容、附件内容等多个维度对电子文件进行自动分类,形成一个电子文件的多个不同分类维度,更好的展现电子文件。

3.5 批量移交

电子文件管理系统需要对外提供移交功能,需要对某一批包括元数据、电子文件附件的数据进行封装、校验、打包、下载的过程,主要涉及到以下几个环节:

封装:根据用户选择的数据条目信息,将对应的元数据封装为XML,电子文件附件信息进行下载。

校验:对元数据和电子文件附件信息进行校验,保证元数据和电子文件附件的对应关系的正确性。

打包:将元数据的XML和电子文件附件进行打包,保证元数据和电子文件的完整性。

下载:将打包好的批量移交信息包推送到用户那里,并保证下载的安全性。

3.6 统计分析

在原来的固定统计的基础上,增加自定义统计功能,可以灵活选择单位、文件类型、业务系统等进行统计,并可以展示为列表、图形化展示(柱图、曲线图、饼图等)。

3.7 基础服务优化

电子文件管理系统需要提供各种类型的电子文件管理以及各类业务系统的接入,采用SOA的技术架构,因此需要把对数据的捕获、存储、利用、格式转换、数据封装、安全控制等封装为基础服务,同时把一些对第三方系统或者软件的调用封装成基础服务。基础服务由上层的组件服务或者业務服务调用。根据电子文件管理系统的实际情况,再前期的基础服务的基础上,深化数据转版,新增自动分类等基础服务。

4 结语

本文从统一的集成服务、大数据大并发支撑改造、业务功能完善三个维度,对电子文件系统在电力企业中的应用结构和提升方向进行了阐述,通过进一步实现具体应用功能,对于整合公司信息资源,实现资源高效利用,提办公效率和效益,提高公司管理水平具有重要意义。

参考文献

[1]库俊平.大数据环境中企业文书档案的信息化管理及利用[J].创新科技,2013(9):50-51.

[2]杨冬权.在全国档案局长馆长会议上的讲话[EB/OL].

[3]宋魏巍.大数据环境下电子文件鉴定研究[J].北京档案,2015(12):16-19.

[4]王兰成,刘晓亮.网上数字档案大数据分析中的知识挖掘技术研究[J].浙江档案,2013(10):14-19.

猜你喜欢
电子文件电力企业
基于新形势下电力企业人力资源的开发与管理
电力企业物资管理模式探讨
电子文件检查归档移交备份存储机研究
浅谈电子文档与纸质文档在保护技术上的差异
档案管理中电子文件的存储探究
浅谈电子文件的全过程管理
关于电力企业生产管理信息系统的设计与实现应用
对电力企业管理信息化的探讨
关于电力企业档案管理之创新探讨