彭蒙蒙
[摘要]数字时代加强电子文件归档和电子档案管理,不仅是时代所需,也是提高档案管理效率和提升档案服务质量的重要保障,对企业具有重要意义。论文以国泰君安为例,从电子文件归档、电子档案管理、电子档案利用三个方面,对企业电子文件归档和电子档案管理模式进行了探索。
[关键词]电子文件归档电子档案管理电子档案利用
[分类号]G271
Research on the Mode of Enterprise Electronic Filing and Electronic Archive Management in Digital Era
——Taking GUOTAI JUNAN Securities as an Example
Peng Mengmeng
(GUOTAI JUNAN Securities Company, Shanghai, 200444)
Abstract: Strengthening electronic filing and electronic archive management is not only necessary in the digital time, but also is an important guarantee for improving the efficiency of archive management and the quality of archive service, which is of great significance to enterprises .This paper explores the mode of enterprise electronic filing and electronic archive management from electronic filing, electronic archive management and electronic archival utilization.
Keywords: ElectronicFiling;ElectronicArchiveManagement;ElectronicArchivalUtilization
当今人类社会发展正处在数字时代,数字化、网络化、智能化正日益融入人们生产生活的方方面面,极大地推动了社会的发展进步。数字化浪潮对现代档案管理带来了深刻的影响,数字信息的出现改变了档案记录和读取方式,产生了形式多样、规格各异且数量巨大的电子文件,打破了传统档案管理模式,为档案工作带来了新的要求和挑战。[1]2016年,国家档案局及上海、安徽、江西等地方档案行政机构纷纷把加强电子文件归档与电子档案管理写入了档案事业发展“十三五”规划。对于企业而言,加强电子文件归档和电子档案管理,不仅是时代所需,也是提高档案管理效率和提升档案服务质量的重要保障,从长远来看还有利于节省管理成本,可谓意义重大。本文在电子文件归档相关规范的基础上,以国泰君安证券股份有限公司(以下简称“国泰君安”)为例,探索企业电子文件归档和电子档案管理模式,力求形成通用性较强、具有指导意义的电子文件归档和电子档案管理经验。
1电子文件归档
电子文件归档是指将具有凭证、查考和保存价值且办理完毕、经系统整理的电子文件及其元数据管理权限向档案部门提交的过程,可采用在线归档或离线归档方式。由于离线归档需要人工先把电子文件从业务系统中导出,之后再导入到电子档案管理系统,耗费较多的时间和精力,而且还存在重复性大、易出错等弊端,而在线归档是通過系统接口实现电子文件直接归档,人工干预较少,所以综合而言,在线归档整体上要比离线归档更合理、科学。
1.1归档接口
在线归档中,归档接口的设计与开发是关键点和难点。作为业务系统与电子档案管理系统的衔接,归档接口一方面要确保电子文件及其元数据在待归档时的真实性、完整性、可靠性、可用性(简称“四性”),另一方面要保障其在整个归档过程中的“四性”要求,为此,归档接口需要具备“四性”检测功能。下文将对“四性”检测内容进行详细阐述。
归档接口通常采用Web Service、中间库或归档电子文件及其元数据规范存储结构的方式,三种方式各有特点,处理方式也不相同。以中间库为例,归档业务系统(上游系统)将数据推送到中间库后,归档接口实时采集“中间库”数据进行“四性”检测,对检测结果进行状态回写,并要求归档业务系统(上游系统)定时全部依次访问中间库,采集检测失败的数据重新进行推送归档,整个流程如图1所示。该方式可同步处理多重任务,效率较高,但在推行时可能会遇到接口开发周期长、需要归档业务系统(上游系统)密切配合、比较耗费系统资源等问题,企业应根据本单位实际及业务系统建设情况选择合适的接口实现方式。
1.2归档环节的“四性”检测
在电子文件归档环节,由于电子文件在归档过程中存在业务部门与档案部门之间的权属交接以及电子文件到电子档案的转变,因此需要对电子文件的“四性”进行检测,确保电子文件归档的质量。“四性”检测具体内容如图2所示。电子文件真实性检测,包括:①电子文件来源真实性检测:MD5算法检测归档电子文件的固化信息和数字摘要值是否有效;②电子文件元数据真实性检测:依据元数据方案检测归档电子文件元数据数据类型、长度、格式、值域是否符合要求;③电子文件元数据与内容关联真实性检测:检测电子文件元数据与内容数据是否关联,检测元数据中记录的文件存储位置与电子档案内容数据的实际存储位置是否一致;④电子文件内容电子属性真实性检测:检测电子档案内容数据中包含的电子属性信息与电子文件元数据中记录的信息是否一致;⑤电子文件归档信息包真实性检测:XML封装与MD5算法检测比对电子文件归档信息包的文件名、文件大小和原始记录,以及归档信息包的数字摘要值。
电子文件完整性检测,包括:①电子文件数据总量检测:检测电子文件归档接收信息登记表中文件数量和大小;②元数据完整性检测:检测电子文件元数据项是否填写齐全,具有连续编号的目录数据(案卷号、件号、文号)是否有漏号;③电子文件内容完整性检测:人工检测电子文件对应的实体内容是否齐全完整;④电子文件归档信息包完整性检测:系统自动检测归档信息包中实际包含的电子文件数量,以及人工检测元数据和内容数据是否存在遗漏或错误情况。
电子文件可用性检测内容包括:①元数据、目录数据可用性检测:检测电子文件归档信息包中存放元数据的XML文件或目录数据存放的EXCEL文件是否可以正常解析、读取数据;②电子文件内容可用性检测:检测电子文件实体是否可以被正常打开和浏览;③电子文件归档信息包可用性检测:检测电子文件归档信息包是否包含非公开压缩算法、是否加密、是否包含不符合归档要求的文件格式;④电子档案内容软硬件环境监测:检测电子属性信息中记录的软硬件环境信息是否符合归档要求。
电子文件可靠性检测,包括:①电子文件归档信息包可靠性检测:系统或人工监测电子文件归档信息包是否感染木马或病毒;②归档载体可靠性检测:系统及人工检测载体内是否含有非归档文件,载体读写速度、载体外观、光盘质量;③归档过程可靠性检测:人工检测归档信息包在归档和保存过程中是否安全、可控。
2电子档案管理
2.1电子档案存储
在电子档案管理过程中,电子档案存储方式直接关系着电子档案的安全,选择合适的存储方式有利于保证电子档案的真实、完整、可靠、可用。需要注意的是,不同的业务阶段电子档案存储的作用范围和技术要求有所不同,具体而言,在电子文件归档时需使用交换存储,在电子文件在线收集、电子档案管理、长期保存和提供利用时需使用在线存储,在电子档案长期保存、电子档案备份时需使用离线存储,各业务环节存储要求规划如图3。在线存储可采用磁盘阵列(SAN)设备,离线存储可采用一次性写入专用移动硬盘、磁盘。
电子档案存储内容应包括电子档案及其元数据、电子档案管理系统及其配置数据、日志数据等。电子档案存储时,应在不改变源文件的情况下自动批量转换成PDF、MP3、MP4等长期保存格式,无法转换的则应以TIFF或JPEG文件格式将纸质文件扫描后归档。电子档案的实体对象应按照“三库分离”原则,在系统中实施分别管理:长期保存库独立于电子档案管理系统,用于存放电子档案长期保存封装包;管理库用于支持档案管理员开展档案的检测、鉴定、销毁、统计、查阅、检索和编研等业务工作;利用库则是根据档案的开放利用属性、档案利用者的要求生成多元化的利用库。
2.2长期保存环节的“四性”检测
电子档案在长期保存过程中,需通过制定检测策略进行定期和不定期检测,检测内容如图4所示。检测策略设置主要包括:电子档案的封装格式以及电子档案元数据与内容数据的关联方式、电子档案的存储路径与存储方式、电子档案各项检测指标与检测周期等。在未发生系统更新、数据迁移、格式转换等影响电子档案元数据和内容数据的行为的情况下,只需要对电子档案的固化信息进行检测。反之,则需要进行全面检测,检测内容包含长期保存封装包、电子档案元数据和电子档案内容。在电子档案长期保存过程中,针对电子档案所做的检测、迁移、格式转换、备份恢复、提取出库应记录在电子档案管理系统的长期保存库中,并补充到电子档案的元数据中。
3电子档案利用
电子档案管理的最终目的是实现档案资源的有效利用,充分实现档案价值,为企业经营、管理等工作提供服务。数字时代,档案数据资源急剧增加,档案利用需求日益增长,档案部门不能仅被动地提供档案查询、借阅等传统档案服务,而是要树立现代管理思维,合理运用先进的信息技术和庞大的档案数据资源,积极挖掘档案价值,发挥资源优势,主动为业务发展服务,努力提高档案部门在企业发展过程中的角色定位。在此,本文以国泰君安为例,介绍其在电子档案利用方面的几项创新做法。
3.1运用大数据技术,助力业务拓展
近年来,大数据在社会实践与理论研究上影响巨大,作为一种数据技术,它也被运用到各个行业和领域中。面对数量庞大的档案资源,档案部门也可通过利用大数据技术对档案数据进行价值挖掘、分析预测等资源管理,从而发挥档案数据价值。为使分析结果更为准确,档案部门可与信息技术部门合作,将档案数据与底层数据进行整合,形成海量档案信息数据池。国泰君安整合了档案部门与信息技术部两个部门的客户档案信息资源,并以客户档案信息数据池为基础,通过大数据技术、人工智能技术形成客户全档案生命周期图谱,以时间轴的方式,完整展现客户办理各个业务的时间,并从多维度对客户进行账户评级,形成客户画像,如图5所示。客户全档案生命图谱,一方面会被推送至业务前端,助力精准营销、业务拓展;另一方面,也会通过公司相关业务系统软件推送给客户本人,从收益能力、选股能力、仓位控制、盘面感知、风险控制五個维度为客户提供全面、专业的投资分析,从而发挥档案利用价值。
3.2运用人脸识别、签名比对,协助风险管控
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,用于人员身份确认,实现智能预警,可有效辅助企业合规风控工作和编研工作。通过采集特定人员的人脸照片或身份证信息形成面像文件,建立面部特征素材索引库,将面部特征素材索引库中的素材照片进行特性化处理,并与数据库中相关声像资料作对比,找出声像档案中含有该面部特征的片段、帧及时长等信息,从而在海量的影像中快速找出特定的人物信息。国泰君安对于公司内部员工与信用业务类客户人脸数据的采集,一方面,将特定的人物脸部素材照片信息匹配相关影像资料,提取相关片段,应用于公司人物、专题等档案编研;另一方面,将特定人物脸部素材照片信息匹配对应业务影像档案(如客户视频)进行身份对比稽核,从而应用于业务合规性检查,协助风险管控。
签名比对是一种通过对手写签名进行分析得出签名是否由本人书写的识别技术,和人脸识别一样,也可协助企业合规风控工作。通过提取有效的签名档特征信息建立模板库,包括:签名的位置、形状、比划方向,比划间的搭配以及伪动态信息等,之后由后台引擎对模板库中的签名档特征信息进行实时对比,比对任务结束后输出相似度,并通过接口反馈给前端平台。该功能可对客户签名文件进行批量对比发现可疑的签名文件,有效协助合规、风控、审计等工作的非现场、电子核查开展,为公司风控稽核工作提供了便捷。
3.3应用自然语义分析,实现智能检索
在系统查询时,可能会因题名不规范导致表意出现偏差,影响查询结果,而自然语义分析能使电子档案管理系统实现智能检索,提高查准率、查全率,从而提高用户查询体验。通过研发PIndex全文检索技术,以中文分词为核心技术,使用Spider程序对Web页面、磁盘文件以及数据库中文本内容三种数据源中的数据进行抓取,再通过索引服务建立索引信息,形成分类索引,最终形成完备索引库。同时,通过建立同义词库,使索引服务具备“自主学习”能力。例如,当要检索有关中国工商银行档案时,输入“工商银行”“工行”“中国工商银行”中的任何一个关键词,均可检索成功,保证查全率。
数字时代,电子文件大量产生,对现代档案管理带来了深刻影响。提高重视并不断加强电子文件归档和电子档案管理,不仅是时代发展的需要,也是提高档案工作效率和档案服务质量的重要保障。现阶段,有关电子文件归档和电子档案管理理论研究与实际应用都还存在不足之处,如制度不健全、归档电子文件门类不全、提供利用仍旧侧重传统纸质档案、元数据管理有待加强、对信息资源挖掘效果偏弱、档案管理系统归档接口少等[2]。对此,企业应树立现代管理思维,依托技术手段和专业管理,不断推动电子文件归档和电子档案管理迈上新台阶,充分发挥档案资源价值,更好地服务于企业各项业务发展。
参考文献
[1]李明华.中国的数字档案资源建设[N].中国档案报,2016年9月15日(第3版).
[2]盛晓明,周妍,刘春波,赵杰.我省企业电子文件归档和电子档案管理试点工作情况[J].黑龙江档案,2016(3).